一种基于手机大数据的地铁换乘客流挖掘方法研究

2018-11-09 10:24姚远陈瑜雷怡
科技视界 2018年18期
关键词:信令换乘客流

姚远 陈瑜 雷怡

【摘 要】本文提出了一种利用手机大数据进行换乘客流挖掘的方法。本方法考虑了地铁网络的拓扑结构,结合图论相关原理,阐释了地铁出行路径的识别算法。最后以上海曹杨路-漕河泾区段为例,通过志愿者调查系统进行了换乘数据验证。结果证明,此方法得出的换乘量与实际换乘量偏差较小。

【关键字】手机大数据;地铁换乘客流

中图分类号: U293.13 文献标识码: A 文章编号: 2095-2457(2018)18-0001-002

DOI:10.19694/j.cnki.issn2095-2457.2018.18.001

【Abstract】Therefore,in this paper a method of mining transfer passenger flow base on big data of mobile is presented.It has taken into account topology structure of metro transit network combine with necessary knowledge of graph theory,expounding identification algorithm of trip route in metro network.At last,paper takes the sector between Caoyang Road and Caohejing as an example,verifying transfer data by volunteer investigation system.The results show that the method has a good performance in illustrating the actual transfer passenger flow.

【Key words】Big data of mobile;Metro transfer passenger flow

1 研究背景

无论地铁人流诱导、应急管理还是票务清分业务,地铁换乘客流都是一个及其重要的指标。地铁运营管理公司广泛采用自动售票检票(Automated Fare Collection,AFC),可以获取出行的起讫点(Origin-Destination,OD),但无法直接获取出行者在地铁网的出行路径。有学者尝试用AFC数据进行推算,研究思路主要有:(1)最短路径法,即最短路径上客流按100%分配。但实际出行者中的路径选择并非完全按最短路。(2)建立路径选择模型,如Logit模型。(3)设置路径阻抗,如出行时间,出行费用等等,进而影响路选择。(4)将乘客进出站时间与列车到发时刻进行关联,当两者在一定时间范围内,则认为该路径是乘客所选路径。然而,这些方法均是通过理论推算出来的,因模型而异都有较大的误差。

另一方面,随着手机使用的普及和基于个体的手机大数据客流挖掘技术的不断完善,使用原汁原味的检测数据直接获取换乘客流成为了可能。本文利用移动通信定位原理,通过分析地铁系统内部的手机大数据,匹配拓扑路网接口,从而挖掘出关键节点的换乘量。

2 研究方法

2.1 手机大数据与站点线路匹配

2.1.1 线路编码

为便于计算机的识别和运算,本研究对线路和站点进行了编码,以表达站点之间的相对位置以及线路之间的换乘关系。

(1)线路编号:线路编号沿用原轨道交通线路的编号进行,对于非数字编号的线路以及Y型线路的一支,使用未被占用的线路数字作为线路编号。

(2)站点编号:按照由西北到东南的总体方向,对站点进行逐一累加编号,例如1号线的第一个站点编号为101,逐次为102,103,……。

(3)换乘站点编号:给所有的换乘站点一个新的“线路”号码,并逐一给予新的站点号码。例如1号线的106站点与7号线的717站点为相同站点,因此给予其新的编号1301。在以站点为分析对象时,换乘站点使用统一的换乘站点编号,在以线路为研究对象时,换乘站点使用其所在线路的编号。

2.1.2 站点基站信息匹配

调查方法是使用工程测试手机,记录蜂窝小区识别码。调查的位置包括地下站点的站厅、站台、通道、出入口等空间的地下位置区的蜂窝小区编号。

具体调查的方法是,对每条线路乘坐双向的列车记录在行车过程中经历的所有蜂窝小区。对每个站点,从站台出发步行至每个站点的出入口处,记录所有经历的蜂窝小区。

按照位置区编码与蜂窝小区编码构成的蜂窝小区识别码对地铁基站地理位置信息进行匹配,匹配站点和线路信息。匹配方案如下:调查表中未涉及的蜂窝小区站点编号与线路编号为0。对调查涉及的所有蜂窝小区,站点列匹配站点编号,换乘站点编号使用“13”开头的换乘站点专用编号;线路列匹配当前位置区所对应的地下线路编号,出入口地面基站的线路列线路编号为0。经过该匹配过程样本数据包含以下有效字段:用户MSID,信令时间,位置区编码,小区编码,事件原因,经度,纬度,站点,线路。因此完整的单条信令记录Mi=(MSID,time,LAC,cellID,EVENTID,Lo,La,S,L)。

2.2 地铁出行路径识别

2.2.1 问题描述

假设地铁某段拓扑图为:有轨交三条线l1、l2和l3,能相互换乘,换乘点分别为b(l1-l2)、f(l2-l3)、d(l1-l3),a為起点,e为终点,a-b-c-d-e为站点序列,均在l1上。

手机用户在a点进站,e点出站。为简化说明,设abcdef即为MAZ又为地铁站点。

(1)如果在c点留下信令,需要判定该用户路径为abcde;

(2)如果在f点留下信令,需要判定该用户路径为abfde;

(3)如果该用户没有在ae间留下任何信令,则为程序按最短路径判断,过滤该条信令。

统计多天(1)和(2)情况下的数量,给出各路径的分流比例。

2.2.2 算法

步骤1.在城市整个地铁拓扑图中查找最小环,假设拓扑图中为bcdf.

步骤2.给出环中元素(m)中取两个元素的排列:P (m,2)

b-d:bfd

b-d:bcd

b-c:bfdc

b-c:bc

步骤3.在现有地铁用户乘坐路径中标记有实际信令发生的站点对于问题描述中的(1),(2)分别为:

(1)[a] b [c] d [e]

(2)[a] b [f] d [e]

其中[]包裹的是实际发生信令的站点

将该链表的子段与排列列表中每条记录采用贪婪算法进行匹配,若匹配且该记录的中间节点有标记,则计入,否则忽略。

步骤4.输出为:O_station,D_station,[candidate path], vol

每月更新一次,candidate path 用排列中的每条记录表示。

2.2.3 实现

步骤1.第一阶段先手动给出最小环上的站点对应的序列,如M1,M2,…,Mi,…,Mn,录入metro_diverter.conf,每行一条环。

步骤2.p.genRideCandidates(…)处标记实际发生信令的MAZ。对于分流情况存入路径/${city}/metro_diverter/yyyy/MM/dd。格式为:msid,flagged_path

步骤3.另起一个app,MetroDiverter,从站点基础表中获取Station_i到MAZ的关系(可能为一对多)。目前这条不需要做,metro_diverter.conf直接用MAZ序列测试算法。初始化排列匹配List,元素为RegExp。排列的参考数据结构为:

b-d:(b1|b2),(f1|f2),(d1|d2)考虑换乘后为(b1|b2)(,(b1|b2)){0,1},(f1|f2)(,(f1|f2)){0,1},(d1|d2)(,(d1|d2)){0,1}b-d:(b1|b2),c,(d1|d2)

读取一个月的/${city}/metro_diverter/yyyy/MM数据,输出贪婪匹配成功的记录,路径/${city}/metro_diverter_stats/yyyy/MM。

格式为:O_station,D_station,vol,candidate_path candidate path中的元素由MAZ换为StationID以增加可读性。

步骤4.如果结果可用则,在metro站点间OD中使用各支路比例扩样。

3 案例情况

由上海嘉定区、普陀区前往徐汇区的漕河泾开发区站有两条线路。

(1)一直乘坐11号线,曹杨路-隆德路-江苏路-交通大学-徐家汇,换乘9号线,徐家汇-宜山路-桂林路-漕河泾开发区。

(2)乘坐至曹杨路,换乘3、4号线,曹杨路-金沙江路-中山公园-延安西路-虹桥路-宜山路,换乘9号线,宜山路-桂林路-漕河泾开发区。

一般来说,大部分乘客会选择1号线路,但是1号线路客流大,乘坐舒适度差,故有部分乘客还是会选择2号线路以替代。

4 结果比对

2017年4月10日-4月23日选取了355位由嘉定去往漕河泾开发区的志愿者,利用上海美慧软件公司自行研发的手机大数据调查志愿者信息采集系统,一方面接收志愿者反馈的实际地铁出行路径,一方面以将志愿者标识和手机大数据的MSID进行关联,依据上述算法进行路径识别。

得到结果如下(单位:人次):

由此可见,由于信号的丢失,在绝对量上的检测误差率较大,但在相对的路径选择比上,此算法具有较高的识别率。

5 展望

由于手机信令存在着“乒乓切换”现象,所以会出现基站误检,生成大量的噪声数据,应采用合理的预处理手段进行清洗。同时,可以结合其他的一些换乘客流检测手段,如智能视频、WiFi等,进行数据源的补充,取长补短,有机融合,提高地鐵出行换乘客流的识别准确度。

【参考文献】

[1]蒲一超,尹梅枝,朱琼斯,许项东,颜奋帆.基于手机数据的地铁线网清分模型验证与优化[J].都市快轨交通,2017,30(04):102-109.

猜你喜欢
信令换乘客流
客流增多
SLS字段在七号信令中的运用
移动信令在交通大数据分析中的应用探索
基于信令分析的TD-LTE无线网络应用研究
天津地铁红旗南路站不同时期换乘客流组织方案研究
LTE网络信令采集数据的分析及探讨
基于自学习补偿的室内定位及在客流分析中的应用
人工免疫算法在电梯客流时段划分的应用
重庆轨道交通换乘站大客流组织探索
城市轨道交通运营客流数据分析缺陷及应对