基于POI信息熵的轨道交通客流影响因素分析
——以重庆地铁一号线为例

2022-01-25 04:15陈雨婷李秋婷罗玲卓
技术与市场 2022年1期
关键词:一号线信息熵客流

陈雨婷,李秋婷,2,罗玲卓

(1.重庆师范大学地理与旅游学院,重庆 400000;2.江西省奉新县第四中学,江西 宜春 330700)

1 研究背景

重庆又称“山城”,是西南地区的超大城市之一。受四山、两江的阻隔影响,重庆市主城区在城市空间发展过程中始终秉承“多中心,组团式”的空间形态发展理念,从而减少山体阻碍、两江阻隔带来的城市发展瓶颈。受城市发展过程和发展阶段的影响,不同组团之间的经济、人口、公共设施配备具有较大差异,主城区人口和就业岗位主要集中于内环以内区域,约占主城区总体的50%左右,城市交通拥堵问题也主要集中于该区域[1]。

本文所研究的重庆轨道交通一号线,是重庆轨道交通线网截至目前唯一一条贯穿东西的主干线,沟通内外环的同时,也是重庆市投入使用的第一条地铁线路。东起朝天门站,途经渝中区、九龙坡区、沙坪坝区、壁山区,西至璧山站,沿途穿过了中梁山隧道,勾连起重庆西站和重庆站两大铁路交通枢纽,是重庆西部科技城与市中极为重要的交通线路。截至2021年3月,重庆轨道交通一号线运营里程约为45 km,共设车站25座。一号线分不同时段开通运营,最早的是小什字至沙坪坝段,于2011年7月28日开通试运营[3],尖顶坡至壁山、小什字至朝天门段开通试运营时间晚于本研究的数据采集时间,因此文中对朝天门站、壁山站不作相关分析。

随着城市的发展,轨道交通在城市交通出行中的作用日益显著,作为重庆市公共交通的重要组成部分,重庆市轨道交通网在不同组团的勾连、促进城市职能分配中起到了较大作用。同时,根据前人研究可知,城市轨道交通安全、运营可靠的基本依据离不开客流分析,对网络客流特征以及演变规律的精确把握可以为网络客流特征分析与趋势预警预测提供参考,因此对轨道交通的客流分析具有较大的地理意义[4]。客流数据获取是客流分析中最为基础的一环,随着移动互联网的普及和大数据时代的优势,轨道交通客流量统计方式已不局限于较难获得的历史刷卡数据,还可以开发基于Wi-Fi探针的客流统计分析系统,为研究实时客流、制定科学的客运组织方案提供可靠信息[5]。

目前,关于轨道交通客流研究的数据来源主要是依托进出站刷卡、三大通信网络的定位等历史数据,对实地探测的客流研究寥寥无几,且都不具备对客流进行不同收入层次的划分功能。此外,在进行客流影响因素分析时更加偏好考虑站点可达性,以及与其他公共交通的接驳、区位优势、经济发展、人口数量等,尤其是将经济发展状况较为笼统地描述为GDP或商业用地面积,而没有进一步分析具体的各商业类别和各类别之间的联系,忽视了多种因素共同作用下的差异性影响。

本文的创新之处在于所使用的轨道交通进出站客流数据均为Wi-Fi探针实测,且根据测得的MAC地址可进一步分析乘客收入水平,对客流有更加精确的划分。客流影响因素分析时采用高德地图内的8类典型POI数据,并引入信息熵算法系统地分析各POI之间的组合结构,精细化不同POI组合结构对客流分布产生的影响,进一步对轨道交通建设提供可行性参考依据。

2 数据来源及研究方法

2.1 数据来源

2.1.1 手机MAC地址数据

手机信令数据能够反映轻轨实时的客流情况,并对客流具有追踪功能。由于国内三大运营商的基站数据保密性强,获取较为困难,通过阅读文献,经实地测试,找到了一种符合实际且使用相对便捷的手机信令获取方式——Wi-Fi探测技术。购买Wi-Fi探针设备以及下载搭配好的探针app,只需要短短几秒就能够扫描到某个范围内所有设备的IP地址、RSSI值(值的大小可反映Wi-Fi信号的强弱),以及MAC地址(智能手机的唯一标识)[6]。Wi-Fi探针的探测原理是根据现有Wi-Fi技术协议规则,针对每一部开启Wi-Fi功能的智能手机会持续发送Probe Request(探测请求帧)去寻找附近可用的无线网络这一现象,来实现在一定范围内获取以秒为单位上传的手机信令数据,并且这个探测请求帧中,就包含了移动设备的IP地址、MAC地址、RSSI值(信号强度值)等有价值的信息。

数据采集过程中,分别在2019年的2个工作日利用Wi-Fi探针实测采集一号线地铁车厢内所有用户智能手机的Wi-Fi信号,了解设备的强弱程度,获取乘客智能手机的MAC地址,并依据后台编写好的程序分析乘客进出站情况以及通勤等数据。

进一步处理收集到的MAC数据,利用MAC地址前6位识别不同的用户,通过与全网MAC数据库比对得出不同用户使用的手机品牌,并据此分析不同用户的收入层次,划分依据为2018年中国各手机品牌用户月收入分布(见图1)的调查结果:高收入人群(10 000元以上)使用苹果、华为手机占比较多,中收入人群(3 000~10 000元)使用OPPO、vivo、小米手机占比较多,低收入人群(3 000元以下)使用其他类手机品牌占比较多;利用RSSI数值的大小判断用户的大概所在范围,剔除车厢范围之外的无效数据。

图1 2018年中国各手机品牌用户月收入分布

2.1.2 高德地图POI检索数据

POI即Point of interest的缩写,直译为“兴趣点”,是一种代表真实地理实体的点状要素,作为地理空间大数据极其重要的组成部分,POI在当今电子地图位置搜索、定位、导航等功能性服务中发挥着核心作用[7]。

一般而言,在学术界POI的概念有狭义与广义上的区分,狭义概念中的POI一般是指电子地图中与人们生活、生产以及城市社会经济紧密相关的实体点要素,主要包含了区域要素中各个类型的社会经济部门[8],广义上的POI是指所有受到人们关注程度高于普通地理点要素的实体点,如博客、微信、网络论坛、位置服务(LBS)中形成的位置签到信息以及GPS轨迹和手机信令服务数据[9]。

本文主要研究的是狭义的POI,涵盖了关于餐饮、购物、金融、公司企业、商务住宅、公共设施/生活服务、科教文化服务、住宿服务共8类地理实体兴趣点,检索结果包含兴趣点名称、经纬度坐标、街道地址、联系方式等字段。检索工具使用的是Date Map内的POI检索模块,以高德地图数据为基础,设定800 m为半径进行地理数据检索。这8类POI数据能够真实地反映地铁站周边各类社会经济活动,较好地满足了精细化研究站点周围空间布局的要求,为人们的出行决策、轻轨客流预测、轨道交通线路宏观规划等方面提供了细致的地理参考[10]。

2.2 研究方法

2.2.1 信息熵及其地理意义

“熵”原是一个热力学概念[11],本研究借用信息熵的算法对城市组成结构进行深入的定量分析。假设在城市一定范围内检索到的POI数据总量为A,该范围内的所有POI根据其关键词可分成N种,每个类别的个数为Ai(i=1,2,3,4,…,N)

各类POI所占规定范围内POI总量的比例为:

(1)

按照信息论的原理[12-13]参考Shannon-Weaner指数定义POI组合结构的信息熵为:

H=)

(2)

信息熵H是系统复杂性和均衡性的测度,用来描述POI的多样性,Pi为第i种POI类型所占的比例[14]。当规定范围未检索到任何POI时,其多样性指数为0,即Hmin=0;相反,当规定范围内社会发展越繁华,各POI类型已趋于稳定、均匀且满足熵最大化条件(A1=A2=…=Am=A/N)时,多样性指数为最大值Hmax=ln(N)。因此POI类别越多,各类POI的数量相差越小,熵值就越大。

2.2.2 结构的均衡度及优势度

信息熵反映城市POI组合结构的复杂程度,均衡度、优势度则描述城市POI之间数量差异、结构格局[15]。基于信息熵公式得到均衡度的表达式为:

E=/ln(N)

(3)

均衡度是信息熵与最大值Hmax之间的比值,取值范围为E∈[0,1][16]。当E=0时城市POI组合结构处于最不均匀状态,当E=1时达到理想的平衡状态。优势度(D=1-E)反映区域内一种或几种POI支配该区域结构的程度,与多样性成反比。

2.2.3 数据分析方法

采用单因素方差分析法和多重比较分析法研究POI均衡度与早晚高峰时期进出站客流之间,与高、中、低收入水平的各时期客流之间是否存在显著性差异和具体差异的体现。进行单因素方差分析之前需要判断数据是否满足以下3个前提条件:①数据是相互独立的随机样本。②各数据样本来自正态分布总体,判断是否符合可以对研究的整体进行正态性检验,若不完全符合则需要采用对数、开方等函数转换法对数据进行正态转换,再次检验满足正态分布,方可进行下一步。③单因素方差分析后的输出结果中,方差齐性检验的莱文统计量显著性必须大于显著水平0.05,才算真正满足单因素方差分析的前提条件。

下一步针对单因素方差分析结果中具有显著性的数据进行多重比较分析,当LSD值检验结果的显著性(F)小于0.05时,显著性差异比较的结果有效,若对比结果有效的2个数据所对应的平均值差值Q(Q=I-J)始终大于零,意味着差异性I大于J,由此可以得出具体的显著性差别。

3 早、晚高峰期进出站客流的区位分布特征

进出站客流是指单位时间内轨道交通站点乘客的空间行为表现。图2是使用Wi-Fi探针实地测得的2019年重庆市轨道交通一号线3月的一个工作日进出站客流分布,分为早高峰 (7:30—9:30)和晚高峰(17:30—19:30)两个时段,纵坐标表示23个车站的实测进、出站客流。

分析可得:早高峰时段尖顶坡站、微电园站的进站客流量较大,出站客流量却较少,这些站点主要分布于沙坪坝区的西部、中梁山西侧;晚高峰时段石桥铺站至大坪站的进站客流量较大,出站客流量较少,该类站点主要分布于渝中区和九龙坡区北侧。其中,小什字站、较场口站、两路口站、沙坪坝站无论早晚高峰期的进出站客流都相对较多,这类站点主要为轨道交通换乘站或者与其他公共交通的接驳站,因此客流量相对稳定且较多,主要分布在渝中组团、沙坪坝组团的中心的区域,周围分布有较大的商圈。

图2 一号线早晚高峰进出站客流统计

4 轨道交通一号线各站点POI熵值的城市区位分布特征

使用Date Map内嵌的高德地图数据,沿轨道交通一号线小什字至尖顶坡段,以800 m为半径分别检索23个站点周边的POI数据,用上述方式计算23个站点的信息熵(H)、均衡度(J)和优势度(D)的值,如表1所示。

位于城市的不同区位的地铁站点周围,POI组合结构的完整性和均衡性均存在明显差异,选取信息熵和均衡度进行线性比较分析可得(见图3):地铁一号线各站点的信息熵值、均衡度大致呈现出2个峰值和2个极低值,第一个峰值由位于渝中区的小什字、两路口、较场口站组成,位于沙坪坝区的沙坪坝站、小龙坎站组成次一级峰值。由信息熵和均衡度的含义得出峰值则意味着该站点周围的POI组合结构发展较为均衡;极低值表明POI发展相对不均衡,即赖家桥站和鹅岭站的POI组合结构最不均衡。结合重庆市行政规划来看,整体上趋势线走势说明,随着与重庆市中心的距离不断增加,熵值和均衡度均呈现出逐渐降低的趋势,而2个峰值站点所在区域均属于区级中心位置,熵值相对较低的站点则基本上处于主城分区的边缘或者过渡地带。

原因在于:这8类POI的分布受到了人口密集程度、空间距离与经济发展阶段等因素的制约。在站点不同的区位条件下,人们拥有不同的生活需求,土地供给情况的差异也影响了各类POI的布局和数量。

表1 各站点POI的信息熵、均衡度、优势度

图3 信息熵、均衡度线性比较

5 基于信息熵、均衡度的客流影响因素分析

5.1 POI信息熵与早、晚高峰客流的单因素方差分析

采用单因素方差分析法和多重比较分析法对POI均衡度与早、晚高峰时期进出站客流之间是否存在显著性差异及具体差异的体现进行研究。首先,将早、晚高峰的进、出站客流以及前面所得的23个站点的信息熵开展正态性检验:一号线早高峰进站客流、晚高峰出站客流、晚高峰进站客流以及各站点的信息熵均不符合正态分布,呈现不同程度的正偏移和负偏移。因此对不符合正态分布的客流数据和信息熵进行正态转换,经检验满足正态分布。将4组客流数据和信息熵数据分别进行单因素方差分析,输出结果中方差齐性检验的莱文统计量显著性均大于显著水平0.05,满足单因素方差分析的前提条件。进一步查看4组单因素方差分析,结果如表2所示,若ANOVA显著性小于0.01,说明POI信息熵值的大小对早、晚高峰进出站客流具有显著性影响。

表2 四组单因素方差分析结果

分析可得: POI信息熵值对早高峰进站客流和晚高峰出站客流的影响是显著性的,而对早高峰出站客流和晚高峰出站客流影响的显著性很小。进一步针对2组具有显著性的数据进行多重比较分析,当LSD值检验结果的显著性(F)小于0.05时,显著性差异比较的结果有效,且对应的平均值差值Q始终大于零,意味着差异性I大于J,多重比较分析结果如表3所示。

表3 多重比较分析结果

对早、晚高峰期的所有进出站客流而言,显著性的差异主要体现在以下2个方面。

1)POI组合结构的均衡度对尖顶坡站、大学城站、微电园站、沙坪坝站、小龙坎站、较场口站、小什字站的客流影响最为显著,对歇台子站、陈家桥站、马家岩站、鹅岭站的客流影响相对不显著。

2)通过与前文中信息熵值、客流量的数据对比可以发现,显著性强的站点呈现两极分化状态:一是信息熵值越高客流也相对较多,二是信息熵值偏低客流依旧较多。这或许与城市的职住分配有关,信息熵值高的站点往往分布在渝中区和沙坪坝区中心地段,相对而言,地价、房价及生活成本都比较高,有一部分上班族选择了较为偏远的外环定居,即中梁山以西的大学城片区。

5.2 POI信息熵与高、中、低收入层次客流的单因素方差分析

同理,采用单因素方差分析法对POI信息熵与高、中、低收入层次客流之间是否存在显著性差异进行研究。分别将高、中、低收入层次客流不符合正态分布的数据进行相应的正态转换,最后得出符合正态分布的3组数据。单因素方差分析输出结果中方差齐性检验的莱文统计量的显著性大于显著水平0.05,满足单因素方差分析的前提条件。进一步查看3组单因素方差分析,结果如表4所示。

表4 三组单因素方差分析结果

分析可得:高、低收入层次的显著性均小于0.01说明POI信息熵值对高收入层次客流和低收入层次客流的影响存在显著性,进一步针对高收入客流和低收入客流2组数据进行多重比较分析,当LSD值检验结果的显著性(F)小于0.05 h,显著性差异比较的结果有效,且对应的平均值差值Q始终大于零,意味着差异性I大于J,多重比较分析结果如表5所示。

高、低收入层次的早晚进出站客流受到POI组合结构影响较为显著的共同站点有尖顶坡站、大学城站、沙坪坝站、大坪站、两路口站、小什字站,其中两路口站、沙坪坝站、小什字站属于大型商圈聚集地也是换乘站,大坪站位于商圈附近,这3类站点附近的8类POI组合而形成集商业、居住、办公为一体的大都市圈可以提供大量的就业岗位和质量优越的生活服务,对高、低收入层次的客流都具有较大吸引力;而尖顶坡和小什字站不仅位于城市近郊区,发展历史过程中地价、房价均不高于核心地区,属于低收入人群的考虑范畴,而且毗邻多所高校,且近年来有重庆市西部科学城的发展规划,加上远郊区城市化发展时间不长,生态环境比早期发展起来的老城区好得多,因此这片地区对高新技术人才和高知人群具有一定的吸引力,这部分人往往都拥有较高的收入。

表5 多重比较分析结果

6 结语

重庆市轨道交通一号线作为第一条投入使用的贯通东西的地铁,很好地缓解了交通压力,对主城区西部地区城市化发展也有着较大的促进作用,首尾勾连西部近郊区和渝中区的布局使得整体客流呈现明显的住郊区在市中心上班的通勤模式。除区位优劣以外,地铁乘客的分流也受到站点周围配套设施的影响,利用信息熵算法得出站点POI组合结构的均衡度、优势度等信息,可以很好地衡量和分析研究范围内的商业、房产、生活服务等方面的发展现状,通过分析其与客流的相关性、显著性差异,精细化POI组合结构的影响程度,并据此对城市用地分配、商业发展、生活服务配套等作出一定的前瞻性规划,利用好不同POI组合结构对各类客流的吸引力程度,促进城市轨道交通站点的建设,使地铁更好地服务于人们的生活。

猜你喜欢
一号线信息熵客流
客流增多
基于信息熵可信度的测试点选择方法研究
地铁连接你我他
城市轨道交通节假日期间大客流行车组织思考与实践
国内
一种基于信息熵的雷达动态自适应选择跟踪方法
基于自学习补偿的室内定位及在客流分析中的应用
我是挤一号线的
人工免疫算法在电梯客流时段划分的应用
基于信息熵的循环谱分析方法及其在滚动轴承故障诊断中的应用