路网实时交通状态数据采集与分析

2022-01-17 06:38郭富成王庆国
地理空间信息 2021年12期
关键词:高德路网时段

郭富成,王庆国*,万 婕

(1.武汉科技大学汽车与交通工程学院,湖北 武汉 430065)

传统的交通状态监测只是基于有限的道路断面,对交通状态的感受局限于“点”和“线”,难以对宏观路网的交通状态进行实时感知和把握。随着各种智能传感器网络的布设和浮动车等多种实时交通信息采集手段的广泛使用,持续获取大范围路网的实时交通状态信息成为可能[1-5]。在此基础上,诸如高德地图等网络地图都提供路网的实时交通状态信息服务。

本文以武汉市路网为研究对象,基于高德地图API,首先借助网络爬虫技术,对路网中主要道路的实时交通状态数据进行连续采集;然后分别从时间维、空间维和时空组合维几个角度分析研究了武汉市路网交通状态的发展演化规律。

1 基于高德地图的路网实时交通状态数据采集

1.1 网络地图中的交通状态特点分析

与传统的基于有限道路断面采集的交通状态相比,网络地图中的交通状态具有如下特点:

1)时空覆盖度高。网络地图中的交通状态主要是通过将浮动车GNSS 数据与网络地图的定位导航数据进行多元融合,并综合运用海量用户的出行数据上报机制和数据挖掘等分析手段产生的[6-8]。用户的海量性,再加上数据挖掘分析手段的使用,使网络地图中的交通状态最大限度地实现了全路网覆盖和全时段覆盖。

2)准确率高。相对于基于有限道路断面采集的交通状态数据,基于海量用户上报的出行数据具有较多的样本量,由此分析得到的结果数据具有更高的准确率。

3)方便分析。网络地图提供的交通状态数据不是由用户直接上报的出行数据,而是基于海量数据加工后形成的一个综合的结果数据。这就使得用户在使用时,无需对多源异构,甚至包含大量噪声的原始数据进行加工处理,大大简化了相关分析。

4)现势性强。网络地图以3 min 左右的周期对交通状态进行动态更新,并通过Web 平台等向公众实时发布。因此,其提供的交通状态具有很强的现势性。

1.2 基于高德地图的路网实时交通状态数据的采集

高德地图主要以2 种形式发布实时交通状态,一种是以瓦片数据的形式通过高德地图APP 向公众发布网页端路况信息图层;另一种是提供免费Web 服务,通过申请“Web 服务API”密匙,调用交通路况查询API 接口,访问实时路况信息。由于第一种形式采取的是栅格图片的表达,缺乏道路的语义性描述,也难以通过相关运算获取道路速度等信息,所以,本文基于第二种形式,借助网络爬虫技术进行交通状态数据采集[9-10],其基本过程主要包括数据爬取、数据解析与重组、数据存储和线程控制4 个模块。

在数据爬取模块,使用python 语言中requests 模块的get 请求方式,将需要申请的参数和地址一起发送到服务器端。服务器接受请求后,将数据返回客户端。客户端接收返回的数据,并将该数据转化为JSON 格式数据。在数据解析与重组模块,根据JSON 格式数据存储特点和各种交通状态对应的特征值,利用get 方法解析出各字段的属性值,再按照字段排列顺序对属性值进行重组,保存到列表中。在数据存储模块,将重组好的数据批量存储到本地MongoDB 数据仓库中,并生成对应的Excel 文件。在线程控制模块,考虑到一个数据爬取周期的耗时约为1 min, 20 s。设定当存储完一个周期的数据或请求超过5 次未得到响应时,程序休眠1 min,接着进行第二次爬取。这样使得每个周期的时间控制在3 min 左右,与高德地图的交通状态更新频率基本一致。本研究中,通过程序持续爬取了研究区内324 条道路的实时路况信息,主要是快速路、主干道、次干道。由于权限限制,支路路况只能获取小部分。

1.3 数据仓库MongoDB

大数据的兴起和发展给数据存储技术带来了全新的挑战,其数据量大、并发性高、格式复杂,传统关系型数据库难以满足需求[11]。数据仓库可以保存大量面向主体的、集成和动态的数据,是决策支持系统和联机分析所用数据源的结构化数据环境,用于解决从数据中高效、动态、批量地获取信息的问题。通过对数据仓库的访问达到对获取的数据进行分析和应用的目的,且允许使用多种技术访问[12-13]。

MongoDB 数据仓库因结构简单、模式自由、超大容量、可扩展性强等特点成功引领了非关系型数据库的发展方向。MongoDB 提供键值对格式的数据存储,不需要关心数据之间的组织形式与结构关系,也不需要经过SQL 层的解析,因此对只关心键值对格式数据的研究实用性很强[14-15]。

本文基于数据仓库MongoDB,对采集到的实时交通状态数据存储示例如图1 所示。

图1 基于MongoDB 的数据存储

2 路网交通状态数据的分析

交通问题是一个与时空位置高度关联的问题,在交通系统中,诸如交通流的潮汐现象、常态性交通拥堵现象、以及多发性交通事故等典型的交通事件和现象都具有明显的时空分布规律特性。将交通系统中的事件和现象等与其发生和存在的时空位置相结合,研究交通事件和现象的时空分布和演化规律,对于应对目前交通系统存在的诸多典型问题,具有重要的基础性作用。

本文以基于高德地图获取的2020-04-17~2020-05-03期间的交通状态数据为依据,分别从时间维、空间维和时空组合维分析了武汉市主要路网的交通状态分布和演化规律。

2.1 基于时间维的分析

基于时间维的分析就是分析交通状态的时态变化规律。由于交通状态与交通速度直接对应,本文以路网的交通速度表征交通状态,将研究期间分为工作日、双休日和节假日3 种。以1 个小时作为一个研究时段,通过均值法计算每个时段内路网的平均交通速度,然后将3 种研究期中交通速度的时间分布特征进行对比分析。均值法的计算如式(1)和(2)所示。

式(1)中,Vij表示路网在第i时间段内第j爬取周期的平均交通速度;n表示该周期内爬取的道路总数;vkj表示第j爬取周期的第k条道路的交通速度。式(2)中,Vi表示路网在第i时间段内的平均交通速度;m表示第i时间段内总的爬取周期数。

武汉市路网交通速度随时间的分布规律如图2 所示。由图2a 可见,工作日的交通速度呈“W”型分布,具有明显的早晚高峰现象,速度峰值出现在凌晨2:00~6:00 间,谷值在8:00~10:00、17:00~20:00间。这表明工作日时,人们的出行活动非常规律,影响交通状态的主要因素是上下班的交通行为。

由图2b 可见,双休日的交通速度呈“碗口”状分布:在上午7:00~10:00 呈缓慢下降趋势,之后持续近6 h 的小幅波动,至16:00 开始出现第二次下降趋势,最终在晚间17:00 ~19:00 形成全天最低速度时段,之后速度缓慢回升。

相比于工作日,双休日的早高峰时段,速度下降较为平缓,但持续时间较长,其中的主要原因可能是工作日时,人们是规律的上下班通勤,时间比较集中。而双休日人们的出行相对自由分散,同时增加了娱乐休闲活动,要考虑娱乐休闲场所的开放时段,以娱乐休闲为目的的交通出行决定了交通的整体状态。

由图2c 可见,节假日的交通速度随时间的分布状态与双休日接近,从6:00 开始速度逐渐降低,在10:00 ~11:00 达到最小值,而后趋于稳定,晚间20:00~21:00 速度开始明显上升。

图2 平均交通速度时间分布规律

与双休日相比,节假日的低速状况持续时间更长。这可能是城市原有交通流叠加了外来游客流,外来游客一般早上8:00 ~11:00 前往旅游景点附近,且基本上全天滞留于旅游景点附近,午间稍作休息,下午前往第二个目的地,导致了节假日全天低速运行状况持续时间较长。

根据时间维的分析,为了改善路网交通状态,交管部门可在早晚高峰时段采用更优化的管控技术来均衡路网荷载分布,而出行者应该尽量避开早晚高峰时段,选择更便利的出行时间。

2.2 基于空间维的分析

基于空间维的分析主要分析交通状态的空间分布规律。本文采用离散点匹配路网的方法,基于ArcGIS10.4 平台,研究了工作日和双休日早晚高峰时段整点交通状态的空间分布特征。

研究发现,在工作日早高峰时段,交通拥堵表现为以二环线为中心,以江汉商业区和武昌火车站为严重拥堵区域的分布。随着时间的推移,逐步向市中心转移。晚高峰时段拥堵以解放大道、友谊路、沿江大道、三阳路所围成的区域为中心点,呈放射状向四周扩散,最终在二环线附近形成“环状”分布特征。

在双休日,交通状态整体上优于工作日。除了零散分布的点状拥堵,没有出现大范围的持续性拥堵。早高峰时段除了存在时间上的迟滞现象,空间分布也由商业办公区转移至休闲娱乐中心区,如黄鹤楼公园、首义公园和紫阳公园三角区,东湖风景区和汉正街、西北湖等商圈附近拥堵程度明显高于工作日。晚高峰时段与工作日相差不大,空间上主要以黄鹤楼公园、首义公园、紫阳公园三角区和汉正街、西北湖、街道口、武广等大型休闲购物商圈为中心形成了块状分布格局。

以武汉市三环线内区域为例,图3、4 分别表示其在工作日和双休日的交通状态的空间分布。图中道路颜色为绿色代表交通畅通状态,道路颜色为黄色代表交通缓行状态,道路颜色为红色代表交通拥堵状态。

图3 工作日空间分布图

根据空间维的分析,为了改善路网交通状态,规划建设部门应该优化路网结构,提高关键路段和交叉口通行能力,达到整个路网快速、便捷、高效的通行效率,而出行者的出行路径应尽量避开关键路段和交叉口。

2.3 时空组合维的分析

时空组合维的分析将更精细化地研究分析交通状态的时空分布和演化规律,仍以上述江汉区的范围为例,并选取晚高峰中拥堵最严重的时段,从17:40 开始,以每15 min 为一个周期,探讨了交通状态由畅通演变为拥堵,直至拥堵消散的变化过程和机理。

由图5 可见,多数拥堵的形成与最邻近的15 min前的缓行路段相关,其次是30 min 和45 min 前最邻近的缓行路段,其对拥堵形成的重要程度远远大于附近的严重拥堵路段的影响。这反映了在时空上多数拥堵的形成都是因为最邻近道路大范围缓行,在短时间内蔓延至其他区域,然后积聚形成。拥堵多呈现突发性与形成后维持时间较长的特征,这也证明了交通拥堵具有空间上的“传染性”。拥堵输通呈现出以重要路段为中心向周围扩散的方式。

图5 时空组合分布

根据时空组合维的分析,为了改善路网交通状态,交通管理控制部门应以重要路段为中心,及时疏散化解其周边的缓行车流,而不是把主要精力放在疏散严重拥堵的路段上。

3 结 语

本文以武汉市路网为研究对象,基于高德网络地图提供的实时交通状态信息,分别从时间维、空间维和时空组合维的角度,分析了城市路网交通状态的演化规律,借此探寻引发路网交通拥堵的主要因素,以及路网拥堵发生的前期状态和路网拥堵之间的因果关系。研究表明,通过对路网交通拥堵发生与发展的时空演化规律的认识,可以为交通规划与管控,以及市民出行选择提供指导和帮助,改善路网交通状态。

猜你喜欢
高德路网时段
养阳的黄金时段到了
江苏高德液压机械有限公司
江苏高德液压机械有限公司
四个养生黄金时段,你抓住了吗
打着“飞的”去上班 城市空中交通路网还有多远
省际路网联动机制的锦囊妙计
首都路网 不堪其重——2016年重大节假日高速公路免通期的北京路网运行状况
路网标志该如何指路?
高德贸易有限公司
分时段预约在PICC门诊维护中的应用与探讨