轨道交通短时客流分析与预测

2022-11-29 09:14董艺
运输经理世界 2022年22期
关键词:客流量客流无锡

董艺

(无锡地铁运营有限公司,江苏 无锡 214000)

1 研究背景及意义

随着我国社会经济的不断发展,机动车拥有量和使用量不断增加。中国在近十几年里私家车的拥有量增长近30 倍[1]。为缓解越发严重的各类交通问题,许多城市采取车牌摇号和限号出行的政策,然而人口聚集带来的“大城市病”在越来越多的城市上演。

由于我国城镇人口不断增加,导致人们的出行需求不断递增。受制于当前交通网络的发展,交通拥堵问题随之而来。如何缓解交通拥堵是很多城市在发展过程中需要解决的关键问题之一。其中,发展城市公共交通是解决此类问题的主要措施之一。作为大运量、低费用、节能绿色的出行方式,公共交通出行已在城市中承担越来越重要的角色[2]。近年来,受到“公共交通优先”的战略支持,乘坐公共交通在越来越多的城市得到推广。

作为城市公共交通的重要方式之一,地铁的客流运载量更大、时效性更强,且乘坐的舒适感比公交车等更高,这些优势使地铁在各大城市发展中不断完善,承担了大城市中大部分的公共交通出行客流,并且从出行者自身出行条件考虑,仍会优先考虑地铁出行。中国的城市地铁建设处于高速发展阶段,2018年新疆乌鲁木齐开通地铁线路,全国增加20 条地铁线路,增加长度728.7km,许多城市地铁与地上轨道相结合,不断完善城市轨道交通系统[3]。

在轨道交通运行系统中,如何对车辆进行合理排班和准确调度是提高运营效率和服务水平的关键,然而地铁客流会受许多因素影响,天气、站点位置等都会对乘客出行产生很大影响。因此,准确预测地铁客流信息能够帮助相关的运营系统和管理人员更好地决策和安排客流。

基于地铁客流的海量数据信息,利用智能算法对地铁刷卡大数据中的客流特征提取分析,并对客流进行准确预测研究,对于管理者可以为其提供更准确的客流信息,为地铁的运营管理提供更加科学准确的指导;对于普通出行者而言,可以根据客流预测信息更加合理地安排出行计划,可以更快捷、更舒适地到达目的地,提升地铁乘坐的体验感。进而,还有利于构建绿色环保友好型城市。

2 地铁客流预测方法

时间序列是一组排列数据,这组数据既会随着时间的变化而变化,也会根据空间的转移而不断改变。但是,数据的改变是具有一定规律性的,根据这种规律性排列成的序列就是时间序列。通过对历史时间序列的规律和变化趋势进行分析和研究,解释时间序列的变化特点,并以此作为依据对未来的时间序列进行预测。地铁客流量就是一组随着时间推移而有规律变化的时间序列,针对不同地铁站,由于地理位置、周边建筑环境、地理特性等因素不同,其客流量也存在一定的差异性。在进行地铁客流量预测的过程中,本文针对不同的地铁站客流量所形成的时间序列进行规律挖掘和分析,从而实现对未来地铁客流量的预测。利用机器学习算法进行客流量预测的流程如图1所示。本文采用机器学习的方法,进行地铁客流量预测,主要包括随机森林算法、支持向量机算法,以及长短时时间序列预测算法。

图1 地铁客流量预测流程

3 基于机器学习的地铁客流量短时预测

3.1 地铁站客流量短时预测

选取五个地铁站的客流量进行预测。在进行预测的过程中,将2019年12月1日 至2019年12月4日的地铁客流量作为训练数据进行特征挖掘和学习,进而预测后三天的客流量。以15 分钟作为时间单位,进行模型的训练和测试。由于部分地铁站在早晨7:00之前和晚上22:00 之后的客流量在15 分钟的单位时间内存在缺失或者为0 的情况,所以提取每个地铁站7:00~22:00 时间段内的,每15 分钟共计420 个数据样本作为数据集,其中240 个样本作为测试集,180 个样本作为训练集。对于机器学习算法而言,每组训练数据的输入长度为60,即包含每天7:00~22:00 时间段内的客流特征的数据集;将240 个数据生成180 组训练数组,每一组训练数据都输入模型中,经过180 次的训练之后,得到最终的模型。

为了比较不同机器学习算法的预测结果精度,使用比较经典的均方根误差(Root Mean Square Error,RMSE)、平均绝对误 差(Mean Absolute Error,MAE)、平均绝对百分误差(Mean Absolute Percentage Error,MAPE)以及决定系数(R2)等四个能够评价预测结果的指标,对所使用的机器学习算法的预测结果进行多角度综合评价。

3.2 不同算法的地铁客流量预测结果比较

为对比三个算法对于地铁客流量预测的结果,对比分析了四个评价指标,如表1所示。通过对比可以看出,随机森林算法能够更加准确地预测地铁站短时客流量;其次是支持向量机算法。对于支持向量机算法而言,除了无锡火车站之外,对于其他地铁站核函数为POLY 的算法预测准确度更高。受到数据数量的限制,长短时时间神经网络的预测结果并不理想。长短时神经网络中隐藏层较多,在针对较大数据量时,预测结果更加准确。

表1 不同算法的地铁客流量预测结果比较

另外,通过对比可以发现,对于无锡火车站、无锡东站等地铁站的预测决定系数较小,说明预测结果较差。这可能与地铁客流量本身的特征有关。

比如,在无锡东站由于地铁客流量波动较大,高峰时刻和非高峰时期的差距并不十分明显,所以预测结果较差。

通过上文的算法比较可以发现,随机森林算法的客流量预测误差较小。为了进一步验证该算法的可靠性,利用该算法预测两周的地铁客流量数据。以堰桥站为例,采用前四天的地铁客流数据作为训练样本进行模型训练,通过比较实际客流量与预测客流量可以发现,预测模型的RMSE 和MAE 分别为41.8097 和27.29。其MAPE 为30.87%,R2 为0.74。通过决定系数也可以发现,预测客流量与实际客流量的拟合度较高。这说明,基于随机森林的预测功能较强。

作为对比,采用前七天的地铁客流数据作为训练样本,对后七天的地铁客流数据进行预测,得到预测结果。通过比较实际客流量与预测客流量可以发现,预测模型的RMSE 和MAE 分别为42.70 和24.10,MAPE 为26.08%,R2 为0.74。通过与上文对比可以发现,采用较长客流量进行训练后,模型预测的MAE和MAPE 都减小,说明预测的误差有一定程度的降低。

3.3 不同时长地铁客流量预测比较

进一步以1 小时作为单位时间进行地铁站客流预测。通过上文的比较发现,随机森林算法具有一定的优越性,所以本章节采用随机森林对地铁小时客流量进行预测。堰桥站进站客流量预测,通过比较实际客流量和预测客流量可以发现,在工作日的时间段内,客流量预测较为准确,实际客流量和预测客流量相对误差较小;在周末时间内低峰期的预测误差较大。通过比较实际客流量与预测客流量,预测结果的RMSE和MAE 分别 为122.17 和92.52,MAPE 为28.89%,R2为0.80。

无锡火车站出站客流量预测结果,通过对比可以发现,单位小时的地铁站客流量预测误差很大。通过比较实际客流量与预测客流量,预测结果的RMSE 为400.64,MAE 为284.96,MAPE 为30.64%,R2 为0.05。

无锡东站进站客流量预测结果,通过对比可以发现,单位小时的地铁站客流量预测误差很大。通过比较实际客流量与预测客流量,其预测结果的RMSE 和MAE 分别为107.93 和79.89,MAPE 误差为24.27%,R2 为0.03。

太湖广场站进站客流量预测结果,通过比较实际客流量和预测客流量可以发现,由于太湖广场站的小时客流量在每天变化的规律性较强,所以模型的预测结果较好。

通过比较实际客流量与预测客流量,其预测结果的RMSE 和MAE 误差分别为52.26 和38.46,MAPE 误差为23.68%,R2 为0.51。

梅园开原寺站出站客流量预测结果,通过比较实际客流量和预测客流量可以发现,由于梅园开原寺站的小时客流量在周五晚高峰与其他时间的晚高峰相差较大,所以预测精度较低。通过比较可知,其预测结果的RMSE 和MAE 分别为181.89 和122.28,MAPE误差为38.73%,R2 为0.34。

4 结论

本文基于无锡地铁的实际客流大数据,基于客流的时间序列特征构建了多种机器学习算法的短时客流预测模型,并对比了不同机器学习算法预测结果的准确性和有效性,选取最优的地铁短时客流预测方法。

地铁的短时客流预测要求计算速度快,预测精度高。本文应用不同种类机器学习算法对地铁短时客流进行预测,选取了堰桥站、无锡火车站等五个典型地铁站的客流运营数据进行实例分析,通过对比多种机器学习算法的预测效果发现随机森林算法能够更加准确地预测地铁站短时客流量,其次是长短时时间序列算法。从5 个车站的预测结果对比中可以发现,不同机器学习算法均对无锡火车站的预测效果最差,主要原因是无锡火车站的客流波动性较强。

但由于城市轨道交通系统自身的复杂性,以及外界因素的影响,如地铁站周边的土地规划、天气因素、交通政策等,导致轨道交通客流具有一定的波动性;再加上在地铁短时客流预测方面的研究水平和研究时间有限,导致本文中存在着有待进一步研究的问题,具体包括:

一是本文以无锡地铁1 号线和2 号线的5 个地铁站为例,应用机器学习算法建立了地铁短时客流预测模型,但未考虑地铁3 号线这类新开通不久的线路,导致该模型对新建地铁站的客流预测不具有适用性。因此,如何考虑新开通/新建线路的客流时空变化特征,建立面向地铁新开通/新建线路的客流预测模型有待进一步的研究。

二是本文仅以典型工作日的客流量进行了地铁短时客流预测模型的构建,未考虑周末、节假日、天气(如下雨、台风等)等因素对地铁客流的影响,导致构建的地铁短时客流预测模型不适用于周末、节假日及异常天气。因此,如何将这些影响因素纳入考虑,建立地铁短时客流预测模型是值得研究的问题。

猜你喜欢
客流量客流无锡
客流增多
无锡一棉
基于数据挖掘的景区客流量预测模型研究
城市轨道交通节假日期间大客流行车组织思考与实践
无锡确定11月1日为“无锡企业家日”
基于系统动力学的城市轨道交通车站客流控制仿真与优化
地铁开,玩起来
轻轻松松聊汉语——去无锡
基于灰色预测理论在交通枢纽客流量的实际应用
基于灰色预测理论在交通枢纽客流量的实际应用