基于大数据的轨道站点客流预测模型研究

2020-06-11 08:12任望刘文斌
中国科技纵横 2020年3期
关键词:预测模型轨道交通大数据

任望 刘文斌

摘  要:随着大数据、云计算的不断进步以及中国公共交通的逐步发展,大众迫切需要智能公共交通。通过分析和研究大量的公共交通数据,在数据中挖掘重要信息可以帮助交通管理部门及时调整工作,并帮助乘客选择正确的旅行时间和路线。在促进智慧城市的发展和建设中发挥着重要作用。当前在交通运输部门对数据挖掘的研究主要集中在传统技术的应用上,缺乏提高数据挖掘效率的研究。本文基于轨道交通客流的特征,提出了针对轨道交通站点的数据研究框架,并建立了预测基本数据的一般过程,创建轨道交通旅客运输流量直接预测模型。

关键词:大数据;轨道交通;客流预测;预测模型

中图分类号:TP39  文献标识码:A    文章编号:1671-2064(2020)03-0000-00

在互联网+城市轨道交通蓬勃发展的背景下,城市轨道交通进入了智能时代。得益于智能售票系统,自动轨道车辆控制系统和基于智能的视频收集系统的进一步发展,轨道交通信息可以得到更准确,更全面的记录。轨道交通数据已成为有效城市轨道交通运营状况和特征的重要资源,是轨道交通管理部门决策的关键依据。尤其是对客运量的短期预测对轨道交通的合理发展和动态监测具有重要意义,这是协调管理轨道交通运输能力的重要基准。对客流的准确预测可以有效减少并避免由于短时间内客流增加而导致的车站事故。本文根据城市轨道交通站点客流特征对车站的类型进行了分类。在此基础上提出了针对轨道交通站点的数据研究框架,并建立了预测基本数据的一般过程,创建轨道交通旅客运输流量直接预测模型,旨在有效应对轨道交通站点客运量变化并避免突发性安全事件[1]。

1轨道交通站点客流数据研究思路

这项研究包括两部分数据需求:(1)统计数据:对轨道交通站点交通卡刷卡数据进行统计生成的数据,用于收集站点现有客流的统计信息,以获取预测站点客运量模型中的基本数据。(2)收集性数据:针对土地利用,运输路线、换乘着三个方面使用开放数据源获取重要的数据属性,以确保轨道站流量预测模型中的基本数据来源。将统计数据导入数据库进行数据预处理,并根据时间序列的生成进行统计分析。根据选择轨道站的客流的时间特性分析客流画像。基于对客流特征指标的鉴别分析对站点类型进行逐级识别,将所获得的站点客流指标引入训练集中,以进行后续轨道站的客流数据回归分析以及客流预测模型。为了收集和处理收集的数据,根据数据的维度特性和研究需求选择关键指标,并使用数据爬取技术获得关键指标,进行预处理。将用于回归分析训练的关键指标放置在回归分析训练集中,并将客流预测关键指标输入回归分析预测集中以收集和处理收集的数据。

2 基于大数据的轨道交通站点客流预测模型

传统上,轨道交通站点客流预测通常从城市轨道交通线网出发,在客流初始预测中应采用“四步法”。但“四步法”需要大量的人力物力进行研究和基础数据的收集,从初步调查到预测客运量的结果需要相当长的时间、经济和时间成本较高。而且客运量预测主要用于轨道交通站点的初步评价和管理。对于部分开通的线路,无法预测新线开通后全网客运量的变化。本文以轨道交通站点(至少一年)为研究对象,从数据挖掘的角度出发,針对投资新建线路(车站)后的整个线路网的直接客流预测模型进行研究。

由于客流进出站位置和时间涉及不同部门之间的利益,因此可以准确、详细地统计运输中的客流数据。网络信息平台、数据爬取技术的发展提供了大量开放数据,此外,由于需要对客流进行及时、快速的预测,通过数据挖掘建立了中尺度的客流预测模型,成为交通运输业客运量预测发展的新方向。

在轨道交通运输方面,新线路的开通运营对整个站点客流的影响包括以下两个方面:

(1)新开通的线路站增加客流量:新开通的线路站增加了客流,站点服务覆盖范围也会增加,总客流也就不可避免地增加了。由于轨道交通的出现,新车站附近的人将从原来的交通方式转移到轨道交通。同时,新车站周围的公共服务也将吸引线网上的其他乘客。

(2)来自原有车站的客流:新车站连接到现有的交通网络,因此使用原有线路完成旅行的人将拥有更多不同的旅行线路选择。由于新开放的车站周围的公共服务具有吸引力,一些人可能会放弃原来的旅行目的地车站,而转而使用新的车站来实现旅行的目的。例如,新车站开放后,车站建造了一个更大,更完善的商业购物中心,人们就会选择新站点完成购物过程,导致原有车站客流转移。此外,车站数量的增加会在多个车站的影响下导致客流腹地的增加,交通换乘条件对人们的出行选择产生更大的影响。

在这种情况下,本文将轨道站点作为研究对象,从轨道交通客流图和轨道交通站点的特征中收集数据,并重点解决在新增轨道交通线路的背景下预测整个轨道站客流的问题,包括:预测车站总客流;预测车站客流波动[2]。

3 基于大数据的轨道交通站点客流预测模型构建思路

从模型基本假设出发,考虑到本文的模型以回归分析为基本分析方法,因此在构建模型前应对模型自变量与应变量进行相关性分析,对相关性过低的自变量进行调整或去除,以保障模型的有效性。在这一前提下,考虑从数量角度(站点客流总量)与形态特征角度(站点客流波动指标)两方面进行站点客流的模型构建。

3.1客运总量预测模型

可以通过以下两种方法来分析轨道站客运流量的变化:

(1)客运总量的变化趋势:多项研究表明,考虑到轨道交通运输的建设和城市的经济发展,随着时间的推移,轨道交通的总体客运量呈现一定的上升趋势。对于这种随着城市发展而进行的总量增长的预测,确定增长率是最常用的预测方法之一。本文涉及的增长率方法,构建了以时间和季节作为表征总体客流趋势的自变量的线性回归模型。同时,季节因素也对车站客流产生重大影响,部分轨道交通车站的季节变化明显,为减少季节因素对车站客流预测的干扰,本文采用月度数据作为训练数据集。即预测目标月份的客流数据,基于与每月数据相对应的训练数据来校准模型参数。

(2)客流分布变化:即由于土地使用的改善,交通条件的变化以及通用线路网络中车站拓扑条件的调整,车站客流量发生了一些变化,即客运流量在站点上的分布发生了变化。为了描述这种变化,本文构建了相应的线性回归模型,以实现每个站点总客流量的预测。最后,为了全面考虑这两种趋势,本文使用模型的组合来完成最终模型的构建,以预测站点客流。

3.2车站客流波动特征预测模型

通常通过对现有客运量的统计分析来获得站点客流波动的特征,如果使用线性回归假设来构建模型,则该模型通常无效,并且预测效果不佳。因此,在这项工作中,非线性回归被用作预测车站客流波动特征的主要方式,进而建立相应的模型。

本文中轨道站客流直接预测模型的构建可以分为三个部分:

(1)建立基本的回归模型:在回归假设的基础上,建立现场总客流量的线性回归模型和现场波动特征的非线性回归模型;

(2)客流增长率模型构建:建立现场客流增长率模型;

(3)模型的最终构建:通过将基本回归模型和客流增长率模型相结合,构建总客流模型和站点波动特征模型。

4基于大数据的轨道站客流预测模型的构建

4.1直接预测车站总客运量的模型

针对轨道交通中的客流,考虑到车站的多维变化,季节性差异,车站总客流主要取决于两个方面:

(1) 场地周围多维因素的变化。本文假定大多数多维因素服从线性相关,并且不存在多重共线性问题[3]。根据相关性分析,由于与限制相对应的每个自变量与因变量都具有线性相关性,因此考虑到未知因素对“总客流量”的其他影响,由于存在回归系数实现第j个自变量和因变量之间的拟合,通过截距使该模型的配置与实际逻辑条件一致,可得用于确定站点总客流量的主要模型如下:

由于各城市居民出行特征的差异以及城市规划和建设的差异,一些自变量会偏离线性相关或具有多重共线性,导致此类自变量的回归系数为零。

(2)軌道站客流总趋势的变化,城市人口的增长导致铁路客运量的增加表明客运总趋势可以用增长率法来表征,并使用年均GDP增长率作为增长因子,同时设置适当的校正参数以提高模型的准确性。因此,总旅客流量的预测模型如下:

4.2 客流总量预测效果评价

对于广州地铁5、13号线的61个车站,由于使用不同的tr值,将车站的总客运量预测值与实际值误差考虑在内,边际误差值为20%时该模型的预测效果最佳,对车站的总客流预测更为合理;由于预测值与计算值之间存在显着相关性(相关系数0.829),可以假设在基于计算值进行模型评估的条件下,大多数轨道站的总客流预测是比较理想的。

5结语

综上所述,本文结合大数据背景下的数据分析和研究方法,对轨道车站客流进行了研究,基于车站总客流和车站客流波动性质两个方面,在多元线性回归分析的基础上进行了直接预测建模。以广州轨道交通为模型进行分析和预测的主要对象,基于该预测模型的适用性,采用多元线性回归模型对车站客流波动的性质进行了预测,效果比较理想。

参考文献

[1]谢英豪,江志彬,徐瑞华.城市轨道交通断面客流数据可视化分析及优化[J].城市轨道交通研究,2017(1):78-83

[2]王啸君.基于大数据分析的客流走廊判别方法研究[J].城市道桥与防洪,2018(1):134-136.

[3]李伟,周峰,朱炜.轨道交通网络客流大数据可视化研究[J].中国铁路,2015(2):106-110.

收稿日期:2020-01-11

作者简介:任望(1985—),男,山西忻州人,本科,工程师,研究方向:轨道交通运输行车组织。

猜你喜欢
预测模型轨道交通大数据
轨道交通产品CE认证论述
高速轨道交通发展趋势
基于神经网络的北京市房价预测研究
基于CAN的冗余控制及其在轨道交通门禁环网中的应用
城市轨道交通联调探讨