融合多因素的短时交通流预测研究

2022-11-16 02:25王庆荣田可可朱昌锋魏怡萌
计算机工程与应用 2022年21期
关键词:交通流量交通流神经网络

王庆荣,田可可,朱昌锋,魏怡萌

1.兰州交通大学 电子与信息工程学院,兰州 730070

2.兰州交通大学 交通运输学院,兰州 730070

随着社会经济的发展及人们生活水平的日益提高,交通拥堵、环境污染和能源消耗等问题也随之而来。实时、可靠的交通流预测可为出行人员提供道路拥堵状况,以便其选择合适的出行路线,从而减少出行延误,最大限度地利用交通资源,提高城市交通的智能化水平[1-3]。

近年来国内外学者利用各学科领域的方法对短时交通流预测进行研究,传统的短时交通流研究方法有卡尔曼滤波模型、历史平均模型、时间序列模型、非参数回归模型、混沌理论模型等。交通流由于受多种外部因素的影响,交通流数据具有随机性和不确定性,传统的模型普遍存在实时性差、预测精度不高的问题。随着研究的深入,学者们相继提出组合模型的预测,将两种模型的优点结合来提高短时交通流的预测准确率。罗文慧等[4]结合卷积神经网络与支持向量回归分类器的特点,提出一种组合预测模型并提高了准确率,但该模型未充分考虑外部因素对交通流预测的影响。Zhang等[5]考虑了传感器的选择,结合混沌理论和模拟退火算法对交通流量进行预测,模型优化了相关向量机的核心参数,却没有考虑交通流数据的随机性。白伟华等[6]通过异常值识别扩展了卡尔曼滤波,使其能对噪声进行识别和过滤,但其对交通流特征挖掘不充分。Qian等[7]采用相空间重构方法对采集的交通数据进行处理,虽用遗传算法优化了初始参数,但不同遗传操作参数的设置对优化效果的影响不同。以上几种模型虽提高了预测精度,但由于传统模型固有的缺陷,仍不能满足短时交通流预测的需求,而LSTM的提出解决了这一难题。LSTM在特征提取时具有强大的鲁棒性和灵活性,LSTM不仅能提取交通流的时序特征,还能将随机外部因素纳入考虑。Lu等[8]综合了LSTM 和自回归积分滑动平均模型(autoregressive integrated moving average model,ARIMA)模型的优点对短时流量进行预测,该方法继承了LSTM在非线性拟合和时间序列分析方面的优点。李彤伟等[9]结合路网交通时空分析对交通流数据进行预测,虽然取得了较好的预测效果,但其对输入数据的质量有较高的要求。Zhao 等[10]提出了一种基于深层LSTM 递归神经网络和线性回归模型的TM预测方法,但未考虑交通流数据处理对预测结果的影响。Wang等[11]提出一种深度双向长短时记忆网络模型,在交通流时空特征提取上有独特优势,却忽略了相邻路段交通流的影响。吕鲜等[12]利用去噪自编码提取交通数据核心特征对LSTM 预测模型进行改进,使得模型在部分数据缺失和错误的情况下仍然具备良好的鲁棒性,但需要消耗巨大的计算资源。桂智明等[13]引入了注意力机制,虽提高了交通流的预测精度,但考虑的因素单一。

综上所述,目前出现的短时交通流预测算法大都考虑常态下的对短时交通流的预测,并没有考虑天气、节假日等外部因素对预测结果的影响。如恶劣的天气会影响人们的出行规律,从而改变交通流的分布特性;节假日会迎来出行高峰,给城市道路交通带来了压力。因此,本文结合天气、节假日等因素对交通流特性进行分析,选择长短时记忆网络(LSTM)并引入注意力机制对短时交通流进行预测。

1 相关理论

1.1 循环神经网络

循环神经网络(recurrent neural network,RNN)不同于前馈式的神经网络,其引入了定向循环机制。RNN可随着时间的变化动态地调整自身的网络状态不断进行循环传递,并且RNN 还可接受广泛的序列信息结构作为输入。RNN的记忆功能使其能够对序列数据进行建模,但循环神经网络模型的基本结构过于简单,随着循环神经网络模型规模的增大,对序列数据的记忆能力就会逐渐下降,当序列信号在网络中经过多次传递后,会使网络丧失连接先前信息的能力,从而引起梯度消失或梯度爆炸,RNN的梯度消失原理如图1所示。

为了保存长期序列信息,减少随着时间传播而衰减的信息,Hochreiter在1997年提出了LSTM神经网络。

1.2 长短时记忆网络

长短时记忆网络引入了门控机制来控制信息传递的路径,门的作用是允许LSTM的记忆单元长时间存储和访问序列信息,从而减少梯度消失问题[14-15]。输入门保持关闭(即激活函数接近0),则新的输入不会进入网络,网络中的记忆单元会一直保持开始的激活状态。通过对输入门的开关控制,可以控制循环神经网络模型什么时候接受新的数据、什么时候拒绝新的数据接入,于是梯度信息就随着时间的传递而被保留下来,LSTM的储存单元架构如图2所示。

输入门(input gate)决定哪些新输入的信息允许被更新,或者被保存到记忆单元中。遗忘门(forget gate)用于控制记忆单元是否记住或丢弃之前的状态。输出门(output gate)决定记忆单元中哪些信息允许被输出。LSTM单个神经元在t时刻的计算如下:

式中,ct为t时刻记忆细胞的更新状态;it、ft、ot、ct、ht分别表示在t时刻的输入门、遗忘门、输出门、记忆细胞以及隐层的输出;xt为t时刻的输入;ht-1、ct-1分别表示隐层及记忆细胞在t-1 时刻的输出;wxc、whc、wxi、whi、wci、wxf、whf、wcf、wxo、who、wco为权重参数;bc、bi、bf、bo为偏置参数;σ(· )及tanh(· )为激活函数;“∘”为两个向量的乘积。

1.3 注意力机制

注意力机制是最初由Treisman等提出的,通过模拟人脑注意力的特点,以概率分布的思想捕捉关键信息,注意力机制能够专注于局部信息,对一些不必要的信息忽略不计[16-17]。本文考虑到交通流量会受到天气、节假日等各种外部因素的影响,这些外部因素对预测时交通流量的影响程度不同,因此本文引入注意力机制层来自动捕获不同输入特征,以概率分布的思想对重要的信息分布足够的权重,以此来提升交通流的预测精度。本文所采用的注意力机制的计算公式为:

式中,et表示t时刻由输出向量ht所决定的注意力概率分布值;αt为t时刻的权重系数;Qt表示输出值;we和be为权重和偏置。

2 融合多因素的短时交通流预测模型

2.1 交通流特性分析

交通流数据具有一定的时变性、非线性及周期稳定性,在实际环境中,交通流由于受到各种外部因素的影响,会导致实验所采集到的交通流数据不准确。通过分析交通流的数据特点,有助于模型的进一步确定。总结以往的实验分析,交通流数据具有以下特点。

(1)交通流数据具有周期性。交通流数据具有一定的规律,周一至周五期间,交通流有明显的上下班高峰,相比较于周六、周日交通流波动较大,周六、周日的交通流状态则较平缓。

(2)交通流数据具有时空特性。当前t时刻的交通流不仅受前一段时间交通流量的影响,还受当前时刻不同路段交通流量的影响。

(3)交通流数据受天气因素的影响。交通流数据具有复杂的特性,交通流量也受到多种外部因素的影响。天气因素影响着人们的出行率,暴雨、暴雪、暴风、冰雹、沙尘暴及大雾等恶劣天气期间,道路情况不确定,路面由于恶劣天气可能造成湿滑、结冰、能见度降低等,这时交通流量会骤减;中雨、中雪的情况下,一些人会选择推迟行程,这种情况会影响一部分交通流量;小雨、小雪对交通流量的影响较小。本文将这些外部因素划分为不同的等级严重、重度、轻度、无影响,根据天气状况将天气状态量化如下:

(4)在节假日期间,交通流数据具有明显的波动。节假日会迎来出行的高峰期,很多人选择在节假日期间外出旅行及回家探亲,此时会造成交通流量急剧增加,本文将分为工作日及节假日。将所有外部因素特征进行定量转换以作为模型的输入,根据是否为节假日将节假日状态量化如下:

2.2 数据集的构造

由于交通流的变化受天气、节假日等外部因素的影响,呈现随机性。因此,本文融合外部因素对短时交通流进行预测。

首先,将采集到的原始数据(交通流数据和天气数据)进行预处理,包括数据缺失值的补全、去噪、标准化。将预处理后的数据构造数据集,作为训练模型的输入,模型的参数设置如表1所示。

表1 参数设置Table 1 Parameter settings

模型的输入样本训练集记为xt,交通流数据集记为a,天气数据集记为w,是否为节假日记为h,则xt表示为:

式中,w表示不同天气状态下的数据,1 表示严重,2 表示重度,3 表示轻度,4 表示无影响,h表示是否为节假日,0表示为工作日,1表示为节假日。

2.3 交通流数据空间特征的提取

假设随机选取一块路段进行预测,已知该路段设有S个地感线圈监测点,其中每个监测点收集了连续T个时刻的交通流数据,那么xts则表示第s个监测点在t时刻的交通流量,将原始一维的交通流数据转化为二维的交通流量矩阵记为F,则有F=(xt1,xt2,…,xts),那么S个监测点T个时刻的交通流量输入矩阵为:

利用卷积神经网络(CNN)根据历史数据提取交通流的空间特性,本文采用2层的卷积神经网络。使用卷积层来提取交通流数据的局部特征,为了保留交通流原始数据的真实性,本文仅用CNN的卷积层对数据进行特征提取,不用池化层压缩数据,卷积核的大小设置为3。

2.4 结合注意力机制的短时交通流预测

根据交通流数据的特点结合天气、节假日等外部因素的影响,本文提出一种融合多因素的短时交通流预测模型(attention-based CNN-LSTM,CLA)。如图3所示,CLA 模型具有四层结构。第一层利用卷积神经网络(CNN)提取交通流的空间特性;第二层利用长短时记忆网络(LSTM)提取交通流的时间特性;第三层将提取的时空特性结合外部因素引入注意力机制;第四层综合交通流量的特性分析,使用全连接层进行预测。

利用CNN 提取交通流的空间特性,利用长短时记忆网络(LSTM)提取交通流的时间特性,分别设置LSTM的输入张量维度及输出张量维度,模型的隐含层分别添加dropout 约束,使得部分神经元在传递过程中暂时失活,以避免过拟合。

式中,wq、bq分别为权重和偏置。

本文使用Python 语言在tensorflow 和Keras 构建模型,基于融合多因素的短时交通流预测模型的流程图如图4所示。

3 实验结果与分析

3.1 实验数据

3.1.1 交通流数据

为了验证本文所提出方法的有效性,采用加拿大Whitemud Drive 高速公路开放数据进行实例分析。Whitemud Drive 是一条横穿加拿大阿尔伯塔省埃德蒙顿市的市内高速公路,全长28 km,路网结构如图5 所示,Whitemud Drive 在主干道和闸道上装有地感线圈,数据的记录频率为20 s/次,记录长度为24 h,用于观测车流量、车速以及车辆密度。向东方向的地感线圈的分布如图6,向西方向的地感线圈的分布如图7,可以看到相关地感线圈的对应标号,文件命名方式为“标号-月-日”,可以对应查找相关数据。该数据集记录了Whitemud Drive 从2015 年8 月5 日至2015 年8 月28 日总计24 天的交通流量,本文以2015 年8 月24 日至2015 年8月28 日的数据作为测试集,剩余所有数据作为训练集进行验证。

3.1.2 天气数据

阿尔伯塔(Alberta)坐落于加拿大西部,这里四季分明,埃德蒙顿(Edmonton)位于阿尔伯塔省的地理中心。根据气象局从1971年至2000年对加拿大主要城市天气的调查,阿尔伯塔省为全年阳光最充足的省份。首府Edmonton 向北而上就是杨木森林和草原地带,最北部为植被丰富的森林区,气候深受大陆性北极气候影响,有时因洛基山暖流而趋于温和,夏季温度较高。本文选取的天气数据来源于埃德蒙顿城市气象观测中心,数据记录了每日气温、天气状况、降雨量、降雪量、风速等。

3.2 评价指标

本文选取均方根误差(RMSE)、平均绝对误差(MAE)及平均绝对百分比误差(MAPE)作为评价指标来评价预测结果的性能,RMSE、MAE、MAPE的定义分别如下:

式中,y^i为交通流量的预测值,yi为交通流量的真实值,N为预测值的个数。当预测值与真实值完全吻合时,RMSE、MAE、MAPE 的值为0,称之为完美模型,RMSE、MAE、MAPE的值越大,表示预测值与真实值的误差越大。

3.3 实例仿真与分析

本文以2015年8月5日至2015年8月23日(00:00—24:00)的数据作为训练集,将采集到的原始数据处理形成采样间隔为5 min 的交通流数据,处理后的数据每天有288 条记录,训练集共有5 472 条数据。以2015 年8月24日至2015年8月28日(00:00—24:00)的数据作为测试集,测试集共有1 440条数据。

3.3.1 结果预测

本文选取了2015年8月27日一整天的交通流数据来验证模型的预测效率,预测结果如图8所示。由图中的预测结果可以看出,预测值随真实值的变化而上下波动,预测曲线变化趋势稳定,模型的准确率最高能达到94.42%,具有较好的预测效果。

3.3.2 Dropout参数设置对预测结果的影响

在训练模型中,如果模型具有很多参数,但训练样本数据又较少,则训练出的模型很容易出现过拟合。过拟合主要表现在模型在训练数据上损失函数较小,具有较高的预测准确率,但是在测试数据上损失函数比较大,预测准确率较低。添加dropout 约束可以在前向传播的时候,让某个神经元的激活值以一定的概率停止工作,使其不会太依赖某些局部的特征,增强模型的泛化能力。为了对比不同dropout参数设置对预测结果的影响,实验采用不同的dropout值进行对比分析。

如表2所示,与添加dropout约束相比不添加dropout约束的RMSE、MAE、MAPE 误差值相对较高。经实验对比当dropout的值取0.5时具有较好的预测效果。

表2 不同dropout对预测结果的影响Table 2 Impact of different dropout on prediction results

3.3.3 传统模型预测结果对比分析

短时交通流预测由于预测时间间隔的增大会导致模型的预测性能变差。为了评估本文所提出的CLA模型的预测准确度,统一采用预测时间间隔为5 min,对交通流量进行预测。通过与门控循环单元(GRU)模型、支持向量回归(SVR)模型、卷积神经网络(CNN)模型以及长短时记忆网络(LSTM)进行对比分析,选取均方根误差(RMSE)、平均绝对误差(MAE)及平均绝对百分比误差(MAPE)作为评价指标来评价预测结果的性能。

如表3 所示CLA 模型的RMSE、MAE 以及MAPE的值相比较于GRU、SVR、CNN、LSTM 较小,在统一的时间间隔上,CLA模型预测效果最佳。与传统模型中预测效果较好的LSTM 模型相比,CLA 模型在RMSE、MAE、MAPE分别降低了0.98、1.71以及1.53个百分点,通过实验验证本文所提出的CLA模型误差最小。

表3 传统模型的交通流预测误差对比Table 3 Comparison of traffic flow prediction errors of traditional model

3.3.4 变体模型预测结果对比分析

为了更直观地看出本文所提出的CLA模型的预测效果,实验选取了未引入注意力机制的CLA-ATTN模型及未引入多因素的CLA-MFACTOR模型进行对比。实验结果如图9所示,从图中可以看出CLA模型的预测结果最接近于真实值,相比较于单一的CLA-ATTN模型及CLA-MFACTOR 模型,本文所提出的CLA 模型具有较好的预测效果。

如表4所示CLA-MFACTOR的预测效果相对较差,交通流数据由于受到多种外部因素的影响而呈现随机性变化,例如恶劣的天气环境会打乱人们的出行计划,导致路段的交通流量减少,因此未融入多因素的CLAMFACTOR 模型预测效果表现也不是很好。本文所提出的CLA 模型预测效果要优于CLA-ATTN 和CLAMFACTOR 模型,CLA 模型相比较于最好的基准模型CLA-ATTN 模型在RMSE、MAE、MAPE 分别降低了1.17、2.1 以及4.39 个百分点,通过实验验证本文所提出的CLA模型误差最小。

表4 变体模型的交通流预测误差对比Table 4 Comparison of traffic flow prediction errors based on variant models

4 结论

本文使用公开的交通数据集,融合多种外部因素并引入注意力机制,对每个影响交通流量的潜在因素或特征的重要程度进行区分,并与传统及变体模型的预测结果进行对比,发现本文所提出的模型与传统模型相比具有较好的预测效果,与CLA-ATTN、CLA-MFACTOR 相比,平均绝对百分比误差分别减少了4.39、0.98 个百分点,经实验验证本文提出的融合多因素的短时交通流预测模型相比于传统模型、未引入注意力机制的CLAATTN 模型及未引入多因素的CLA-MFACTOR 模型具有较好的预测效果。交通流是一个结构复杂的非线性系统,传统模型由于只能概括交通流系统的部分特性,因此其预测精度有限。虽然本文所提出的模型提高了预测准确率,但模型在引入注意力机制分配权重时,需要计算每一个输入特征的权重,会消耗大量的计算资源,未来的研究工作中应进一步考虑这些因素以提高交通流的预测效率。

猜你喜欢
交通流量交通流神经网络
基于LSTM的沪渝高速公路短时交通流预测研究
京德高速交通流时空特性数字孪生系统
基于神经网络的船舶电力系统故障诊断方法
基于简单递归单元网络的高速公路交通流量预测
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
基于ANFIS混合模型的短时交通流预测①
基于神经网络的中小学生情感分析
燕山路与曹雪芹西道交叉口运行有轨电车可行性研究
交通流量增长下的空管安全预警系统研究