基于改进ICSO-LSTM方法的城市交通预测研究

2024-01-23 03:22陈暄
现代信息科技 2023年23期

摘  要:为进一步提高城市道路交通流量预测水平,降低城市拥堵度,提出一种基于改进鸡群算法优化长短期记憶神经网络的城市交通预测方法——Improved Chicken Swarm Optimization Long Short-Term Memory(ICSO-LSTM)。首先,针对鸡群算法存在收敛速度快、容易陷入局部最优的问题,从非线性递减的公鸡位置更新、加权的母鸡个体和自适应的跟随系数优化三个方面进行优化;其次,建立了ICSO优化LSTM网络参数的预测模型;最后,将ICSO-LSTM用于交通流量预测中,仿真实验表明,该方法在城市交通流量方面具有较好的预测效果。

关键词:鸡群算法;长短期记忆神经网络;城市交通预测

中图分类号:TP18;TP39  文献标识码:A  文章编号:2096-4706(2023)23-0151-06

Research on Urban Traffic Prediction Based on Improved ICSO-LSTM Method

CHEN Xuan

(Zhejiang Industry Polytechnic College, Shaoxing  312000, China)

Abstract: In order to further improve traffic flow prediction on urban roads and reduce urban congestion, an urban traffic prediction method based on an Improved Chicken Swarm Optimization Long Short-Term Memory(ICSO-LSTM). Firstly, the Chicken Swarm Optimization is optimized in three aspects, namely, nonlinear decreasing rooster position update, weighted hen individual and adaptive following coefficient optimization, to address the problem that the Chicken Swarm Optimization has a fast convergence rate and easily falls into local optimum; secondly, the prediction model of ICSO optimized LSTM network parameters is established; finally, ICSO-LSTM is used in traffic flow prediction, and simulation experiments show that the method has good predictive performance in urban traffic flow prediction.

Keywords: Chicken Swarm Optimization; Long Short-term Memory Network; urban transportation forecast

0  引  言

随着5G技术、云计算技术的不断发展,智能交通系统已经成为当前数字化治理城市交通的重要方法之一,如何构建合理、精确、有效的交通流预测模型是后续开展交通预测工作的重要保证。由于交通流量具有非线性、随机性等特点,导致早期采用的历史平均法[1]、卡尔曼滤波模型[2]和移动平均法[3]等方法已经无法适应当前城市交通预测。神经网络的出现能够为当前的交通流量预测提供一种有益的尝试。文献[4]提出了一种融合多特征的CNN-BiLSTM-AM组合模型,旨在提升模型在交通流量预测准确度上的表现,实验结果表明该模型具备准确预测交通流量的能力,各项误差指标均有明显下降。文献[5]建立基于时间特征的TSO-LSTM的预测模型;实验仿真结果表明该方法提出的交互预测方法在RMSE、MAPE和MAE等方面均有明显优势;文献[6]提出了一种堆叠长短期记忆(Long Short-term Memory, LSTM)神经网络来执行此任务,该方法以堆叠的结构增加神经网络的深度,从而提高预测的准确性,结果表明所提出方法优于常用的机器学习和经典的LSTM方法;文献[7]提出一种高精度基于深度学习的并行卷积神经网络交通流量大数据预测模型,实验结果表明其提出的模型在平均绝对误差、平均相对误差和均方根误差方面均优于所对比的方法;文献[8]提出了一种ARIMA与SVM的组合预测模型,仿真结果表明与单一预测模型的预测效果相比,该组合预测模型的精确性更高,可靠性更强;文献[9]提出了一种时空注意图卷积网络,结果表明STAGCN优于其他现有的方法;文献[10]提出一种交通车流量区间预测优化算法,即SSA-BP预测算法,实验说明算法具有良好的泛化能力,能够更好地反映交通流量的变化。

基于以上学者的研究成果,本文提出了一种基于改进的鸡群算法优化LSTM的预测方法,通过对鸡群算法的非线性递减的公鸡位置更新、加权的母鸡个体和自适应的跟随系数优化提高了算法性能,并将该算法用于优化LSTM网络参数,仿真结果表明该预测模型具有较好的预测效果。

1  基本知识

1.1  交通预测应用模型

目前有许多交通预测应用模型可用于预测交通流量、拥堵情况和出行时间等交通相关指标。常见的模型如下:1)基于时间序列的模型:这类模型使用历史交通数据来建立时间序列模型,如自回归移动平均模型(ARIMA)、季节性自回归移动平均模型(SARIMA)和指数平滑模型等。它们适用于对短期交通趋势进行预测,并能捕捉到一些周期性和季节性的变化。2)机器学习模型:包括回归模型、支持向量机(SVM)、随机森林(Random Forest)和神经网络等。这些模型可以从历史数据中学习交通模式和特征,并进行预测。机器学习模型通常能够处理更复杂的非线性关系,并具有较强的预测能力。3)深度学习模型:深度学习模型如循环神经网络(RNN)、长短期记忆网络(LSTM)和卷积神经网络(CNN)等在交通预测中表现出色。这些模型能够处理时间序列数据和空间特征,能够学习更复杂的交通模式,并具有较强的泛化能力。4)基于传感器数据的模型:这些模型使用交通传感器(如交通流量传感器、摄像头和地磁传感器)收集的实时数据进行交通预测。传感器数据可以提供更准确的实时信息,使得预测更具实时性和精确性。5)基于地理位置数据的模型:这些模型使用地理信息系统(GIS)数据、地理位置数据和地图数据等来预测交通状况。通过考虑到道路网络拓扑、路段属性和道路拥堵等因素,这类模型能够提供更准确的交通预测。

这些交通预测应用模型各有其特点,选用适合的模型取决于数据可用性、预测精度需求和实际应用场景。在实际使用中,通常会结合多种模型或方法来提高预测精度,并根据实际情况进行参数调优和模型优化。

1.2  鸡群算法

鸡群算法是一种模拟大自然中群体捕食的算法,它的核心思想是根据设定的等级和觅食方式将鸡群分为若干个子群,而在每一个子群中保留一只公鸡。由于设定的不同等级规则导致不同鸡子群之间形成了一种竞争关系。在鸡群算法中,我们将适应度值最优的个体视为公鸡,适应度值最差的个体为小鸡,适应度值适中的个体为母鸡。而母鸡具有选择任何一个子群的权利,并且母鸡和小鸡之间的关系并不是固定关系,更新后才会发生改变。因此,在每个子群中,群内个体围绕公鸡寻找食物。

设定鸡群的群体数量为N,空间维度为D,个体i在第j维中第t次迭代所在位置为 。公鸡、母鸡和小鸡的位置表示如下。

1.2.1  公鸡位置

公鸡是每一个子群中适应度值最好的,并且在子群中处于引领的位置,具体的位置更新为:

式(1)与式(2)中,Randn(0,σ2)表示均值为0,标准差为σ的正态分布,ε表示一个保证分母不为0的常数,fi和fk分别表示当前第i、k只公鸡的目标函数值。

1.2.2  母鸡的位置

母鸡是每一个子群中数量最多的个体,在觅食过程中,母鸡主要在公鸡附近搜寻食物,母鸡的位置更新公式如下:

在式(3)至式(5)中,Rand表示数值为0.5的随机数,而r1表示子群中的第i只母鸡所对应的公鸡个体,r2表示在整个鸡群中,任意选择的公鸡和母鸡的个体,且存在r1 ≠ r2关系。

小鸡的位置在每一个子群中,小鸡都会跟随在母鸡身边进行觅食,位置更新如下:

式(6)中,m表示在该子群中第i只小鸡对应的母鸡个体,而采用F表示跟随系数,用来说明小鸡跟随母鸡一起寻找食物的过程。

1.3  LSTM神经网络

长短期记忆神经网络(LSTM)是Hochreiter和Schmidhuber在1997年提出的一种新的神经网络模型,结构如图1所示,其本质是Rc-current Neural Network(RNN)神经网络的一种变体。RNN在时序预测方面取得不错效果,但是反向传播的梯度问题依然存在,而LSTM解决了这个问题,它能够缓解训练过程中出现的这种梯度消失现象,从总体来说更加适合用来处理交通流量数据。该模型的公式表达如下:

式中,xt表示该层输入的t时刻的数据,ht表示该层输入的t时刻的隐藏信息,ft表示遗忘门,it表示输入门,ot表示输出门,ct表示记忆细胞,W和U表示权值,b表示偏移量,σ和Tanh分别表示Sigmoid和Tanh激活函数。

2  基于改进的鸡群算法的交通流量预测模型

2.1  改进的鸡群算法

2.1.1  基于非线性递减的公鸡位置更新

在鸡群算法中,公鸡个体的位置非常重要,它决定着算法解的最优值的效果,但是从个体位置的更新中发现公鸡的位置缺乏及时的和全局的个体解进行对比,这样使得算法的局部解和全局解无法及时有效地进行平衡,为了改进这种情况,我们在公鸡位置的更新中引入了非线性学习因子公式:

在式(13)和式(14)中,t表示当前迭代次数,tmax表示最大迭代次数,wmax和wmin分别表示学习因子的最大值和最小值。W()表示学习因子,因此公鸡个体的位置更新为:

2.1.2  基于加权的母鸡个体

在鸡群算法中,每一个母鸡在子群的搜索空间中寻找适应度值最好的公鸡并向其靠拢,这样导致算法在迭代的过程中容易出现个体聚集而丧失了获得更多解的可能性,为了避免算法陷入局部最优,本文提出了基于加权思想的母鸡个体,该加权后的个体能够在整个鸡群中一起寻找整个种群最优个体的位置,从而能够帮助个体跳出局部最优,从而保障算法获得更好的解。加权的公式如下所示:

式(16)和式(17)中, 表示母鸡个体i在第t次迭代时候的位置, 表示母鸡个体i的适应度值, 表示在第t次迭代后的归一化的适应度值作为加权系数, 表示在第t次迭代时候母鸡群体中加权中心的位置,H表示母鸡个数。

2.1.3  基于自适应的跟随系数优化

从小鸡的位置更新的公式中发现,跟随系数是由人为设定的,其作用是保证在子群范围中小鸡跟随母鸡,由于小鸡个体的适应度值是最差的,因此如何提高小鸡个体位置更新就显得非常的重要。在小鸡位置更新的过程中,当跟随系数的数值结果较大的时候,就会造成算法在迭代后期产生较为严重的震荡现象,从而影响算法的运行速度,使得算法精度随着降低。反之,则会避免算法產生震荡,使得算法的求解精度逐步上升。从这里可以发现,跟随系数的设置关系到整个鸡群算法的性能,为了避免这种情况的发生,本文提出了一种自适应步长的思想,这种思想可以使得在算法初期,小鸡位置的变换比较小,借助较大的步长可以快速地向个体的局部最优值靠近,使得算法的收敛速度得到提升。随着算法的不断运行,自适应步长数值逐渐减少,这样能够保证小鸡在自身周围不断地进行优化处理,慢慢向着最优解靠拢。通过自适应思想的调节,一方面可以扩大搜索的范围,另一个方面提升了解的搜索精度,进一步提高了解的质量。跟随系数的变化公式为:

式(18)中,t表示当前迭代的次数,tmax表示设定的最大迭代次数, 和  分别表示个体i当前迭代过程中的适应度值最大值和最小值, 表示个体i的适应度值。

2.2  预测模型

通过对某一个路口的历史交通流量数据的学习,预测下一个阶段的交通流量。本文使用LSTM神经网络进行交通流量的预测,但是由于该神经网络的超参数的不确定性会影响预测精度,为了避免这种情况的发生,本文使用了改进的鸡群算法去优化隐含层中的神经元个数、学习速率等参数。具体流程如图2所示。

步骤1:数据预处理。将收集的数据按照神经网络预测特点分为训练集、验证集和测试集,并进行归一化处理。

步骤2:构建并行处理子模型。设置预测输入数据量为M,分别用前3个、前6个、前9个交通流数据对下一个阶段的交通流数据进行预测。

步骤3:算法种群初始化。将鸡群个体进行随机设置。

步骤4:模型求解。将LSTM的预测结果的均方根误差作为鸡群个体的适应度函数。

步骤5:算法更新。在鸡群算法中分别采用非线性递减的公鸡位置更新、加权的母鸡个体和自适应的跟随系数优化。

步骤6:判断是否达到最大迭代次数,如果没有达到最大迭代次数,则转步骤4,否则终止算法,输出最优值。

3  仿真实验

为了更好地说明本文算法的效果,本文首先采用国际公开的流量数据库作为理论测试来源,该数据库是美国加州某条公路2020年1月27日到2月25日的数据,时间间隔为5 min,将获得的实验设置按照8:1:1的比例分配给训练集、验证集和测试数据集合。其次,选择实际场景中的绍兴市区的山会大道和解放路的交叉口(如图3所示)作为研究对象,收集2023年6月1日至6月10日的车流量数据,时间间隔为10 min。本文选择CPU为酷睿I7,内存为8GDDR4,硬盘为1 TB容量,软件选择Windows 10系统,软件为MATLAB 2012。

3.1  评价标准

交通流量预测的效果主要依靠真实的实际值和方法产生的预测值的差值进行反映。目前,在交通流量预测中,主要采用MAE、RMSE和MAPE作为指标。公式分别为:

在以上公式中,Yi表示第i个交通流量数据的预测的数值,yi表示第i个交通流量数据的实际数值,N表示交通流量数据的数量。

3.2  改进后的鸡群算法性能分析

为了更好地展示改进后的鸡群算法的性能,本文采用ICSO和CSO分别优化小波神经网络(WNN)和LSTM,采用美国加州某公路作为数据进行交通流量预测,两种算法都采用统一的种群数量,设置迭代次数为100。图4显示了两种算法的适应度数值的变化。表1显示了在不同的数据流量下的两种算法预测指标的对比。

从图4中发现,两种算法随着迭代次数的逐渐增多,适应度值都呈现下降趋势,而本文算法的适应度值优于CSO算法,这说明经过优化后的算法具有较好的性能。表1的结果中发现,本文算法在WNN和LSTM方面都具有较好的预测效果,预测误差数值相比于CSO具有一定的优势,这说明本文算法具有较好的优势。但同时也发现WNN和LSTM存在超参数选择不合理而导致预测效果不佳的问题,虽然CSO对其分别进行了优化,但由于自身性能的问题,使得误差精度无法进一步提高,而ICSO算法通过非线性递减的公鸡位置更新、加权的母鸡个体和自适应的跟随系数优化等一系列措施,提高了算法的性能,使得误差精度明显降低。

3.3  基于ICSO-LSTM的模型预测效果分析

为了进一步验证本文提出的ICSO-LSTM预测性能,我们选择了支持向量机(SVM)、小波神经网络(WNN)、LSTM、ICSO-WNN、ICSO-LSTM作为对比算法,将绍兴市道路路口的车流量评价指标进行对比,如图5至图7所示。

从图中发现,ICSO-LSTM算法下的三种预测评价指标的数值都为最小值,相比于SVM和WNN具有明显的优势,相比于LSTM在M = 3和M = 9的RMSE数值结果几乎相等,而在MAE和MAPE具有明显的优势,说明了ICSO-LSTM算法具有较好的预测效果。

4  结  论

针对当前交通流量预测精度有待进一步提升的问题,提出了一种基于改进的鸡群算法优化长短期记忆神经网络的城市交通预测方法(ICSO-LSTM),与传统的WNN、LSTM 模型预测对比,该方法均具有较好的预测效果,进一步说明了该方法对于城市交通流量的预测具有一定的预测优势。

参考文献:

[1] JEFFERY D J,RUSSAM K,ROBERTSON D L. Electronic Route Guidance by AUTOGUIDE; The Research Background [J].Traffic Engineering and Control,1987,28(10):525-529.

[2] OKUTANI I,STEPHANEDES Y J. Dynamic prediction of traffic volume through Kalman filtering theory [J].Transportation Research Part B:Methodological,1984,18(1):1-11.

[3] 刘静,关伟.交通流预测方法综述 [J].公路交通科技,2004(3):82-85.

[4] 孙加新,惠飞,张凯望,等.基于CNN-BiLSTM-AM模型的交通流量预测 [J].计算机技术与发展,2023,33(2):32-37+43.

[5] 孙宝华,谢生曼,杨刚.一种基于时空特征的短时交通流量交互预测方法 [J].电子技术与软件工程,2022(24):229-233.

[6] 李楷,黄少伟.基于堆叠LSTM神经网络的短期交通流量预测 [J].肇庆学院学报,2022,43(5):79-84+89.

[7] 周思吉,钱真坤.基于深度学习的高精度交通流量大數据预测 [J].西南师范大学学报:自然科学版,2022,47(8):9-15.

[8] 陈昆,曲大义,贾彦峰,等.基于ARIMA-SVM模型的短时交通流量预测研究 [J].青岛理工大学学报,2022,43(5):104-109.

[9] 李志鹃.时空注意图卷积网络的交通流量预测研究 [J].智能计算机与应用,2022,12(11):253-257+261.

[10] 姚洁,邱劲.基于SSA-BP算法的道路交通流量预测研究 [J].西南大学学报:自然科学版,2022,44(10):193-201.

作者简介:陈暄(1979.03—),男,汉族,安徽祁门人,教师,副教授,硕士,研究方向:数字技术赋能、智能交通。

收稿日期:2023-07-03

基金项目:绍兴市哲学社会科学研究“十四五”规划2023年度重点课题——基地智库专项课题(145J069)