面向高速公路流量预测的自适应时空图卷积循环神经网络

2023-09-06 05:24阮鸿柱王金宝杜梦辉
软件工程 2023年9期
关键词:智能交通

阮鸿柱 王金宝 杜梦辉

关键词:智能交通;流量预测;自适应图卷积网络;时空相关性

中图分类号:TP391.4 文献标志码:A

0 引言(Introduction)

准确的高速公路流量预测对提升智能交通系统的安全性、稳定性和效率至关重要。受多种复杂因素的影响,例如道路拓扑结构、可见度、降水量等,交通数据中存在复杂的时空相关性[1-3]。基于图卷积神经网络的深度学习方法可以建模交通数据中的动态时空相关性,但是这些方法需要根据距离等特征预先定义邻接关系图建模空间相关性[4-8]。本文通过对桂林市路网数据集中的流量数据进行分析发现,根据有限先验知识构建的邻接关系图难以反映完整的空间相关性[9-10]。基于此,本文基于数据驱动的方式生成自适应邻接矩阵,在此基础上设计了一个自适应图卷积网络,以便更全面地捕获交通数据中的空间相关性。

为更好地捕获具有较大时间跨度的交通数据间的依赖性,采用门控循环单元建模时间相关性,将其与自适应图卷积网络整合成具有编码器-解码器结构的自适应时空图卷积循环神经网络(ASTGCRN)实现准确地预测多时间步流量。

1 流量数据特性分析(Analysis of flow datafeatures)

高速公路网承载各种交通工具的运行,其流量的变化与人们的生活出行紧密相关,表现出一定的时空分布规律,分析这种规律是对交通流量进行有效预测的前提与基础。本文对桂林高速公路网的流量变化做以下分析:(1)相邻节点流量变化趋势相近,但数据尺度可能会有差异。如图1所示,“粟家6-灵川西3”和“马面立交2-桂林南3”断面在邻接图中具有邻接关系,它们的断面流量分布的整体趋势相近,但平均值与峰值水平相差较大。在很多工作中,研究对象选取的是普通的城区道路,采样点的密度很大,并且采样点之间的距离很短,所以相邻的节点流量数值相近、变化更平缓;但是,本文选取的高速公路的断面总是伴随互通与收费站出现,采样点之间的距离相隔较远且稀疏,流量变化与节点所处地段密切相关,所以流量变化会随着总车流量的整体变化而表现出趋势上的相似性,但也会因进出高速车流量的不同,导致不同采样点在数据尺度上存在差异性。(2)路网中距离相隔较远的两个节点也可能表现出较强的相关性。如图1中“粟家6-灵川西3”与“兴桂路起点1-兴安城南5”断面虽然没有邻接关系,但是都处于同一方向的高速路线上,其流量变化也表现出相似的趋势。由于先验知识有限,因此根据距离等特征预先定义邻接关系图难以捕获交通数据中完整的空间相关性。

为解决以上问题,本文使用自适应图卷积网络学习路网交通数据中的空间相关性,将其与门控循环单元整合,用于学习交通数据中复杂的时空相关性,进而实现准确的流量预测。

2 自适应时空图卷积循环神经网络(Adaptivespatio-temporal graph convolutional recurrentneural network)

本文提出面向高速公路流量预测的自适应时空图卷积循环神经网络,如图2所示。以多个时间步的图信号矩阵为输入,利用自适应图卷积捕获路网交通数据中的空间相关性,利用门控循环单元捕获数据中的时间相关性,将编码后的节点嵌入表示输入门控循环单元构成的解码器,预测多个时间步的交通流量。

2.2 自适应图卷积网络

图卷积网络(Graph Convolutional Network, GCN)是一种用于处理非欧式结构数据的神经网络。现实中的高速公路路网是不规则的,可以视作非欧式结构,并且可以使用图卷积网络处理高速公路路网数据,捕获不同检测点交通数据的空间相关性,提升交通数据预测的精度。图卷积运算可以用一阶切比雪夫多项式展开实现很好的逼近,并且可以推广到高维图卷积:

2.4 模型训练

模型训练的损失函数使用均方误差函数,优化算法选用Adam算法,Adam算法是一种基于动量思想的自适应随机梯度下降算法,在迭代前计算梯度的两阶動量并计算滑动平均值,并用于更新参数。

3 实验与结果(Experiments and results)

实验使用桂林市路网区域的交通数据,共有36个节点,从2022年1月1日到2月28日共59天,以1 h为单位聚合每个节点的流量。按6∶2∶2的比例划分训练集、验证集和测试集,使用训练集的均值和标准差对所有数据进行归一化,输入时间步Th 设置为8,预测时间步Tp 设置为8。

3.1 评价指标

为验证本文提出模型的预测性能,研究人员选取了回归任务常使用的平均绝对误差(Mean Absolute Error, MAE)、均方根误差(Root Mean Squared Error, RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)。

3.2 基准线模型

选取以下基准线模型与本文提出的模型进行对比:(1)HA:历史平均模型,即对每一个节点都以前Th 个时间步流量的平均值作为下一时间步的预测值;(2)GCN[11]:标准图卷积神经网络,使用谱域中对角化的线性算子替代经典卷积算子实现卷积操作;(3)RNN[12]:循环神经网络,能很好地挖掘数据中的时序信息与语义信息,这里使用门控循环单元(GRU)作为编码器和解码器;(4)GMAN[4]:图多注意网络,借助自注意力机制实现了空间与时间维度的注意力模块,多个时空注意力模块堆叠组成编码器与解码器;(5)AGCRN[10]:自适应图卷积循环神经网络,使用数据自适应图和自适应图卷积循环神经网络模块,为每个节点都学习了一个特定的参数空间,挖掘流量序列中不同的模式。

3.3 参数设置

模型扩散图卷积的扩散维度设置为2,自适应图卷积模块的嵌入维度设置为10,堆叠的图卷积模块数设置为2,图卷积隐藏维度设置为64,门控循环神经网络层数设置为2,循环单元隐藏状态的维度设置为64,解码器中的全连接层数设置为1,训练时,小批量大小设置为8,初始学习率设置为0.001,早停步数设置为10。

3.4 实验结果分析

按上述使用不同的方法在相同场景下进行预测,结果如表1所示。

从表1中看出,效果最差的是历史平均模型(HA),其次是仅使用了图邻接关系的GCN,擅长捕获节点间特征相关性的GMAN在训练过程中产生了过拟合,最终结果也只是稍好于GCN,原因是节点间数据尺度的差异导致了过拟合。RNN仅关注数据中的时序信息,却在本任务中表现出色,说明高速公路数据具有较强的周期性,在门控神经循环网络中嵌入了自适应图卷积的AGCRN表现则好于RNN,这也证明节点间存在空间相关性,并且自适应图卷积能在一定程度上解决不同位置流量数据尺度不同的问题,而ASTGCRN一方面通过扩散卷积学习节点与更高阶邻接节点间的相关性,通过自适应图卷积学习不同尺度数据间的相关性,很好地捕捉到了空间相关性,另一方面使用基于门控循环神经网络的编码器和解码器捕获数据中的时间相关性,效果优于其他最优基准线模型,平均绝对误差、均方根误差、平均绝对百分比误差分别降低了约17.6%、18.6%和10.8%。

为了更全面地分析本文提出方法(ASTGCRN)的优势,对各模型在“蒙村互通3-阳朔高田5”断面从某年2月24日23时到2月25日23时时间区段的交通流量预测值和真实值(truth)进行可视化(如图3所示)。从图3中可以看出,各个基准线模型基本保持了与真实值相似的变化趋势,但在数值水平上相差较大。从中也能直观地看到RNN、AGCRN和ASTGCRN要优于其他三个模型,而在车流量整体水平的预测上ASTGCRN优于RNN。当车流量值在短时间内发生较大波动时,如2月25日15时到2月25日17时时间区段,ASTGCRN的预测效果优于AGCRN。

3.5 消融实验分析

为进一步分析模型中各个组件的作用,设计了原模型ASTGCRN 的三个变体进行消融实验,将这三个变体与ASTGCRN进行比较,变体的描述如下。

ASTGCRN_wo_diff:在ASTGCRN的基础上,去掉扩散图卷积模块,考查模型是否学习到了高阶邻接信息。

ASTGCRN_wo_adap:在ASTGCRN的基础上,去掉自适应图卷积模块,考查模型是否克服了不同节点交通数据的尺度差异性,并学习到了更全面的空间相关性。

ASTGCRN_wo_GRU:在ASTGCRN的基础上,使用全连接层替代以门控循环单元为基础的编解码器。

消融实验的结果如表2所示,在去掉扩散图卷积模块(ASTGCRN_wo_diff)后,模型的预测准确性要稍好于去掉之前,而去掉自适应图卷积模块(ASTGCRN_wo_adap)后模型预测准确性显著降低,证明自适应图卷积很好地捕获到了交通数据中的空间相关性,而扩散图卷积在本实验中的作用并不大,在高阶邻居节点的信息得到融合的情况下,预定义图结构的信息可能对空间相关性的学习产生了干扰,使得扩散图卷积没能充分发挥作用。在去掉以门控循环单元为基础的编解码器(ASTGCRN_wo_GRU)后,模型预测准确性大幅下降,这证明门控循环单元对于学习数据在时间维度的变化规律是非常重要的。

4 结论(Conclusion)

本文通过分析桂林路网中高速公路流量的时空分布,针对其分布特性提出了一种自适应时空图卷积循环神经网络模型,该模型基于自适应图卷积网络解决了根据有限先验知识构建的邻接关系图难以反映交通數据中完整空间相关性的问题,并结合门控循环单元捕获了交通数据中复杂的时空相关性。将本文所提模型同其他常用的预测方法在桂林市高速公路网真实的交通数据集上进行了实验,实验结果表明本文所提模型的预测效果最优,并通过消融实验说明了提出方法的有效性。但是,该方法依然存在一些优化空间,例如可以考虑其他因素,如节假日、交通事故对车流量的影响,合理地量化这些因素可以作为优化模型的方向。

作者简介:

阮鸿柱(1993-),男,硕士,高级工程师。研究领域:智慧高速,交通信息工程。

王金宝(1973-),男,本科,正高级工程师。研究领域:智慧交通。

杜梦辉(1999-),男,硕士生。研究领域:智慧交通。

猜你喜欢
智能交通
基于自适应虚拟线圈的多车道车流量检测算法
基于大数据的智能停车场管理系统设计
基于智慧城市智能交通系统的交通运行态势分析系统设计
“互联网+”模式下上班族出行方式分析
大数据时代城市智能交通的数据技术
基于物联网的智能交通系统架构
基于支持向量机的车牌字符识别方法
智能交通中的车辆检测专利技术综述
可视化智能交通体系对货运车辆运营的优化