基于全局时空特性的城市路网交通速度预测模型

2022-05-14 03:28冯思芸施振佺
计算机工程 2022年5期
关键词:交通流路网关联度

冯思芸,施振佺,2,曹 阳,2

(1.南通大学 信息科学技术学院,江苏 南通 226019;2.南通大学 交通与土木工程学院,江苏 南通 226019)

0 概述

随着我国城市化建设加快,车辆保有率逐步上升,城市交通拥堵问题日益严峻,同时导致空气污染加剧。智能交通系统(Intelligent Transportation System,ITS)将先进的科学技术有效地综合应用于交通运输中,有利于加强车辆、道路和出行者的联系,提高交通资源分配和调度的合理性[1]。

交通参数预测是ITS 的重要组成部分,现有研究主要集中于如何根据历史和实时数据预测交通流下一时刻状态,如流量、速度、密度等。城市路网交通速度预测可以为出行者提供实时的交通信息,对提升道路通行能力具有重要意义。通常,有效的城市路网交通速度预测重在捕捉交通系统内部的时空变化特征。神经网络因其优异的性能被广泛地应用于求解交通参数预测问题中[2]。当前常用的神经网络主要包括卷积神经网络[3](Convolutional Neural Network,CNN)、循环神经网络[4](Recurrent Neural Network,RNN)、图卷积网络[5](Graph Convolutional Network,GCN)等。然而,交通状态具有非常复杂的非线性、随机性等特征[6],单一的神经网络模型并不能获得较好的预测性能,因此,当前的研究方向已逐步向混合神经网络模型发展[7]。文献[8]提出的注意力图卷积序列模型,利用GCN 和注意力机制分别对空间依赖性和时间依赖性进行建模。文献[9]结合长短时记忆网络和注意力机制构建混合模型框架。文献[10]利用卷积门控循环单元(Gated Recurrent Unit,GRU)进行空间特征提取,结合双向GRU对时间依赖性进行分析,从而有效地对交通流量进行预测。文献[11]堆叠CNN 和长短时记忆网络挖掘交通数据的时空特性,取得了良好的预测效果。此外,大量研究表明,混合神经网络模型能够更充分地挖掘时空特征,预测性能更好[12-13]。

图卷积网络是图神经网络的一个重要分支[14],目前已较好地应用于路网交通预测中[15]。文献[16-17]将路网拓扑结构表示为0-1 邻接矩阵,利用GCN 对城市路网空间相关性进行分析,再结合长短时记忆网络等分析交通流的时间相关性。然而,上述方法对于空间特征的挖掘并不充分,传统的图卷积传播规则依赖于路网的实际拓扑结构,并未考虑到相邻路段间不同的空间影响程度。针对这一缺陷,已有多种解决方法。文献[18]利用相关性分析方法,根据路段的连通性构建邻接矩阵。文献[19]利用softmax 函数重构0-1 矩阵,对每个非0 元素赋予变量值,通过迭代训练得到最优邻接矩阵。这些方法都从一定程度上加强了模型对一阶相邻路段间空间关联程度的挖掘,但是时空特征不受道路连通性的限制,非一阶相邻道路的交通流之间也存在相互影响性[20]。在部分非一阶相邻路段关联度大于部分一阶相邻路段关联度的情况下,如果仍输入原始的邻接矩阵,会遗失一些相对重要的路段空间信息,无法得到较好的预测结果。

为更好地挖掘城市路网的交通特性,本文提出一种基于全局时空特性的速度预测模型G-GCGRU。利用全局图卷积网络进行空间特征分析,构造路网有向带权的内部空间关系,解决非一阶高度关联路段信息缺失的问题,充分挖掘交通流的空间特征。同时,通过GRU 分析数据的时间依赖性以挖掘其时间特征。在此基础上,选用深圳市罗湖区城市路网车辆速度数据对模型进行验证。

1 模型建立与求解

1.1 时空矩阵构建

为充分挖掘交通流的时空特征,建立时空矩阵作为模型的输入。利用待研究路网中交通流参数的全量特征数据构造时空矩阵,矩阵中的每一列表示为路网中的一个路段,行表示为每个路段一个时间片的特征值,以此构成路网的时空矩阵,其结构如下:

其中:R={1,2,…,r}为路段集合;T={1,2,…,t}为时间片集合为包含r条路段且时间步长为t的时空矩阵。表1 列出了本文相关的符号定义。

表1 符号定义Table 1 Symbols definition

1.2 模型结构

对交通流的空间特征和时间特征分别进行分析,构建预测模型。模型结构主要包含三部分,如图1 所示。第一部分为全局图卷积网络模块,利用全量特征数据进行相关性分析,计算关联度矩阵,将关联度矩阵和指定时间步长的时空矩阵输入图卷积网络中,提取交通流数据全局空间特征;第二部分为门控循环单元模块,将第一部分的输出值输入GRU 网络中,进一步分析数据的时间特性;第三部分为预测模块,利用GRU网络最后时刻的输出,通过Dense 层控制需要预测的时间步长并计算得到模型最后的预测结果,以此建立G-GCGRU 的网络结构。

图1 G-GCGRU 网络结构Fig.1 Network structure of G-GCGRU

1.3 全局空间特征提取

城市路网的结构特征类似于图的拓扑结构。GCN是当前处理图结构等非欧式数据比较流行的神经网络。将路网拓扑结构表示为无向图G=(V,Ε),其中,V为节点集合表示路段,Ε为边集合,表示路段间的相邻情况。GCN 的计算规则为:

GCN 通过邻接矩阵对实际路网的空间结构进行显式表征,利用进行特征卷积,将相邻路段节点特征进行融合,以此获取新的路段特征表示。然而,考虑到道路本身的地理条件和道路周边基础设施的影响,部分相邻路段间的空间影响性会弱于非相邻路段间的空间影响性。邻接矩阵虽然能够表达出直观的路段邻接性,但是并不能表达出路网内部空间影响性。针对这一缺陷,对路段内部的空间结构进行隐式表征。对于任一路段,利用皮尔逊相关系数方法[21]计算其与路网中其余路段间的关联性,筛选关联度较高的若干条路段数k,组成关联度矩阵C。在此基础上,利用GCN 的卷积思想,通过C聚合关联度高的路段空间信息作为道路节点的新特征。

对于任意2 条路段Xi、Xj,设相应的特征值数据为则关联度矩阵计算方法为:

关联度矩阵描述的路段节点关系为一张有向带权图,节点之间的连接表示影响权重,方向代表影响关系。通过关联度矩阵聚合与节点自身关联度高的路段信息,进一步提高模型对空间特征的挖掘。因此,全局图卷积网络的规则更新为:

将C以及包含r条路段和p个时间片的时空矩阵输入两层图卷积网络中进行空间特征分析,网络传播规则如图2 所示,计算规则如下:

图2 全局图卷积网络传播规则Fig.2 Communication rule of G-GCN

1.4 时间特征提取

GRU 能够有效避免RNN 梯度消失和爆炸的问题,是处理时间序列预测问题的主流神经网络之一[22]。GRU网络包含三部分,即输入层、隐藏层和输出层,其核心算法在于隐藏层单元块中的计算过程,如图3 所示。

图3 门控循环单元模块Fig.3 Gated recurrent unit module

针对某一时间片,GRU 首先拼接上一时刻隐藏层的输出ht-1和当前时刻的输入Xt,通过sigmoid 函数将数据变换到[0,1]中,充当重置门控信号rt和更新门控信号zt;然后利用门控信号分别对ht-1和Xt进行选择性的遗忘和保存,从而实现在保存上一时刻交通信息的同时结合当前时刻的交通状态,达到捕获时间依赖性的效果。

获取GRU 网络最后时刻的输出,输入Dense 网络中,控制输出的时间步长得到最后的预测结果:

1.5 模型求解过程

G-GCGRU 模型的主要求解步骤如下:

步骤1对有效交通数据进行归一化,将数值限定在[0,1]之间,将数据集按照8∶2 的比例拆分为训练集和测试集。

步骤2设定模型结构及超参数,包括GRU 隐藏层神经元数量、模型输入时间步长、输出步长、批数据大小、学习率、迭代次数、损失函数、优化方法等。

步骤3选择合适的关联路段数量k,构造关联度矩阵,输入G-GCGRU 模型中获取预测结果。对预测值与真实值进行对比,使用Adam 优化器进行训练,满足迭代次数后训练结束。

步骤4利用训练后的模型对测试集进行预测。

2 实验

2.1 实验设置

实验设置具体如下:

1)数据集。本文利用深圳市罗湖区2015 年1 月1 日—2015 年1 月31 日的路网数据进行分析。该数据集包含156 条路段,以15 min 聚合,共计2 976 条车速数据。

2)参数设置。设置单个路段的关联路段数量k,构造关联度矩阵输入模型。实验基于TensorFlow 框架进行实现,主要参数设置如下:GRU 维数为64;学习率为0.001;批大小为32;训练次数为3 000。

3)评估指标。以均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)和测定系数(Coefficient of Determination,R2)作为模型性能评价标准,定义分别如下:

2.2 实验结果分析

2.2.1 关联路段数量k的分析

G-GCGRU 模型考虑全局路网中路段的空间关联性。利用路网路段车辆速度分析路段间的关联性,得到各路段间的相关性值,如图4 所示。图4(a)为路网中相邻路段间的关联情况,图4(b)为根据关联路段数量k计算出的高关联路段情况,颜色越深,关联度越高。可以看出,图4(a)中的节点关联性明显弱于图4(b),说明真实的拓扑结构对路网空间关联关系的表达并不充分。关联度矩阵通过重新构建路段间的相关性,深度分析高关联的路段并抛弃关联度低的路段信息,能够进一步提高模型捕获空间特征的能力。

图4 道路关联度矩阵对比Fig.4 Road correlation matrix comparison

关联路段数量k是影响模型预测性能的一个重要因素。k与RMSE、MAE值的关系如图5所示。从整体上看,随着k值的增大,模型误差呈下降趋势,说明多路段空间信息的聚合有利于提高模型对空间特征的挖掘能力。当k值为6时,模型误差达到最低,随后,k值增大,模型误差缓慢增长,这表明6为最佳关联路段数量,并且过多的k会引入额外的数据信息,影响模型的预测能力。

图5 关联路段数量分析Fig.5 Analysis of correlation road number

2.2.2 对比实验

为验证所提模型的有效性和优越性,选取GCN、GRU 及GCN-GRU 混合模型进行对比,结果如表2 所示。可以看出,在4 种预测模型中,本文提出的G-GCGRU 模型性能最优。

表2 模型性能对比Table 2 Model performance comparison

图6 为不同模型对路网中编号为102129 路段一天数据的拟合曲线图,可以看出,本文提出的模型拟合效果相对较好。与GRU 网络相比,GCN 网络的预测效果明显不佳,说明时间特征是交通流较为关键的特征。与GRU、GCN 相比,GCN-GRU 模型预测精度有一定提升,表明混合网络模型同时兼顾了数据的时间和空间特征,进行了较为全面的特征挖掘。而与G-GCGRU 相比,GCN-GRU 模型性能略有下降,说明关联度矩阵对空间特征的卷积效果优于邻接矩阵,能够有效提高模型预测精度。

图6 4 种模型的预测结果对比Fig.6 Prediction results comparison of four models

2.2.3 多步预测能力

为验证本文模型的多步预测能力,调整模型输出的时间步长及各参数进行验证,结果如图7 所示。可以看出,随着预测时间步长的增大,模型性能稍有下降。但是各时间步预测结果波动不大,表明本文模型性能对输出步长的改变相对并不敏感,能够有效预测未来长时间段的交通状态。

图7 多步预测结果Fig.7 Multi-step prediction result

3 结束语

本文提出一种基于全局时空特性的城市路网交通速度预测模型G-GCGRU,利用皮尔逊相关系数分析挖掘交通流内部的空间关联性,通过图卷积网络卷积(GCN)提取交通流空间特征,再结合门控循环单元(GRU)分析交通流时间特征。利用真实的路网数据进行测试,实验结果表明,与GCN、GRU 及GCN-GRU 混合模型相比,G-GCGRU 模型性能表现最好。在本文研究中,关联度矩阵通过相关性分析计算得到,后续将考虑利用参数法优化该矩阵,进一步提高模型性能。

猜你喜欢
交通流路网关联度
基于LSTM的沪渝高速公路短时交通流预测研究
基于熵值法与灰色关联度分析法的羽毛球技战术综合评价分析
京德高速交通流时空特性数字孪生系统
基于熵权法改进的TOPSIS法和灰色关联度分析的压榨脱水过程优化研究
基于卫星遥感图像自动提取路网与公路路网的校核比对
中国制造业产业关联度分析
中国制造业产业关联度分析
高速公路路网复合通行卡(CPC)管理方案探讨
高速公路路网内复合通行卡(CPC)调拨方法研究
打着“飞的”去上班 城市空中交通路网还有多远