基于集成学习的多式联运货运量预测模型构建

2021-03-12 11:04韩振鑫温旭丽殷世松武莹莹张人杰
物流技术 2021年2期
关键词:运输量货物神经网络

韩振鑫,温旭丽,殷世松,武莹莹,张人杰

(1.南京理工大学,江苏 南京 210014;2.东南大学成贤学院,江苏 南京 210088)

0 引言

在“一带一路”战略背景下,大力发展多式联运是积极探索实现“交通强国”战略的重要路径[1]。货运量预测是未来多式联运发展的基础,可为研究多种运输方式之间运输量的合理分配和综合运输网建设,提供有效的数据支撑。目前国内外对货运量的预测方法通常可以分为定性预测和定量预测[2]。随着多式联运网络的日益完善,其货物运输量的随机性、非线性及不确定性给这项工作带来了巨大的挑战。定性预测中大量的参数都是利用主观因素判断确定的,会使得复杂网络条件下货物运输流量预测的效率及精度严重下降。定量预测方法则能够解决非线性、时效性强等问题,且预测性能良好,受到学术界的广泛关注[3-7]。然而,大多数单一预测模型存在较大的局限性,导致模型不能持续在各个方面保持良好的性能。同时,在传统模型中,数据种类单一且数据体量较小,导致训练模型不能捕捉到最优的时间特征关系,从而预测模型很难达到最优值。集成学习(Ensemble Learning)是定量预测方法(机器学习)中的一种,且被广泛应用于交通预测领域,是通过多个模型的组合形成一个精准度更高的模型,具有效率高、训练快、鲁棒性强等特点[8-9]。本文基于货物运输量的时间特征规律,构建了Bagging+BP集成学习网络模型,并将原始数据构造成一个前序时间序列因子数据集,采用南京市龙潭港的有效数据验证了Bagging+BP集成学习网络模型的有效性。

1 基于Bagging+BP的集成学习网络

1.1 初始相关时间特征输入集构建

基于多式联运货物运输量的季节性、周期性特点,结合物流流量的时间特征关系,构建初始相关时间特征输入集。假设在预测时间段t,某港口的货物运输量预测值为,需构造初始相关时间特征输入集表示预测前序间隔,T表示预测最小周期间隔,N表示最大相邻周期间隔,t+1 表示预测目标时间段后一时间段,t-1 表示预测目标时间段前一时间段。

1.2 初始相关时间特征输入集预处理

多式联运货物运输量具有复杂的时间特性,对原始数据进行时间特征挖掘,是提高输入因子质量与降低BP 神经网络模型训练难度的关键环节。根据斯皮尔曼相关性系数法计算初始相关时间特征输入集中各相关时间特征向量与目标向量之间的相关性系数[11],并结合相关性标准法则与大量的实验结果,建立优化初始相关时间特征输入集的判断标准:若同目标向量之间的相关性系数低于0.4,需删除初始输入集中不符合标准的相关时间特征向量,具体优化过程如图1所示。

1.3 基于Bagging+BP 的货运量预测学习网络构建

1.3.1 BP 神经网络模型。BP 神经预测网络是一种按照误差逆向传播算法训练的多层前馈神经网络[10],BP神经预测网络在处理非线性的拟合问题上具有更好的映射能力,能够更好地挖掘类似港口货运吞吐量这种呈现出时间性和季节性的数据规律,模型结构如图2所示。

面向多式联运的Bagging+BP货物运输量预测学习网络中BP神经网络可以表达为:

图1 初始相关时间特征输入集预处理流程

式(1)中,Xi表示输入层中的第i层,bi代表中间层中的第i层,V表示输入层到隐含层之间的权值,Q1表示输出层的多式联运货物运输量输出,W表示隐含层到输出层之间的权值。

由于sigmoid函数作为激发函数能够有效地分析函数的局部特性,所以本文采用sigmoid 函数作为网络隐含层的激励函数,见式(2)。

图2 传统BP神经网络结构

1.3.2 Bagging+BP货运量预测学习网络。传统BP神经网络模型虽然解决了非线性、时变性等问题,但是在解决数据集小和输入因子维度的不确定性大等问题时,仍然不能保持原有模型良好的性能。基于上述分析,在Bootstrap 传统抽样的基础上,结合各相关时间特征向量与目标向量之间相关性系数的分布,建立Spearman+Bootstrap 抽样法,用每次抽样形成的数据集训练一个弱学习器模型,如果目标函数(即模型的损失函数)数值出现降低,则停止抽样循环过程,通过加权获取组合后BP神经网络中各分支向量的新权值,具体步骤如下:

(1)假设预处理后初始时间特征输入集为S',利用斯皮尔曼系数法计算集合中各相关时间特征向量与目标向量之间的相关性系数;

(2)假设相关性系数分布在{i,j},结合相关性系数分布规律及相关性强弱系数划分标准(0.8-1.0 表示极强相关,0.6-0.8表示强相关,0.4-0.6表示中等程度相关),将预处理后的时间相关性输入向量重新构造成三个子样本集

(7)通过对所有子模型分支向量的权重进行加权,最终得到组合后BP神经网络

1.3.3 网络节点设置。Bagging+BP 货物运输量预测学习网络的超参数设置,决定了预测网络的性能和效率。根据数据维数,确定输入层神经元节点数量n,由预测的目标货物运输量确定输出层神经元节点数量m。按照如下步骤选择每个Bagging+BP 货物运输量训练模型的隐含层神经元的节点数:

(2)通过列举法对比分析在不同隐含层神经元节点数下的网络模型训练效果,即比较损失函数(softmax交叉熵)值大小;

(3)从步骤(2)所列出的节点数中选择损失函数值最小时对应的节点数,作为各个货物运输量学习网络训练模型的隐含层神经元节点数。

2 实验分析

2.1 数据描述

本文模型验证所有数据均由南京市龙潭港提供,所提供数据的时间段为2010 年-2019 年(数据间隔为月),包括本港集装箱数量、中转集装箱数量及本港总计集装箱数量三种数据类型,数据总计120个月。在实验中,本文对龙潭港的集装箱总量(中转箱与本港箱的总量)进行预测,并采用中折交叉验证法对模型的精性能进行验证(即将80%的数据作为训练数据,20%的数据作为测试数据)。

2.2 模型评估指标

在上述三种方法中,各个模型都具有自己的优势,为了能够较好地评价三种多式联运货物运输量预测模型的优劣性,本文采用均方根误差(MAP)与平均相对百分误差法(MAPE)刻画预测货物运输量与实际货物运输量间的拟合程度,即计算预测误差,见式(3)与式(4)。

其中,N表示测试集样本个数,Qi表示测试集第i个实际货运流量值,则表示测试集第i个模型预测货物运输量值。

2.3 模型对比分析

为了更好地验证Bagging+BP货物运输量预测学习网络的优越性,本文分别选取ARIMA、LSTM 神经网络、Bagging+BP 学习网络进行实验对比分析。在实验过程中,为了更好的对模型进行客观分析,需要三个模型的数据集样本量、超参数保持一致。最优参数设置下,测试集中三个模型的实验结果如图3所示,具体预测评价指标见表1。

图3 多网络模型预测结果

表1 ARIMA、Bagging+BP、LSTM预测结果分析

从表1 和图3 可以看出,相比于ARIMA 和LSTM模型,Bagging+BP 货物运输量预测学习网络的性能是最佳的。由于龙潭港提供的多式联运货物运输量数据体量较少,数据类型较为单一,LSTM 模型本身参数结构复杂且较为敏感,最终导致长短时记忆神经网络模型过度拟合、预测效果较差。另外,由于近几年来龙潭港发展较快,导致货物运输量数据非线性强,使得ARIMA模型预测效果较差。因此,在货物运输量非线性、时变性强、数据多样性缺失以及模型稳定性差等问题中,Bagging+BP 货物运输量预测学习网络模型能够有效提高预测的准确性。同时从RMS 模型评判指标可以看出,Bagging+BP 货物运输量预测学习网络的稳定性相比其他两个模型(ARIMA和LSTM)更高,说明通过集成学习可以减少数据量少带来的过度拟合问题。

综上,Bagging+BP 货物运输量预测学习网络在长时间序列的货物运输量预测时具有优秀的表现力,且相比多参数动态模型更适用于数据量少的预测场景。

3 结语

基于港口货物运输量的时间变化特征,构建了一种基于集成学习的Bagging+BP货物运输量预测模型,解决了传统线性模型和单一神经网络模型不能在数据集较少、非线性强等问题中保持较高的模型性能的问题。以龙潭港为例,实验表明:Bagging+BP模型在货物运输量预测中的准确性高,在货运量预测领域中的适用性更强。在目前研究工作的基础上,后续研究可进一步扩展模型的隐藏层层数和增加空间特征,建立更有效的多式联运货物运输量预测模型,并运用到不同地区、不同港口的各种货物运输量预测中。

猜你喜欢
运输量货物神经网络
国内客运恢复快速 航司第一季度亏损程度收窄
神经网络抑制无线通信干扰探究
逛超市
基于神经网络的中小学生情感分析
9月份中国民航旅客运输量同比增长7.9%
基于神经网络的拉矫机控制模型建立
基于支持向量机回归和RBF神经网络的PID整定
路遥知马力
参考答案