基于NARX 动态神经网络的民航客运量预测研究*

2022-08-26 09:39张启凡王永忠王圣堂裴柯欣
计算机与数字工程 2022年7期
关键词:客运量时序波动

张启凡 王永忠 王圣堂 裴柯欣

(中国民用航空飞行学院空中交通管理学院 广汉 618300)

1 引言

交通运输是连接生产与消费的重要环节,是经济运行的基础。民航运输系统的发展反映了一个国家或地区的经济发展水平[1~2]。面对日益增长的航空运输需求,政府部门可能会为此制定机场等交通建设的决策和计划。对客运量进行预测,对于客运系统的规划与建设、项目的投资和运输资源的合理配置都具有重要的现实意义[3~4]。

民航客运量受到多种随机性、模糊性因素的影响,其本质为非平稳的时间序列。目前,对民航客运需求主要的预测方法有:回归分析、BP 神经网络、SVM、SARIMA、ARIMAX 等[5]。这些方法大都是对数据进行了平稳处理,缺失了数据序列存在的非线性特征,从而限制了算法预测的精度。

本文提出一种基于NARX 动态神经网络的民航客运量预测方法,从民航客运量的时间分布出发,利用NARX 模型从客运量的时间序列中挖掘数据的波动周期和变化特征,对民航客运量进行准确地预测。同时,本文还采用了ARIMA 和Holt-Winters模型进行对比仿真分析。

2 民航客运量发展及波动趋势

对于民航客运量发展趋势的研究可以更清晰的了解序列数据的整体发展趋势,而波动趋势体现了客运量的周期性变化特征,这些对于预测模型的建立提供指导。根据CAAC 官方网站提供的生产统计数据,本文选取2008年1月~2019年12月的客运量数据进行研究。绘制客运量时序图如图1 所示。

图1 2008年~2019年民航客运量时序图

从图1 可以看出随我国经济发展水平与航空运输需求的增长民航客运量逐年递增,总体发展趋势较为稳定,存在受年中不同季度交通需求及公共假期等因素影响的周期性波动。为进一步明确周期性波动趋势,绘制了2008年~2019年月平均客运量时序图如图2 所示,可以看受周期性波动因素的影响,8 月为客运量高峰期,而1 月为客运量低谷期。

图2 2008年~2019年民航月平均客运量时序图

3 仿真模型概述

3.1 NARX动态神经网络模型

NARX 动态神经网络是具有外源输入的非线性自回归动态神经网络,不同于集中输入层的动态网络或前馈网络,NARX 是一种在静态多层感知器基础上通过引入延时模块及反馈构成的递归动态网络[6]。NARX 动态神经网络模型基于线性ARX模型,适用于非平稳序列的建模问题。NARX 神经网络的结构主要由输入层、隐藏层和输出层以及延时层构成[7]。结合数据序列增长趋势,隐含层激励函数选用softplus[8]函数,输出层为purelin[9]传递函数。模型表达式为式(1)所示。

式中,f表示特定非线性函数,u(t)为网络模型输出变量;y(t)为网络模型外部输入变量;y(t-ny),u(t-1),u(t-2),…,u(t-nu)为网络模型输入变量和反馈时延变量[10]。

3.2 ARIMA模型

ARIMA 模型由三部分组成,分别为自回归模型(AR)、移动平均模型(MA)[11~12]、差分阶数(I)。模型表达式如式(2)所示:

其中:c 为常数项;α1,α2…αp是自回归系数;θ1,θ2…θq为移动平均系数;εt是残差。

由于客运量时序数据属于非平稳序列,所以需要进行高阶差分达到平稳要求。

3.3 Holt-Winters模型

从图1 可以看出客运量时序数据在年中出现重复波动趋势,存在季节性特征,因此以年为单位的时间间隔称为一个季节。三次指数平滑模型在二次指数平滑的基础上增加了季节分量。利用季节调整方法的离群值识别、节假日效应处理的优势,对原始负荷序列进行季节调整,可得到消除了离群值影响和节假日影响的季节调整后序列和季节成分序列,然后用Holt-Winters 方法对季节调整后成分进行预测[13]。季节趋势可以分为累加性和累乘性。累加三次指数平滑模型表达式为

累加三次指数平滑的预测公式为

累乘三次指数平滑模型表达式为

累乘三次指数平滑模型表达式为

其中α、β、γ、k 分别为数据平滑因子、趋势平滑因子、季节改变平滑因子、周期。

4 模型仿真分析及评价

为使得NARX 模型适应年中波动趋势从而得到更好的训练结果,采用大小12*2,步长为1 的滑动窗口进行客运量时序数据的切片,并使用连续的12 条数据构建时序数据集。为加强数据序列特征,加入季节分量作为辅助特征[14]。将2008年1月~2017 年12 月共120 个月的数据作为训练集,将2018 年1 月~2019 年12 月共计24 个月的数据作为测试集。得到运行结果如图3所示。

可以看出,经仿真得到的2018 年1 月~2019 年12 月的数据与真实值波动趋势几乎一致且数值上也较为接近。为进一步验证模型的准确度,使用ARIMA 模型、Holt-Winters 加法、Holt-Winters 乘法模型进行对比仿真实验得到结果如图4~图6所示。

图4 Holt-Winters乘法模型仿真结果

图6 ARIMA模型仿真结果

为验证NARX 动态神经网络模型的预测精度,本文采用R2、MAE、RMSE[15]三种指标对四种模型的仿真结果进行评价,公式如式(11)~式(13)所示。模型评价结果如图7、图8所示。

图5 Holt-Winters加法模型仿真结果

图7 各模型仿真结果误差评价

图8 各模型仿真结果拟合度评价

通过对比仿真实验可以看出,NARX 动态神经网络对于民航客运量的预测拟合度更高、误差也更小。相比之下,ARIMA 模型的预测准确度不佳,ARIMA 模型对客运量时序数据变化趋势预测相对准确,但由于缺乏对时序数据非线性特征以及季节性波动的学习,所以在整体上的准确度不佳。Holt-Winters三次指数平滑可以预测非线性时序数据,将时序数据分解为趋势项和周期项并增加季节分量,对于民航客运量数据的趋势比AMIMA 预测更准确。其中,乘法模型较加法模型的拟合度高,说明民航量客运量的增长趋势更强偏向于累乘增长。但由于Holt-Winters 三次指数平滑模型对时序数据非线性特征提取不充分的问题,在连续预测中随着预测步长的增大,预测结果的误差也在增大。

5 结语

本文对民航客运量的增长趋势和波动规律进行了分析,民航客运量时序数据属于非平稳序列数据,呈现年内波动规律。在此基础提出基于NARX动态神经网络的民航客运量预测方法,通过滑动窗口进行客运量时序数据的切片,并使用连续的12条数据构建时序数据集。为加强数据序列特征,加入季节分量作为辅助特征对模型进行训练对2018年1 月~2019 年12 的客运量进行预测。同时,本文还采用了ARIMA 模型、Holt-Winters 加法模型、Holt-Winters乘法模型进行了对比仿真实验。仿真结果表明NARX 动态神经网络的拟合度和预测精度较高。民航客运量预测的复杂性还可以继续深入的研究,尤其是在受到大流行等因素的影响下客运量的变化规律。

猜你喜欢
客运量时序波动
顾及多种弛豫模型的GNSS坐标时序分析软件GTSA
清明
基于GEE平台与Sentinel-NDVI时序数据江汉平原种植模式提取
你不能把整个春天都搬到冬天来
澳门国际机场客运量创历史新高
休闲假期