基于ARIMA模型的三亚机场客流量预测

2018-08-13 11:35李苑辉欧志鹏
软件 2018年7期
关键词:客流量吞吐量差分

李苑辉,刘 夏,欧志鹏



基于ARIMA模型的三亚机场客流量预测

李苑辉,刘 夏,欧志鹏

(三亚航空旅游职业学院 人文社科学院,海南 三亚 572000)

通过对2008年1月至2016年12月三亚机场的客流量数据进行分析,发现其具有趋势和季节的规律。通过构建机场客流量的ARIMA预测模型并进行检验,结果表明,ARIMA模型对客流量数据有着较好的拟合效果,预测误差较小,可应用于机场旅客吞吐量的短期预测,为机场的运营管理提供相应决策依据。

客流量;ARIMA模型;预测

0 引言

三亚凤凰国际机场于1994年7月1日正式通航,初期的设计保障规模为旅客年吞吐量150万人次.2007年,凤凰机场年旅客吞吐量突破500万人次;2011年,突破1000万人次;2017年,超过1938万人次,逼近2000万人次大关。目前凤凰机场的客流量已经远远超过其设计保障能力,航站楼已处于超负荷运行状态,造成了机场客运高速增长与发展空间严重不足的矛盾,影响国际旅游岛的形象,增加了机场安全运营风险。

机场客流量预测对于机场未来规划和管理措施改进有重要意义。科学准确地预测凤凰机场客流量的发展趋势,是确定合理的交通设施规模的基础、保证机场设施高效率使用的前提,能够为机场运营管理提供科学决策依据。

1 旅客吞吐量数据

本研究选择2008~2017年三亚凤凰机场的月度旅客吞吐量作为研究数据,共120个数据样本,其中2008~2016年108个样本作为训练集进行建模,2017年12个样本作为测试集,检验预测模型的性能。具体数据如表1所示。

2 构建预测模型

2.1 选择预测方法

为达到较高精度的预测成果,国内外许多学者对不同的预测模型进行了广泛研究[1-3]。预测客流量的方法很多,据不完全统计,世界上大约有约300种方法,其中有150多种比较成熟,30多种比较常用,10多种使用比较普遍,但根据不同的标准,大体分为两类:一类是线性理论和非线性理论,另一类是定性预测法和定量预测法,但总体都包括:时间序列模型、灰色预测模型、专家预测模型、指数平滑法、神经网络、支持向量机、趋势外推法、回归分析法等[4]。

表1 2008~2017年三亚机场旅客吞吐量月度统计表(单位:万人)

Tab.1 Monthly Statistics of Passenger Flow of Sanya Airport from 2008 to 2017 (unit: 10,000 people)

数据来源:三亚旅游官方政务网http://tour.sanya.gov.cn/tongji_yue.asp

国内学者用不同的模型对机场客流量进行预测研究,取得了一些成果。例如,王婷婷(2017)运用灰色马尔科夫模型对贵阳龙洞堡机场2006-2016年的旅客吞吐量数据进行预测,结果证明灰色马尔科夫预测模型拥有较好的预测精度,平均年误差为3.38%[5]。刘夏(2016)将Holt-Winter季节模型、ARMA模型和线性回归模型加权组合对三亚机场客流量进行预测,经验证该方法可以作为有效预测机场客流量,平均年误差为3.98%[4]。黄邦菊(2013)建立了多元线性回归模型预测西南某机场的旅客吞吐量,平均年误差为2.49%[6]。屈拓(2012)将灰色模型和BP神经网络相结合,建立组合预测模型,预测成都机场的旅客吞吐量,平均误差为2.74%[7]。

由此观之,不同模型的预测精度有着明显的差别。而在短期预测方面,ARIMA模型是一种精确度较高的方法,国内学者已经应用于不同领域的预测。例如,薛冬梅(2010)根据吉林省过去十六年的全社会固定资产投资总额数据,运用ARIMA(3,1,2)模型对吉林省今后五年的全社会固定资产投资进行了预测分析[8]。周叶(2010)根据2002年1月至2009年12月我国航空货运量月度数据,采用ARIMA (1,1,1)模型,对往后六个月的货运量进行了预测[9]。张小斐(2006)以1978~2003年我国的国内生产总值作为样本资料,采用平滑ARIMA(1,1,2)时序模型,对往后四年的我国国内生产总值作出预测[10]。以上拟合值均与实际观察值非常接近(误差小于5%),具有较高的预测精度,表明ARIMA(p,d,q)模型应用于短期的时间序列预测是有效可行的。

一个地方的机场旅客吞吐量受到当地产业结构、节假日安排、航线安排、机票定价和气候等多种不同因素的影响,往往兼具周期性和非线性变化的特性。三亚作为旅游城市,淡旺季差异明显,来访旅客月度数量纵向比较波动较大(见表1),具有明显的季节性特征。因旅客吞吐量月度数据包含季节变化,考虑采用ARIMA(sp,sd,sq)S(1)季节模型.

因此,本文拟综合ARIMA(p,d,q)模型与ARIMA (sp,sd,sq)S(1)季节模型,构建复合季节模型,对三亚机场的旅客吞吐量进行预测分析,以期为本地的航空客运市场调控和发展提供理论支持。

2.2 ARIMA模型简介

ARIMA模型,又叫求和自回归移动平均(Auto Regressive Integrated Moving Average)模型, 简记为ARIMA(p, d, q)模型,是由美国学者博克思(Box)和英国学者詹金斯(Jenkins)于20世纪70年代提出的时间序列预测模型,又称为Box-Jenkins模型,亦简称B-J模型。

其建模思想是将预测对象随时间变化形成的序列看作是一个随机序列,并用相应的数学模型加以近似描述,通过对相应数学模型的分析研究,更本质地认识这些动态数据的内在结构和复杂特性,从而达到在最小方差意义下的最佳预测。

ARIMA模型具有如下结构:

由ARIMA模型结构可知:

即ARIMA(p,d,q)模型是由差分运算与ARMA (p,q)模型组合而成。由于差分运算具有强大的确定性信息提取能力,说明非平稳序列只要通过适当阶数的差分后平稳,就可以用ARIMA(p,d,q)模型对时间序列进行拟合[11]。

对于以月、季度为时间单位的序列,数据经常包含季节变化。季节模型(Seasonal Model)和连续序列一样,只是连续模型的时间单位是1,而季节模型的时间单位是相应的周期S。季节求和自回归移动平均模型ARIMA(sp,sd,sq)S(1)可以表示为:

且规定:

将ARIMA(p,d,q)模型与ARIMA(sp,sd,sq)S(1)综合在一起,得到复合季节模型(General Multiplicative Seasonal Models),它是相乘模型。对于一般的序列,复合季节模型能得到较为满意的结果[12]。其模型结构为:

记为:ARIMA(p,d,q)(sp,sd,sq)S(1),即为ARIMA模型的一般形式。其中,p是自回归模型的阶数,d是差分的阶数,q是移动平均的阶数,sp是季节模型的自回归阶数,sd是季节差分的阶数,sq是季节模型的移动平均阶数,S是季节周期[13]。

3 使用ARIMA模型预测的基本步骤

3.1 检验数据的平稳性

如果序列是平稳的,进入下一个步骤,否则进行差分运算,使得序列变得平稳。

根据表1的数据,用SPSS 19作出旅客数的时序图,如图1所示。由图1可知,三亚机场的旅客吞吐量呈整体上升趋势和季节性周期波动(周期为12个月),因此旅客数的数据具有趋势和季节的规律,可以初步判断为非平稳序列。为进一步判定,下面作出自相关图和偏相关图,如图2和图3所示。

图1 旅客数的序列图

图2 旅客数的自相关图

图3 旅客数的偏相关图

从图2和图3可以看出,旅客数数据的自相关函数和偏相关函数都是拖尾的,并未衰减到0,因此数据序列是非平稳的。

为消除趋势信息,对原始序列做一阶差分。一阶差分的运算公式为:

同时要清除季节信息,需对数据做一阶季节差分。一阶季节差分的运算公式为:

分别做完一阶差分和一阶季节差分后,作出时序图,如图4所示。

图4 旅客数一阶差分时序图

由图4可以看出,数据的方差有逐渐增大的趋势。为消除方差的变化,对数据进行自然对数转换,再作出时序图,如图5所示。从图5初步可以判断,旅客数序列此时已经基本平稳。

图5 对数转换后的一阶差分时序图

为进一步验证差分运算后序列的平稳性,作出自相关函数和偏相关函数的图,如图6、图7所示。可以看出此时数据基本平稳。

图6 一阶差分后的自相关图

3.2 对ARIMA模型定阶

图7 一阶差分后的偏相关图

现在分别对各个模型进行拟合,然后根据可决系数R方和正态化BIC的值作出判断。R方值越大、BIC值越小的模型拟合效果越好。最终需要在以上所有可能的模型中选择一个最优的模型。

利用SPSS软件进行建模,对各个可能的(p,q) (sp,sq)组合反复检验与比较,如表2所示(为显示简洁,略去R方值较小且BIC值较大的数据)。尽管ARIMA(1,1,1)(0,1,1)模型可决系数略小于其它模型, 但它的标准化BIC值最小,因此,最终选择的拟合模型为ARIMA(1,1,1)(0,1,1)S(12)模型。

表2 各种模型拟合效果表

Tab.2 Various model fitting effects

3.3 分析预测结果

根据所选择的模型进行拟合,结果如表3所示。

表3 模型统计量

Tab.3 Model statistics

从表中可以看出,模型能解释原来序列中97.1%的信息,N-BIC值最小,Ljung-Box统计量的值显著,说明ARIMA(1,1,1)(0,1,1)S(12)模型拟合时间序列数据的效果比较理想。

根据所选择的ARIMA(1,1,1)(0,1,1)S(12)模型,应用SPSS 19统计软件对2017年1~12月三亚机场的旅客吞吐量进行预测,结果如表4和图8所示。从表4可看出预测值的误差绝对值大多低于5%,年度总误差的绝对值小于2%;从图8可以看到观察值与拟合值几乎重合。因此,该ARIMA模型能很好地应用于预测三亚机场的客流量。

表4 2017年客流量预测值与实际值比较(单位:万人)

Tab.4 Comparison Between Predicted Value and Actual Value of Passenger Flow in 2017 (Unit: 10,000)

现在用ARIMA(1,1,1)(0,1,1)S(12)模型预测三亚机场2018年和2019年的月度客流量,结果如表5所示。

表5 两年的月度客流量预测(单位:万人)

Tab.5 Monthly forecast of passenger volume in two years (Unit: 10,000)

4 结论

(1)根据2008年1月至2016年12月三亚机场的客流量数据分析来看,其具有趋势和季节的规律。三亚作为旅游城市,淡旺季差异明显,容易使得民航市场旺季时运力紧张,淡季时运力闲置。若能预估进出港客流量,提前合理安排运力,可带来明显的经济效益和社会效益。

(2)通过构建机场客流量的ARIMA模型并进行检验,结果表明,ARIMA模型对三亚机场的客流量进行预测是可行和可靠的,预测精度较高,误差较小,可以为机场的运营管理提供决策依据。

[1] 张金飞, 黎英, 高伟, 等.城市交通路口短时流量预测[J]. 软件, 2018, 39(1): 126-131.

[2] 崔仁桀. 数据挖掘在学生专业成绩预测上的应用[J]. 软件, 2016, 37(01): 24-27.

[3] 杨振宇. 高校招生数据采集及分析系统设计与实现[J]. 软件, 2015, 36(5): 61-66.

[4] 刘夏, 陈磊, 李苑辉, 等. 基于组合方法的三亚机场客流量预测[J]. 计算机系统应用, 2016, 25(8): 23-28.

[5] 王婷婷, 王紫晨. 基于灰色马尔科夫对龙洞堡机场旅客吞吐量预测[J]. 交通科技与经济, 2017, 19(5): 48-51.

[6] 黄邦菊, 林俊松, 郑潇雨, 等. 基于多元线性回归分析的民用运输机场旅客吞吐量预测[J]. 数学的实践与认识, 2013, 43(4): 172-178.

[7] 屈拓. 组合模型在机场旅客吞吐量预测中的应用[J]. 计算机仿真, 2012, 29(4): 108-111.

[8] 薛冬梅. ARIMA模型及其在时间序列分析中的应用[J]. 吉林化工学院学报, 2010, 27(3): 80-83.

[9] 周叶, 肖灵机. 基于ARIMA模型的我国航空货运量预测分析[J]. 南昌航空大学学报, 2010, 9(12): 22-27.

[10] 张小斐, 田金方. 基于ARIMA模型的短时序预测模型研究与应用[J]. 统计新论, 2006, 10: 7-9.

[11] 游皓麟. R语言预测实战[M], 北京:电子工业出版社, 2016: 365-366.

[12] 张文彤, 董伟. SPSS统计分析高级教程[M]. 北京: 高等教育出版社, 2013: 404-405.

[13] 夏怡凡. SPSS统计分析精要与实例详解[M]. 北京: 电子工业出版社, 2010: 265-266.

Passenger Flow Forecast of Sanya Airport Based on ARIMA Model

LI Yuan-hui, LIU Xia, OU Zhi-peng

(School of Humanities and Social Sciences, Sanya Aviation and Tourism College. Sanya 572000, China)

By analyzing the passenger flow data of Sanya Airport collected from January 2008 to December 2016, the general trend and seasonal variation regular-ity of the passenger flow can be found. By constructing and testing the ARIMA forecast model, the results show that the ARIMA model has a good fitting effect on the passenger flow data, and its forecast error is small. Therefore, this model can be applied into the short-term forecast of airport passenger flow, and help to provide the corresponding decision-making basis for the airport operation man-agement.

Passenger flow; ARIMA model; PredictionIntroduction

O211.61

A

10.3969/j.issn.1003-6970.2018.07.009

海南省自然科学基金项目(批准号:618QN258)、三亚市院地科技合作项目(批准号:2014YD52)

刘夏(1983-),男,副教授,主要研究方向:计算机应用;欧志鹏(1973-),男,讲师,主要研究方向:管理学。

李苑辉(1982-),男,讲师,主要研究方向:数据挖掘。

本文著录格式:李苑辉,刘夏,欧志鹏. 基于ARIMA模型的三亚机场客流量预测[J]. 软件,2018,39(7):42-47

猜你喜欢
客流量吞吐量差分
数列与差分
基于嵌入式系统的商场客流量统计算法
2017年3月长三角地区主要港口吞吐量
2016年10月长三角地区主要港口吞吐量
2016年11月长三角地区主要港口吞吐量
基于AFC数据的城轨站间客流量分布预测
基于差分隐私的大数据隐私保护
相对差分单项测距△DOR
2014年1月长三角地区主要港口吞吐量
差分放大器在生理学中的应用