航线旅客流量组合预测模型

2017-12-01 05:08朱杰杰
中国民航大学学报 2017年5期
关键词:客座率差值年份

樊 玮,朱杰杰

(中国民航大学计算机科学与技术学院,天津 300300)

航线旅客流量组合预测模型

樊 玮,朱杰杰

(中国民航大学计算机科学与技术学院,天津 300300)

航线旅客流量预测是航空公司航线网络优化的关键技术,传统的预测方法包括回归法、时间序列法等面向旅客订座数进行预测,鲜见考虑航线旅客流量数据较强的随机性和持续增长特性。为了解决上述问题,该研究在回归法的基础上分别基于两种不同的参考期进行预测,并提出一种组合预测模型。该模型的构建分为4个阶段:①将传统的订座数预测转换为对客座率的预测,并对客座率数据的一阶累加平滑处理,使得研究目标曲线变得平滑且单调;②采用DOW策略的回归法模型预测目标年份的数据;③以相邻年度同期拟合曲线的点差值来模拟年度增长量,建立预测模型;④针对第2、3阶段两种模型的预测结果,取加权平均值,建立新的组合预测模型。该研究选取某航空公司2011—2015年全年XMNPEK航段客座率数据为依据,预测2016年上半年的客座率数据。对比传统的回归法、时间序列法两种模型的预测结果,平均绝对误差由原来的4.76和4.21缩减到3.77,预测的准确性有明显提高。

航线旅客流量;组合预测;线性回归;时间序列

?

航线订座数据预测是航空公司航线网络规划的基础,伴随着航空公司收益管理系统的深入实施,航空公司在单一航班预测方面,积累了丰富的经验[1],然而,由于应用上的滞后,近年来国内航空公司才逐渐重视航线整体预测,并将其应用于基于起始地—目的地的航线网络优化[2]。常见的航线预测算法有基于时间序列的预测算法[3]、回归法、基于支持向量机的预测算法[4]、基于神经网络的预测算法[5]等。然而这些算法大都面向旅客订座数进行预测,且鲜见考虑民航旅客市场随年度的增长特性[6-8]。由于市场运力的波动,会导致订座数据由于受航线上总座位数的波动而产生较大波动,且数据随机性较大。因此,该研究拟在解决上述问题的基础上,进行航线订座整体预测研究。

对航线旅客流量的预测一般都基于历史订座数据,单一航班的订座数据稳定性相对较高,而航线上往往在每周的不同天(DOW,day ofweek)具有不同的机型、航班数量,航线总座位数相差较大,同时订座数也相差较大,因此,该研究采用相对稳定的航线客座率进行预测,预测结果可依据当日航线总座位数折算为预测订座数。

1 组合预测模型

1.1 数据预处理

考虑到销售异常及航班销售限制,在预测之前必须进行数据预处理。首先需要统计1年的航线订座数据均值及标准差,滤去订座数据超出3倍标准差的航班;其次,对销售旺期客座率接近100%的航班,考虑到销售受到实际座位数的限制,对订座数据要作10%左右的放大处理。此外,该研究将每年的日期分别记作第1~365天。选取某航空公司2014年和2015年全年XMNPEK航段客座率数据,以x轴代表第1~365天的航班日期,y轴代表每天的客座率数据,如图1所示,可见航班客座率的变化具有较强的随机性。但同时也易发现,两年对应时间段客座率趋势的变化具有一定的相关性。

图1 XMNPEK航线2014和2015年客座率变化曲线Fig.1 PLF variation curve of XMNPEK route in 2014 and 2015

鉴于图1所示数据较强的随机性,记原始数据为

该研究首先对原始数据进行一阶累加并得到一阶累加数列

图2显示了分别对2014和2015年的客座率数据进行累加处理后得到的曲线,可看出累加处理后的曲线较处理前,不但更加平滑且具有明显的单调性。

图2 XMNPEK航线2014和2015年客座率一阶累加曲线Fig.2 PLF first order accumulated value curve in 2014 and 2015 of XMNPEK route

1.2 基于DOW策略的回归预测

回归法是航班订座常用的方法[9],一般采用同一个DOW的历史数据对未来航班进行预测,和传统方法不同之处在于,该研究是对航线整体的预测,且将预测目标转换为客座率的一阶累加,但历史数据的选择依然采用了相同DOW的策略,如要预测第n天的客座率,可利用第n-49、n-42、…、n-7的历史数据,一般用前面7个数据点拟合曲线,每个数据点间隔7天,注意,这里暂时不考虑节假日对数据的影响。

首先对一阶累加结果进行线性拟合,设天数为xi,累加结果为yi,n=365,则拟合如下

该模型对于未来拟预测的数据可直接拟合,将某天的一阶累加预测结果记为b^i,则预测时需同时计算第i-1天的一阶累加预测结果b^i-1,如此,航线客座率在第i天的预测结果为

1.3 参考去年同期数据的回归预测

受市场经济影响,航线销售量持续增长,且由于节假日的影响,单采用n-49、n-42、…、n-7的历史数据进行线性拟合必然导致整体预测数据准确率降低,考虑到这两个因素,该研究首先使用线性回归对要预测的航线客座率及去年同期数据进行线性拟合,并找出同一点上的年度差值,进行组合预测。

假设预测2016年第i天客座率,预测过程如下:

1)通过一阶累加处理2014和2015年的XMNPEK航线的客座率数据,分别得到如下两个数列

这里要指出关键的一点,如果是参考往年同期的数据,拟预测年份的括号内标i记为年份对应的0~365天,代表相对应拟预测年份第i天的去年同期的某个日期。

2)将两个数列分别进行线性拟合,得到两条直线fb(2014)(x),fb(2015)(x)。

3)计算2014和2015的年度差值。差值模型为

其中:ωn(x)代表拟预测年份的x天分别映射到参考期年份同期之间年度差值,ω的下标n代表拟预测年份和最大参考期年份之间的差值;y为参考期中的最大参考年份。

因此,2014和2015的年度差值为

其中:预测年份为 2016,参考期为{2015,2014},n 为预测年份(2016)与最大参考年份(2015)差值为1。

4)式(8)为单独使用 2015、2014两年求得的年度差值,为了防止过拟合和降低特殊年份带来的影响,该研究中选取了2011—2015年某航空公司在XMNPEK航段上5年的全年数据进行预测,并分别以{2015,2014}、{2014,2013}、{2013,2012}、{2012,2011}4 组数据为参考期进行预测。重复步骤1)~步骤3),并计算年度差值。

5)根据现有的数据,经过线性回归,拟合ω1(x)、ω2(x)、ω3(x)、ω4(x),预测得到2015和2016之间的年度差值为ω0(x)。

6)外推得到预测2016年的客座率累加结果为

1.4 组合预测

为了提高精度,将上述两个预测模型的预测结果加权平均得到最终的预测结果为

其中,k1+k2=1。根据2014和2015年的历史数据,分别用1.1节和1.2节的算法预测2015年全年每天的客座率,并和实际值相比,得出预测误差项为

取 k1在(0,1)之间,以 0.02的精度遍历,分别求出每个k1对应的最小误差e,得到k1=0.38,k2=0.62。

2 实例分析与结果比较

以某航空公司XMNPEK航线客座率数据为例,该公司在本条航线上每日有7个班次,选取2014和2015年全年数据作为历史数据,用来预测2016年上半年数据,预测提前期25天。分别采用传统的回归预测法[10]、基于时间序列的预测法进行预测,该研究提出的组合预测算法,结果如图3~图5所示。

图3 传统回归算法预测效果比较图Fig.3 Comparison of traditional regression forecasting algorithms

图4 时间序列的算法效果比较图Fig.4 Comparison of time series for casting algorithm s

图5 组合预测算法效果比较图Fig.5 Comparison of combined for casting algorithms

表1中分别计算上述3种算法的平均绝对误差,显然,组合预测算法平均绝对误差远小于其他各种单一误差的最小误差,组合预测模型的效果较好。

表1 不同预测方法预测值平均相对误差对比Tab.1 Comparison of mean absolute errors of predicted values by different prediction algorithms

3 结语

本文主要研究航线旅客流量预测,为了解决航线上运力随时变化的问题,将传统的订座数预测转换为对客座率的预测,针对航线客座率数据随机性较大的问题,采用了一阶累加来平滑数据。在具体算法设计上,考虑到旅客流量和航空公司投入运力的逐年增长,以本年度和往年同期拟合曲线的点差值来模拟年度增长量,经多重线性回归,形成一种新的组合预测模型。实例仿真表明,组合预测模型比单一模型的预测结果更可靠、更合理。

[1]ARSLAN A M,FRENK JBG,SEZER SO.On the single-leg airline revenue management problem in continuous time[J].Mathematical Methods of Operational Research,2015,81(1):1-26.

[2]王 帅,潘志林.我国民航航路航线的优化和设计问题探讨[J].科技创新与应用,2016(21):67.

[3]王 楠,张 显.大数据时间序列分析航班旅客人数预测[J].统计与咨询,2016(4):26-28.

[4]王文然,陈金良,张舰齐.基于最小二乘支持向量机的航路流量预测与评估[J].东北师大学报(自然科学版),2015,47(3):83-89.

[5]朱 倩.基于小波神经网络模型的民航旅客流量预测研究[D].北京:北京交通大学,2014.

[6]张桥艳.国内航线市场需求预测方法研究[J].桂林航天工业学院学报,2016,21(1):20-23.

[7]张 乾.我国民航业和GDP关系实证研究[J].时代金融旬刊,2016(9):15-17.

[8]冯驰一,张 丽.民航客运量与GDP的线性分析[J].科学与财富,2012(9):33.

[9]施天威,赵忠明,刘永良,等.基于最小一乘法的瓦斯含量预测研究[J].矿业安全与环保,2016,43(1):54-56.

[10]瞿 钧.回归分析在航空运量预测中的应用[J].数理统计与管理,1988(3):7-10.

Combined forecasting model for passenger traffic volume on route

FAN Wei,ZHU Jiejie
(College of Computer Science,CAUC,Tianjin 300300,China)

Prediction of passenger traffic volume on route is one of the most important technologies of route network optimization.Traditional prediction method is based on passenger booking data.Generally used models include regression method,time series method and so on.However,these models consider less about the randomness of route flow data and the continuous growth of passenger volume.In order to solve these problems,combined forecast model is proposed based on regression method,which rely on two different reference periods.Construction of the model is divided into four stages:a.using load factor data to forecast and the visiting rate data of first-order accumulative smoothing makes the target curve becomes smooth and monotonous;b.using DOW method to predict the target year data;c.using the fitting curve of the adjacent pointvalue to simulate the annual growth amount and build a forecasting model;d.taking average weighted value based on forecasting results from the above two stages,and establishing a new combined forecasting model.XMNPEK segment guest rate data of an airline in 2011—2015 is used to predict the load factor data for the first half of 2016.Compared with traditional regression method and time series method,mean absolute error of the current method is reduced from 4.76 and 4.21 to 3.77 and the prediction accuracy is improved obviously.

passenger traffic volume on route;combined forecasting;linear regression;time series

樊玮(1968—),男,陕西乾县人,教授,博士,研究方向为数据挖掘、计算机软件理论与应用和智能信息处理.

TP301;V352

A

1674-5590(2017)05-0026-04

2016-12-08;

2017-03-02

国家自然科学基金项目(U1333109);中央高校基本科研业务费专项(3122016B006)

?

孟 欣)

猜你喜欢
客座率差值年份
提升高铁列车开行效益的实践与思考
数字日照计和暗筒式日照计资料对比分析
特殊的一年
红细胞压积与白蛋白差值在继发性腹腔感染患者病程中的变化
航空:上半年各航司运营数据解析
南航迎旺季 油价跌利好
关注
航空:客座率同比改善
什么是闰年?
一样的年份