指数平滑法在铁路运输指标预测分析中的应用

2021-04-22 10:44杭良文中国铁路上海局集团有限公司南京东机辆段
上海铁道增刊 2021年1期
关键词:预测值系数变化

马 力 杭良文 中国铁路上海局集团有限公司南京东机辆段

1 研究背景

在铁路运输管理中,各级领导经常会要求统计部门提供在未来一段时间内运输指标完成情况预测,以便领导在调整运力、技术改造、新线建设等决策时参考。影响铁路运输指标完成情况的因素较多,例如:宏观经济政策、工业生产景气程度、节假日、天气变化、春运、学生客流等,这些因素包含长期趋势影响、季节性变化、随机性等变化特点,数据变化复杂不能简单用公式描述。对于运输数据预测拟合,是数据分析的重要目的之一,也是运输数据发展趋势预测的重要手段。传统的时间序列数据分析模型较多,本文主要针对指数平滑法模型在拟合铁路运输数据的作用效果进行研究。

2 分析模型

指数平滑法是分析数据的常用方法。主要分为单参数指数平滑法、双参数指数平滑法等。本文分别使用两种方法进行分析。为了更好评价数据拟合结果的优劣,定义评价指标平均误差比例、估计标准误差。

2.1 单参数指数平滑模型

单参数指数平滑法是将一段时期的预测值与实际值的线性组合作为i+1期的预测值,其预测模型为:

式中,yi表示第i期的实际值;表示第i期的一次指数平滑值(预测值);a表示平滑系数(0<a<1)。

2.2 双参数指数平滑模型

双参数指数平滑法又称Holt 方法,常见的双参数指数平滑法有加法模型和乘法模型。乘法模型可以看成是在加法模型基础上取对数,所以乘法模型是加法模型的特殊形式。本文选用加法模型,得到双参数指数平滑法计算公式为:

3 数据预测分析

3.1 铁路运输数据特点分析

如图1所示为南京东机务段2017年-2019年全段机车总走行数据变化。机车总走行是反映运输工作量的基本指标之一,也是反应各类运用机车本务走行公里与辅助走行公里之和的重要数据。从图中可以看出,机车总走行数据主要有长期趋势变化、季节性周期波动以及随机性变化的特点。从长期来看,南京东机务段机车总走行公里呈上升趋势,主要是因为长三角地区人口居住密集、工业基础较好、商品贸易发达,受到地方经济辐射,市场需求较大,铁路线路里程不断增加,铁路运输量不断增加。运输数据季节性波动主要体现在每年2 月(春运)、9 月(学生开学季)以及10 月(国庆黄金周)会出现运输高峰,而在每年4月、6月、11月运输数据则相应较低,进入运输淡季。此外受到市场经济波动和国家政策调整的影响(例如:钢铁去产能、煤炭减产等),运输数据也存在一定随机性变化。

图1 2017年—2019年机车总走行数据变化

3.2 单参数指数平滑法分析

单参数指数平滑法是对时间序列数据由近及远采取具有逐步衰减性质的加权处理。每一期预测值都是上一期实际值与预测值的加权平均。其权数由近及远按照几何级数的衰减,特点是近期权数较大,远期权数较小。加权系数符合指数规律,又具有平滑数据的作用。但是不能区分长期趋势和季节变化,而是将长期趋势、季节变化 、随机变化等因素都看成一个整体进行处理。

使用指数平滑法时数据处理的关键是确定一个合适的平滑系数,本文对平滑系数分别取0.2、0.5、0.8 工况下,分别拟合机车总走行数据,得到结果如图2 所示。从图中可以看出不同指数平滑系数下,都能对机车总走行数据进行拟合且与实际值间都存在一定误差。同时,随着平滑系数增加,数据波动性越弱,数据衰减较强。

图2 不同平滑系数下单参数指数平滑预测值与实际值对比

为了具体分析不同平滑系数a情况下数据拟合的效果,对不同平滑系数a情况下实际值与预测值间的平均误差比例、估计标准误差进行计算,将数据汇总得到表1。

表1 不同平滑系数a下的误差情况

从表1 可以看出,当平滑系数a=0.5 时估计标准误差最小,当平滑系数a=0.2 时平均误差比例最小。考虑平均误差比例是每一期误差比例的平均数,平均数易受到极值影响,不如估计标准误差更具有统计学的稳定性。所以认为估计标准误差小的平滑系数更佳。如果平滑系数取值接近1 时,数据变化幅度较大适用于时间数列数据变化剧烈的情况,以便很快跟随其变化。取值接近0 时,则各期数据的作用缓慢减弱,呈比较平稳的状态。而运输数据的变化具有长期趋势增加、短期波动较大的特点,则不能反应数据的波动性。在实际应用中拟合机车总走行数据,平滑系数的取值需要反复比较确定,数值偏大或偏小都会增加估计标准误差。

通过EXCEL规划计算,当平滑系数取值0.61时平均误差比例和估计标准误差分别为0.692%、934.7,此时计算得到的各期预测值与实际观测值之间的误差最小,效果最佳。平滑系数的取值直接影响过去各期数据对预测值的作用,当使用单参数指数平滑法时近期数据作用最大,远期各数据的作用迅速衰减,所以单参数指数平滑法适合短期数据预测,预测数据期数越多准确性越低。

3.3 双参数指数平滑法分析

双参数指数平滑法将数据的影响因素分解为“平滑值+趋势值”,然后通过对数据的平滑值和趋势值分别进行加权处理。由于两个参数加权作用,数据衰减程度不会较快递减,避免了单参数指数平滑法中近期权数较大远期权数较小情况,强化了数据平滑的作用。

使用指数平滑的关键点是:①初始平滑值和趋势值的确定,②确定两个合适的平滑系数a、β。如果确定的平滑值和趋势值不能很好的代表数据特点,后期的数据发展趋势会偏离实际值。平滑系数a、β代表后期数据的衰减和加权变化,其特点是反应季节变化和趋势变化的影响因子在数据发展中所占的加权比例。对于初始平滑值和趋势值的处理,常规做法是运用线性方程法确定数据的初始平滑值和趋势值。因为回归方程的特点就是利用最小二乘法对参数进行估计,拟合的平滑值和趋势值保持偏导数为零的特点。本文也采用回归方程法确定初始平滑值和趋势值。而对于平滑系数a、β 处理,采用枚举法确定。利用EXCEL 进行规划求解,以估计标准误差最小为主要目标,查找分析最佳的平滑系数a、β 取值。通过计算发现当a=0.082,β=0.013 时,此时平均误差比例和估计标准误差分别为0.223%、735.89,估计标准误差达到最小值。双参数指数法预测值和实际值对比结果如图3所示,预测值过滤了一定的随机波动,使得数据结果更加平滑,同时也能反应出数据的季节变化和长期趋势变化的特点。

图3 双参数指数平滑预测值与实际值对比

3.4 结果对比

针对本文涉及的两种指数平滑法,分别取估计标准误差最小时的预测数据,将主要评价指标对比得到表2。

从表2可以看出双参数指数平滑法预测结果比单参数指数平滑法预测结果的误差更小。单参数指数平滑法通过拟合使得数据中短期偶然性因素的影响被削弱,从而显示出数据在较长时间的基本发展趋势。对预测结果的准确性会随着期数增加逐级降低,使得观察值离预测值时期越久远权数变得越小,双参数指数平滑法其基本原理是把具有长期趋势、季节性变化的时间序列进行分解,通过数据处理可以过滤掉随机波动的影响。双参数指数平滑法克服了单参数指数平滑法不能区别长期趋势和循环变动的缺点,也解决了一个参数权数比重逐渐变小的问题。所以从预测结果看双参数指数平滑法比单参数指数平滑法更好,更适合铁路运输指标预测分析。

表2 单参数和双参数指数平滑法的误差情况对比

4 结论

通过单参数和双参数指数平滑法模型在预测铁路运输数据的作用效果进行研究分析,得到的结论有:

(1)指数平滑法可以过滤数据随机性变化,使得预测数据能够在一定误差范围内反应周期性(季节性)和长期趋势变化特点。

(2)单参数指数平滑法在预测数据时,数据期数越多衰减越大准确性降低,不适合长期预测。

(3)双参数指数平滑法在预测数据时,可以分解平滑值和趋势值,通过两个参数加权作用使数据变化更加平滑,降低数据衰减带来的误差,更贴近实际值。

(4)通过两种方法对铁路运输数据的拟合,从误差结果分析,双参数指数平滑法更适合用于数据的预测分析。

猜你喜欢
预测值系数变化
基于符号相干系数自适应加权的全聚焦成像
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
AI讲座:ML的分类方法
从9到3的变化
这五年的变化
嬉水
高阶变系数齐次线性微分方程常系数化的判别准则
鸟的变化系列
“让路”让出的变化