卷烟单规格月度销量的时间序列预测方法研究

2023-07-24 07:07何雪峰冯洪涛向其凤杨红玉夏体渊
中国市场 2023年20期
关键词:季节性月度卷烟

杨 蕾,何雪峰,张 涛,冯洪涛,向其凤,杨红玉,夏体渊

(1.云南中烟工业有限责任公司技术中心,云南 昆明 650231;2.云南财经大学 统计与数学学院,云南 昆明 650221;3.昆明学院 农学与生命科学学院,云南 昆明 650214)

1 引言

中国的卷烟消费市场已经从高速发展的阶段进入平稳成熟的阶段,新的经济环境也使得单规格卷烟的销量规律弱化。对单规格卷烟销量的精准预测,有助于企业及时把握市场状态,提高企业对市场的响应能力,提升卷烟营销水平。

对于卷烟销量的预测,学者和业界人士已经做过许多研究。在预测的时间类型上,年度数据的预测因时间短,样本少,没有周期、节假日等问题,相关研究最多。季度数据的预测需要解决季节性问题,但是节假日的影响不用单独考虑,因此该类型的研究也较多,如石涛等(2021)[1]。月度数据因其频率短,波动多,应用需求大,近年来也颇受关注,相关的研究有罗彪等(2012)[2]、武牧等(2016)[3]、吴明山等(2019)[4]。且数据获取困难且波动性过大,相关的研究非常少,目前仅见一篇,即邓超等(2021)[5]。从预测方法上看,样本量较小的年度预测通常使用灰色模型[6-7]、灰色马尔科夫模型[8-9]、回归模型[10-11]、组合模型[12-13]、系统动力学模型[14]、随机森林算法[15]。在季度预测和月度预测中,数据的周期性必须得到处理,相应的方法有趋势比率模型[16]、季节ARIMA模型[17]、时间序列分解模型[18]、组合模型[4,19]、混频模型[1]等。随着大数据技术的兴起,机器学习方法也运用到卷烟销量预测中,如支持向量机[3]、神经网络[20]等。并且,有学者注意到节假日尤其是农历的春节等对卷烟销量的影响,提出了针对性的改进方法[21]。

已有的文献为研究卷烟销量的月度预测提供了坚实的基础。但是,在以下几点上仍然存在改进的空间。一是现有的月度预测集中在一个区域的总销量上,鲜有单规格卷烟的销量预测;二是对春节等农历节假日的处理仍不尽如人意,春节属于移动假日,其影响的月份不固定,简单的设置成0~1虚拟变量难以准确度量春节效应;三是在预测方法上,考虑了季节调整、趋势循环、不规则变动和移动节假日的Census X13-ARIMA-SEATS方法还未应用到卷烟的月度销量预测中,而该方法是目前为止最新的季节调整方法[22]。文章拟以某省单一规格玉溪(软)的月度销量数据为基础,构建和引入五种预测方法,对其月度销量进行预测,并选出最优方法。

2 材料与方法

2.1 研究对象

文章使用2015年1月至2020年12月共72个月的数据进行模型估计并预测,利用2021年1月至10月的实际销量数据进行预测的检验。

2.2 研究方法

2.2.1 回归分析预测方法

回归分析通过建立变量间的回归方程,根据解释变量的预期值来对被解释变量进行预测[23]。考虑影响卷烟月度销量的影响因素,假设卷烟销量的长期趋势与周期性之间没有叠加效应,拟建立如下加法回归预测模型:

式中,yt为卷烟月度销量,μt为随机误差项;t为长期趋势变量,t=1,2,…,T;Sit为季节虚拟变量(=1,销量属于第i个月,=0,销量不属于第i个月,i=1,2,…,11);Zt为春节虚拟变量,假设春节对销量的影响在春节前是均匀的,计元旦到春节时的天数为m,Zt为Z1-Z12的循环取值。

式中,Dt为政策变量(=1,提税顺价(2015年6月)前,=0,提税顺价后);参数αi度量了第i个变量对月度销量的净影响;若卷烟销量的长期趋势和周期性之间存在叠加效应,还可建立销量预测的乘法回归模型。

2.2.2 指数平滑方法

指数平滑法是一种常用的中短期预测方法,按照平滑的次数,可以进行一次、二次和三次指数平滑。三次指数平滑模型又分为加法和乘法模型。乘法模型主要用于周期性和线性叠加的序列。平滑序列公式为:

yt+k=(a(t)+b(t)k)ct+k

加法模型主要用于周期变化稳定、线性趋势简单合成的序列。序列由下列公式给出:

yt+k=a(t)+b(t)k+ct+k

式中,yt+k为t+k时期的卷烟月度销量,α(t)为截距;b(t)为斜率,随时间t变化而变化,ct+k为季节因子。

2.2.3 引入虚拟变量的时间序列分解法

时间序列分解将原始序列拆分为长期趋势变动、循环变动、季节变动和不规则变动[24]。常用的模型有加法、乘法和混合模型。一般卷烟月度销量的趋势和周期存在叠加效应,多选择乘法或混合模型。

yt=TCt·St·It或yt=St·(TCt+It)

式中,yt为卷烟月度销量,TCt、St和It分别代表长期趋势变动、季节变动和不规则变动。

文章在处理季节因素时,将传统节日设为虚拟变量,构建基于时间序列分解和虚拟回归结合的改进模型,估测传统节日对序列的影响。用D1t(=1,1月,=0,其它月份)和D2t(=1,提税顺价前,=0,提税顺价后)分别表示春节变量和政策变量,建立卷烟销量长期趋势的回归模型。

TCt=β0+β1t+β2D1t+β3D2t+μt

2.2.4 季节ARIMA模型

按照博克斯—詹金斯的时域分析方法,建立季节ARIMA模型。假设季节变化周期为s,首先用季节差分法消除周期性变化,其次用一阶差分算子去除线性趋势。对于差分后的序列,可能还存在季节效应和随机波动间的交互影响,短期相关性和季节效应之间具有乘积关系,所以季节乘法模型实际上为ARIMA(p,q)和ARIMA(ms,ns)的乘积[25]。季节乘法模型的形式如下:

Φp(L)Am(Ls)(1-L)(1-Ls)yt

=Θq(L)Bn(Ls)εt

式中,L为滞后算子,Φp(L)、Θq(L)分别是L的一元p次和q次多项式,Am(Ls)、Bn(Ls)分别是Ls的m次和n次多项式,εt为白噪声。

2.2.5 X-13A-S方法

X-13A-S方法是X-11-ARIMA与SEATS的结合,主要用于经济数据的季节调整。X-13A-S方法首先建立RegARIMA模型,调整原始序列中的极端值和日历效应。RegARIMA模型是回归模型与ARIMA模型的组合,其形式如下:

Φp(L)Am(Ls)(yt-∑iβixit)=Θq(L)Bn(Ls)εt

式中,yt为被解释变量,xit为解释变量,回归残差yt-∑iβixit为平稳时间序列,满足季节ARIMA模型。X-13A-S方法运用RegARIMA模型对经过预调整后的序列进行向前和向后预测来补充数据,通过移动平均法从原序列中分离出趋势成分、循环成分、季节成分和不规则成分,最终对结果进行诊断。

3 结果与分析

3.1 五种模型的估计和优化选择

如图1所示,某省玉溪(软)卷烟从2015年1月到2021年10月的月度销量具有明显的周期性,但周期的振幅没有规律变化,2015年和2018年的峰值明显偏低,趋势变化不明显,不规则因素的影响较大。

图1 玉溪(软)月度销量的时序图情况

3.1.1 回归模型

分别估计加法和乘法回归模型,模型拟合优度为0.9532和0.9492,选择拟合优度较高的加法模型作为最终的预测模型,估计结果见表1所示。模型的拟合优度为0.9532,F统计量对应的P值为0,模型拟合的较好,在1%的水平下模型显著。解释变量中,除了季节变量S2不显著以外,其余变量均在5%的水平下显著,说明虚拟解释变量有较好的解释作用。模型的DW值为2.0577,表明模型不存在随机误差项的序列相关,可用于预测。时间变量t的系数为-23.9669,表明去除周期性和政策影响后,月度销量每月平均下降23.9669箱。春节效应变量Z和政策效应D均显著为正,表明春节所在月份确实高于其他月份的销量,提税顺价前的销量也明显高于提税顺价后的销量。

表1 回归分析的加法模型估计结果

3.1.2 指数平滑模型

分别估计三参数指数平滑加法和乘法模型,结果如下。

加法模型:

yt+k=0.05(yt-ct(t-s))+0.95(a(t-1)+b(t-1)+b(t-1)k-ct+k(t+k-s)

乘法模型:

(0.26(a(t)-a(t-1))+0.74b(t-1))k]ct+k(t+k-s)

式中,0.05,0.06和0.26为阻尼因子估计值。两个模型中的s均为“季节性周期”中指定的季节性频率,文章中s为12。加法模型的残差平方和为83821095,均方误差为1078.97。

乘法模型的残差平方和为1.15×108,均方误差为1261.26。加法季节因子和乘法季节因子见表2。从均方预测误差来看,加法模型的预测误差更小,选择加法模型作为预测模型。

表2 指数平滑模型提取的季节因子

3.1.3 时间序列分模型的预测结果

考虑到文章中的月度销量趋势和周期存在着叠加效应,因此选择乘法分解模型。首先使用季节指数提取周期性,其次采用线性回归提取趋势,剩余部分归为不规则变动。剔除季节因素后的趋势回归模型为:

式中,S1t和Dt为1月和政策的虚拟变量。经检验,模型整体显著,拟合优度为0.5251,所有变量均在5%的显著性水平下显著。分别对趋势和季节进行估计,然后合并成总的估计,结果如表3所示。

表3 加入虚拟变量的时间序列分解模型预测结果 单位:箱

3.1.4 季节ARIMA模型的估计和优化

首先对销量序列进行1阶差分去除趋势,然后进行12步差分消除季节性,通过绘制自相关和偏自相关图,确定可以估计AR(2)、MA(1)、ARMA(1,1)、ARMA(1,12)、SARMA(1,1)×(1,1)12以及SARMA(2,1)×(1,1)12等模型。运用ML法估计识别出的所有模型,经模型显著性检验(残差白噪声检验)和参数显著性检验后,SARIMA(1,1,1)×(0,1,0)12,SARIMA(1,1,1)×(1,1,0)12和SARIMA(1,1,1)×(0,1,1)12通过检验,可以用来预测。三个模型估计结果的对比如表4所示。

表4 SARIMA模型的优化选择

模型的选择通常根据信息准则来决定。从表中可知,SARIMA(1,1,1)×(0,1,0)12具有最小的SC值,SARIMA(1,1,1)×(0,1,1)12具有最小的AIC值。因此选择模型通过LR检验来进行。以SARIMA(1,1,1)×(0,1,1)12为基础模型,SARIMA(1,1,1)×(0,1,0)12作为嵌套模型,检验SMA项的系数是否为0的原假设,其LR统计量为3.84(prob>0.05),因此不拒绝原假设,应该以SARIMA(1,1,1)×(0,1,0)12作为最终的预测模型,其估计结果如下式:

3.1.5 X13-A-S方法

文章运用Eviews10软件中的Census X-13A-S程序,对数据不做转换,不考虑交易日影响和移动假日影响(对消费者而言,卷烟销售不存在交易日;前文的研究表明季节效应已经将春节和中秋效应包含在内),由X-11 Auto选择ARIMA模型,用X-11方法进行季节调整,X-13 Auto 进行趋势和季节过滤,可得到一个相对较好的预测。

在无季节性影响的假设下,稳定季节性F检验的统计量为18.367,在1%的显著性水平下存在季节性,稳定季节性非参数检验的Kruskal-Wallis统计量为79.354,在1%的显著水平下季节性存在;移动季节性F检验(原假设为年变化无影响)的统计量为1.354,在5%的显著性水平下没有证据表明移动季节性存在。综合三个检验的结果来看,玉溪(软)在某省的卷烟销量存在稳定的季节性,季节性随月变化,不随年变化。季节调整后的序列进行季节性检验的结果表明,在1%的显著性水平下序列中没有剩余的季节性。综上说明,X-13A-S方法能较好的消除卷烟销量中的季节性。

3.2 五种方法的预测结果对比分析

3.2.1 销量的预测结果分析

采用五种不同的时间序列预测方法,对某省玉溪(软)2021年1月至12月的销量进行预测。根据表5,各方法的预测基本体现了季节性,符合卷烟销售的周期性特点,在销量1月最大,12月最小。五种方法在1月的销量预测上差异最大,12月的差异最小。预测的差异和当月的实际销量总体呈正相关。

表5 五种方法的销量预测结果 单位:箱

3.2.2 预测的绝对误差分析

五种方法预测的绝对误差如表6所示。1月预测的绝对误差最大,4月最小。文章计算了1至10月的实际销量为49780.78箱,预测最为接近的是季节ARIMA模型,相差23.68箱,占实际销量的0.057%,预测差距最大的是时间序列分解法,相差8381.48箱,占实际销量的18.72%。

表6 五种方法的预测绝对误差分析 单位:箱

3.2.3 预测的相对误差分析

相对误差的计算结果如表7所示。从结果看,X13-A-S方法平均相对误差最小,为8.57%,其中6月预测误差最大,10月最小。时间序列分解、指数平滑和回归分析方法预测的平均相对误差均较大,主要原因在于1月份和2月份的预测偏差较大。

表7 五种方法的预测相对误差 单位:%

3.2.4 预测的标准误差分析

上述五种方法中,指数平滑方法和时间序列分解方法无法给出预测的标准误差,剩下三种方法的标准误差如表8所示。

表8 五种方法的预测标准误差 单位:箱

根据表8,标准误最小的是回归分析,在710箱左右。季节ARIMA模型和X13-A-S方法的标准误相差不大,在1400箱左右。X13-A-S方法的标准误差略低于季节ARIMA模型。

4 结论与建议

文章使用5时间序列分析预测方法对某省单规格(玉溪(软))的月度销量进行了预测。结果显示:回归模型、指数平滑、时间序列分解、季节ARIMA和X13-A-S方法均能有效提取季节因素、趋势和节假日效应,预测结果能较好地反映序列波动性,为未来卷烟的投放提供一定的参考。

卷烟销量主要受经济社会发展中长期趋势、周期和节假日因素影响。传统回归模型基于因果关系建立,再通过原因变量的已知或设定值,去估计总体均值[23]。卷烟销售市场监测指标如零售户个数、零售户进货量等和卷烟销量存在着高度的同期相关,并不适合做预测,因此文章的回归预测法主要使用可以外推的外生解释变量:时间变量t、月度虚拟变量和政策虚拟变量,避免了预测解释变量带来的误差。指数平滑法是使用过去若干期销量的加权平均作为下一期的预测,因此其趋势具有滞后性。单规格卷烟的月度销量在前一年的12月和后一年的1月由于销售策略和春节的影响,会产生较大幅度的跳跃。而每一年1月的销量预测是上一年最后几个月销量的加权平均,由此导致1月的销量预测出现严重的偏低。因此,指数平滑法可能不太适合周期波动比较大的时间序列预测。回归分析,指数平滑和时间序列分解模型在可变季节效应和不规则移动节假日效应处理方面欠缺,这可能是三类模型预测误差偏大的原因。

5 结论

预测方法中,季节ARIMA模型和X13-A-S方法在预测均值上拥有相对较小的绝对误差和相对误差。季节ARIMA模型和X13-A-S方法都使用趋势差分和季节差分来提取时间序列中的趋势和周期性,对随机趋势或波动复杂的周期效应更有效。不同之处在于X13-A-S方法增加了预调整、滤波和移动平均等来处理节假日效应、周期效应、趋势以及交易日效应等,从而能对周期性和节假日效应更充分剥离。

在销量均值的预测上,季节ARIMA模型和X13-A-S方法无绝对误差和相对误差在五种预测方法中都相对较低,因此预测效果明显优于其他三种方法,可作为卷烟单规格月度销量均值预测的基本方法和通用方法。

猜你喜欢
季节性月度卷烟
季节性需求放缓 钾肥价格下行
蔬菜价格呈季节性回落
远离季节性过敏
卷烟包装痕迹分析
我国卷烟需求预测研究述评
卷烟引燃倾向测试方法的研究与改进
卷烟加料中1,2-丙二醇的快速测定方法