基于ARIMA SVM的体育彩票销售量预测

2017-08-07 09:24鄢正纲
周口师范学院学报 2017年2期
关键词:体育彩票销售量向量

鄢正纲

(中南财经政法大学体育部,湖北武汉430064)

基于ARIMA SVM的体育彩票销售量预测

鄢正纲

(中南财经政法大学体育部,湖北武汉430064)

体育彩票销售量受到多种综合因素影响,呈现出复杂的、非线性的动态变化特性.为了准确刻画体育彩票销售量的变化特征,提出差分自回归移动平均和支持向量机相融合的体育彩票销售量预测模型.首先根据体育彩票销售量时间序列建立ARIMA模型,拟合体育彩票销售量的线性变化部分,然后采用支持向量机对差分自回归移动平均的预测残差进行建模,拟合体育彩票销售量的非线性变化部分,最后采用具体体育彩票销售量数据进行仿真实验.仿真结果表明,相对于其它模型,该模型具有更高的预测精度,可以更准确反映体育彩票销售量的变化趋势.

体育彩票销售量;差分自回归移动平均;支持向量机;组合预测

随着经济的迅速发展,体育彩票也随之壮大,为国家和社会筹集了大量的公益金,并带动了相关产业发展.对体育彩票的未来销量进行准确预测,为体育彩票的营销推广提供科学依据,对体育彩票产业的健康发展具有十分重要的意义[1].

针对体育彩票销售量问题,国内外学者进行了大量而深入地研究,并取得许多研究成果.体育彩票销售量与经济水平、市场规模、居民收入、节假日相关,变化非常复杂,传统体育彩票销售量模型主要是差分自回归移动平均模型(autoregressive integrated moving average,ARIMA),其主要思想是利用体育彩票销售量前m个数据量作为描述因子建立回归模型,对未来体育彩票销售量进行预测,然而ARIMA本质上属于线性模型,在描述时间序列的线性特征时有一定的优越性,但在描述其非线性特征时却具有局限性[2].随着机器学习算法的不断成熟,支持向量机(support vector machine,SVM)在体育彩票销售量预测中取得了不错的应用效果[3-6].然而体育彩票销售量受到人的心理、体育赛事等影响,具有明显整体趋势变动性和季节波动性,以及随机性,仅使用SVM无法对体育彩票销售量进行高精度地预测[7-9].近年来,根据组合优化理论,研究人员将不同模型组合在一起,实现优势互补,可以提高预测精度,因此组合预测模型为体育彩票销售量预测问题提供了一种新的研究思想.

为了提高体育彩票销售量的预测精度,利用ARIMIA和SVM的优点,提出了一种ARIMA和SVM相融合的体育彩票销售量预测模型(ARIMA -SVM),最后利用某地区体育彩票销售量数据进行仿真实验.仿真结果表明,ARIMA-SVM获得了较高的体育彩票销售量预测精度,同时相对其它体育彩票销售量预测模型,预测和建模效率更高,具有一定的优势.

1 ARIMA-SVM的工作流程

体育彩票销售量是按照一定的时间间隔收集的数据,是可以采用{x1,x2,…,xn}来表示,体育彩票销售量受到多种综合因素的影响,不仅具有线性、周期性变化特点,同时也具有非线性变化特征,其预测的数学模型可描述为:

式中,y^表示体育彩票销售量的预测值,f()表示预测模型.

ARIMA-SVM的建模与预测思想为:采用ARIMA对体育彩票销售量时间序列进行建模,对预测体育彩票销售量序列的线性特点进行描述,然后,根据残差值包含了体育彩票销售量时间序列的非线性特点,利用支持向量机进行建模,最后将两者进行相加,得到体育彩票销售量的最终预测值.ARIMA-SVM的具体工作流程如图1所示.

图1 体育彩票销售量预测模型的工作流程图

2 ARIMA-SVM的体育彩票销售量模型

2.1 ARIMA模型

ARIMA模型是Box等提出的一种时间序列建模方法,对原始序列Zt进行d阶差分,得到序列(1-B)dZt,设p和q为阶数,ARIMA(p,q)模型可以描述为:

式中,B为滞后算子;εt为白噪声;φi(i=1,2,…,p)和θj(j=1,2,…,q)为参数[10].

2.2 支持向量机

支持向量机通过函数φ(x)对数据进行非线性映射,将问题转化为凸二次规划问题:

式中,ξi2为训练误差;参数C为惩罚因子[11-12].

引入对偶问题的Lagrange约束规划,具体如下:

式中,αi为Lagrange乘子.

对式(3)中的ω,b,ξi,αi进行求偏导得到:

式中,i=1,2,…,l.

消去ω和ξi,得矩阵方程为:

式中,设Z=[φ(x1),φ(x2),…,φ(xl)]T,Y=[y1,y2,…,yl]T,ρ=[I1,I2,…,Il]T,α=[α1,α2,…,αl]T,ξ=[ξ1,ξ2,…,ξl]T,I为单元矩阵.

根据Mercer条件,可得:

解上述方程组得:

根据上述求解可得支持向量机的预测模型为:

2.3 ARIMA和支持向量机的体育彩票销售量预测

体育彩票销售量数据Zt可以描述为

式中,Lt和Nt分别代表线性和非线性变化规律.

体育彩票销售量预测模型的工作步骤如下:

(1)利用ARIMA模型对Lt建模,有:

式中,L^t为ARIMA的估计,et为估计残差.

对(10)式进行分析可以发现,et隐含Zt的非线性变化特点,因此,Nt可看作残差序列和原体育彩票销售量序列的非线性函数,即:

式中,f1是非线性变化部分的拟合函数;n,m均为正数.

因此,由(3)~(5)式有:

(2)根据式(12),利用支持向量机进行建模.将L^t,ei(i=t-1,t-2,…,t-n)和Zi(j=t-1,t-2,…,t-m)作为支持向量机的输入变量,Zt为输出变量,根据支持向量机进行训练建立体育彩票销售量预测模型.

(3)利用训练好的模型进行体育彩票销售量预测.

3 仿真实验

3.1 仿真环境及对比模型

为了验证ARIMA-SVM的体育彩票销售量预测性能,在Pentium(R)双核2.8GHz、4G RAM、Windows 7的操作系统计算机上,采用VC++进行仿真实验.为了测试ARIMA-SVM的优越性,选择ARIMA和SVM在相同条件下进行仿真实验,其中支持向量机参数采用遗传算法进行优化.采用均方根误差(RMSE)和平均相对百分比误差(MPAE)对体育彩票销售量预测结果衡量.

3.2 数据来源

仿真数据资料来源于2010-2013年某地区的体育彩票月销售量,共48个数据,具体如图2所示,其中以前24个月体育彩票销售量作为训练样本进行建模,最后24个体育彩票销售量作为测试样本测试模型的泛化和推广能力.

图2 2010-2013年某地区的体育彩票销售量图

3.3 模型的实现

对体育彩票销售量预处理,采用DPS 6.5软件作为建模工具,通过ARIMA模块建立体育彩票销售量偏相关和自相关图,如图3所示.

图3 原始体育彩票销售量偏相关和自相关图

从图3可知,该体育彩票销售量自我相关性极高,自相关性呈下降趋势,有拖尾现象,对其进行差分处理,使其变成平稳时间序列,在进行一阶差分后,1阶偏相关和自相关图如图4所示,从图4可知,体育彩票销售量基的阶数d=1,根据AIC准则和SC准则ARIMA模型为ARIMA(3,1,2).

图4 体育彩票销售量1阶偏相关和自相关图

3.4 结果与分析

3.4.1 单步预测结果

ARIMA、SVM以及ARIMA-SVM的体育彩票销售量单步预测结果如图5所示,可以明显看出,相对于对比模型,ARIMA-SVM大幅度降低了体育彩票销售量预测误差,提高了体育彩票销售量的预测精度.

图5 ARIMA-SVM的体育彩票销售量单步预测结果图

表1 ARIMA-SVM与对比模型的单步预测误差

3.4.2 多步预测结果

ARIMA-SVM提前2和4步预测结果及预测误差的变化曲线如图6~图7所示.从图5可以清楚看出,ARIMA-SVM的预测误差率范围均小于10%,预测结果符合要求,可用于体育彩票销售量的预测.

多步体育彩票销售量预测误差见表2,从表2可以得到结论为:

(1)预测步长越大,ARIMA、SVM的预测误差增加幅度相当,预测精度低,难以描述体育彩票销售量变化趋势,预测结果没有什么实际应用价值.

(2)相对于ARIMA、SVM,ARIMA-SVM的预测精度得到相应提高,预测误差相对较小,这主要是由于ARIMA-SVM基于组合优化理论,从不同的方面对体育彩票销售量的变化趋势进行预测,预测结果更加可靠,可以获得较理想的体育彩票销售量预测结果.

图6 ARIMA-SVM的体育彩票销售量提前2步预测结果

图7 ARIMA-SVM的体育彩票销售量提前4步预测结果

表2 不同模型的体育彩票销售量多步预测误差对比

4 结束语

将ARIMA与SVM技术进行融合,建立体育彩票销售量组合预测模型,并采用具体体育彩票销售量数据进行仿真实验,仿真结果表明,ARIMASVM集成了ARIMA和SVM的优势,可以描述体育彩票销售量的变化特性,获得了更理想的体育彩票销售量预测结果,具有更高的实际应用价值.

[1]Ariyabuddhiphongs V.Lottery gambling:a review[J].Journal of gambling Studies,2011,27(1):15-33.

[2]谢琼桓.关于发行体育彩票的若干问题[J].体育科学,2000,20(3):7-9.

[3]刘炼,王斌.基于计划行为理论的体育彩民购彩行为研究[J].上海体育学院学报,2014,38(4):42-46.

[4]李海,陶蕊,傅琪琪,等.上海市体育彩票问题彩民现状[J].体育科研,2011,32(3):43-49.

[5]史文文,王斌,刘炼,等.体育彩票消费中问题彩民判断标准的研制[J].北京体育大学学报,2013,36(6):22-26.

[6]杨亚莉,程林林,张永韬.体育彩票销量的计量模型及促销策略研究—以四川省为例[J].成都体育学院学报,2012,38(9):1-7.

[7]李刚.彩票人均销量的决定因素和我国彩票市场发展趋势的预测[J].体育科学,2006,26(12):38-45.

[8]史文文.问题彩民的购彩心理与行为特征[J].心理科学进展,2012,20(4):592-597.

[9]李海.我国体育彩票问题彩民现状调查—以上海、广州、郑州、沈阳、成都为例[J].成都体育学院学报,2011,37(5):9-13.

[10]吴殷,李海.基于ARIMA模型的体育彩票销量预测—以上海为例[J].体育科研,2013,34(5):23-26.

[11]罗赟骞,夏靖波,王涣彬.混沌-支持向量机回归在流量预测中的应用研究[J].计算机科学,2009,6(7):244-246.

[12]张培林,钱林方.基于蚁群算法的支持向量机参数优化[J].南京理工大学学报(自然科学版),2009,33(4):464-468.

Sales volume prediction of sports lottery based on autoregressive integrated moving average and support vector machine

YAN Zhenggang
(P.E.Department,Zhongnan University of Economics and Law,Wuhan 430064,China)

Sales volume of sports lottery is comprehensively influenced by a variety of effects and has complex dynamic and nonlinear variation features,in order to accurately describe the sales volume of sports lottery,a sales volume prediction model of sports lottery based on autoregressive integrated moving average and support vector machine is proposed in this paper.Firstly,ARIMA model is used to predict linear structure of sports lottery sales volume,and then support vector machine is used to model the prediction residual of autoregressive integrated moving average,finally the specific sports lottery sales data is used to test the performance by simulation experiment.The simulation results showed that,compared with other models,the proposed model has higher prediction accuracy and can more accurately reflect the change trend of sports lottery sales volume.

sports lottery sales volume;autoregressive integrated moving average;support vector machine;combine prediction

TP183

A

1671-9476(2017)02-0123-04

10.13450/j.cnkij.zknu.2017.02.031

2016-07-18;

2016-11-25

湖北省高校省级教学改革研究项目(No.2013160)

鄢正纲(1978-),男,湖北武汉人,硕士,讲师,研究方向:体育教育训练学.

猜你喜欢
体育彩票销售量向量
向量的分解
5月份鄂尔多斯市煤炭销售量为5691万t 同比增长5%
聚焦“向量与三角”创新题
试论体育彩票公益金的使用与核算
中国体育彩票
中国体育彩票
2017年美国电动自行车销售量增长了440%
美国豆粕出口销售量预计为0到18万吨
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线