基于ARMA模型分析的股价预测
——以中信银行为例

2020-01-03 12:18谢海宁
北方经贸 2020年12期
关键词:股票价格残差中信银行

谢海宁,尚 园

(武汉纺织大学,武汉430200)

1984年,我国第一支股票公开发行预示着我国金融市场迎来了改革开放,进入21世纪以后,股票投资已经成为国民理财不可缺少的一部分。对于投资者来说,能够预测股票未来发展趋势对于其投资理财规划具有非常深刻的意义。伴随着股票市场的繁荣,股民们不断寻求各种办法判断选择最优的投资组合,追求最大化自身收益。近年来,国内外都由此兴起了数家围绕着股票价格进行预测的社交平台,网友们自由发表自己预测股票价格走势的经验,学者们也在积极研究更加精准有效的股票价格预测算法。本文将主要对ARMA模型进行介绍,以中信银行历史数据建模,建立股票价格预测模型预测其未来一个月中信银行(股票代码:601988)的股票价格走势。然后对ARMA模型预测效果进行评析,通过分析结果为投资者提供一些合理的投资建议。

一、ARMA模型介绍及建模流程

(一)ARMA模型

自回归滑动平均模型(简称:ARMA模型)是一种随机时间序列分析模型,由博克斯(Box)和詹金斯(Jenkins)于20世纪70年代创立。它的基本思想是:某些时间序列是依赖于时间的一族随机变量,构成该时序的单个序列值虽然具有不确定性,但是整个序列的变化却有一定的规律性,可以通过相应的数学模型进行近似描述。[1]在ARMA模型中,对一组指标序列进行预测时,主要利用过去值、当期值以及滞后随机扰动项的加权建模,从而解释并且预测时间序列的变化发展规律。[2]建立ARMA模型进行时间序列预测分析时,该时间序列必须是平稳的。

假设yt是一个平稳的时间序列,对yt时间序列进行分类讨论:

当yt是它的前期值和随机项的线性函数时,就被称为p阶自回归模型,记AR(p)。表达式为:

其中,βi(i=1,2,3,...,p)是待估系数,εt为白噪声。

当yt是当期值和前期值的误差和随机项的线性函数时,就被称为q阶移动平均模型,记MA(q)。表达式为:

其中,α1(i=1,2,3,...,p)是待估系数。

当yt是当期值和前期值的误差与随机项,以及前期值的线性函数,就被称为自回归移动平均序列,记作ARMA(p,q)。表达式为:

其中,β1(i=1,2,3,...,p)和α1(i=1,2,3,...,p)都是待估系数,{εi}是为白噪声序列,通俗点来说,ARMA(p,q)就是一个“混合”模型,将AR模型和MA模型结合在一起,使得所使用的参数个数最少。

(二)ARMA模型的识别与估计

首先,ARMA模型建立的前提条件是目标时间序列必须满足平稳性和白噪声的要求。这里采用ADF检验研究序列的平稳性,观察残差序列的自相关图判断是否是白噪声。其次,针对模型的选择和定阶问题,这里通过自相关系数和偏自相关系数的性质,以及AIC准则和SC准则来确定。

1.ADF检验

ADF检验又称为单位根检验,如果被检测的序列中存在单位根,则该序列非平稳。表达式为:

原假设:序列至少存在一个单位根;备择假设:没有一个单位根。

若p>=α,则不能拒绝原假设,即存在单位根,序列非平稳;反之拒绝原假设,即不存在单位根,序列平稳。

2.白噪声检验

白噪声就是均值为零、方差为常数的稳定随机序列,计量模型中的随机误差项必须是白噪声,模型才有经济意义。表达式为:

H1:至少存在某个ρk≠0

原假设:自相关函数均为零,滞后m阶序列值相互独立;备择假设:至少存在一个自相关函数不为零,滞后m期的序列之间存在相关性。

当p>=α时,则不能拒绝原假设,序列为白噪声;反之拒绝原假设,序列为非白噪声。

3.根据自相关函数和偏自相关函数性质的方法

AR(p)的自相关函数是拖尾的,即会按指数衰减,或者正弦振荡衰减,偏自相关函数是截尾的,截尾处为自回归阶数;MA(q)模型的自相关函数是截尾的,截尾处对应移动平均阶数q,偏自相关函数则是拖尾的;ARMA(p,q)模型的自相关函数和偏自相关函数都是拖尾的,自相关函数是q-p步拖尾,偏自相关函数是p-q步拖尾。[3]

4.AIC信息准则(Akaike information criterion)和SC准则(Schwarz Criterion)

AIC和SC的指标都是负数,一般值越小表示模型越精简(绝对值越大越好)。通过逐期增加模型的滞后变量建立模型,比较每个模型中AIC和SC统计量,取最小的统计量对应的滞后期数作为模型的阶数。

(三)建模流程介绍

博克斯(Box)和詹金斯(Jenkins)针对ARMA模型的选择时提倡应该遵循节俭性(parsimony)原则,并提出建模过程的系统方法论,称为Box-Jenkins方法论。该方法包括四个阶段:第一,通过ADF检验判断观测序列是否是平稳序列,若不是,可通过差分变换将观测序列转化为平稳序列;第二,根据自相关系数和偏自相关系数的性质以及AIC准则和SC准则判断出合适的ARMA模型(确定阶数)用于分析;第三,利用最小二乘法估计模型的未知参数;第四,检验构建的ARMA模型是否满足模型的假设前提,其残差序列是否是白噪声,若不是或者存在一定的偏差,模型则需要修正;第五,使用得到的模型进行预测。

二、实证分析及预测

(一)数据来源

本文数据来源于同花顺财经网,选取中信银行2018年1月1日至2019年12月31日的股票日开盘价数据,共计487个样本数据。接下来基于ARMA模型的理论下,利用EViews 8对中信银行的未来股票价格走势进行分析预测。

(二)实证分析

1.检验原始数据序列是否为平稳序列

根据ARMA模型建模的前提要求,对原始样本数据进行平稳性检验,将中信银行487组样本数据导入EViews 8软件中,并且画出其时间序列图,观察图形走势,可以初步判断该时间序列是非平稳的,进一步对原始数据选择含有截距项和趋势项的ADF检验,其t值为-1.444275,p值为0.8468接近于1,t值的绝对值小于1%的显著性水平下的临界值,所以不拒绝原假设,该时间序列为非平稳序列。再次对该时间序列进行含有截距项、不含有截距项和趋势项两种情况的ADF检验,发现结果均不拒绝原假设,该时间序列是非平稳序列。

对该时间序列进行平稳化处理,对原始数据进行一阶差分,一阶差分后的时间序列图以及ADF检验,t值为-21.68150,其绝对值大于1%的显著性水平下的临界值,p值为0,所以拒绝原假设,一阶差分后的序列为平稳序列。接下来以一阶差分后的序列进行建模分析。

2.确定最优的ARMA模型

观察原始数据的自相关图和偏自相关图,可见原始数据的相关图衰减很慢,因此原始数据序列是非平稳序列,画出一阶差分后的DY序列的自相关图和偏自相关图,发现DY序列的自相关系数和偏自相关系数迅速趋于0,围绕着0上下波动,并且均存在明显的拖尾,依据模型识别的基本原则,将建立ARMA模型。

通过图6可知模型中的p、q值可选取1或者2,因此我们选取ARMA(1,1)、ARMA(1,2)、ARMA(2,1)、ARMA(2,2)四种模型进行比较,根据AIC准则和SC准则选取最优模型,结果显示ARMA(2,2)模型的AIC和SC统计量最小,该模型最优。

表1 AIC/SC/HQ统计量结果汇总表

3.建立ARMA(2,2)模型和参数估计

观察ARMA(2,2)模型的估计结果,可以看出参数估计值中AR(1)、AR(2)、MA(1)、MA(1)的系数具有统计意义,而常数项的p值为0.31,并不显著,故剔除。剔除之后,重新对模型ARMA(2,2)进行估计和检验,结果表明:模型的系数依然显著,但是AIC和SC统计量增大,故为了拟合效果更好选择保留常数项。因此,模型表达式可以写成:

其中,εt为残差序列。

4.对模型进行检验

一是白噪声检验。接下来对参数估计后的残差序列进行白噪声检验,若残差序列为非白噪声序列,则建立的AEMA模型仍然需要改进。画出残差序列的自相关图和偏自相关图,可知该残差序列的p值都大于0.05,这表明所有的Q值都小于0.05的显著性水平下的卡方分布临界值,且自相关与偏自相关图显著趋于0,即残差序列不存在自相关,该序列是白噪声序列。综上所述,ARMA(2,2)模型符合要求,可以运用ARMA(2,2)模型对中信银行未来股价进行预测。二是模型的预测。利用AEMA(2,2)模型对中信银行2019年12月31日后的22天的股票价格进行预测,动态预测几乎成一条直线,故选择采取静态预测。将预测结果与实际的股票价格进行对比,拟合趋势图可以看出,其实预测结果还是较好的,尤其是前15日,后5日的预测值与实际值的误差偏离比较大,因此,模型对短期内的股票价格走势预测能够得到一个比较好的结果,但是就长期而言,影响股票价格波动的因素太多,比如宏观政策调控(例如《中华人民共和国外商投资法》正式发布),重大突发性事件的发生(例如新冠肺炎)等,ARMA模型就无法对股票价格进行准确的预测了。

三、结论

(一)ARMA模型的优缺点

1.优点

图1预测结果与实际值对比图

通过对中信银行2018年1月1日至2019年12月31日共计487组开盘价数据预处理,利用一阶差分后的序列构建AEMA(2,2)模型,利用静态预测方法预测未来22日的股票价格走势,预测结果总体较好。股票市场瞬息万变,其走势一般是非平稳的,通过ARMA模型预测短期内的股票价格具有一定的实践意义,投资者可以根据模型预测结果判断某只股票短期内的盈亏变化,有助于帮助投资者进行理性理财。

2.缺点

ARMA模型针对的是平稳序列,在对数据的处理方面可能产生系统误差,股票每日开盘价收集会存在一些缺失值,也会导致模型拟合时存在误差;其次,现实中有诸多因素可能导致股票价格变化,而且AEMA模型针对短期预测具有较好的效果,不能对股票长期走势进行预测。

(二)研究结论及建议

本文对中信银行(股票代码:601988)2018年1月1日至2019年12月31日期间共计487组每日开盘价数据进行处理,以该组数据一阶差分后的序列为建模基础构建ARMA模型,对中信银行未来22日的股票价格进行估计。结果显示前15日预测值与实际值误差偏离较小,后5日误差偏离显著较大。因此,得出结论,ARMA模型针对短期内的股票价格进行预测,具有较大的参考价值,但是就长期而言,预测结果具有较大偏差。投资者在进行投资决策时,可以利用ARMA模型对短期内的股票价格进行预测,制定短期投资计划。就长期而言,更需要不断探索更加准确的股票价格预测模型。

猜你喜欢
股票价格残差中信银行
多级计分测验中基于残差统计量的被试拟合研究*
基于残差-注意力和LSTM的心律失常心拍分类方法研究
用于处理不努力作答的标准化残差系列方法和混合多层模型法的比较*
融合上下文的残差门卷积实体抽取
上市公司财务指标与股票价格的相关性实证分析
人民币汇率与上证指数互动的实证研究
员工持股计划对股票价格的影响
实证分析会计信息对股价的影响