隔夜收益率能提高高频波动率模型的预测能力吗

2017-01-20 11:16黄登仕庄晓洋
系统工程学报 2016年6期
关键词:极差波动收益率

马 锋,魏 宇,黄登仕,庄晓洋

(西南交通大学经济管理学院,四川成都610031)

隔夜收益率能提高高频波动率模型的预测能力吗

马 锋,魏 宇,黄登仕,庄晓洋

(西南交通大学经济管理学院,四川成都610031)

将隔夜收益率作为解释变量加入到高频波动率模型中,研究其对模型预测精度的影响.以沪深300指数为例,运用样本外预测技术及新颖的模型可信集检验方法,同时选取比RV更为稳健的两尺度已实现波动率为基准波动率,实证研究表明,隔夜收益率对短期波动率存在显著的非对称效应;隔夜收益率能改善各波动率模型的拟合能力,并能显著提高模型的短期预测能力;在预测短、中及长期波动率时,已实现和已实现极差高频波动率模型的预测表现并不一致.

波动率预测;隔夜收益率;已实现和已实现极差波动率;模型可信集检验

1 引 言

对金融资产收益的波动率描述和预测是现代金融学界和实务界研究的热点和难点问题,同时,它与资产定价理论的检验、最优资产组合的选择、衍生产品套期保值策略的设计以及金融风险的测度和管理密不可分.早期对波动率的研究主要集中在GARCH、SV及它们的扩展模型,但无论是在刻画还是预测波动率等方面,这些模型表现得并不理想[1],且损失了大量的日内交易信息[2].近几年,随着计算机技术的飞速发展和金融高频数据获取性逐渐增强,学者们开始利用日内高频数据进行波动率测度和建模.具有代表性的是Andersen等[3,4]提出的已实现波动率(realized volatility,RV)测度方法,它不仅计算简便、无模型,而且具有无偏性和较好的稳健性等优点,另外,在波动率刻画和预测等方面也取得了一定的成效[5-11].

然而,Corsi[2]指出分整模型(如ARFIMA)仅是一个便利的数学技巧,缺乏明确的经济解释.另外,由于分整模型需要构建分数差分算子,这样会导致损失大量的观测值,即损失了大量的交易信息. Corsi[2]基于异质市场假说(heterogeneous market hypothesis)提出了简单的异质自回归已实现波动率模型(heterogeneous autoregressive model of realized volatility,HAR-RV),且通过模拟和真实的金融市场数据进行实证,结果表明HAR-RV模型在样本外的预测能力明显优于短记忆模型,而与ARFIMA模型的非常接近.相比ARFIMA模型,HAR-RV不仅避免了ARFIMA模型的复杂估计,而且还可成功复制出金融收益率序列的长记忆性、胖尾等“典型特征”.

另外,Christensen等[12,13]基于日极差波动率的思想,提出了基于日内高频数据的已实现极差波动率(realized range volatility,RRV),并证明了RRV在理论上要比RV至少高效5倍.尤其是对极端事件等, RRV更具信息含量[13,14].近几年,RRV受到了国内外学者们的广泛关注[12-20].另外,已有学者[14,16-18]利用HAR-RRV模型研究其对金融市场波动率的预测能力和测度风险等.然而,就目前所检索的国内外文献来看,本文发现鲜有文献评价HAR-RV和HAR-RRV对波动率预测能力的优劣.

随着日内高频数据的广泛应用,国内外学者逐渐发现,金融资产日内高频收益率在日内近似连续的时间内有可能会出现大幅波动,而这种现象称为“跳跃”(jump).Lee等[21]指出,跳跃对金融资产收益波动率的刻画和预测具有非常重要的意义.自Barndorff-Nielsen等[22]提出已实现二次幂变差(realized bipower variance, BPV)的概念后,学者们可成功地计算在跳跃扩散过程下的高频数据波动跳跃的大小.Andersen等[23]在此基础上,提出了HAR-RV-J和HAR-RV-CJ模型.另外,Christensen等[12,24]利用Barndorff-Nielsen等[22]的思想,也构建了基于已实现极差波动率的跳跃测度,且提出了跳跃的显著性检验.类似地,本文构建含跳跃和显著性跳跃的已实现极差波动率模型,分别标记为HAR-RRV-J和HAR-RRV-CJ.

值得一提的是,大量影响股票价格波动的事件一般发生在非交易时间[14],如我国证监会更倾向于在收市后发布消息.因此,前一天因收市发布的消息对股票价格的影响会在开盘时得到显著反映[25].由此表明,隔夜收益率对股票价格的波动起到特殊的作用[14,25].另外,股票波动常常表现为非对称性,当股价下跌时,股票波动加大;当股价上涨时,股票波动下降,Black[26]称这种现象为杠杆效应.鉴于此,本文将隔夜收益率及其杠杆效应作为解释变量,分别引入到上述六种高频波动率模型中,并研究它们对各波动率的模型的拟合精度和预测能力的影响.

鉴于此,本文将隔夜收益率作为解释变量引入到上述六种高频波动率模型中,研究其对波动率模型拟合程度和预测精度的影响.选择相比RV更稳健和更接近真实市场波动率的两尺度已实现波动率(two scales realized volatility)作为真实波动率的替代变量,并运用样本外的滚动时间窗技术,计算了上述波动率模型在样本外的预测值.一方面已有研究[27-29]发现样本内拟合优度的检验往往会受到数据挖掘偏误的影响,而样本外的滚动预测方法则可以规避此类偏误所造成的问题.另一方面,Egorov等[30]指出对计量模型优劣的判断不是看其在样本内对数据拟合的好坏,而是要看其样本外的预测能力.为保证结论更加严谨和可靠,本文还使用了Hansen等[31]最近提出的“模型可信集”(model confdence set),实证检验了上述波动率模型对中国股票市场实际波动特征的刻画能力和预测精度.相比Hansen等[32]在2005年提出的“高级预测能力检验法”(superior predictive ability,SPA),MCS检验法的条件更为宽松,与SPA检验主要的区别是它不需要选择基础模型,因此其检验结果更具稳健性和外延性.

2 已实现和已实现极差高频波动率模型

2.1 已实现波动率模型

首先,假定pt为股票在t时刻的对数价格,其连续时间跳跃扩散过程表示为

其中ut是连续且局部有界的方差过程,σt是严格为正的,且样本路径右连续、左极限存在的随机波动过程(允许发生跳跃),Wt是标准布朗运动,qt是时变强度为λ(t)的计数过程,有p(dqt=1)=λ(t)dt,κt≡pt-pt-,κt表示的是对数价格过程离散跳跃成分的大小.

进一步,根据二次变差理论,则有

其中r表示收益率.

由式(2)不难得出,波动率可分为两个部分:连续的样本路径方差(积分波动率)和离散的跳跃方差.然而,在真实的股票市场交易中,24 h连续交易几乎无法实现,因此真实的波动率(即式(2)左部分)则无法测度.但有学者指出[2,3,23,33-34],当抽样间隔Δ→0时,则有

其中RVt表示的是已实现波动率(realized volatility,RV),定义为金融资产日内高频收益率的平方和,另外,将1 d的交易时间表示为1,即有已实现波动率满足如下等式,即

在同样的假定下(Δ→ 0),积分波动率(integrated variance,IV),即可以用已实现二次幂变差(realized bipower variance,BPV)测度,定义为

另外,李胜歌等[35]利用上证综指和深圳成指的1min高频数据从理论和实证方面对比探讨了RV和BPV的有效性.根据式(3)~式(5),则有

由式(6)得到的跳跃成分可能出现负值,为了保证跳跃的非负性,最终定义跳跃成分为

在Huang等[36]显著性跳跃检验和HAR-RV-J模型的基础上,Andersen等[23]又提出了HAR-RV-CJ模型,其中显著性跳跃成分定义为

其中I(·)为示性函数.

式(8)中的Φα表示的是为标准正态分布的上1-α分位数,显然,置信水平α取值越高,显著性跳跃发生的可能性越低,另外,Zt表示的是Huang等[36]显著性跳跃检验的统计值,定义为

其中统计量Zt服从标准正态分布.

另外,TQt表示的是已实现三次幂次(realized tripower quarticity),定义为

其中u4/3=22/3Γ(7/6)/Γ(1/2),Γ(·)为Gamma函数.利用式(9)和式(10),可得到不同显著水平下的连续成分,定义为

其中CRVt,α为连续成分,它能够反映出从跳跃扩散过程中去除显著跳跃成分的波动对RV的影响程度.

另外,利用式(8)~式(11),可得HAR-RV-CJ模型

其中CRVWt和CRVMt分别表示的连续成分的周和月已实现平均波动率.

2.2 已实现极差波动率模型

Christensen等[12]发现在作为二次变差(quadratic variation,QV)的估计量时,已实现极差波动率的有效性是已实现波动率的7.2倍.为了表述清楚,将每一日的交易区间定义为[0,1],抽样间隔为Δ,则每一天可得到1/Δ个区间.其中第td的第i个区间内可观测的收盘价为P1,i,P2,i,P3,i,...,PL,i,则该区间内的最高收盘价为Hh,i=max(P1,i,P2,i,P3,i,...,PL,i),而最低收盘价为Ll,i=min(P1,i,P2,i,P3,i,...,PL,i),由此可得,该区间的极差收益率为si=ln(Hh,i)-ln(Ll,i).最后,已实现极差波动率为

结合二次变差理论的思想,Christensen等[12,24]指出当Δ→0,有

进一步,类似于Barndorff-Nielsen等[22]的研究,Christensen等[12,24]提出了基于极差的双幂次变差(rangebased bipower variation,RBV),定义为

从式(15)不难发现,当Δ→0时,RBV是积分波动率(IV)的一致性估计量.利用式(14)和式(15),可得

Christensen等[12,23]基于已实现极差波动率构建了检验资产价格跳跃的统计量,有

其中n等于1/Δ,t为总样本长度,RQQt,m是基于已实现极差波动率的四次幂次变差(range-based quad-power quarticity,RQQ),即

同样的,基于已实现极差波动率的跳跃等于(为与用RV估计的跳跃成分区分,用RJ表示用RRV估计的跳跃成分)

给定显著水平α,可得跳跃性波动,为

依据Corsi等[2]和Andersen等[23]的思想,可以构建HAR-RRV,HAR-RRV-J和HAR-RRV-CJ模型.值得注意的是,Christensen等[13]指出当m→∞,λr,m收敛于某常数1关于λ2,m与m值的关系如文献[13]中的图2所示..然而,当m取具体数值时,λr,m并不能从文献[13]获取.因此,为得到λr,m,结合文献[16,37]的思想利用蒙特卡洛模拟,模拟公式为

通过利用计量软件MATLAB 2010b模拟1 000 000次,表1给出了r=1,2,...,10的模拟结果.

表1 m和λr,m关系对应表Table 1 The relationship between m和λr,m

2.3 隔夜收益率

由于现实的股票市场几乎难以24 h连续交易,则会出现夜间停盘的情况,而隔夜收益率(overnight return,OR)则表示为第二天开盘价的对数值减去前一天收盘价的对数值,即

隔夜收益率在一定程度上反映了晚间停盘时所有消息(例如,宏观信息的发布)对股票市场的影响.Gallo等[25]指出隔夜收益率对捕捉条件异方差性的持久特征是个合适的指标,他们还指出在发生高回报(large return)和波动聚集性(volatility clustering)时,隔夜收益率对收益率的预测起到重要作用.Andersen等[38]指出虽然夜间休市没有交易数据,但隔夜收益率所包含的信息是不可忽视的.因此,已有不少国内外学者将其作为解释变量来研究其对波动率预测能力的影响[14,39,40-42],鉴于此,论文将隔夜收益率作为解释变量分别加入到HAR-RV,HAR-RV-J,HAR-RV-CJ,HAR-RRV,HAR-RRV-J和HAR-RRV-CJ六种高频波动率模型中.另外,Tseng等[14]指出隔夜收益率对未来波动率的影响存在“非对称”,即正和负隔夜收益率对未来波动率的影响并非是对等的.最后,将隔夜收益率,“非对称”效应作为新的解释变量加入到上述模型中,构建新的波动率模型,依次标记为LHAR-RV-O,LHAR-RV-J-O,LHAR-RV-CJ-O,LHAR-RRV-O,LHAR-RRV-J-O和LHARRRV-CJ-O.也就是说,本文不仅探讨研究隔夜收益率及其“非对称”对已实现波动率模型的预测影响,而且还探讨其对已实现极差波动率模型的影响,另外,本文还对比了上述12种高频波动率模型对未来波动率预测能力的优劣.

值得注意的是,当抽样间隔越小,即抽样频率越高时,价格本身包含的噪声越大,使得对各波动率的估计量不再可靠,进而降低了研究结论的可靠性和稳健性.但Andersen等[3]证实了外汇交易波动能很好地用288个每5 min取样的数据的变化平方和来估计,并进一步发现5 min的取样频率可在兼顾精确性和减少微观噪声之间取得平衡(trade-off).另外,文献[43,44]以上证高频数据为例,也证实了5 min抽样频率数据的合理性.文献[4,14,16,37]也利用5 min高频数据进行波动率测度及预测等方面的研究.鉴于此,本文选取5 min作为抽样频率,并以此对已实现波动率(RV)和已实现极差波动率(RRV)等进行建模和分析.

3 基准波动率测定及MCS检验

3.1 基准波动率测定

Andersen等[3]发现传统研究中多采用日收益率的平方作为日波动率的代理变量将面临非常严重的测量误差和噪声,而基于高频数据的已实现波动率则可以有效地降低这些误差和噪声对真实潜在的波动率的影响.但由于潜在真实的波动率是不可观察的,学术界开始利用已实现波动率作为市场波动率的代理变量进行相关研究.但需要特别强调的是,已实现波动率的测度与抽样频率有着密切的联系,如频率越高,它越趋近于真实的市场波动率,但伴随的噪声问题也越严重,从而导致估计出现偏差.因此,已实现波动率作为真实市场波动率的替代变量,也存在这样或者那样的不足.另外,用已实现波动率构建的高频率模型(例如,HAR-RV等),然后用它作为基准波动率与其他波动率模型(如GARCH-type模型等)进行预测能力比较,并发现已实现波动率模型在预测波动率方面具有更优的表现[5-8].尽管已实现波动率模型的预测效果更好,但有可能是因为模型本身对已实现波动率的拟合效果相比其他模型要好,另外,用其本身作为预测评价的基准,可能会造成“预测效果好的错觉”.由于本文涉及到两种波动率测度方法——已实现波动率和已实现极差波动率,倘若用RV或RRV作为真实市场波动率的替代变量,似乎不太合适.举例来说,如果用HAR-RRV-type模型预测波动率时,采取RV作为基准波动率,按常理来说,HAR-RV-type模型在预测比较时,优势更为明显.反过来,如果选取RRV时,对HAR-RV-type亦不合理.

鉴于以上分析,本文建议采用Zhang等[45]提出的两尺度已实现波动率(two scales realized volatility, TSRV)作为真实波动率的替代变量.一方面,有学者指出,相比RV而言,TSRV对噪声(microstructure noise)具有更强的稳健性[16,37,45,46],因为它不仅涉及到低抽样频率(如5 min抽样),而且还涉及到超高频波动率(如1~10 s抽样),充分利用了交易日内的信息.另一方面,近几年,已有学者利用两尺度已实现波动率作为真实波动率的替代变量,并取得了实质性的进展[15,16,37].但就目前所掌握的国内文献来看,本文发现鲜有学者利用两尺度已实现波动率作为基准波动率去评价波动率预测能力等相关研究.因此,本文采用该方法作为基准波动率的代理变量,不仅可保证结论更具外延性和稳健性,而且还丰富了国内相关研究的内容.

两尺度已实现波动率(TSRV)的测度表达式为

3.2 波动率预测方法及MCS检验

对各波动率模型进行滚动时间窗(rolling time windows)的“样本外预测能力检验”(test for out-of-sample predicting ability),选择的样本外预测窗口为371 d,然后采用向前预测1 d(one-ahead-step)的技术,即每个模型可得344个预测值2选择不同长度的估计样本和预测样本的实证结果基本一致,如果需要,作者可以提供不同样本长度上的模型检验结果,如预测样本长度为271,471,及571等..为节约篇幅,更为具体的预测步骤可参考文献[8].

然而需要说明的是,到目前为止,学术界还不清楚用哪一种损失函数(loss function)作为衡量预测偏差的标准最为合理.因此,Hansen等[6]建议,可以尽可能多地采用不同形式的损失函数作为预测模型精度的判断标准.基于这样的考虑,在本文的实证研究中采用了六种不同的损失函数分别作为各类波动率模型预测精度的评判标准.

这六种损失函数分别记为Li,i=1,2,...,6,其中L1和L2称为平均误差平方(mean squared error, MSE)和平均绝对误差(mean absolute error,MAE),它们是此类判断中最常用的两类损失函数.L3和L4分别是经异方差调整的MSE和MAE,而限于篇幅,对L5和L6的具体含义可以参考文献[6]的讨论.各损失函数的具体定义如下.

需要指出的是,如果在一次实证研究中发现:采用某种Li作为判断标准,得到了模型甲比模型乙的预测损失值小的话,那么只能判断:“在这样一个特定的数据样本中,采用这一特定的损失函数Li时,模型甲比模型乙的预测精确度高”.很明显,这一判断是不稳健的,且无法推广到其它类似的数据样本或者其它的损失函数判断标准.比方说,数据样本中的少数奇异点往往会严重影响损失函数的计算结果,从而引起损失函数值的异常增加,进而可能导致对波动率模型优劣的错误判断[6].

为了解决这一问题,Hansen等[32]提出了一种所谓的“高级预测能力检验法”(superior predictive ability, SPA),然而SPA检验需要选择基准模型,会导致产生“与对照组的多重比较”(multiple comparisons with controlling set)问题.为了克服这一缺陷,Hansen等[31]最近又提出了一种名为“模型可信集”(model confdence set,MCS)的模型比较方法.与SPA检验相比,MCS检验具有很多明显的优势,比方说,由于SPA检验的零假设是复合假设(composite hypothesis),它会影响SPA检验统计量的渐进分布,从而会产生“厌恶参数”(nuisance parameters)的问题,进而难以控制第一类错误(或称“拒真”)概率.而MCS检验则不用进行此类复合假设检验,从而可以大大减小第一类错误发生的概率.本文采用这种新的MCS方法来比较众多波动率模型对我国股市波动的预测精度,从而其结论应该具有更好的稳健性.

MCS检验的实现过程如下:首先,假定存在m0个波动率预测模型(就本文而言,m0=12),这些模型都在一个集合中,该集合记为M0,则有M0={1,2,...,m0}.每个预测模型都可获得M个未来1天的样本外市场波动率估计值,m=H+1,H+2,...,H+M.对每个预测值,都可按照本文给出的六种损失函数(L1,L2,...,L6)计算出相应的损失函数值,记为Li,j,m,i=1,2,...,6;j=1,2,...,u,v,...,m0,m=H+1,H+2,...,H+M.因此,对于M0中任意两个波动率预测模型u,v(u,v∈M0),都可以计算出相对应的波动率预测值的相对损失函数值

其次,定义“高级对象的集合”(set of superior objects)为

MCS检验过程是在集合M0中进行一系列的显著性检验,剔除集合M0中预测能力较差的模型.因此,在每一次检验中,零假设都是两个模型具有相同的预测能力,即

MCS检验的过程是依据等价检验(equivalence test)δM和剔除准则(elimination rule)eM.其中对于任何M⊂M0,等价检验δM都是用来检验零假设,而剔除准则eM是用来剔除拒绝零假设的模型.因此, MCS算法步骤为:第一步,设定M=M0;第二步,在显著水平α下,利用等价检验δM检验零假设H0,M;第三步,如果接受零假设,则定义否则利用剔除准则eM将拒绝零假设的模型从M中剔除,这一过程一直持续到不再出现拒绝零假设的情况,最后得到MCS检验下的幸存模型(surviving objects).集合包含了在1-α的置信水平下的最优预测模型.如果对于给定的模型k(k∈M0),该模型属于集合的条件是其MCS检验的P值大于显著水平α.换句话说,P值越大,表明该模型得到的波动率预测结果越精确.

相比SPA而言,MCS的检验统计量更为复杂.考虑到篇幅,本文仅介绍较为常用的范围统计量(range statistic)和半二次方统计量(semi-quadratic statistic)3除以上两种方法外,还有最大偏差(maximum deviation),偏差(deviation,from common average),最大t值(Max t)统计量等,具体内容可以参考文献[31].,其定义分别为

如果统计量TR,TSQ大于给定的临界值,表明拒绝零假设.由于统计量TR和TSQ的渐近分布依赖于“厌恶参数”(nuisance parameters),因此它们的真实分布非常复杂.然而,统计量TR,TSQ及相应的P值可以通过采用一种所谓的Bootstrap(自助法)来获得4关于Bootstrap的实现过程可以参考Hansen和Lunde[31]的相关论文..

4 样本数据及其统计性描述

研究的数据样本为沪深300指数从2008–01–02—2013–09–23的每5 min高频数据(剔除节假日等,共N=1 391个交易日),数据来源于“国泰安CSMAR股票市场高频数据库”.上海(或深圳)证券交易所每个交易日有4 h(即240 min)连续竞价交易时间,因此,采用每5 min钟记录一个数据的方法每天可以产生48个高频股价记录,则高频数据总量为66 768个.另外,在测定基准波动率(TSRV)时,超高频数据来源于股票行情软件—大富翁数据中心.其中,每一天的数据记录个数平均约4 766个,则样本内总记录数为6 629 506 (=4 766×1 391)个.

从表2可以看到,无论是已实现波动率,还是已实现极差波动率以及隔夜收益率等序列,都表现出显著的“有偏”(skewed)和“尖峰”(leptokurtic)形态,且都明显超出了正态分布假定的范围(Jarque-Bera统计量都很显著).在滞后5、10和20期内,除跳跃CJt序列外,各序列都具有明显的自相关特征(Q统计量都很显著).因此,论文发现已实现波动率和已实现极差波动率等序列都存在较为显著的长记忆(long memory)特征.另外,还发现已实现极差波动率的标准差明显小于已实现波动率的.进一步,ADF单位根检验结果表明,各序列都显著拒绝了存在单位根的原假设,表明各序列都是平稳(stationary)时间序列,进而可以直接作下一步的分析和计量建模.

表2 已实现波动率RV和跳跃等序列的描述性统计Table 2 Descriptive statistics of each time series

5 实证结果

5.1 估计结果

首先,将隔夜收益率(OR)和“非对称”分别引入到HAR-RV,HAR-RV-J,HAR-RV-CJ,HAR-RRV,HARRRV-J和HAR-RRV-RCJ六种高频波动率模型中,构建新的六种模型,依次记为LHAR-RV-O,LHAR-RV-JO,LHAR-RV-CJ-O,LHAR-RRV-O,LHAR-RRV-J-O和LHAR-RRV-CJ-O.表3是在总体样本(2008–01–02—2013–09–23)基础上的各类波动率模型参数估计结果,且均采用最小二乘法结合Newey West协方差修正形式进行估计.

表3 基于样本总体的各类波动率模型参数估计结果Table 3 The estimation results of the each volatility models in-sample period

从表3中不难发现,各波动率模型都具有较高的拟合优度(R2),并进一步发现,加入隔夜收益率(OR)和“非对称”的波动率模型的拟合优度略高于未加入的,即在一定程度上证实了它们有助于提高HAR-RV,HAR-RV-J,HAR-RV-CJ,HAR-RRV,HAR-RRV-J和HAR-RRV-CJ六种模型的拟合精度.另外,除LHAR-RRV-CJ-O模型外,其余波动率模型的隔夜收益率(OR)的系数值都在置信水平为99%的条件下显著异于0,且都为负数,即表明负隔夜收益率(OR)对未来波动率(future volatility)存在显著负向影响.进一步,当βlOR系数全部显著为正,且其绝对值大于βOR的,由此可见,正隔夜收益率对未来波动率存在显著地正向影响.因此,本文可得出无论是已实现波动率模型还是极差已实现波动率模型,隔夜收益率对未来波动率的预测都存在“非对称”,即“杠杆效应”.最后,从含跳跃的已实现和已实现极差波动率模型中,本文发现显著性跳跃对未来波动率存在负向影响,且无论是跳跃还是显著性跳跃都有助于提高模型的拟合精度.

5.2 波动率模型的MCS检验结果

各类波动率模型对未来1 d的市场波动率预测方法如3.2节所示.考虑到篇幅,本文仅报告LHAR-RVCJ-O、LHAR-RRV-O和LHAR-RRV-CJ-O模型在预测样本区间内(n=1,2,...,371)的市场波动率预测结果,如图1所示.其中,图1中的实际市场波动率(TSRV)用五角星表示.

图1 LHAR-RV-CJ-O、LHAR-RRV-O和LHAR-RRV-CJ-O等模型的市场波动率预测结果(h=1)Fig.1 One-day-ahead volatility forecasts based onLHAR-RV-CJ-O、LHAR-RRV-O and LHAR-RRV-CJ-O(h=1)

从图1中,直观来讲,各类波动率模型都具有较强的预测能力,即使市场发生大幅波动时,仍能较好的预测出该段时间内的市场波动状况.需要特别强调的是,本文采用的是滚动时间窗(rolling time windows)的“样本外预测能力检验”(test for out-of-sample predicting ability),因此每次滚动样本估计的各类波动率模型的参数估计值是时变的,而非固定的.举例来说,对HAR-RV模型而言,可以获取371个不同的系数值(βd,βw和βw)和拟合优度R2.因此,这种方法可规避数据挖掘偏误的影响,进一步保证了结论的稳健性和严谨性.

为了得到MCS检验中的各统计量及P值,这里选取d=2(block length)和模拟次数B=10 000次作为Bootstrap过程的控制参数.参照Hansen等[31]的做法,MCS检验的显著性水平α取值为0.1,则P值小于0.1的波动率预测模型是样本外预测能力差的模型,将在MCS检验过程中被剔除,而P值大于0.1的波动率预测模型是样本外预测能力较好的模型,在MCS检验中能幸存下来.

表4是MCS检验结果,表的第一列是所涉及的12种波动率模型,第一行是各损失函数Li,表中数字的是在各损失函数下统计量TR和TSQ对应的P值.P值大于0.1,表示的是在MCS检验过程中的幸存模型,即预测能力较好的模型.P值越大,表明该模型得到的波动率预测精度越高(最大的P值用下划线和加粗字体表示,即最优的波动率预测模型).从表4的实证结果可以发现:

1)对沪深300指数而言,总体上,已实现波动率模型相比已实现极差波动率对其具有更好的预测能力.因为在六种损失函数标准下,已实现极差波动率模型仅在HMSE和HMAE未能通过MCS检验,而已实现极差波动率模型却仅在这两种损失函数标准下通过了MCS检验.

2)相比HAR-RV、HAR-RV-J、HAR-RV-CJ模型而言,加入隔夜收益率及其“非对称”后的模型的波动率预测能力得到显著提升,因其相应的损失函数的P值全部大于或等于前者的(仅排除损失函数MSE外),即表明隔夜收益率及其“杠杆效应”有助于提高波动率模型的预测能力.另外,对已实现极差波动率而言,除在损失函数标准HMAE外,其结论基本与已实现波动率模型一致.

3)除在损失函数标准MSE和HMAE外,最优的波动率模型都引入了隔夜收益率及其“杠杆效应”作为新的解释变量,分别为LHAR-RV-O、LHAR-RV-CJ-O和LHAR-RRV-O,从而再次表明隔夜收益率及其“杠杆效应”有助于提高波动率模型的预测能力.

5.3 各波动率模型中长期预测能力的MCS检验结果

就目前国内检索的文献来看,关于波动率模型预测方面的研究多集中于对未来一天的预测比较.但值得注意的是,对资产风险的控制并非仅限于短期(h=1),尤其是2008年金融危机后,已有不少金融机构更关注中期或长期的风险控制.因此,结合Corsi[2]对“中长期”定义的思想,本文不仅预测未来1 d(h=1)的波动率,还预测了未来5 d(h=5)和20 d(h=20)的波动率5由于上海(或深圳)交易所的总交易天数大概在240 d左右,因此,本文选择预测长期的天数为20 d,并非国外学者选用的22 d.,并探讨了上述高频波动率模型的预测能力.

表4 不同波动率模型预测结果的MCS检验结果(h=1)Table 4 MCS of out-of-sample forecasts(h=1)

表5报告了各高频波动率模型对中期波动率(h=5)的MCS检验结果,实证结果表明:已实现极差波动

表5 不同波动率模型预测结果的MCS检验结果(h=5)Table 5 MCS of out-of-sample forecasts(h=5)

率模型总体上比已实现波动率模型对中国股票市场的预测效果更好,主要是因为已实现波动率模型仅在两种损失函数下通过了MCS检验,而在其余损失函数标准下,均未通过MCS检验.

进一步,本文还对比了上述12种高频波动率模型对长期波动率预测能力的优劣.从表6中,不难发现,在六种损失函数标准下,已实现波动率模型的预测效果明显比不上已实现极差波动率模型的.一方面,已实

表6 不同波动率模型预测结果的MCS检验结果(h=20)Table 6 MCS of out-of-sample forecasts(h=20)

现波动率模型未通过的MCS检验的模型明显多于已实现极差波动率的,另一方面,在任何一种损失函数标准下,预测精度最高的模型均是已实现极差波动率模型(HAR-RRV、HAR-RRV-J和HAR-RRV-CJ).值得特别注意的是,不同于表4,加入隔夜收益率及其“非对称”后的模型的波动率预测能力并没有得到显著提升,因其相应的损失函数的P值全部等于或者小于前者的(尤其是在已实现极差波动率中,表现得更为明显).因此,本文发现隔夜收益率及其“杠杆效应”并不能提高各波动率模型对长期波动率(h=20)的预测能力.

6 结束语

近几年,高频波动率受到了国内外学者们的广泛关注,尤以已实现波动率和已实现极差波动率最为突出.同时,资产价格的跳跃对波动率预测的重要性也得到了学者们的认可.因此,本文不仅对比研究了HAR-RV和HAR-RRV模型,还评价了带跳跃的高频波动率模型,即HAR-RV-J、HAR-RV-CJ、HAR-RRV-J及HAR-RRV-CJ.另外,本文还将隔夜收益率及其杠杆效应作为新的解释变量,加入上述六种高频波动率模型中,构建了新的六种波动率模型,探讨研究它们对各波动率模型的拟合精度和预测能力的影响.以2008–01–02—2013–09–23沪深300指数的5 min高频数据为例,采用相比SPA检验更为严谨的MCS检验方法和比RV更为稳健的两尺度已实现波动率为基准波动率,实证对比了上述12种高频波动率模型对中国股市波动率不同期限的预测能力.实证结果显示:首先,隔夜收益率对波动率未来一天的预测估计存在显著的杠杆效应,即正、负向隔夜收益率对波动率预测的影响是不一致的;其次;隔夜收益率和杠杆效应不仅能提高各波动率模型的拟合能力,而且还能改善它们的预测能力.但对于预测中长期(周和月)时,隔夜收益率和杠杆效应对波动率预测方面的影响明显不如短期的.简单来说,隔夜收益率及其杠杆效应对波动率短期(h=1)预测能力的影响表现得更为突出;最后,在预测不同期限的波动率时,已实现波动率模型和已实现极差波动率模型对中国股票市场的预测能力出现了不同的表现.对于已实现波动率模型而言,其在预测短期内的波动率更具优势,然而已实现极差波动率模型在波动率中长期预测时表现得更好,尤其是在进行长期预测(h=20)的.本文的检验方法和实证结果对于中国股票市场的风险管理以及沪深300股指期货的定价等问题都具有一定的理论和现实意义.

[1]Carnero M A,Pena D,Ruiz,E.Persistence and kurtosis in GARCH and stochastic volatility models.Journal of Financial Econometrics,2004,2(2):319–342.

[2]Corsi F.A simple approximate long-memory model of realized volatility.Journal of Financial Econometrics,2009,7(2):174–196.

[3]Andersen T G,Bollerslev T.Answering the skeptics:Yes,standard volatility models do provide accurate forecasts.International Economic Review,1998,39(4):885–905.

[4]Andersen T G,Bollerslev T,Diebold F X,et al.The distribution of realized stock return volatility.Journal of Financial Economics, 2001,61(1):43–76.

[5]Andersen T G,Bollerslev T,Diebold F X,et al.Modeling and forecasting realized volatility.Econometrica,2003,71(2):579–625.

[6]Koopman S H,Jungbacker B,Hol E.Forecasting daily variability of the S&P 100 stock index using historical,realised and implied volatility measurements.Journal of Empirical Finance,2005,12(3):445-475.

[7]Hansen P R,Lunde A.A forecast comparison of volatility models:Does anything beat a GARCH(1,1).Journal of Applied Econometrics,2005,20(7):873–889.

[8]魏 宇.沪深300股指期货的波动率预测模型研究.管理科学学报,2010,13(2):66–76. Wei Y.Volatility forecasting models for CSI300 index futures.Journal of Management Sciences in China,2010,13(2):66–76.(in Chinese)

[9]文凤华,刘晓群,唐海如,等.基于LHAR-RV-V模型的中国股市波动性研究.管理科学学报,2012,15(6):59–67. Wen F H,Liu X Q,Tang H R,et al.Research on China’s stock market fuctuations based on LHAR-RV-V model.Journal of Management Sciences in China,2012,15(6):59–67.(in Chinese)

[10]马 锋,魏 宇,黄登仕,等.基于跳跃和符号跳跃变差的HAR-RV预测模型研究及其MCS检验.系统管理学报,2015,24(5): 700–710. Ma F,Wei Y,Huang D S,et al.The HAR-RV forecasting model with the jump and signed jump variation and its MCS test.Journal of Systems&Management,2015,24(5):700–701.(in Chinese)

[11]陈浪南,杨 科.中国股市高频波动率的特征,预测模型以及预测精度比较.系统工程理论与实践,2013,33(2):296–307. Chen L N,Yang K.High-frequency volatility features,forecast model and performance evaluation.Systems Engineering:Theory& Practice,2013,33(2):296–307.(in Chinese)

[12]Christensen K,Podolskij M.Range-based Stimation of Quadratic Variation.Dortmund:Universit¨at Dortmund,SFB 475 Komplexit¨atsreduktion in Multivariaten Datenstrukturen,2006.

[13]Christensen K,Podolskij M.Realized range-based estimation of integrated variance.Journal of Econometrics,2007,141(2):323–349.

[14]Tseng T C,Lai H C,Lin C F.The impact of overnight returns on realized volatility.Applied Financial Economics,2012,22(5): 357–364.

[15]Martens M,van Dijk D.Measuring volatility with the realized range.Journal of Econometrics,2007,138(1):181–207.

[16]Todorova N.Volatility estimators based on daily price ranges versus the realized range.Applied Financial Economics,2012,22(3): 215–229.

[17]赵 华.中国股市的跳跃性与杠杆效应:基于已实现极差方差的研究.金融研究,2012(11):179–192. Zhao H.The jump and leverage effect in the Chinese stock market:Based on the research of realized range-based volatility.Journal of Financial Research,2012(11):179–192.(in Chinese)

[18]邵锡栋,殷炼乾.基于实现极差和实现波动率的中国金融市场风险测度研究.金融研究,2008(6):109–121. Shao X D,Yin L Q.China’s fnancial market risk measure research:Based on realized range-based and realized volatility.Journal of Financial Research,2008(6):109–121.(in Chinese)

[19]唐 勇,张世英.已实现波动和已实现极差波动的比较研究.系统工程学报,2007,22(4):437–442. Tang Y,Zhang S Y.Comparing research:Realized volatility and realized range-based volatility.Journal of Systems Engineering, 2007,22(4):437–442.(in Chinese)

[20]西村友作,门 明.基于高频数据的中国股市风险价值度量研究.证券市场导报,2010,217(8):67–72. Xicun Y Z,Meng M.China’s stock market risk measure research:based on high-frequency data.Securities Market Herald,2010, 217(8):67–72.(in Chinese)

[21]Lee S S,Mykland P A.Jumps in fnancial markets:A new nonparametric test and jump dynamics.Review of Financial Studies, 2008,21(6):2535–2563.

[22]Barndorff-Nielsen O E,Shephard N.Power and bipower variation with stochastic volatility and jumps.Journal of Financial Econometrics,2004,2(1):1–48.

[23]Andersen T G,Bollerslev T,Diebold F X.Roughing it up:Including jump components in the measurement,modeling and forecasting of return volatility.The Review of Economics and Statistics,2007,89(4):701–720.

[24]Christensen K,Podolskij M.Asymptotic theory of range-based multipower variation.Journal of Financial Econometrics,2012, 10(3):417–456.

[25]Gallo G M,Pacini B.The effects of trading activity on market volatility.The European Journal of Finance,2000,6(2):163–175.

[26]Black F.Studies in stock price volatility Changes//Proceedings of the American Statistical Association,Business and Economic Statistics Section.1976,177–181.

[27]Ashely R,Granger C W J,et al.Adevertising and Aggregate consumption:An analysis of causality.Econometrica,1980,48(5): 1149–1167.

[28]Lo A W,Mackinlay A C.Data-snooping biases in tests of fnancial asset pricing models.Review of Finance Studies,1990,3(3): 431–467.

[29]Foster F D,Smith T,Whaley R E.Assessing goodness-of-ft of asset pricing models:The distribution of the maximal R2.Journal of Fiance,1997,52(2):591–607.

[30]Egorov A V,Hong Y M,Li H T.Validating forecasts of the joint probability density of bond yields:Can affne models beat random walk.Journal of Econometrics,2006,135(1/2):255–284.

[31]Hansen P R,Lunde A,James M N.The model confdence set.Econometrica,2011,79(2):453–497.

[32]Hansen P R,Lunde A.A test for superior predictive ability.Journal of Business and Economic Statistics,2005,23(4):365–380.

[33]Barndorff-Nielsen O E.,Shephard N.Econometric analysis of realised volatility and its use in estimating stochastic volatility models. Journal of the Royal Statistical Society,2002,64(2):253–280.

[34]Barndorff-Nielsen O E.,Shephard N.Estimating quadratic variation using realized variance.Journal of Applied Econometrics,17(5): 457–478.

[35]李胜歌,张世英.高频金融数据的两种波动率计算方法比较.系统管理学报,2007,16(4):426–431. Li S G,Zhang S Y.Comparative study of two volatility estimation methods of high frequency fnancial data.Journal of Systems and Management,2007,16(4):426–431.(in Chinese)

[36]Huang X,Tauchen G.The relative contribution of jumpsto total price variance.Journal of Financial Econometrics,2005,3(4): 456–499.

[37]Todorova N,Husmann S.A comparative study of range-based stock return volatility estimators for the German market.Journal of Futures Markets,2012,32(6):560–586.

[38]Andersen T G,Bollerslev T,Huang X.A reduced form framework for modeling volatility of speculative prices based on realized variation measures.Journal of Econometircs,2011,160(1):176–189.

[39]Todorova N,Soucek M.The impact of trading volume,number of trades and overnight returns on forecasting the daily realized range.Economic modelling,2014,36(1):332–340.

[40]Tsiakas I.Overnight information and stochastic volatility:A study of European and US stock exchanges.Journal of banking and fnance,2008,32(2):251–268.

[41]Wang X,Wu C,Xu W.Volatility forecasting:The role of lunch-break returns,overnight returns,trading volume and leverage effects. International Journal of Forecasting,2015,31(3):609–619.

[42]王春峰,孙 端,房振明,等.隔夜信息对资本市场收益率及波动性的影响.系统工程,2011,29(11):1–6. Wang C F,Sun D,Fang Z M,et al.The Impact of overnight information on the yield and volatility of capital market.Systems Engineering,2011,29(11):1–6.(in Chinese)

[43]唐 勇.金融资产跳跃检验方法实证比较.中国管理科学,2012,20(S1):290–299. Tang Y.The empirical comparison among jump tests of fnancial asset based on high frequency data.Chinese Journal of Management Science,2012,20(S1):290–299.(in Chinese)

[44]叶五一,缪柏其.已实现波动率与日内价差条件下的CVaR估计.管理科学学报,2012,15(8):60–71. Ye W Y,Miao B Q.Estimating of CVaR with consideration of realized volatility and price range.Journal of Mangagement Sciences in China,2012,15(8):60–71.(in Chinese)

[45]Zhang L,Mykland P A,A¨ıt-Sahalia Y.A tale of two time scales:Determining integrated volatility with noisy high-frequency data. Journal of the American Statistical Association,2005,100(472):1394–1411.

[46]Ait-Sahalia Y,Mancini L.Out of sample forecasts of quadratic variation.Journal of Econometrics,2008,147(1):17–33.

附录A

各波动率模型的具体表达式如下.

Can overnight returns improve the forecasting performance of high-frequency volatility models

Ma Feng,Wei Yu,Huang Dengshi,Zhuang Xiaoyang
(School of Economics&Management,Southwest Jiaotong University,Chengdu 610031,China)

Adding the overnight returns as an explanatory variable to the high-frequency volatility models, this paper investigates whether the overnight returns have an infuence on the models’forecasting accuracy. Taking 5-minute high frequency data of the CSI 300 index as an example,the paper uses the out-of-sample method and a novel model confdence set to test the impact of the overnight returns on future volatility as the two-scale realized volatility benchmark.The empirical results show that the overnight returns have signifcant asymmetric effects on future volatility.Moreover,the overnight returns can improve the models’goodness of ft,and can help in short-horizon forecasting especially.Finally,the realized and realized range-based volatility models have different forecasting performances for different forecasting horizons.

volatility forecasting;overnight returns;realized and realized range-based volatility;model confdence set

F830.9

A

1000-5781(2016)06-0783-15

10.13383/j.cnki.jse.2016.06.007

马 锋(1986—),男,湖南常德人,博士,讲师,研究方向:金融复杂性,金融工程,Email:mafeng575@126.com;

魏 宇(1975—),男,四川攀枝花人,博士,教授,博士生导师,研究方向:金融复杂性,金融工程,Email:weiyusy@126.com;

黄登仕(1961—),男,重庆忠县人,博士,教授,博士生导师,研究方向:金融工程,公司理财,服务科学,Email:dengshi.huang@126.com;

庄晓洋(1990—),女,山东菏泽人,博士生,研究方向:金融复杂性,金融工程,Email:zhuangxy19@126.com.

2016-01-04;

2016-05-05.

国家自然科学基金资助项目(71371157);四川省科技青年基金资助项目(2015JQO010).

猜你喜欢
极差波动收益率
厘清概念 领悟意义
羊肉价回稳 后期不会大幅波动
二次函数极差的规律与应用
11月汇市:波动率降低 缺乏方向
微风里优美地波动
2019年国内外油价或将波动加剧
2016年10月债券平均久期、凸性及到期收益率
2016年10月底中短期票据与央票收益率点差图
2016年9月底中短期票据与央票收益率点差图
2016年9月债券平均久期、凸性及到期收益率