高频数据下的沪深300股指期货量化交易策略设计

2021-08-23 08:17张玉希
管理学家 2021年14期
关键词:股指期货

张玉希

[摘 要]近年来,随着互联网技术的迅猛发展,我国网络提速已进入5G时代,通过计算机的海量计算能力,为各种金融策略和高频数据下的量化交易提供了更加快捷有效的实践手段。在基于沪深300股指期货市场上的跨期套利交易策略中,通过建立改进的AR(4)-EGARCH(1,1)模型,设置止损点将回撤降低到最小,并根据交易阈值的大小匹配不同风险偏好的投资者,结果表明该模型所构建的策略具有稳定可观的收益。根据横向比较列出了不同交易阈值下,交易按正常手续费收取和按照30倍收取时的两种收益情况的对比,结果说明交易所对手续费率设置比率的影响是很大的。

[关键词] 高频数据;跨期套利;股指期货

中图分类号: F253 文献标识码:A 文章编号:1674-1722(2021)14-0088-03

一、绪论

投机、套利、套期保值作为股指期货最主要的三种交易模式,为投资者追逐利益、规避风险、价值发现等需求提供了更加多元化的投资选择。但大部分投资者目前仍采用以自身经验或基本面分析为主的主观逻辑上的人工手动交易。而随着经济、社会的发展,宏观经济走势、热点新闻、K线趋势、个人经验等各方面因素都影响着投资者的价值判断。这种人工操作的情绪化问题使得投资者不能在重大损失面前理性出逃,也不能在重大利好之际见好就收。相比之下,量化交易在这个信息迅速发展的时代对人性的情绪管理、机器学习和相关因素设计等方面具备绝对的优势。量化研究正是在大数据的背景下,通过对历史数据的归纳和分析,利用统计建模等方法不断优化改进,寻求长期可盈利的交易模式[1]。

二、套利交易策略的方案设计及评估

(一)改进的AR-GARCH和AR-EGARCH跨期套利模型

1.改进的AR-GARCH模型

首先,获取训练集数据为样本内数据,从万得数据库获取当月连续合约、下月连续合约的一分钟交易数据,并对数据进行匹配调整。将所有取自2018年1月19日到2018年7月25日的每日9:29分到14:59分的一分钟高频数据共25129条数据,按照7:3的比例分为训练集和测试集。即2018年1月19日到2018年6月4日的一分钟高频数据共17590条数据作为训练集数据;2018年6月4日到2018年7月25日的一分钟高频数据共7539条数据作为测试集数据。选择高频数据可以获得更多套利机会。

Bollerslev证明GARCH(1,1)足以适用在大部分的时间数列上。因此,文章在对两合约分钟成交价的时间序列进行检验后,分别对回归估计的残差序列建立滞后阶数为四阶的AR(4)-GARCH(1,1)模型和AR(4)-EGARCH(1,1)模型,并将两个模型进行对比和选择。

建立的AR(4)-GARCH(1,1)模型表达式为:

建立的AR(4)-GARCH(1,1)模型拟合方程为:

2.改进的AR-EGARCH模型

建立改进的AR(4)-EGARCH(1,1)模型表达式为:

建立的AR(4)-EGARCH(1,1)模型拟合方程为:

GARCH模型和EGARCH模型的拟合程度均较好,都为0.9748。同时,GARCH模型的AIC和SC值分别为-12.9035和-12.8999,EGARCH模型的AIC和SC值分别为-12.9114和-12.9075,择优选择数值较小的模型但结果相差不大,并且EGARCH模型的对数似然值Log likelihood 为113532.8较GARCH模型的113462.0有所增大。考虑到EGARCH模型本身将参数进行了对数处理,其条件方差能够更精准地反映积极与消极消息所产生的冲击,体现时间序列的非对称性特点,因此EGARCH模型拟合优度更好[2]。

3.殘差平稳性检验

对建立的EGARCH模型的残差序列进行平稳性检验:

可以看出,残差平稳性检验结果p值为0,说明该残差序列没有单位根,通过平稳性检验,说明该条件方差所受到的冲击是持久的,即对未来的预测具有重要作用,可用于该高频股指期货数据中,见表1。

4.跨期套利模型的建立

从图1可以看出,残差序列Jarque-Bera统计量 126329.9的p值为0,说明服从均值为-6.32E-06、方差为0.00464的正态分布。在标准化后的残差序列的波动图中可以看出,标准化残差的波动范围主要落在[-1.5,+1.5]区间,可以作为接下来构建交易策略的依据。

(二)跨期套利交易策略的方案设计

从之前的对当月、下月两份合约之间的协整性关系以及价差和残差的特点进行分析后,对股指期货套利交易数据建立了基于时间序列分析的计量经济学模型,接下来根据以上数学模型设计该方案的交易策略,即建立交易模型[3]。

(三)跨期套利交易策略的实证分析

1.股指期货训练集跨期套利实证分析

将总体数据的70%作为训练集数据,即2018年1月19日到2018年 6月4日的当月、下月连续合约的一分钟高频数据共17590条数据作为训练集数据,在利用该段数据所建立的AR(4)-EGARCH(1,1)跨期套利模型得到序列的标准化残差序列后,将平仓手续费全部作为平今仓的6.908%%计算。在该种高昂手续费的情况下,按止损点在0.001下的持仓与收益情况(考虑交易成本手续费费率:开仓手续费0.238%%、平仓手续费6.908%%,滑点设置0.2,仓位90%的情况)如表2。

可以看出,在交易所设置的高昂平仓手续费之下,该跨期套利策略下的年化收益率都由正变负,原本优秀的胜率都大幅下跌,可见手续费对原本盈利的冲击是显著的。同时,开平仓阈值越低的策略,原本较高的年化收益率被稀释的幅度也较大,所承担的风险同样增大。

2.股指期货测试集跨期套利实证分析

将总体数据的30%作为训练集数据,即2018年6月4日到2018年7月25日的当月、下月连续合约的一分钟高频数据共7539条数据作为测试集数据。利用训练集数据所建立的AR(4)-EGARCH(1,1)跨期套利模型,得到序列的标准化残差序列如图1所示。

根据训练集的实证分析结果,选择风险较低的±2σ作为开平仓阈值进行检验,同时纵向对比了三种手续费下的收益情况:(1)考虑止损点在0.001下的持仓与收益情况(考虑交易成本手续费费率:开平仓手续费0.238%%,滑点设置0.2,仓位90%的情况);(2)考虑止损点在0.001下的持仓与收益情况(考虑交易成本手续费费率:开仓手续费0.238%%,平仓手续费6.908%%,滑点设置0.2,仓位90%的情况);(3)考虑止损点在0.001下的持仓与收益情况(考虑交易成本手续费费率:开仓、平昨仓手续费0.238%%,平今仓手续费6.908%%,滑点设置0.2,仓位90%的情况)。

由此可见,交易所对手续费的设置和变动对于策略的收益率效果影响非常明显。在现阶段的现实情况下,该策略在测试集能够获得5.44%的真实收益,并且最大回撤也只有-0.62%,可见该策略在现实情况下是一个可操作的稳健型策略。但随着经济的不断发展,交易所随时有可能对手续费率进行调整,当平今仓手续费率降低时,该策略可以获得更高收益;当平今仓手续费率升高时,该策略所获收益将会被稀释甚至變为亏损。

三、结语

文章在前人的基础上,将现代技术中的时间序列分析应用于股指期货市场,对波动率预测的GARCH模型进行改进,建立AR(4)-EGARCH(1,1)模型,根据标准化残差序列的特征设置交易阈值,该模型能够很好的刻画数据的相关特性,在考虑交易成本下,交易的成功率较高并且风险较低,因此该策略在一定的政策条件下具有参考性和实践价值。建议投资者在套利交易的过程中,除了充分关注交易手续费率变化的情况,还要尽量使用高频数据获取更多的套利机会 。

参考文献:

[1] Cummings J R,Frino A.Index Arbitrage and the Pricing Relationship between Australian Stock Index Futures and Their Underlying Shares[J].Accounting & Finance,2011,51(3):661-683.

[2] 余臻,王苏生,李育补.基于高频数据的股指期货和ETF指数套利研究[J].华北电力大学学报(社会科学版),2014(1):18-20.

[3] 赵思宇.沪深300股指期货跨期套利基本思路[J].时代金融(中旬),2016(3):150-151.

猜你喜欢
股指期货
股指期货对股票价格波动影响分析
基于ECM—GARCH模型的
浅谈股指期货的风险管理
股指期货市场亟待恢复常态化
沪深300股指期货对我国股票市场流动性的影响分析
股指期货套期保值比率计算的实证研究
股指期货中熔断机制的分析与效用解读
基于Copula—SV模型的LPM套期保值方法及其应用
基于Copula—SV模型的LPM套期保值方法及其应用