基于多重注意力机制的图神经网络股市波动预测方法

2022-07-29 08:10李晓寒王俊贾华丁萧刘
计算机应用 2022年7期
关键词:股票市场神经网络节点

李晓寒,王俊,贾华丁,萧刘

基于多重注意力机制的图神经网络股市波动预测方法

李晓寒1*,王俊1,贾华丁1,萧刘2

(1.西南财经大学 经济信息工程学院,成都 611130; 2.四川久远银海软件股份有限公司 住房金融行业部,成都 610063)( ∗ 通信作者电子邮箱lixiaohan134@163.com)

股票市场是金融市场关键组成部分,因此对股票市场波动的研究对合理化控制金融市场风险、提高投资收益提供了重要支持,一直以来都是学术界和相关业界的关注焦点,然而,股票市场会受到各种因素的影响。面对股票市场中多源化、异构化的信息,如何高效挖掘、融合股票市场的多源异构数据具有挑战性。为了充分解释不同信息及信息间相互作用对于股票市场价格波动的影响,提出一种基于多重注意力机制的图神经网络来预测股票市场的价格波动。首先,引入关系维度构建股票市场交易数据和新闻文本的异构子图,并利用多重注意力机制实现图数据的融合;其次,通过图神经网络门控循环单元(GRU)进行图分类,在此基础上完成对股票市场中上证综合指数、沪深300指数、深证成份指数这三个重要指数波动的预测。实验结果表明,从异构信息特性角度,相较于股票市场交易数据,股市新闻信息对于股票价格影响存在滞后性;从异构信息融合角度,所提方法与支持向量机(SVM)、随机森林、多核-means (MKKM)聚类等算法相比,预测准确率分别提升了17.88个百分点、30.00个百分点和38.00个百分点,并进行了模型交易策略的量化投资模拟。

股市预测;多重注意力机制;图神经网络;股市新闻;图数据

0 引言

为实现金融风险防范、投资获利等,股票市场作为金融市场重要组成部分,得到了学者和投资者们广泛关注。在过去三十多年里,中国股票市场作为发展最为迅速的新兴资本市场,成为学者们重点研究和关注的对象。在对股票市场研究中,有效市场假说和行为金融理论得到普遍认可。基于有效市场假说[1]认为完全理性的投资者能够根据获得足够完全信息,作出迅速、合理的投资行为。该理论认为在市场有效假设条件下,投资者很难实现超额投资收益。然而随着金融行为学研究的深入,学者们发现投资者会受到文化、心理等因素影响,市场中人们的金融行为存在非理性[2-3]特征。随着对以上两种理论研究的深入,学者们逐渐形成共识,认为影响股市波动的因素众多,而且不同信息可以反映不同因素对于股市波动影响。股票市场各因素的相互关系及作用成为研究的方向和热点[4-5]。信息技术发展为研究分析股市价格波动提供了数据基础。交易数据[6]如开盘价、收盘价、成交量等逐渐衍生出动量[7]、重量[8]等衍生指标用于预测分析股票市场价格波动。随着互联网及移动互联技术发展,股市新闻对于股票市场投资者的影响越发显著。股市新闻包罗万象,从反映股票市场行情、公司经营事件的客观、中立性新闻,到带有倾向性的新闻报道,都会对股票市场短期走势产生影响[9-10]。目前,研究者们提出了大量基于股市新闻情感分析的方法用于股市预测[11-12]。Simon[13]针对新闻数量进行研究,验证了大量信息将会导致注意力贫乏。Chan[14]以新闻标题为切入点,研究了投资者对于新闻的敏感程度。王晓丹等[15]则从新闻媒体关注度和情感指标两个方面研究了新闻报道对股票市场价格波动的影响。Liu等[16]提出了利用企业知识图嵌入系统扩展企业相关新闻信息。在此基础上,采用门控循环单元(Gated Recurrent Unit, GRU)模型结合股票新闻情绪和焦点股票的数量特征来预测股票价格波动。随着研究深入,为能够更加准确预测股市波动,用于预测的股市信息逐渐由交易数据、股市新闻数据等单一指标逐渐发展为多维度指标数据。多维度指标数据呈现多源化、异构化特性。对于多源异构数据的融合、处理、分析成为预测股市价格波动亟待探索和解决的问题。Thakkar等[17]将股票市场融合技术分为信息融合、特征融合和模型融合。信息融合[18]主要是通过对新闻信息进行提取,与股市交易数据等实现数据融合,以获得用于股市预测的综合性数据。特征融合[19]则多采用算法模型将同源数据表达为不同形式,从而实现多维特征提取。模型融合[20]则主要是对统计模型、人工智能算法模型、深度学习模型等进行组合,形成复合模型分析预测股票市场波动。在最新研究中,融合方法和技术得到进一步发展,Zhang等[21]采用长短期记忆网络中引入注意力机制识别长期时间依赖以突出关键特征,构建了基于多种数据来源的分析框架。Patel等[22]提出了一种基于支持向量回归两阶段融合的方法,对智能算法融合以预测印度股市价格波动。

但是目前研究存在一定局限性,总结概括如下:首先,对于股票市场新闻文本信息处理,当前研究主要停留在对指定来源新闻文本进行量化研究,然而面对多种来源的股市信息如何高效甄别客观、真实信息,并未有更为深入的探索研究;其次,传统融合方式一定程度上忽略了部分融合指标的金融特性、指标间关系及时间序列特征;再次,现有融合分析方法在挖掘股票市场数据金融特征、相互作用、时间序列等隐含语义信息时有待进一步扩展;最后,为弥补作者之前研究[23]股市预测信息维度过于单一的问题,本文对图神经网络在股票市场价格预测进行了更加深入的探索。同时,将研究对象由美国股市调整为中国股票市场,中国股票市场作为全球最大新兴资本市场,其研究意义得到显著提升。本文的主要工作如下:1)构建新闻文本子图数据,利用文本相似性完成顶点聚合,进行新闻文本信息挖掘融合; 2)引入关系维度充分表示时间序列相关关系,构建具有股市指标特征信息的异构图数据,实现多源异构数据融合; 3)为挖掘多源异构数据隐含语义信息,结合异构图数据构建多重注意力图神经网络进行股市波动预测。股市波动预测及策略回测实验结果表明,本文方法在股市预测方面取得了较好效果。

1 相关工作

1.1 股市波动预测

有效市场假说阐述在投资者理性及市场信息被完全获得且理解的假设下,股票价格将实现对信息的充分反映。另外与之对应的理论体系是行为金融理论[24],该理论认为影响股市波动的因素存在非理性特征,解释了股票市场中日历效应、动量效应等异常现象。以上两种理论在股票市场中得到了验证、发展,为股票市场预测奠定了理论基础。在过去三十多年里,对股票价格波动的研究和预测从未停止过。学者们利用各种交易数据及衍生出的技术指标预测股市走势[25]。采用统计学、经济学等方法构建时间序列[26]、因子定价模型[27]用于研究股市波动。如Jegadeesh等[28]提出股票价格有延续原来运动方向的趋势,成交量、换手率均衍生出动量因子用于股票价格走势预测。Fama等[29]利用总市值、账面市值比等衍生指标因子构建了因子定价模型用于解释预期股票报酬率横截面变化。然而随着金融行为学理论的发展,学者们发现投资者受到文化、心理等因素影响,存在非理性特征。新闻事件[30]、社交媒体[11]、股吧[31]等数据经过自然语言处理后成为此类研究的主要指标,学者们不断拓展文本嵌入方法,引入卷积神经网络(Convolutional Neural Network, CNN)、循环神经网络(Recurrent Neural Network, RNN)等机器学习算法用于股市研究[32-33]。

1.2 融合技术

股票市场融合技术主要包括信息融合、特征融合和模型融合。Zhang等[18]分别从网络新闻、社交媒体中提取事件和用户情绪,并通过一个耦合矩阵和张量分解框架提取信息,研究其对于股价波动的综合影响。Kim等[19]提出了特征融合长短期记忆卷积神经网络模型,结合同一数据不同表示,将股票时间序列和股票图表图像进行特征融合。Hassan等[20]对隐马尔可夫模型、人工神经网络和遗传算法进行融合得到复合模型预测金融市场行为。近年来,股市新闻与历史交易指标数据融合应用于股市走势预测,成为热门研究方向,如Tan等[34]提出了用张量代替串联向量实现数据信息融合来建模获取市场信息,并利用事件驱动机制平衡不同数据类型的异构性完成数据预测。Chai等[35]对多源数据预加工提取相应特征,采用扩展隐马尔可夫模型对量化预处理特征进行建模,捕获数据中潜在的时间依赖性用于金融时序预测。主流方法针对股市异构数据的融合、处理进行了大量研究[36-38]。然而,当今股市新闻数量庞大,新闻来源渠道多样,新闻真伪难辨。如何高效处理海量数据,对有用、真实新闻信息进行甄别,并与结构化的股市历史交易数据进行有效融合成了亟待解决的问题。

1.3 图神经网络

为能够解决图数据深度学习问题,图神经网络应运而生。短短几年时间中图神经网络技术突飞猛进,得到了广泛应用[39-41]。Bruna等[42]2013年首次提出图卷积神经网络,采用谱空间方法定义图卷积。利用切比雪夫多项式的近似拟合卷积核(ChebNet)[43]和图卷积网络(Graph Convolutional Network, GCN)[44],为降低时空复杂度,从空间角度定义节点权重矩阵,对核函数进行参数优化。Kim等[40]提出了一种利用关系数据进行股票市场预测的分层注意力网络。选择性地聚合关于不同关系类型的信息,并将这些信息添加到每个公司的表示中,此方法用于预测个股价格和市场指数走势。Liu等[16,45]提出了一种利用上市公司之间关系知识图谱,采用封闭式回归单元模型结合相关股票新闻情绪、焦点新闻情绪和焦点股票数量特征预测股票价格波动。Matsunaga等[46]验证了市场预测和图形神经网络交叉工作的有效性,将公司知识图谱引入预测模型模仿投资者投资决策,使用滚动窗口回溯测试不同市场和较长时间跨度的有效性。学者们将图神经网络应用于股市预测进行了大量探索,图数据根据关系维度拓展特征指标,用于股票市场走势预测。为分析预测股票市场波动,目前所开展的股票市场信息图结构数据构建及分析研究均处于起步阶段。

为解决股市新闻信息的挖掘和交易指标数据多时间尺度问题,本文基于开放世界假设,构建股市新闻子图和交易指标数据子图,通过异构图融合表示股票市场多源异构数据隐含语义信息,提出多重注意力图神经网络模型用于分析预测股票市场价格波动。

2 模型构建

2.1 模型框架

本文提出一种基于多重注意力机制的图神经网络模型用于股市波动预测分析。图1展示了所提方法的模型整体框架。

图1 本文模型整体框架

2.2 嵌入及聚合分类过程

图2为图1①部分中子图数据嵌入方法示意图,如图2(a)所示,选取5个交易日作为节点构建交易指标子图。结合相邻交易日的延续性,交易日节点之间设置边。开盘指数、最高指数、最低指数、收盘指数、成交量、成交金额6个指标作为节点特征。图2(b)股市新闻子图将每个交易日股市新闻作为一个指标子图,以每条新闻作为子图节点,新闻文本词向量作为节点特征,新闻文本相似度作为边的权重构建新闻文本之间的联系。图2(c)将两类子图中的节点按照异构节点设立边,构建股市复杂网络图数据。

图2 图数据嵌入方法

注意力机制如式(6)所示:

为了避免梯度爆炸及消失问题,引入残差连接将权重矩阵及特征直接相加作为隐藏层输入,如式(7)(8)所示:

采用GRU进一步提取特征形成特征向量矩阵,通过递归神经网络忘记门舍弃部分特征信息,而输入门则添加部分新的信息到节点特征中,并进行式(8)的状态层归一化处理:

通过聚合更新过程,不断更新权重矩阵。模型采用交叉熵损失函数完成训练过程。本文引入多重注意力机制完成股票市场异构图数据分类,从而完成股票市场波动的预测分析。

2.3 模型算法

程序首先定义所取交易日的区间,构建子图,按照交易日设立子图节点,取交易日交易数据指标作为节点特征。

对于股市新闻子图的构建,则采用两个核心函数。第1个函数EWEIGHT()主要用来计算新闻之间相似度,在子图数据构建过程中,作为边权重值。采用函数jieba()进行分词,并采用函数SparseMatrixSimilarity()进行文本之间相似度的计算。第2个函数CREATNEWSUB()作为子图构建函数,每一条新闻文本作为一个节点,函数add_edge()增加节点之间的边,并利用函数EWEIGHT()对边权重进行赋值。新闻文本向量作为节点特征。

本文所提出的多重注意力图神经网络在2.2节中进行了详细阐述。代码利用for循环利用多重注意力完成顶点特征嵌入提取过程,更新权重参数。其中权重参数包括边权重和节点特征权重,利用权重矩阵完成异构图数据有效信息提取,完成图分类进行股市波动预测。

3 实验与结果分析

3.1 数据集

本文采用CSMAR数据库(China Stock Market & Accounting Research Database)进行实验,使用该数据库2013-01-11至2018-12-31数据信息分别构建上证综合指数、沪深300指数、深证成份指数的股市图数据。其中2013-01-11至2017-12-31数据设置为训练数据,采用dgl(https://docs.dgl.ai/)构建图数据并进行相应卷积操作,每日新闻文本数据随机取500条,新闻指标子图以每条新闻作为图节点,新闻文本词向量作为节点特征,新闻文本相似度作为边的权重构建新闻文本之间的联系,每个交易日为一个子图。采用gensim(https://radimrehurek.com/gensim/)库将新闻文本转换成200维词向量作为节点特征。Word2Vec设置参数为(=20,=7,_=0,=1,=0.15,=10,_=10 000),其他均采用默认参数。Similarities模块计算新闻文本之间的相似度作为新闻子图边的权重。交易数据指标子图则选择预测之前的5个工作日,将每个交易日开盘指数、最高指数、最低指数、收盘指数、成交量、成交金额六个指标作为聚合后的节点特征,通过连接操作与聚合顶点特征拼接。图3(a)中边的深浅与新闻文本相似度成正比,节点大小则与节点度成正比。图3(b)中灰度标识新闻之间的相似度。两类子图节点如图2所示构建的异构图数据,作为输入训练及测试数据,该数据具有任意两节点间的平均路径相对较短。股市新闻子图中,关键新闻节点度值较大,与其他新闻节点具有紧密的关联性,具有律度分布特性。两类指标所属模块度值较低,平均模块度为-0.36。本文输入数据具有小世界特性、律度分布特性、社区结构特性,属于复杂网络图数据。复杂网络图数据以交易日之前的5个工作日交易指标节点和当日股市新闻节点构成,标签为+1指数较前一交易日涨与跌进行二分类标记0:<0、1:0。模型训练及测试输出预测数据为复杂图数据分类结果,即指数涨跌分类。

图3 股市新闻图数据

3.2 结果呈现

为能达到模型理想训练效果,本文主要从两个方面优化提升训练效果。首先,损失值收敛情况,当模型逐渐收敛到一个较小的损失值,并且测试预测准确率达到预期要求且稳定,在这期间调整dropout值等参数,防止过拟合;其次,设置合理的训练循环次数,为合理利用计算资源,提高训练效率,训练循环次数由初始值100次逐渐递增,递增幅度为100。直到在训练循环次数内,损失值收敛,训练预测准确率达到预期。经多次调整参数进行实验后,本文设计网络模型基本达到预期要求,训练过程如图4所示。

图4 图神经网络训练过程

本文混淆矩阵如表1所示。将股市收盘价的上涨和下跌作为分类预测结果:预测结果与真实结果都为上升,则为真阳性(True Postive,);预测结果为上升而真实结果为下降,则为假阳性(False Positive,);预测结果为下降而真实结果为上升,则为假阴性(False Negative,);预测结果为下降而真实结果也为下降,则为真阴性(True Negative,)。

表1 混淆矩阵

准确率(accuracy)和召回率(recall)是评价机器学习预测模型的重要指标。模型的准确率与预测性能密切相关。本文的准确率及召回率如式(12)和式(13)所示:

为能够探究新闻文本影响的滞后性及各算法的最优参数设置,本文采用2018-10-01至2018-12-31交易日数据用于测试,实验结果表明模型对上证综合指数、沪深300指数、深证成份指数的预测结果。本文所提出方法基于图关系权重注意力网络进行表示。首先,与GATConv(Graph Attention Network Convolution)[18]、RelGraphConv(Relational Data with Graph Convolutional Networks)[37]、文献[38]中提出的一种新的神经网络模块EdgeConv、SAGEConv(Graph SAmple and aggreGatE Convolution)[39]等嵌入操作进行对比。

为能够进一步验证所构建模型对新闻文本信息挖掘及融合技术的优越性,本文引入多源指标方法支持向量机(Support Vector Machine, SVM)、随机森林(Random Forest, RF)、多核-means(Multiple Kernel-Means, MKKM)聚类[40]、基于张量的股票信息分析器(Tensor-based Stock Information Analyzer, TeSIA)[41]用于模型对比,对比方法并未考虑新闻数据之间的关系维度,对特征进行向量数据拼接,所引入用于对比的模型参数设置如表2所示。本文提出的模型则按照表3中相关参数进行设置。

SVM 是一种应用广泛的机器学习分类算法。将这两种类型的特征拼接成向量,并将向量输入支持向量机进行预测。

RF 在多源特征分类任务中表现出优异的性能,本文将拼接成的向量使用随机森林方法进行预测。

MKKM MKKM聚类的目标是从一组指定的核中找到最优组合,从而能够准确地将特征向量划分为若干类。在本研究中,将来自两个股市评价指标的特征串联起来,在核空间中探索出最佳聚类结果用于股票市场走势判断。

TeSIA 将2.2节中提取的两种指标特征结合起来构造一个二阶张量。然后通过张量分解去除冗余,根据价格运动方向建立张量流模型进行预测。TeSIA融合多源信息建立基线用于预测,在部分多源数据预测项目中取得了较好的效果。

预测标签则为股市当天收盘价与前一交易日收盘价的对比。表4和图5分别从预测的准确率和稳定性两个方向展示了本文所提出方法与其他预测方法的比较结果。表4中,考虑到股市新闻对于股市影响的滞后性,实验中分别通过模型挖掘的股市新闻对T+1、T+2、T+3时刻的股市走势进行了预测。

表2 实验网络参数设置

表3 实验模型参数设置

表4 不同指数预测结果对比

通过图5和表4中呈现的结果,可以得出本文所提出的方法对于T+2时刻的股票走势具有较好的预测能力。进一步分析数据,发现新闻图数据中节点度较大的节点,如2018年11月13日“天然气价格上涨”的新闻,当日大于关系权重阈值的相关节点新闻达到13条。在模型中也准确预测出了相关股票之后的走势。2018年11月28日“关税会威胁 苹果这个假期季过得有点艰难”的新闻,当日大于关系权重阈值的相关节点新闻达到23条,也准确地标记了之后的股票走势。为进一步了解模型预测性能,本文将模型对T+2时刻股市走势预测的ROC(Receiver Operating Characteristic)、AUC(Area Under Curve)进行了对比。通过实验验证,SVM、RF、MKKM聚类等算法在表4中T+2交易日平均准确率分别为:55.12%、55.00%、53.00%,本文方法准确率与SVM、RF、MKKM聚类等算法平均准确率相比,对3种指数波动预测准确率分别提升了17.88个百分点、30.00个百分点和38.01个百分点。本文所提出的方法与GATConv、RelGraphConv、EdgeConv、SAGEConv、SVM、RF、MKKM、TeSIA方法相比在预测准确率和稳定性方面具有明显优势。

图5 不同分类器预测的ROC AUC图

3.3 策略回测

如表4和图5所示,本文方法在T+2股市走势预测中,明显优于其他方法。为进一步论证本文方法形成的策略在量化交易中收益情况。选取2019-11-25至2020-04-22期间100个交易日上证综合指数、沪深300指数、深证成份指数数据进行本文策略的回测。模型预测上涨,则生成买入信号,下降则生成卖出信号,连续相同信号不触发交易操作。策略初始资金为10 000,以交易日收盘价作为收益结算标准。本文具体展示了上证综合指数、沪深300指数、深证成份指数收益情况实验结果并进行分析。图6分别采用表4中所提及的方法进行交易策略回测。为能够清晰呈现策略收益情况,对图5、表4中预测效率较好的SVM、RF、MKKM、TeSIA预测模型形成的交易策略进行回测比较。

图6 不同指数策略收益

图6分别对根据策略投资上证综合指数、沪深300指数、深证成份指数收益情况进行了展示。如图6所示,因受2020年3月份新型冠状病毒疫情影响,同期上证综合指数下跌1.43%,沪深300指数下跌0.28%,深证成份指数上涨10.29%。本文所提出的方法投资收益率为19.53%、17.32%和25.6%,收益率为最高,收益优于三种指数的整体走势和其他策略收益。因本文策略中并未考虑股市预测中的做空收益,所以本文策略回测收益与预测指数的走势密切相关。股市在经历突如其来的黑天鹅事件(新型冠状病毒疫情爆发)引起的两次大幅下跌情况下,通过本文策略起到了止损的重要作用,取得了较好的收益。面对大量的新闻数据,本文所提方法对于股市预测更加准确、迅速,不但有效挖掘突如其来的利空新闻,更是能够通过日常股市新闻准确提取预测股票走势的有效信息,与历史交易数据融合形成有效的股市波动评价体系。

4 结语

本文提出一种经过优化的图神经网络用于股市新闻信息挖掘和异构数据融合。基于开放世界假设,构建股票市场异构图数据,设立新闻数据的节点、节点特征、边及边的权重。根据边的权重优化卷积模块注意力机制,利用注意力机制实现股票市场异构数据融合,预测股市价格波动。在实验验证中,采用本文方法取得了较好的效果,扩展了图数据及图神经网络在股票市场新闻挖掘和异构数据融合中的应用。本文提出方法提高了股市新闻文本的挖掘效率,但是影响股票走势因素非常多。在接下来的研究中将考虑增加交易衍生、图形化指标等数据,尝试构建、优化图神经网络模型,提高模型训练效率及预测性能,使模型可以应用到股市风险防控及量化投资中,并泛化应用到其他金融产品的走势预测中。

[1] FAMA E F. Efficient capital markets: a review of theory and empirical work[J]. The Journal of Finance, 1970, 25(2): 383-417.

[2] KAHNEMAN D. Maps of bounded rationality: psychology for behavioral economics[J]. The American Economic Review, 2003, 93(5): 1449-1475.

[3] SHILLER R J. Irrational Exuberance[M]. Revised and Expanded 3rd Ed. Princeton: Princeton University Press, 2016:237-267.

[4] HONG H, KUBIK J D, STEIN J C. Social interaction and stock-market participation[J]. The Journal of Finance, 2004, 59(1): 137-163.

[5] STROHSAL T, WEBER E. Time-varying international stock market interaction and the identification of volatility signals[J]. Journal of Banking and Finance, 2015, 56: 28-36.

[6] OLIVEIRA N, CORTEZ P, AREAL N. The impact of microblogging data for stock market prediction: using Twitter to predict returns, volatility, trading volume and survey sentiment indices[J]. Expert Systems with Applications, 2017, 73: 125-144.

[7] CAKICI N, FABOZZI F J, TAN S. Size, value, and momentum in emerging market stock returns[J]. Emerging Markets Review, 2013, 16: 46-65.

[8] BURTON R F. Why is the body mass index calculated as mass/height2, not as mass/height3?[J]. Annals of Human Biology, 2007, 34(6): 656-663.

[9] TETLOCK P C. Giving content to investor sentiment: the role of media in the stock market[J]. The Journal of Finance, 2007, 62(3): 1139-1168.

[10] BARBER B M, ODEAN T. All that glitters: the effect of attention and news on the buying behavior of individual and institutional investors[J]. The Review of Financial Studies, 2008, 21(2): 785-818.

[11] ATKINS A, NIRANJAN M, GERDING E. Financial news predicts stock market volatility better than close price[J]. The Journal of Finance and Data Science, 2018, 4(2): 120-137.

[12] WEI Y C, LU Y C, CHEN J N, et al. Informativeness of the market news sentiment in the Taiwan stock market[J]. The North American Journal of Economics and Finance, 2017, 39: 158-181.

[13] SIMON H A. Designing organizations for an information-rich world[J]. International Library of Critical Writings in Economics, 1996, 70: 187-202.

[14] CHAN W S. Stock price reaction to news and no-news: drift and reversal after headlines[J]. Journal of Financial Economics, 2003, 70(2): 223-260.

[15] 王晓丹,尚维,汪寿阳. 互联网新闻媒体报道对我国股市的影响分析[J]. 系统工程理论与实践, 2019, 39(12):3038-3047.(WANG X D, SHANG W, WANG S Y. The effects of online news on the Chinese stock market[J]. System Engineering — Theory and Practice, 2019, 39(12):3038-3047.)

[16] LIU J, LU Z C, DU W. Combining enterprise knowledge graph and news sentiment analysis for stock price prediction[C/OL]// Proceedings of the 52nd Hawaii International Conference on System Sciences. [2021-07-02].https://scholarspace.manoa.hawaii.edu/bitstream/10125/59565/0125.pdf.

[17] THAKKAR A, CHAUDHARI K. Fusion in stock market prediction: a decade survey on the necessity, recent developments, and potential future directions[J]. Information Fusion, 2021, 65: 95-107.

[18] ZHANG X, ZHANG Y J, WANG S Z, et al. Improving stock market prediction via heterogeneous information fusion[J]. Knowledge-Based Systems, 2018, 143: 236-247.

[19] KIM T, KIM H Y. Forecasting stock prices with a feature fusion LSTM-CNN model using different representations of the same data[J]. PLoS ONE, 2019, 14(2): No.e0212320.

[20] HASSAN M R, NATH B, KIRLEY M. A fusion model of HMM, ANN and GA for stock market forecasting[J]. Expert Systems with Applications, 2007, 33(1): 171-180.

[21] ZHANG Q, YANG L J, ZHOU F. Attention enhanced long short-term memory network with multi-source heterogeneous information fusion: an application to BGI Genomics[J]. Information Sciences, 2021, 553: 305-330.

[22] PATEL J, SHAH S, THAKKAR P, et al. Predicting stock market index using fusion of machine learning techniques[J]. Expert Systems with Applications, 2015, 42(4): 2162-2172.

[23] 李晓寒,贾华丁,程雪,等. 基于改进遗传算法和图神经网络的股市波动预测方法[J/OL]. 计算机应用. (2021-08-17) [2021-08-20].http://kns.cnki.net/kcms/detail/51.1307.TP.20210816.1658.012.html.(LI X H, JIA H D, CHENG X, et al. Stock market fluctuation prediction method based on improved genetic algorithm and graph neural network[J/OL]. Journal of Computer Applications. (2021-08-17) [2021-08-20].http://kns.cnki.net/kcms/detail/51.1307.TP.20210816.1658.012.html.)

[24] KAHNEMAN D, TVERSKY A. On the interpretation of intuitive probability: a reply to Jonathan Cohen[J]. Cognition, 1979, 7(4): 409-411.

[25] LO A W, MacKINLAY A C. Stock market prices do not follow random walks: evidence from a simple specification test[J]. The Review of Financial Studies, 1988, 1(1): 41-66.

[26] TANG H, CHIU K C, XU L. Finite mixture of ARMA-GARCH model for stock price prediction[C/OL]// Proceedings of the 3rd International Workshop on Computational Intelligence in Economics and Finance. [2018-10-10].http://www.cse.cuhk.edu.hk/~lxu/papers/conf-chapters/TangCIEF2003.pdf.

[27] ROJAS I, VALENZUELA O, ROJAS F, et al. Soft-computing techniques and ARMA model for time series prediction[J]. Neurocomputing, 2008, 71(4/5/6): 519-537.

[28] JEGADEESH N, TITMAN S. Returns to buying winners and selling losers: implications for stock market efficiency[J]. The Journal of Finance, 1993, 48(1): 65-91.

[29] FAMA E F, FRENCH K R. The cross-section of expected stock returns[J]. The Journal of Finance, 1992, 47(2):427-465.

[30] FAMA E F, FRENCH F K R. Multifactor explanations of asset pricing anomalies[J]. The Journal of Finance, 1996, 51(1):55-84.

[31] SI J F, MUKHERJEE A, LIU B, et al. Exploiting topic based twitter sentiment for stock prediction[C]// Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers). Stroudsburg, PA: Association for Computational Linguistics, 2013: 24-29.

[32] DING X, ZHANG Y, LIU T, et al. Deep learning for event-driven stock prediction[C]// Proceedings of the 24th International Joint Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2015: 2327-2333.

[33] DING X, ZHANG Y, LIU T, et al. Using structured events to predict stock price movement: an empirical investigation[C]// Proceedings of the Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: Association for Computational Linguistics, 2014: 1415-1425.

[34] TAN J H, WANG J, RINPRASERTMEECHAI D, et al. A tensor-based eLSTM model to predict stock price using financial news[C/OL]// Proceedings of the 52nd Hawaii International Conference on System Sciences. [2021-07-02].https://scholarspace.manoa.hawaii.edu/bitstream/10125/59606/0166.pdf.

[35] CHAI L, XU H F, LUO Z M, et al. A multi-source heterogeneous data analytic method for future price fluctuation prediction[J]. Neurocomputing, 2020, 418: 11-20.

[36] ZHANG X, LI Y X, WANG S Z, et al. Enhancing stock market prediction with extended coupled hidden Markov model over multi-sourced data[J]. Knowledge and Information Systems, 2019, 61(2): 1071-1090.

[37] KIM R, SO C H, JEONG M, et al. HATS: a hierarchical graph attention network for stock movement prediction[EB/OL]. (2019-11-12) [2021-06-20].https://arxiv.org/pdf/1908.07999.pdf.

[38] LI Q, WANG J, WANG F, et al. The role of social sentiment in stock markets: a view from joint effects of multiple information sources[J]. Multimedia Tools and Applications, 2017, 76(10): 12315-12345.

[39] 呼延康,樊鑫,余乐天,等. 图神经网络回归的人脸超分辨率重建[J]. 软件学报, 2018, 29(4):914-925.(HUYAN K, FAN X, YU L T, et al. Graph based neural network regression strategy for facial image super-resolution[J]. Journal of Software, 2018, 29(4):914-925.)

[40] KIM K-J, HAN I. Genetic algorithms approach to feature discretization in artificial neural networks for the prediction of stock price index[J]. Expert Systems with Applications, 2000, 19(2): 125-132.

[41] LI Q, JIANG L L, LI P, et al. Tensor-based learning for predicting stock movements[C]// Proceedings of 29th AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2015:1784-1790.

[42] BRUNA J, ZAREMBA W, SZLAM A, et al. Spectral networks and locally connected networks on graphs[EB/OL]. (2014-05-21) [2021-06-20].https://arxiv.org/pdf/1312.6203.pdf.

[43] DEFFERRARD M, BRESSON X, VANDERGHEYNST P. Convolutional neural networks on graphs with fast localized spectral filtering[C]// Proceedings of the 30th International Conference on Neural Information Processing Systems. Red Hook, NY: Curran Associates Inc., 2016: 3844-3852.

[44] KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[EB/OL]. (2017-02-22) [2021-06-20].https://arxiv.org/pdf/1609.02907.pdf.

[45] LIU Y, ZENG Q G, YANG H R, et al. Stock price movement prediction from financial news with deep learning and knowledge graph embedding[C]// Proceedings of the 2018 Pacific Rim Knowledge Acquisition Workshop, LNCS 11016. Cham: Springer, 2018: 102-113.

[46] MATSUNAGA D, SUZUMURA T, TAKAHASHI T. Exploring graph neural networks for stock market predictions with rolling window analysis[EB/OL]. (2019-11-27) [2021-06-20].https://arxiv.org/pdf/1909.10660.pdf.

[47] HUANG T L. The puzzling media effect in the Chinese stock market[J]. Pacific-Basin Finance Journal, 2018, 49: 129-146.

[48] ARASU A, WIDOM J. Resource sharing in continuous sliding-window aggregates[C]// Proceedings of the 30th International Conference on Very Large Data Bases. [S.l.]: VLDB Endowment, 2004: 336-347.

LI Xiaohan, born in 1985, Ph. D. candidate. His research interests include financial information management, intelligent decision-making, big data, business intelligence.

WANG Jun, born in 1987, Ph. D., associate professor. His research interests include financial technology, financial intelligence.

JIA Huading, born in 1956, Ph. D., professor. His research interests include machine learning, algorithmic trading, spread spectrum sequence design.

XIAO Liu, born in 1986, senior engineer. His research interests include machine learning, big data,social security, economics and finance.

Stock market volatility prediction method based on graph neural network with multi-attention mechanism

LI Xiaohan1*, WANG Jun1, JIA Huading1, XIAO Liu2

(1,,611130,;2,,610063,)

Stock market is an essential element of financial market, therefore, the study on volatility of stock market plays a significant role in taking effective control of financial market risks and improving returns on investment. For this reason, it has attracted widespread attention from both academic circle and related industries. However, there are multiple influencing factors for stock market. Facing the multi-source and heterogeneous information in stock market, it is challenging to find how to mine and fuse multi-source and heterogeneous data of stock market efficiently. To fully explain the influence of different information and information interaction on the price changes in stock market, a graph neural network based on multi-attention mechanism was proposed to predict price fluctuation in stock market. First of all, the relationship dimension was introduced to construct heterogeneous subgraphs for the transaction data and news text of stock market, and multi-attention mechanism was adopted for fusion of the graph data. Then, the graph neural network Gated Recurrent Unit (GRU) was applied to perform graph classification. On this basis, prediction was made for the volatility of three important indexes: Shanghai Composite Index, Shanghai and Shenzhen 300 Index, Shenzhen Component Index. Experimental results show that from the perspective of heterogeneous information characteristics, compared with the transaction data of stock market, the news information of stock market has the lagged influence on stock volatility; from the perspective of heterogeneous information fusion, compared with algorithms such as Support Vector Machine (SVM), Random Forest (RF) and Multiple Kernel-Means (MKKM) clustering, the proposed method has the prediction accuracy improved by 17.88 percentage points, 30.00 percentage points and 38.00 percentage points respectively; at the same time, the quantitative investment simulation was performed according to the model trading strategy.

stock market prediction; multi-attention mechanism; graph neural network; stock market news; graph data

This work is partially supported by Science and Technology Program of Sichuan Province (2020JDJQ0061, 2021YFG0099).

TP391.7; TP18

A

1001-9081(2022)07-2265-09

10.11772/j.issn.1001-9081.2021081487

2021⁃08⁃19;

2021⁃11⁃30;

2021⁃12⁃03。

四川省科技计划项目(2020JDJQ0061, 2021YFG0099)。

李晓寒(1985—),男,山东济南人,博士研究生,CCF会员,主要研究方向:金融信息管理、智能决策、大数据、商务智能; 王俊(1987—),男,山东青岛人,副教授,博士,CCF会员,主要研究方向:金融科技、金融智能; 贾华丁(1956—),男,四川成都人,教授,博士,CCF高级会员,主要研究方向:机器学习、算法交易、扩频序列设计; 萧刘(1986—),男,四川成都人,高级工程师,主要研究方向:机器学习、大数据、社会保障经济与金融。

猜你喜欢
股票市场神经网络节点
基于RSSI测距的最大似然估计的节点定位算法
基于神经网络的船舶电力系统故障诊断方法
基于人工智能LSTM循环神经网络的学习成绩预测
MIV-PSO-BP神经网络用户热负荷预测
分区域的树型多链的无线传感器网络路由算法
一种基于能量和区域密度的LEACH算法的改进
货币政策与股票市场流动性的互相关关系研究
货币政策与股票市场流动性的互相关关系研究
基于点权的混合K-shell关键节点识别方法
我国股票市场的有效性研究