基于深度学习的证券趋势特征分析方法

2018-11-19 06:23

金融经济 2018年20期

一、引言

经济行为呈现出高度的复杂性和不确定性[1]。以证券交易为例，海量的多种策略类型的投资交易者相互博弈，并受到全球经济活动的影响，使得证券数据异常庞大而且充满了复杂的随机性。对证券数据的研究，提取其特征和规律可应用于金融理论分析或交易指导，例如产生交易信号、投资策略等。因而长期以来，对证券数据的有效分析一直以来都是热点研究领域。

在证券数据研究的早期，研究者主要靠着数学工具以及市场的经验和一些经济学知识来判断证券的涨跌，或预测证券的价格。其后，随着社会科学不断的发展，研究者提出量化计算证券数据的更多规律特征，从而发展成为量化投资技术[2-4]。总体而言，因证券交易数据作为一种时间序列总体上体现出高度的复杂性和不确定性，研究者们尝试利用各种方法、工具寻找出证券数据的规律，然而目前却仍然没有完善、成熟的理论或者算法来解释证券数据中的规律和包含的信息。

机器学习技术具有类似人的思维能力，亦被称之为人工智能，其中深度学习技术[5]是机器学习领域的核心学习技术，推动着人工智能时代往前迈出一大步。利用机器学习相关算法对证券数据进行研究是一大热点与新颖的研究方向。

本文采用深度学习算法来研究证券历史数据，通过学习趋势交易者对证券数据的思维方式，从中获取证券数据的特征信息并挖掘证券交易中隐藏的规律。由于证券数据的趋势特征具有周期性和稳定性，深度学习如果能提取出证券数据中的特征趋势，这样就可以分析证券市场的运动方向，给投资者提供可靠的指导信息。

二、基于深度学习模型的证券趋势特征分析

在机器学习领域，卷积神经网络有着非常强大的功能，能够提取局部数据的特征、局部数据与局部数据之间的联系。本文选择神经网络和深度学习技术作来提取证券数据的趋势特征。

证券历史数据来自于国内A股市场，考虑到次新股的历史交易周期偏短，因此剔除了上市时间不足1年的次新股，得到近2200只证券的历史交易数据作为训练样本和回测数据，典型的证券数据以及趋势指标(MACD、均线等)计算结果见表1。

表1 证券历史数据与趋势指标

表1中的数据作为输入数据，其中的行数据代表不同时间周期的历史交易数据或技术指标值，数据的交易周期包括天、周、月、分钟等。此外，深度学习模型还需要输入期望数据，即标签数据。本文采用涨/跌这两种趋势分类，由此得到对输入数据趋势(trend)的期望输出标签数据。

本文模型训练数据为日线和周线数据。在深度学习模型的训练过程中，数据的处理流程如图1所示。先将数据分为m组的二维数据，二维数据的大小为(dateLen，input_dim)。dateLen表示每组二维数据包含日线数据的天数，input_dim表示输入特征向量个数。接下来分割数据，任意从表中截取行列( 即卷积核的大小，远小于所有交易个数，小于输入特征向量)的数据，将一组二维数据又分为n个局部数据。每个截取的小块数据的特征、各个截取的小块数据之间的联系就是隐藏在证券数据中的特征。利用深度学习模型将这些特征利用卷积核提取出来并记录在每一步的输出数据中。

图1 深度学习模型的数据预处理过程

三、学习模型训练与结果分析

将上述输入数据集作为本文的训练样本数据集，训练样本数据集在训练过程中按照时间先后顺序会被分为训练集与验证集，训练集占80%，验证集占20%。训练过程中将每一组数据通过已经构建好的模型进行训练，每一组训练完成后都会保存当前组训练完的权重值以及每组训练的结果。当下一组的数据训练时，会加载上一组训练完成的权重值，接续上轮的训练后权重值继续加以训练，直到所有的数据通过模型的训练过程。图2是训练函数误差的收敛情况，表明随着训练轮数的增加，训练集的准确率也是逐步提高到趋于稳定，最终训练集的准确率达到了72%；验证集的准确率基本也是先增加再趋于稳定状态，最终准确率达到了68%，且其相对于训练集，更早进入了稳定状态，对证券数据的趋势特征分析效果优良。

图2 涨/跌趋势分类的训练误差收敛情况

四、结束语

本文研究了利用卷积神经网络与深度学习技术，构造一种证券数据趋势分析模型来提取证券历史数据特征信息。首先研究了对证券历史数据的预处理和样本标签化处理，然后采用分块的循环训练模式。仿真结果表明，本模型对证券数据的涨/跌特征提取的效果良好，主要趋势特征趋势分类的准确率达到68%，稳定性高、可泛化性好，具备一定的参考价值和应用价值。