基于SPSS Modeler的股票走势预测建模及应用研究

2018-06-06 10:14赵力衡
电脑知识与技术 2018年7期

赵力衡

摘要:随着信息化技术的迅速发展,社会生活中产生的数据在近年来呈现出指数式的增长,这些数据也对当前社会生产和生活产生了越来越重要的活动。在股市中采取大数据建模的方法来分析未来股票走势也越来越显得重要。鉴于此,提出使用大数据中时间序列模型的方法来分析预测股票走势。实验结果表明,所提方法能较准确地反映出股票的走势,可作为股票分析的有效依据。

关键词: 大数据;Modeler;时间序列;预测;股票

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)07-0256-02

Abstract:With the rapid development of information technology in recent years, the data generated in social life grow exponentially. These data become more and more important for social production and life. The big data modeling approach on analyzing future trend of stock is also increasingly important in the stock market. Base on this, a kind of time series model in big data is proposed to forecast the stock trend. The experimental results show that the proposed method can reflect the stock trend, can be considerate as an effective way for stock analysis.

Key words:big data; modeler; time series; forecasting; stock

股市從产生到现在,规模越来越大,从历年的交易中逐渐积累了大量的历史数据,如何有效使用这些历史数据来分析越来越复杂的股市,从而促进股市的健康发展并增加投资者的收益就变得越来越重要。本文使用大数据数据挖掘的方式,根据IBM历年股票数据,使用SPSS Modeler工具分析预测IBM股票在历史数据之后一个月的走势。用于预测的数据选用具有连续记录,并且数据量足够充足,能用于建立可靠预测模型。

本文使用的IBM历史股票数据包括从1981-6-19到2013-7-21的全部交易日的数据①,包括每个交易日的开盘价、最低价、最高价、收盘价、成交量和成交额。数据格式如下:

预测模型将使用从1981-6-19到2013-7-21全部交易日的数据预测其后一个月(2013年6月22号~7月21号)的IBM股票交易数据,并将实际交易数据与预测数据作比较。

交易数据中最低价、最高价预测意义不大;开盘价和收盘价反映了股票走势,预测价值较大,但两者意义相似,这里选择收盘价作为预测数据;成交量反映了市场对股票状态的认可度,也有较大的预测价值;成交额则由股票成交价格和交易量决定,在预测了收盘价和成交量后,成交额同时就已经确定,因此这里不再预测成交额。因此本次建模预测数据为收盘价和成交量。

1 数据建模

1.1 数据分析

首先查看输入数据的分布规律,可以看到数据按天的输入分布如图2所示:

从图2中可以看出收盘价数据连续,并且没有大的游离值,数据总体呈上升分布,数据来源很好;成交量数据同样连续,少量游离值的出现显示存在成交量突然增大的特殊情况,这也符合实际交易情况,同时成交量数据基本上保持了相对稳定的数量。这些信息表明用于建模的数据连续有效,符合真实情况,适合用于建模统计。

1.2 股价预测

实际上,仅预测1个月的数据并不需要30多年的数据,仅取最近几年的数据建模即可,经过比较,用11~13年的数据用于建模得到的预测数据与使用长期数据建模的结果相近,并且不至于显得数据冗余,得到的数据如图3所示:

因此取IBM从2011年7月5号到2013年6月21号的股票数据用于建模,预测2013年6月22号~7月21号的股票走势。

由于本次分析需要按照时间对股价进行预测,因此需要选择支持时间轴分析的Time Series模型进行建模。

在SPSS Modeler中选取Time Series节点进行建模,经测试选择Exponential Smoothing,并选用Holts Linear trend模型得到的结果与当前实际数据最为接近,因此用这种模型得到的预测数据最为可靠。设置模型如图4所示:

这里预测的收盘价和成交量两个参数,其中收盘价表现非常活跃,最能反映交易数据的变化,而成交量相对比较固定,因此预测结果中以收盘价最为重要。本次建模主要分析收盘价,最后再简单分析成交量。执行结果如下:

从图中可以看到,模型和实际数据非常接近,两条线几乎完全重合,表明模型很好的反映了数据的变化,因此采用这个模型的预测结果。

收盘价的预测日期从13年6月22号到7月21号,图中右侧红色微微上翘的短线段即是预测结果。从图中来看,未来1个月的收盘价预计呈上升趋势,但上升幅度较小。因此预测未来1个月中股票收盘价会缓慢上升。实际交易数据中,股票价格会有一定的波动,不会像预测结果那样稳定。

1.3成交量预测

加入一个Time Plot节点到生成的建模节点后面,用于显示成交量的预测模型。预测结果如下图所示:

从图6中可以看出成交量的预测模型也真实反映了实际成交量的变化,但预测模型总体在实际数据之上,分析可能是受到了游离数据的影响。图中右边缓慢向下的红色短线段是对6月22号到7月21号的成交量的预测结果。

从图上看,预测成交量在未来1个月中会呈略有减少的趋势。

2 结束语

总的来说,本次预测未来1个月中IBM的股票收盘价有小幅度的上升,但成交量会有小幅的下滑。查看2013年6月22号到7月21号股价和成交量数据如下图所示:

可以看到未来一个月内目标股价总体有小幅上升,而成交量总体略微减少,与预测结果相符。实验结果表明,所提方法能较准确地反映出股票的走势,可作为股票分析的有效依据。

注释:

①:数据来源www.nasdaq.com

参考文献:

[1] 张治斌. 基于SPSS Modeler的数据挖掘过程解析[J].数字技术与应用, 2017(8).

[2] IBM. Preparing Data for Analysis (Data Audit) [EB/OL].https://www.ibm.com/support/knowledgecenter/zh/SS3RA7_17.0.0/clementine/example_telco_dataaudit.html

[3] 席伟. 基于MATLAB的一类生态数学模型的建模仿真[J].电脑知识与技术,2016(9).