数据挖掘技术在股票选择中的应用

2018-10-19 18:51王都
智富时代 2018年9期
关键词:数据挖掘

王都

【摘 要】随着计算机和信息时代的到来,数据的收集、存储和访问量急剧增加,传统的查询技术不能解决目前面临的信息爆炸问题,数据挖掘正是在这样的应用需求下产生并迅速发展起来的一门技术。我国股票市场经历了近三十年发展,随着股票市场和股市制度的逐步完善,越来越多的投资者参与到股票投资中来。将数据挖掘技术运用到个股选择中,可以有效地处理与证券投资决策相关的市场信息、经济信息、财务信息、以及其他各种相关信息,从海量的数据中,为投资者挖掘出有用的相关数据和相关规则,并将其与其他证券投资决策方法相结合,探索出适合海量数据条件下的投资决策。

【关键词】数据挖掘;股票选择;价值投资

一、背景及意义

随着计算机和信息时代的到来,人们收集、存储和访问的数据急剧增加,对这些快速增长的海量数据进行分析和知识理解已经远远超出了人的能力。大量的数据被描述为“数据丰富,但信息贫乏”。数据库规模日益扩大,仅依靠数据库管理系统的查询检索机制和统计分析方法,已经远远不能满足现实的需要。而大量激增的数据中往往又隐藏着许多重要的信息,如果能把这些信息从数据库中提取出来,就能为用户创造很多潜在的利润。因此,对大量历史数据进行分析处理,挖掘出有用的知识就显得非常迫切。

数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未知,有效和可实用三个特征。先前未知的信息是指该信息是预先未曾预料到的,即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。

数据挖掘,首先要确定挖掘的任务或目的是什么,如数据总结、分类、聚类、关联规则或序列模式发现等。确定了挖掘任务后,就要决定用什么样的挖掘算法。选择实现算法有两个考虑因素:一是不同的数据有不同的特点,因此需要用与之相关的算法来挖掘;二是用户或实际运行系统的要求。

数据挖掘发现出来的模式,经过用户或机器的评价,可能存在冗余或无关的模式,这时需要将其剔除。另外,由于知识发现最终是面向人类用户的,因此可能要对发现的模式进行可视化,或者把结果转换为用户易懂的另一种表示。

二、数据挖掘在股市选择中的意义

从1990年上海证券交易所、深圳交易所成立,到《证券法》的实施,再到中小企业板块、创业板推出,我国股票市场经历了近三十年发展,随着股票市场和股市制度的逐步完善,越来越多的投资者参与到股票投资中来。人民收入水平不断提升,闲置资金增多,开始追求除银行储蓄之外更加多样化的投资需求,投资意识和金融意识也日益增长,股票市场日益受投资者的关注。而由于股票市场风险髙、口槛高,对于普通投资者而言,寻找简单易行的投资方式极为重要。如何对众多的股票投资者进行投资指导,同时又不因投资金额较小而导致成本过高,是很多学者和创业公司共同研究的问题。

进行投资分析,并得出有价值的股票选择,需要对海量的信息和数据进行分析。这些数据包括上市公司所处的行业数据、公司财务数据及非财务信息、中介机构评价信息,外部研巧机构分析等。专业的投资机构,如基金、保险资管等机构通过雇佣专业人员进行投资分析,目的是为了综合多样的信息和专业人士的专业判断,以优化投资决策,而长期以来,广大投资者采取基本分析和技术分析投资的方式,其时间精力和专业水平有限,难以找到海量数据背后隐藏的信息,因此无法把握具体的选股巧选时的标准。因此,将数据挖掘技术运用到个股选择中,可以有效地处理与证券投资决策相关的市场信息、经济信息、财务信息、以及其他各种相关信息,从海量的数据中,为投资者挖掘出有用的相关数据和相关规则,并将其与其他证券投资决策方法相结合,探索出适合海量数据条件下的投资决策。

三、数据挖掘在股市选择中指标的选取

本文选择了反应股票基本面的财务指标、公司内部状况指标、以及外部行业指标作为模型输入变量,选择公司股价涨跌幅相对于沪深300涨跌幅的差额作为模型目标变量。

(一)输入变量

股票选择有众多策略,典型代表有价值投资与技术分析,其中股票价值投资由证券分析之父格雷厄姆提出,该理论通过衡量“内在价值”与“安全边际”,从众多股票中寻找市场价值低于内在价值的股票,寻找投资机会。本文采取价值投资的投资理念,价值投资需要考虑能全面反映公司基本面的指标体系。该指标体系需要将企业外部和内部环境相结合,反应影响股价的企业内部和外部活动。

(1)财务活动;财务指标为主要表现形式,反应企业的内部因素。财务指标是常规的反应公司基本面的指标,应用最为广泛。在财务指标中,财务比率的指标非常多,我们将其分成盈利能为、偿债能力、营运能力、成长能力、每股指标五个大类。

(2)内部环境:包括企业内部控制有效性,员工结构,控制权集中程度等问题,通过考察内部环境说明企业的内部控制情况。本文选取了一些指标作为公司内部状况的代表因素:市盈率、市销率、市净率、大股东持股比例、主营业务收入占营北收入的比例、贝塔值等。

(3)外部环境;公司所处行业的经济政策、法律制度、发展状况等,从宏观角度考察企业经营所面对的外部环境状况。除内部因素外,股票投资价值受行业状况的影响。行业发展通常经历四个阶段,即初创期、成长期、成熟期和衰退期,每个行业阶段,行业内公司经营、盈利状况大不相同。当行业处于快速成长期时,普遍业内公司有较好的经营业绩,相反,行业处于衰退期时,公司问题逐步暴露,较差的公司退出行业舞台。

(二)目标变量

价值投资将价格相对于其内在价值过低的股票作为投资对象,在股票价格低于其内在价值时买入,反之卖出,以此获得超过市场表现的超额收益。由此看出,超过市场的表现是投资是否具有成果的衡量标准。本文选择公司股价涨跌幅相对于沪深300涨跌幅的差额作为模型目标变量,对股价进行了如下处理:

计算股价、指数涨跌幅。股价、指数的大小本身不具备可比性和参考意义,而投资收益率反应投资者运用资金的机会成本和收益,具备可比性和参考价值。

计算股价相对于指数涨跌幅的大小差额。股票投资收益的好坏的一个重要参考标准是指数的收益,指数反应大盘的状况,也反应投资者的机会成本,因此对胸买股票的投资者而言,超过大盘表现的公司才有投资价值。

四、数据挖掘实证分析及结论

在实证分析中发现,在各种上市公司财务指标、公司内部状况指标、外部行业指标中,对股票的投资价值影响较大的有销售净利率、现金流量利息保障倍数、营业总收入同比增长率、利澗总额同比増长率、关联交易事项、贝塔值,这些指标应该是投资者判断股票投资价值时应该重点考虑的因素。

股票的涨跌受到众多不确定因素的影响,且该因素及其具体的影响效果、影响程度难以衡量,股价往往难以把握。随着计算机技术的发展,使得人类行为的诸多数据得以沉淀,人们对数据的价值和作用越来越重视,数据挖掘技术在各行各业进行了广泛的运用。从本文可以看出,在价值投资方面,数据挖掘技术有一定的作用,它可以应用于投资领域,为股票投资决策做出贡献。

【参考文献】

[1].韩慧,毛峰,王文渊.数据挖掘中决策树算法的最新进展[J].计算机应用研究研究,2004,12:5-8.

[2].范明,孟小林等译. 数据挖掘技术与概念[M].北京:机械工业出版社,2001.

[3].黄惠平,彭博.市场估值与价值投资策略——基于中国证券市场的经验研究[J].会计研究,2010(10):40- 46.

[4].孙晓莹,李晓静.数据挖掘在股票价格组合预测中的应用[J].计算机仿真,2012(7):375- 378.

猜你喜欢
数据挖掘
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
数据挖掘技术综述与应用
基于GPGPU的离散数据挖掘研究
利用数据挖掘技术实现LIS数据共享的开发实践
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议