基于主成分分析的股票指数构建研究

2019-11-01 01:24
新营销 2019年5期
关键词:方差基准股票

(北京物资学院 北京 101149)

一、引言

目前,随着计算机技术发展及智能时代的到来,依托于计算机技术为投资者提供投资决策指导的量化投资技术在量化选股、量化择时、风险控制、统计套利等方面越来越普及。文章采用数量的方法构建出具有价值的股票池进行投资,如果该公司满足了该方法的条件,则放入股票池,如果不满足,则从股票池中剔除。

二、基于主成分分析的指数构建

(一)数据选取与指标选取

沪深300股票能代表市场整体的情况,它的样本涵盖了沪深 A 股 60%左右的市值,而且其成分股是业绩与规模较好的股票。文章选取沪深300成分股作为研究对象。其中,2018年7月2日作为选股期,2018年7月2日—2019年8月29日作为选股策略的检验期,数据源于东方财富choice数据。文章在比较投资组合收益情况时选用的市场基准也是沪深300指数,可以消除其他因素的影响,有利于评价选股的效果。

指标的选取直接影响分析的结果和模型的有效性,选取的指标范围越广,构建的投资组合考虑方面越周到。在前人研究的基础上,对变量筛选归纳后得到如下指标:年换手率(基准,自由流通股本)(X1)、市盈率(TTM.扣除非经常性损益)(X2)、历史PEG值(X3)、自由流通市值(X4)、每股收益EPS(扣除/稀释)近三年年报均值(X5)、每股经营活动产生的现金流量净额(TTM)(X6)、净资产收益率ROE(TTM)(X7)、最近24个月年化收益率(X8)、毛利率近三年年报均值(X9)、资产负债率近两年与2019年第一季度均值(X10)、最新股息率(X11)、净利润近五年复合增长率(X12)、营业收入近五年复合增长率(X13)。

由于各指标取值范围不同以及度量单位存在差异,原有的主成分分析法会受到评价指标量纲和数量级的影响,主成分也会因评价指标量纲和数量级的改变而不同,并且使部分信息丢失。所以,首先应该对原始数据进行标准化处理。本文用SPSS软件描述统计量进行标准化处理得到Xi(i=1,2,…,13)。

(二)主成分分析

主成分分析将原有多个相关性较强的变量X1,X2,…,X13重新组合,生成少数几个彼此不相关的变量F1,F2,…,Fm,使它们尽可能多地提取原有变量的信息。其中F1,F2,…,Fm就叫作第一主成分、第二主成分……第m主成分。

通过SPSS软件对13个指标变量进行主成分分析。变量间的相关矩阵直观显示变量之间有相关性。KMO 和 Bartlett 的检验得到KMO值达到0.63,Bartlett球形度检验近似卡方为683.730,P值0小于0.05,表明变量间适合做主成分分析。

由解释的总方差可知,前6个主成分对应的特征根大于1,累积方差贡献率达72.5%,有一定的信息损失但是可以接受,因此提取得到6个主成分F1,F2,…,F6代表原Xi(i=1,2,…,13指标变量)。

(三)综合评价模型的构建及股票选取

首先求标准化后的原始指标变量在6个主成分线性组合中的系数,即用成分矩阵中的载荷数除以对应的主成分特征值的开方。由解释的总方差和成分矩阵可以得到指标Xi在不同主成分Fm线性组合中的系数ki,m,这样就可以将指标转换成6个主成分

Fm=k1,m×X1+k2,m×X2+…+k13,m×X13,m=1,2,…,6. 用主成分分析确定的指标权重是以主成分的方差贡献率为权重的,因此指标在综合评价中的系数要归一化处理。主成分与方差贡献率相乘求和即可得到综合得分指标数据。

根据综合得分数据的高低对沪深300成分股股票所属公司的财务状况综合评价进行排名,排名结果在前30的股票如表1所示。

表1 沪深300成分股排名(前30)

三、指数的检验与评价

因为上市公司的财务报表中指标数据太多,而使用主成分分析算法可以用很少的综合指标代替原先的指标数据,使分析者能够对上市公司的财务状况有一个全面的了解。综合得分作为上市企业全面综合的财务状况评价指标,可以让投资者更直接地了解上市企业的经营状况,为选股池构建提供了依据。

下面对选出的股票建立指数。选取排名前30的股票,在choice金融终端中建立指数HS,其中,三聚环保当日停牌,故不在指数中,权重采用2018年7月2日除三聚环保以外的29支股票在沪深300指数中所占的权重(如图1所示)。

以2018年7月2日—2019年8月29日作为选股策略的检验期,图1显示,组合在近一年收益率净值增长率为29.22%,业绩基准增长率为11.92%,净值相对业绩基准为17.30%;创建以来净值增长率为31.19%,业绩基准增长率为7.95%,净值相对业绩基准为23.23%。HS组合的夏普比率为0.2818,超过标的指数(0.202 5)。总体来说,该选股模型是有效的,使用该模型选股构建出的指数表现出收益率超过大盘沪深300指数收益率的现象;在短期内略跑赢沪深300,在长期内业绩表现更好。

图1指数HS组合业绩表现

四、结论与改进

证券市场瞬息万变,本文在实证中构建出的股票指数仅以2018年7月2日一天的指标数据作为依据误差较大,在之后一年的时期内也未根据市场宏观政策情况进行调整。但本文将选取的所有指标考虑在内,使分析者对上市公司的财务状况能够把握地更加全面,在长期投资中,该方法构建的股票指数抗突发变动情况好,收益良好。在实际操作中,可以把近期一段时间作为选股期,并且按月或季度根据市场动态情况进行调整。

猜你喜欢
方差基准股票
方差怎么算
概率与统计(2)——离散型随机变量的期望与方差
计算方差用哪个公式
方差生活秀
本周创出今年以来新高的股票
本周创出今年以来新高的股票
本周连续上涨3天以上的股票
近期连续涨、跌3天以上的股票
明基准讲方法保看齐
滑落还是攀爬