基于主成分分析与因子分析的开放式公募基金评价模型

2021-03-04 01:13潘佳祥董傲坤鲍一丹
全国流通经济 2021年31期
关键词:夏普标准差比率

潘佳祥 董傲坤 鲍一丹

(天津科技大学,天津 300450)

基金投资在近些年来是一个热门话题,越来越多的投资者将购买基金作为投资方式,截至2020年第四季度末,我国的基金数量已多达7000多只。同时我国的开放式公募基金经过了20多年的发展,截至2020年年底,其规模已经跃居亚太地区第一,全球第五。并且,随着开放式公募基金的发展,出现了越来越多的基金经理,其管理的基金规模也在逐步扩大。但是,由于基金经理的水平差异较大,基金之间的业绩也各不相同,基金投资领域出现分化的现象。许多投资者面对如此众多的开放式公募基金与基金经理,很难作出最优选择。

面对数量众多的基金与投资者难以选择的局面,开放式公募基金的业绩评价和推荐模型对基金销售机构和广大投资者都具有重要意义。

一、模型的建立与分析

1.数据来源

本文利用基于Python的开源金融数据接口库收集2008年至2020年所有开放式公募基金从成立以来的所有历史净值数据,包括每日净值、累计净值和收益率,并进行数据清洗,得到有效数据。

2.主成分分析与因子分析概述

主成分分析与因子分析的主要思想类似,二者都是利用了“降维”思想,利用若干主成分或者公因子来代表原始变量。

主成分分析是利用线性的变换方法,把高维的问题向低维的问题转化,把研究变量通过降维处理,转变成新的变量,同时按照方差降序排列。主成分分析的方法可以将很多变量通过降维处理,转化成少数互不相关的新变量。所形成的新变量能够解释原有数据的绝大多数变量,即原有变量的主要成分,并且能够解释数据的综合指标。因子分析同样运用了“降维”理念,结合原有变量的相关矩阵内部关系,将关系复杂变量转化为少数公共因子和特殊因子线性组合。相比较于主成分分析法,因子分析则侧重于描述原始变量之间的相关关系。

3.模型的建立

(1)收益率指标

基金的收益水平是基金的业绩的重要组成部分。本文选取日均收益率、超额收益率两个收益评价指标来对基金收益情况进行衡量。首先建立基金业绩与收益水平的关系函数。设第i只基金的收益率为ri,第i只基金的单位净值为pi,基金份额为X,P0,P1分别为0时刻与1时刻基金单位净值,

超额收益率:Rit=ri-rm

(2)风险衡量指标

投资中的风险问题也不容忽视,主要是基金投资收益的不确定性,基金经理一般会结合自己独有的投资经验与操作风格,通过各种方式来达到规避风险的目的,可是基金的收益波动不能被完全消除。本文选用基金收益率的标准差、最大回撤值这两个指标衡量基金的风险情况。

(3)夏普比率

基金投资中,风险的差异往往意味着收益的差异。夏普比率同时将风险因素与收益因素综合考虑,能够减少因考虑单一风险或收益因素来评价投资的误差,提高评价的准确性与客观性。因此,本文选取夏普比率作为综合评价指标。

由于我国国债市场流动性较弱,利率市场化较弱,不适合直接选取国债利率。因此本文综合考虑后,决定选用中国银行2021年度的一年期定期存款利率1.75%为投资无风险利率,即rf=1.75%。

(4)综合评价

最后运用SPSS软件对得到的相关数据进行主成分分析找出两个主成分,通过因子分析得到旋转后的方差贡献率作为因子权重。将因子权重与对应成分构建线性方程,得出综合得分并排序,从中选择前10的基金作为推荐基金。然后把这10只基金2015年每日收益率赋予相等的权重并求和,作为组合的收益率,在此基础上对所推荐基金未来一年,即2016年的日收益进行预测。

4.模型的分析

本文对2008年至2020年中每一年已成立的基金分别进行分析,在该年尚未成立的基金不予考虑。接下来从基金的收益水平和风险程度两方面进行综合分析。一方面,通过计算基金的日均收益率、超额收益率和夏普比率判断基金的收益水平;另一方面,通过计算基金的最大回撤值、标准差作为基金的风险指标。综合从以上五个角度进行分析。本文选取2016年基金的发展状况进行展示分析。

(1)分析一:相关性分析

对每年各只基金的日均收益率、超额收益率、夏普比率、最大回撤值、标准差这些指标进行相关性分析。使用SPSS,对所选取指标进行相关性分析,绘制相关性热力图表示不同指标之间的相关程度,如图1所示。

图1 相关系数矩阵热力图

从图1可得,由于收益率和夏普比率的相关系数为1,说明这两个指标完全正相关。超额收益率与标准差、夏普比率、收益率有着较弱的正相关性,与最大回撤值有着较低的负相关性;夏普指数和收益率与最大回撤值有着较强的负相关性。因此,收益率和夏普比率可以作为一个指标,其他指标均具有一定的可解释性,可作为衡量基金收益或风险的指标。

(2)分析二:日均收益率

日均收益率,代表着基金成立以来的收益状况的一般水平,以基金代码为160918为例计算日均收益率约为0.3657。同理可得该年其他基金日均收益率。通过Python编程筛选出2015年初已成立的基金,在2015年每天的收益率数据,计算各基金的日均收益率。

(3)分析三:超额收益率

超额收益率Rit=ri-rm,反映一只基金的收益情况高出整个市场平均水平的程度。超额收益率越高就说明基金的收益情况越好。运用Python编程筛选出2015年年初已成立的基金,在2015年每天的超额收益率数据,进行求解。以160918的超额收益率计算为例:即Rit=ri-rm=0.3675-0.1216=0.2459,同理得出各基金2015年1整年的超额收益率

(4)分析四:标准差

基金收益率的标准差代表基金收益的波动情况,标准差越大意味着基金收益情况越不稳定。运用Python编程筛选出2015年已成立基金在2015年1整年每天的标准差数据,得出各基金2015年1整年的标准差,以编号为166016的基金收益标准差为例进行计算。结果如下:

(5)分析五:夏普比率

夏普比率表示投资者每多承担一单位风险,能够获得超过无风险报酬率的报酬。在夏普比率大于零的情况下,说明在衡量期内基金的平均净值增长率超过了无风险利率,夏普比率越大,表示投资该基金承担单位风险能够获得的收益越高。以代码为160918的基金夏普比率为例计算。结果如下:

同理可得其他基金夏普比率。以根据Python编程所筛选出2015年初之前成立的所有基金的2015年1整年夏普比率。

(6)分析六:最大回撤值

最大回撤值是衡量在投资某一产品之后,可能会出现最大程度亏损的风险指标。最大回撤值越小说明基金的风险越低。以基金代码为160918的基金为例计算最大回撤值:即将该基金2016年每一天的当天单位净值与后一天的单位净值作差,再除以当天单位净值求出回撤值,然后求出一年中最大回撤值约为-0.0036,同理可得其他基金最大回撤值。

二、模型的求解

1.求解一:推荐合适的基金

为保证模型准确性,需保证使用至少一整年的数据进行计算分析,以2016年推荐基金为例,那么只需考虑截至2015年1月1日已成立的223只基金,在此范围中进行基金推荐。

考虑评价模型的客观性、有效性,本文使用数理统计中主成分分析法、因子分析法结合SPSS软件,分别对两类(风险与收益)的五个评价指标进行了综合的测评与排序。因为主成分1、2特征值都大于1,而且能够解释原数据89.42%的方差,即涵盖了大部分信息,这表明前两个主成分能够代表最初的5个指标,所以本文选取前两个主成分的方式具有一定可取性。

表1和表2分别给出了2016年基金主成分、特征值、方差贡百分比与累计献率和经过旋转之后的成分矩阵。

表1 总方差解释

表2 旋转后的成分矩阵a

从旋转之后的成分矩阵可以看出,收益率、夏普比率和超额收益率和主成分1具有较大相关性,将其归纳整理,作为评价基金收益情况的相关指标,主要表示开放式公募基金的收益水平和业绩情况。最大回撤值和标准差与主成分2具有较大相关性,可以将其归纳总结为开放式公募基金的风险调控的相关能力指标。分别用Y1和Y2代表主成分1和主成分2。

利用SPSS软件,将所求得的因子载荷矩阵中的数值与对其应特征根的算术平方根作商,求得主成分的线性组合系数,将所得系数代入模型,求解出主成分的表达式。然后利用成分矩阵旋转之前的方差贡献率求得各自的权重,再将每一项的权重与所对应的主成分值相乘,计算结果作为综合得分。即:

Score=0.61449×Y1+0.2797×Y2(Y1,Y2∈R)

最终得出2016年初推荐的十只基金依次为:大成中小盘混合A、国泰估值优势混合、国泰中小盘成长混合、兴全轻资产混合、银华内需精选混合、申万菱信量化小盘股票、兴全合润混合、东方红睿丰混合、融通领先成长混合、万家行业优选混合A。以排名第一的基金大成中小盘混合A综合得分为例,Y1为2.8660,Y2为0.4569,得分为1.89。

将主成分综合评价结果与单一的收益水平和风险程度的评价结果进行Pearson相关性分析,结果显示可以通过相关性检验,说明主成分综合评价与所选取的单一指标具有较强相关性,因此能够使用主成分综合评价法进行基金的业绩评价。

2.求解二:预测等权重组合基金未来一年的表现

在得出2016年年初推荐的10只优秀的基金后,还需要给出这10只基金等权重组合在2016一整年的的表现情况。所以将2015年中排名前10的每只基金的日收益率分别乘以10%的权重,再将其加总作为当日的组合收益率,最终得出基金等权重组合2015年整年间的每日组合收益率。

此外,由于基金市场节假日休市,所以一年中每只基金有效交易天数为244天。因此可以将2015年的有效交易日期用序号1-244表示,2016年的有效交易日期则可用245-494表示。这样就把2015年和2016年的日期放于同一坐标轴,以2015年基金的每日组合收益为基准,运用matlab工具箱反三角函数拟合方法,得到函数f(x),对2016年的日收益进行预测。函数f(x)的系数和变量的拟合程度分别如表3和图2所示。

表4 模型系数

图2 模型拟合程度

通过计算结果以及拟合模型图所示,函数f(x)具有较高的拟合程度,说明模型较为准确。因此,本文将运用该模型预测每年年初所推荐的十只开放式公募基金等权重基金组合在未来一整年的发展趋势。

三、结语

关于基金的评价,目前有很多学者从不同的角度建立模型,并进行分析求解,可是截止目前仍没有全面准确的基金评价模型,可见这一问题十分复杂。

本文对开放式公募基金评价这一问题进行探索,建立基于主成分分析与因子分析的开放式公募基金的评价模型。首先查阅大量参考文献,对影响基金发展的因素进行收集与分析后,选用基金的日均收益率、超额收益率和夏普比率、最大回撤值和标准差等5个重要指标。通过SPSS软件做相关性分析得到这些指标间具有一定的相关性后,基于各个基金的单位净值和日增长率建立5个指标的函数关系式。

以2016年为例,通过python编程分别筛选出2015年年初之前成立的所有基金2015年1整年内5个指标的相关数据。然后进行主成分分析、因子分析,得出旋转后的成分矩阵,将日均收益率、夏普比率和超额收益率划入收益型指标,将标准差和最大回撤值划入风险型指标。利用SPSS软件得到主成分的线性组合系数,由此得到主成分的表达式。再求得权重,再将每一项的权重与所对应的主成分值相乘,计算结果作为综合得分。取前10名作为2016年年初的推荐基金。在假设无风险收益率是定值、忽略现金分红的情况下,分别求解目标函数,得出各基金2015年1整年的5个指标的值,并根据5个指标分别排名,作为2016年年初基金的前十名。

最后将所推荐的十只基金等权重组合,对未来一年,即2016年的日收益进行预测。同时,模型还可以进行调整与推广,例如可以将开放式公募基金按照风险成分或收益成分的得分进行排名,根据投资者对于风险的承受能力与偏好程度,细分为保守型、激进型等多种类型投资者,为不同类型的投资者推荐合适基金。

所建立的基于主成分分析与因子分析的开放式公募基金评价模型能够为基金投资者提供一定参考,能够帮助基金投资者在众多基金中综合分析,选择最优基金。

猜你喜欢
夏普标准差比率
订正
Risk score for predicting abdominal complications after coronary artery bypass grafting
比率分析公司财务状况——以步步高及永辉超市为例
千点暴跌 两市净流出逾7000亿资金
美拭目以待的潜力城市
医学科技论文中有效数字的确定
谈数据的变化对方差、标准差的影响