基于随机森林方法的投资者概念关注对概念指数收益预测及交易策略的研究

2021-01-16 02:56扈文秀苏振兴杨栎
预测 2021年1期
关键词:随机森林

扈文秀 苏振兴 杨栎

摘 要:概念炒作一直是股票价格波动的重要驱动因素之一,本文基于投资者关注视角探究投资者概念关注对概念指数波动的预测作用。使用百度搜索指数的非结构化数据测度投资者概念关注,利用随机森林方法构建预测模型,验证市场交易指标和投资者概念关注对概念指数收益和超额收益涨跌的预测作用,并根据预测结果设计交易策略。结果发现市场交易指标对概念指数收益涨跌有较好的预测作用,投资者概念关注则对概念指数超额收益涨跌有较好的预测作用,根据预测结果设计的交易策略可以获得正向的超额收益。本文弥补了前人关于投资者概念关注预测作用研究的空白,也为投资者制定交易策略提供一定的理论参考。

关键词:投资者概念关注;概念指数收益;随机森林;交易策略

中图分类号:F832.5文献标识码:A文章编号:1003-5192(2021)01-0060-07doi:10.11847/fj.40.1.60

Abstract:The concept speculation has always been one of the main reasons of stock price fluctuation. From the perspective of investor attention, this paper explores the prediction effect of investor attention to the concept index on the fluctuation of concept index. The unstructured data of BSI (Baidu Search Index) is used to measure the investor attention to the concept index, and the Random Forest Algorithm is used to build a prediction model, to verify the prediction effect of market trading indicators and the investor attention to the concept index on the return and abnormal return of concept index. Then, design investment strategies according to the prediction results. The results show that the market trading indicators have a good prediction effect on the return of concept index, and the investor attention to the concept index has a good prediction effect on the abnormal return of concept index, and the investment strategies can get positive abnormal returns. This paper fills in the gap of the existed research on the prediction effect of investor attention to the concept index and provides some academic reference for investors to making investment strategies.

Key words:investor attention to the concept index; return of concept index; random forest algorithm; investment strategy

1 引言

在中国证券市场,“概念”板块炒作已经成为股票价格波动的重要推手之一。近年来“科创板”、“5G”、“一带一路”、“互联网+”等概念层出不穷,吸引了大量投资者关注,助推股票价格大幅上涨。投资者关注是投资者为降低投资不确定性从而主动获取投资信息的认知行为,在一定程度上反应了投资者的预期[1],所以利用投资者关注预测股票价格波动在理论上具有一定的可行性[2]。Da等[3]首次将股票简称在Google搜索引擎的搜索量作为投资者关注的代理变量,解决了投资者关注不可观测性、不可获得性和时效性等问题,使得利用投资关注预测证券市场成为可能,为投资者识别证券市场盈利机会、获取超额收益提供新的思路。

随着大数据在金融领域的广泛应用,大量实证研究以搜索引擎的非结构化数据作为投资者关注的代理变量,对证券市场进行了有效的预测。这些研究主要从两个层面展开,其一是利用投资者对宏观证券市场中特定关键词的关注来构建和测量市场领先指标[4]、投资者情绪[5,6]以及市场风险[7]等变量,进而对证券市场指数以及市场风险进行预测;其二是利用微观层面的投资者个股关注对股票价格、收益率以及波动率等因素进行预测[3,8]。但是中观层面的投资者概念关注却鲜有人研究,王宇哲和赵静[9]将PM2.5和雾霾的百度搜索量作为投资者对“雾霾”关注度的代理变量引入研究,研究发现投资者对PM2.5和雾霾的关注度越高,污染治理类股票收益越高,滞后一期的公众雾霾关注度对雾霾治理概念股收益率有显著的正向影响。杨涛和郭萌萌[10]也以PM2.5概念为例进行研究,发现投资者对PM2.5和雾霾的关注会正向影响PM2.5概念股的收益率。这些文献为研究投资者概念关注提供了有益的探索,但是也存在一些局限性。一方面仅以PM2.5概念板块的股票为样本进行研究,存在样本选取误差,研究结果可能不具有普适性;另一方面也未有研究考虑投资者概念關注是否对概念指数收益以及超额收益涨跌具有预测作用。现有文献在研究投资者关注对股票收益预测作用时,大多采用Granger因果关系检验[1]、VAR模型[9]、GARCH模型[11]以及线性回归分析方法[1,3,6~10,12]等传统计量模型进行实证研究,也有学者使用机器学习方法中的SVM模型和BP神经网络模型预测股票市场收益[13]。由于投资者关注的剧烈变化会导致其分布呈现出尖峰厚尾、波动集群的统计特征,所以投资者关注与市场表现之间存在非线性复杂关系,使用传统回归分析难以构建有效的金融预测模型[14]。而机器学习方法不需要严格假设和充足先验条件为前提假定的,可以有效规避这一统计分布缺陷,刻画变量间的非线性关系,所以本研究选择机器学习方法中的随机森林方法(Random Forests Algorithm,RFA)作为预测模型。该方法是一种包含多个决策树的分类和预测模型,适用于存在大量未知特征的数据,可以有效解决数据不符合正态分布的问题,当数据存在大量噪音时,也可以取得很好的预测性能,且不必担心过度拟合问题[15,16]。

基于此,本文将中观层面的投资者概念关注引入预测模型,采用随机森林方法对概念指数收益和超额收益涨跌进行预测,并根据预测结果构建交易策略。与以往文献相比,本文的贡献在于:(1)补充了中观层面的投资者概念关注对概念指数收益和超额收益预测研究的空白,丰富了投资者关注的理论研究和实证研究。(2)随机森林方法作为非参数分类预测方法,可以有效克服投资者概念关注的统计分布缺陷,提高投资者概念关注极端变化以及股票收益极端变化情况下的预测准确性。(3)依据投资者概念关注的预测结果构建交易策略,为投资者的投资决策提供理论参考。

2 理论分析

目前学术界尚未对股票市场中的“概念”进行统一的定义,本文引用股票市场板块的定义对“概念”进行阐述。“概念”是指对驱动某一类股票价格波动要素的概括,也是投资者基于该要素形成的一种更为积极、含义更为肯定、具有持续性的投资共识。投资者概念关注是指投资者对该要素及其相关信息的关注行为,本质是投资者对信息的关注。本文以信息搜寻理论[17](search theory)、分类思考[18](ctegory-learning/thinking)以及投资者有限关注[19]为理论基础论述投资者概念关注对概念指数波动的影响作用。

信息搜寻理论认为,信息搜寻可以降低投资决策的不确定性,从而获得超额收益,但是信息搜寻具有成本,其中投资者注意力的有限性是搜索成本的重要因素之一[17,20]。因此为了使注意力这一稀缺资源获得最大收益,会促使投资者采用分类思考的方式处理信息,即较少关注股票的特质信息,而是将更多注意力分配给市场信息、行业信息或者板块信息,利用市场、行业或板块的信息来指导其投资决策[18]。Huang[21]利用个人投资者的交易数据实证研究发现,投资者在某一特定行业的成功投资经历会增加随后购买同一行业股票的可能性,即投资者会采用分类思考的方式作出投资决策。Barberis和Shleifer[22]研究也发现投资者存在按行业等类别对股票进行分类从而简化投资决策的行为特征。故说明投资者对分类要素信息的关注会影响投资决策,即投资者概念关注会影响该概念板块股票价格的波动。

投资者概念关注作为一种认知行为,必然会受到投资者注意力有限性的约束[23],只能有选择地关注某些信息,而忽略其它事物的信息,即有限关注[19]。所以当投资者准备买入股票时,需要在数以千计股票中进行选择,只能关注引起自己注意的部分股票,并将这些股票视作潜在的投资目标。但是当投资者准备卖出股票时,由于卖空限制,投资者仅可以卖出自己所持有的股票,所以注意力不受约束。这种注意力约束对买卖决策的非对称影响势必导致投资者成为其关注股票的净买入者,从而在短期内带来净买入资金,对股票价格形成上涨压力,所以投资者的关注行为表达了一定程度的买入预期[24]。投资者信念的偏差性会导致投资者选择关注与自己观念相一致的信息,拒绝接受与自己观念相冲突的信息,所以投資者概念关注也是其投资偏好和预期的体现[25]。“概念”是投资者形成的一种积极投资共识[10],所以当投资者概念关注增加,表示这种积极投资共识的扩大,从而导致买入资金的增加,推动股票价格上涨。因此本文认为投资者概念关注可以有效地预测概念指数的波动。

3 变量设计与研究方法

3.1 研究变量与数据来源

本文选择三个概念板块的概念指数进行实证研究,分别是基于产业技术发展驱动的5G板块,基于公众关注驱动的PM2.5板块以及基于国家政策驱动的一带一路板块,这三个板块具有典型的中国证券市场概念板块特征,且是目前证券市场投资者较为认可和追捧的热点板块。三个概念板块的时间跨度分别以该概念板块指数首次收入WIND数据库为基准日期,故5G概念的基准日期为2016年1月4日,PM2.5概念的基准日期为2013年5月2日,一带一路概念的基准日期为2014年10月9日,期末日期均为2018年11月29日。

本研究假设以每个概念板块中的所有股票建立投资组合,每只股票投资金额的权重为构建概念指数的权重,以概念指数作为投资组合的价格。采用前置一期的概念指数收益和超额收益涨跌为被预测变量。借鉴王宇哲和赵静[9]的量化方法测量投资者概念关注(ICA),将“5G”、“PM2.5+雾霾”和“一带一路”为关键词的百度搜索量分别作为投资者5G概念关注、PM2.5概念关注和一带一路概念关注的代理变量。借鉴俞庆进和张兵[26]测度沪深300指数投资者关注度的方法,将个股证券简称作为关键词的百度搜索量作为投资者个股关注,按照股票所属的概念板块进行等权求和,从而得到投资者概念板块关注(ISA)。

市场交易变量的设计参照戴德宝等[13]的研究,在构建预测模型时,考虑到指数收益和超额收益均具有自相关性,所以将当期的概念指数收益和超额收益加入预测模型。将概念指数市场交易指标开盘点位、最高点位、最低点位、振幅、成交额和成交量也纳入研究,还引入沪深300指数的收盘点位作为市场影响因素加入预测模型。投资者关注的数据来自于百度搜索指数,利用Python 3.7构建的网络爬虫代码抓取这些数据,股票市场的交易数据均来自于WIND数据库。

概念指数收益和超额收益的计算方法借鉴Burrowes和Jones[27]的方法。

3.2 随机森林方法

随机森林方法[15]是一种基于统计抽样理论(Bootstrap)的数据挖掘分类算法,有随机森林回归和随机森林分类两种方法,本研究使用随机森林分类。随机森林分类建模的基本思想是利用Bootstrap方法从原始样本中有放回地随机抽取N个子样本,对每一个子样本进行决策树建模,最后根据N个决策树模型的预测结果,使用多数投票法决定随机森林的分类结果,即

其中H(x)表示最终分类结果,hi(x)表示每个子样本i的决策树分类结果,Y表示被预测变量,I(·)表示示性函数,若hi(x)=Y,则I(·)=1,否则I(·)=0。(5)式表示随机森林方法使用多数投票决策的方式来确定最终的分类[28]。

随机森林方法的核心是决策树模型,该模型是一种非参数分类方法,也是一种有监督的分类方法。决策树模型会根据每个样本确定的分类属性训练出一个分类器,其中节点分裂是该模型的核心步骤,通过节点分裂才能产生一棵完整的决策树。每棵树分支的生成,都是按照某种分裂规则选择属性,这些规则主要包括信息增益最大、信息增益率最大和Gini系数最小等,不同的规则对应不同的分裂算法。在节点分裂时,将每个属性的所有划分按照规则指标进行排序,然后按照规则选择某个属性作为分裂属性,并按照其划分实现决策树的分支生长。通过理论和实证研究都证明了随机森林具有很高的预测准确率,对异常值和噪声具有很好的容忍度。

4 实证研究

本研究的实证分析主要由三部分构成,首先是对数据进行预处理,由于变量概念指数收益率(RIT)、超额收益率(AIR)、开盘点位变动率(DOpen)、最高点位变动率(DHigh)、最低点位变动率(DLow)、振幅变动率(DTa)、成交额变动率(DVol)、成交量变动率(DVot)和沪深300指数收盘点位变动率(DMR)之间具有相关性,为了避免“维数灾难”,所以对变量进行主成分分析(Principal Component Analysis)。其次是将预测变量进行组合,构建不同的预测模型,设置随机森林预测模型的相关参数并训练预测模型,根据预测模型对预测集数据进行预测并计算准确率。最后根据预测结果构建交易策略,验证预测模型的实践效果。

利用SPSS 21对RIT、AIR、DOpen、DHigh、DLow、DTa、DVol、DVot和DMR 9个变量进行主成分分析。结果显示5G概念、PM2.5概念和一带一路概念的KMO值均大于0.6,Bartlett’s球状检验在1%的显著水平下显著,说明适合做主成分分析。最终每个概念均提取了三个因子,提取的累计方差5G概念为85.57%、PM2.5概念为83.33%、一带一路概念为85.72%,说明提取的三个因子可以保留9个初始变量大部分信息,最终根据每个因子的方差权重计算市场交易变量(MTV)。

4.1 随机森林模型参数设置与预测结果

为了验证三个预测变量市场交易变量(MTV)、投资者概念板块关注变动率(DISA)和投资者概念关注变动率(DICA)及其组合对DRIT和DAIR预测的准确率,本研究共设计了7个预测模型,不同模型的预测变量如表2。使用Python 3.7中的随机森林算法对模型进行预测,所以需要对预测模型的相关参数进行设置。根据一般预测模型的要求,将样本划分为训练数据集与预测数据集,比例为7∶3,训练数据集为概念指数交易周期内的前70%的数据,预测数据集为概念指数交易周期内后30%的数据。随机森林方法需要设置:两个重要参数决策树的数量ntree和内部节点输入变量mtry的个数,根据前人研究和实验经验,设置决策树ntree为500,内部节点输入变量mtry为3[16,28],预测结果如表2。

根据表2,模型1对三个概念指数的DRIT预测准确率分别为52.05%,53.12%,50.66%,均高于其他模型的准确率,说明MTV可以较好地预测DRIT。模型3对三个概念指数的DAIR预测准确率分别为53.88%,50.03%,52.67%,高于其他模型,说明DICA对DAIR有较好的预测能力。模型2对DAIR和DRIT的预测能力均较弱,说明DISA对概念指数的DAIR和DRIT预测作用不佳。为了进一步探究预测模型的预测作用,根据预测模型1和模型3的结果分别构建交易策略。

4.2 交易策略构建

交易策略设计的核心是根据预测的收益率涨跌设计交易机制,并计算累计收益和累计超额收益,从而验证预测模型的有效性。根据随机森林算法的预测结果,模型1的市场交易指标可以较好地预测概念指数收益,模型3的投资者概念关注可以更好地预测概念指数的超额收益,故根据前文的模型1和模型3预测结果设计买入和卖出信号。若预测结果DRITi,t+1=1,则买入投资组合;若DRITi,t+1=0,則卖出投资组合。同理,若预测结果DAIRi,t+1=1,则买入投资组合;若DAIRi,t+1=0,则卖出投资组合。

为简化起见,在计算该交易策略的累计收益和累计超额收益时,做出如下假设和约束:交易成本为ETF指数的交易费用,单边费用为0.025%;假设交易存在卖空限制;设定交易价格为概念指数的收盘点位;设定每次每个概念板块的投资金额均为100万元。最终交易机制是:以基期开始计算,投资者在概念板块i第一次出现买入信号之前一直空仓,当出现买入信号后买入概念板块i构建的投资组合,并持有至卖出信号出现的交易日,在该交易日清仓概念板块i的投资组合,期间如果出现买入信号不追加仓位。同理,清仓概念板块i的投资组合后,在第一个出现的买入信号时,买入概念板块i的投资组合,期间如果出现卖出信号则不进行任何操作。如此循环往复进行投资,根据交易策略获取每日收益,计算概念板块i投资组合的累计收益和累计超额收益。为了比较交易策略的有效性,同时构建长期持有交易策略,该策略的交易机制是:以期初的价格买入概念板块i构建的投资组合,持有至期末清仓概念板块i构建的投资组合,持有期不进行交易,故没有交易费用。

根据表3,在三个概念中,PM 2.5的交易周期最长,获取的收益也最多,利用预测模型构建的交易策略的期末累计RIT相较于长期持有交易策略会多获取48.6万元的收益,年化收益为25.61%,多获取40.08万元的AIR,年化收益为21.12%。使用5G概念样本进行预测时,预测模型构建的交易策略的期末累计RIT相较于长期持有交易策略会多获取17.42万元的收益,年化收益为19.82%,多获取4.73万元的AIR,年化收益为5.29%。使用一带一路概念样本进行预测时,预测模型构建的交易策略会多获取11.24万元的RIT和4.79万元的AIR,年化收益分别为9.11%和3.89%。说明预测模型交易策略的期末累计RIT和AIR均高于长期持有交易策略期末累计的RIT和AIR,所以根据预测模型构建的交易策略可以获取超额的收益,进一步说明了预测模型的有效性。且在三个概念样本中均成立,说明预测模型具有较好的鲁棒性。

根据图1,在交易周期内,5G概念和PM 2.5概念预测模型交易策略的累计RIT基本均在0轴之上,说明相较于长期持有策略,预测模型构建的交易策略更有效。但是在一带一路概念样本中,预测模型交易策略的累计RIT却在部分交易日期内低于长期持有交易策略的累计RIT,说明交易指标对DRIT有一定的预测作用,但是在不同的概念板块中却存在差异。根据图2,发现投资者概念关注变动率对DAIR具有预测作用,但是在不同的概念板块中同样存在差异。

根据对概念板块的分析发现,一方面是由于5G概念和PM 2.5概念板块的股票多以低市值、高市盈率的为主,这些股票价格的波动幅度较大,容易受到市场消息的驱动。但是一带一路概念板块的股票大多以高市值、低市盈率的股票居多,股票价格的波动幅度较低,股票价格主要受公司盈利能力的影响较多,因此通过市场交易指标或投资者概念关注来预测一带一路概念指数波动的效果较差。另一方面PM 2.5概念是基于公众关注驱动的板块,空气污染的变化会影响公众对PM 2.5关注度的变化,而空气污染具有一定的渐变性和周期性,投资者对PM 2.5概念的关注也具有一定的渐变性和周期性,所以概念指数的波动也具有一定的渐变性,导致投资者概念关注预测作用增强;而5G概念和一带一路概念是基于信息冲击驱动的板块,具有一定的突发性,所以信息会迅速被股票价格吸收,导致预测作用下降。故相对于PM 2.5概念,投资概念关注对5G概念和一带一路概念指数超额收益的预测作用较弱。

5 结论与启示

5.1 研究结论

本文以信息搜寻理论、分类思考以及投资者有限关注为理论基础,论述投资者概念关注对股票价格波动的影响作用。基于百度搜索指数的非结构化数据测度投资者概念关注,并利用随机森林算法验证了7个预测模型对概念指数收益和超额收益涨跌的预测作用,根据预测结果设计交易策略。研究发现:市场交易指标对概念指数收益的涨跌有较好的预测能力,投资者概念关注则对概念指数超额收益的涨跌有较好的预测能力,而基于投资者个股关注计算得到的投资者概念板块关注对概念指数的收益和超额收益涨跌的预测结果均不理想。根据随机森林方法预测结果设计的交易策略会获得高于长期持有交易策略的超额收益,其中PM 2.5概念超额收益的年化回报率达到了21.12%,5G概念的年化超额收益为5.29%,一带一路概念的年化超额收益为3.89%,可以看出概念板块之间的年化超额收益有较大的差异性,本文根据概念板块股票的构成和概念指数的驱动因素探究了该差异的原因。

5.2 理论贡献与实践启示

通过系统的文献评述、理论分析和实证研究,本研究的主要理论贡献有:(1)利用信息搜寻理论、分類思考以及投资者有限关注论述中观层面的投资者概念关注对概念指数收益和超额收益的预测作用,弥补了前人研究的空白。(2)以百度搜索指数的非结构化数据为数据源,采用大数据分析方法中的随机森林方法展开实证研究,拓展了随机森林方法在金融领域的应用。(3)依据预测模型结果构建的交易策略可以获得正向的超额回报,为投资者制定交易策略提供新的路径。

本研究得到如下实践启示和建议。对于监管部门而言:(1)应深入挖掘、捕捉和监测投资者网络搜索数据,改进股票市场监管的技术手段,抑制股票市场的概念炒作现象,也可以利用大数据技术提高金融市场系统性风险预警的先导性和准确性,促进金融市场健康发展。(2)成立大数据分析部门,积极收集投资者的声音和挖掘投资者的需求,助力上市公司研判市场趋势,实现精准投融资决策。(3)完善数据保护、监管与共享机制,制定相关法律法规,防止大数据平台利用数据优势攫取超额收益,同时应该鼓励互联网的共享思维,提高数据共享水平,促进金融领域的大数据技术快速发展。对于投资者而言:(1)可以利用投资者概念关注数据预测股票收益并制定相应的投资策略。(2)应该提升自身的投资知识水平,学习大数据技术,通过大数据技术来汲取经验,预判未来,理性决策。(3)应该树立价值投资理念,摈弃概念炒作的思维。

5.3 研究局限与展望

首先,由于本研究侧重于研究投资者概念关注对概念指数收益和超额收益的预测作用,所以缺乏对其作用机理的实证研究。其次,本研究选择了三个具有代表性的概念板块进行预测研究,但是股票市场存在较多的概念板块,可能存在一定的样本选取误差,未来的研究可以对概念指数进行全样本研究,提高预测模型的普适性。最后,在构建概念指数收益和超额收益预测模型时,未将投资者情绪加入模型,未来研究可以将投资者情绪纳入预测模型,提高预测模型的精准度。

参 考 文 献:

[1]张谊浩,李元,苏中锋,等.网络搜索能预测股票市场吗[J].金融研究,2014,(2):193-206.

[2]李倩,吴昊.大数据背景下投资者行为研究的趋势分析:基于“内涵-思路-方法”的三重视角[J].中央财经大学学报,2017,(2):52-62.

[3]Da Z, Engelberg J, Gao P. In search of attention[J]. Journal of Finance, 2011, 66(5): 1461-1499.

[4]Vozlyublennaia Nadia. Investor attention, index performance, and return predictability[J]. Journal of Banking & Finance, 2014, 41: 17-35.

[5]Takeda F, Wakao T. Google search intensity and its relationship with returns and trading volume of Japanese stocks[J]. Pacific-Basin Finance Journal, 2014, 27: 1-18.

[6]胡昌生,陶铸.个体投资者情绪、网络自媒体效应与股票收益[J].预测,2017,36(3):50-55.

[7]曾建光.网络安全风险感知与互联网金融的资产定价[J].经济研究,2015,(7):131-145.

[8]赵龙凯,陆子昱,王致远.众里寻“股”千百度——股票收益率与百度搜索量关系的实证探究[J].金融研究,2013,(4):183-195.

[9]王宇哲,赵静.“用钱投票”:公众环境关注度对不同产业资产价格的影响[J].管理世界,2018,(9):46-57.

[10]杨涛,郭萌萌.投资者关注度与股票市场——以PM 2.5概念股为例[J].金融研究,2019,(5):190-206.

[11]Afkhami M, Cormack L, Ghoddusi H. Google search keywords that best predict energy price volatility[J]. Energy Economics, 2017, 67: 17-27.

[12]白丽娟,闫相斌,金家华.基于搜索关键词关注度的商品房价格指数预测[J].预测,2015,34(5):65-70.

[13]戴德宝,兰玉森,范体军,等.基于文本挖掘和机器学习的股指预测与决策研究[J].中国软科学,2019,(4):166-174.

[14]Fan X, Yuan Y, Zhuang X. Long memory of abnormal investor attention and the cross-correlations between abnormal investor attention and trading volume, volatility respectively[J]. Physica A: Statistical Mechanics and Its Applications, 2017, 469: 323-333.

[15]Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.

[16]李娜,李秀婷,魏云捷,等.财政支出的社会经济效应——基于面板随机森林的分析与优化[J].管理评论,2018,30(10):258-269.

[17]Stigler G J, Stigler S M, Friedland C. The economics of information[J]. Journal of Political Economy, 1961, 69(3): 213-225.

[18]Peng L, Xiong W. Investor attention, overconfidence and category learning[J]. Journal of Financial Economics, 2006, 80(3): 563-602.

[19]Hirshleifer D, Teoh S H. Limited attention, information disclosure, and financial reporting[J]. Journal of Accounting and Economics, 2003, 36(1-3): 337-386.

[20]Smith G E. Diagnosing the search cost effect: waiting time and the moderating impact of prior category knowledge[J]. Journal of Economic Psychology, 1999, 20(3): 285-314.

[21]Huang X. Mark Twain’s cat: investment experience, categorical thinking, and stock selection[J]. Journal of Financial Economics, 2019, 131(2): 404-432.

[22]Barberis N, Shleifer A. Style investing[J]. Journal of Financial Economics, 2003, 68(2): 161-199.

[23]Kahneman D. Attention and effort[M]. Prentice-Hall, 1973. 75-76.

[24]Barber B M, Odean T. All that glitters: the effect of attention and news on the buying behavior of individual and institutional investors[J]. Review of Financial Studies, 2008, 21(2): 785-818.

[25]Engelberg J, Sasseville C, Williams J. Market madness? The case of mad money[J]. Management Science, 2012, 58(2): 351-364.

[26]俞慶进,张兵.投资者有限关注与股票收益——以百度指数作为关注度的一项实证研究[J].金融研究,2012,(8):152-165.

[27]Burrowes A, Jones K. Initial public offerings: evidence from the UK[J]. Managerial Finance, 2004, 30(1): 46-62.

[28]方匡南,吴见彬,朱建平,等.信贷信息不对称下的信用卡信用风险研究[J].经济研究,2010,(S1):97-107.

猜你喜欢
随机森林
随机森林算法在中药指纹图谱中的应用:以不同品牌夏桑菊颗粒指纹图谱分析为例
基于随机森林的登革热时空扩散影响因子等级体系挖掘
基于随机森林的HTTP异常检测
个人信用评分模型比较数据挖掘分析
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
拱坝变形监测预报的随机森林模型及应用
基于随机森林算法的飞机发动机故障诊断方法的研究
基于奇异熵和随机森林的人脸识别
基于随机森林算法的B2B客户分级系统的设计