网络论坛用户的行为分析研究——以股吧为例

2019-09-13 06:34王家箴何美会李美暄
网络安全技术与应用 2019年9期
关键词:收盘价发帖股民

◆王家箴 何美会 李美暄 于 娜 钱 程

网络论坛用户的行为分析研究——以股吧为例

◆王家箴 何美会 李美暄 于 娜 钱 程

(河北师范大学(石家庄)计算机与网络空间安全学院 河北 050024)

在过去几十年中,股票一直是金融领域的热门话题,股票涨落可以影响投资者的心理,同时,股市行情也可以由市场参与者的行为驱动。投资者会利用互联网分析股票走势,并且根据经济形势在相关论坛上发帖,而发帖内容又会影响股民的决策,股票走势与发帖行为之间的交互作用加强。本文从统计学的角度,试图探究股票走势对股吧论坛留言者的影响。实验的股票走势参考东方财富网的上证指数,爬取股吧论坛数据,该样本包括2007年11月至2019年3月淘股吧发布的180多万条帖子和其发布时间,研究发现,论坛发帖量服从幂率分布,按月统计后,发现在股市波动和平静时期幂指数分别为1.35和2.5。且发帖行为受股市波动具有时滞性,经计算,周发帖量和上证指数的相关系数可达0.84。

股票;淘股吧论坛;发帖行为;幂律分布

股市是一个国家经济发展的晴雨表,能够提前反映一个国家的经济发展状况,中国属于“政策市”[1],随着改革开放和社会经济的飞速发展,中国股市在这20多年发展很快,虽然它还很年轻,但也存在其自身弱点,通常是牛市较短熊市较长,伴随着日常小幅波动和两次大幅涨落。

根据MobData发布的《2018中国股民图鉴》显示,男性股民的数量高达69.6%,北上广深的股民最多,苏浙沪地区炒股比例最高。《全国股票市场投资者状况调查报告(2018年度)》报告指出,截至8月底,全国股票投资者数量达1.42亿。从20世纪90年代起,中国股市的大部分散户一直处于亏损的状态,超过一半股民在2018年亏损20%以上,盈利股民不到12%,是继2008年以来跌幅最大的一年,这也是大部分股民日常的真实写照。

互联网媒体是金融界传播消息交流互动的首要平台,根据第43次《中国互联网发展状况统计报告》统计显示,截至2018年12月,我国网民规模达8.29亿,网络用户群体庞大,投资者由互联网得到经济新闻和企业政策,而后又通过网络论坛传递对金融市场波动的观点[2],中国的股市需要科学的政策和必要的情绪引导来为金融市场的发展提供保障,因此,探究股市波动对网民发帖行为的影响非常重要。

1 研究现状

股票领域中存在的理论大致有三种:随机漫步理论、有效市场假说和行为金融学[3]。探索人类的发帖行为,是人们自我认知的一个重要方面,也是避免资金不必要流失的基础。相关研究表明,如果一个股票的价格波动越大,则发帖量越大,而发帖越大,会导致成交量越大,Fisher K L等人的研究指出,股票市场的波动和投资者的评论行为具有相关关系[3],Das等人在研究新闻和评论数量中发现,投资者的情感受股市波动影响具有时滞性,他们更倾向于解释对过去股市状况的表现[4]。早在2005年Barabási揭示了人类行为在时间上对泊松过程的偏离,成为人类对时空复杂性研究的转折点[5]。而后来,越来越多的实证表明行为的时间统计特性可以用幂函数率来真正反映[6]。网络论坛是自组织临界系统,网络论坛发帖量满足幂律分布和自相似性等特征[6],本实验是按不同时间段采用幂函数率进行的股民行为分析。

2 实验分析

2.1 数据获取

为了研究群体层面的人类行为,需要一个通用的、权威的数据集。淘股吧是中国大陆知名的财经SNS垂直网站。本文的数据来源是国内淘股吧论坛的用户访问时间记录,从2007年11月至2019年3月,按月进行统计存储。

2.2 发帖时间间隔行为分析

首先,将所有用户看成一个整体,登录淘股吧网站爬取每月的群体用户发帖时间,选取最近一个月数据,如图1所示,今年2月份时间间隔和频率服从幂率分布且带有肥胖的尾部。

图1 普通坐标系下用户在淘股吧发帖的时间间隔分布

注:图1是2019年2月群体用户时间间隔的群体数据集,其中时间分辨率为秒。

图2 双对数坐标系下用户在淘股吧发帖的时间间隔分布

注:图2是2019年2月群体用户时间间隔的群体数据集,拟合出一条斜率约为-2.4的直线。幂率分布图像呈现肥尾效应。

2.3 收盘价和发帖量之间的关系

将东方财富网中k线的每月收盘价存入csv文件,如表1所示,展示2014年5月到2016年2月的月收盘价。观察发现,上证指数在2015年中经历了一次大幅涨落。2014年1月到6月,月收盘价走势平稳,7、8月份开始增长到2200多,9月份开始快速逐月递增,在2015年5月12日达到峰值5166.35,之后开始递减,在2016年2月收盘价降到谷底。东方财富网的k线走势图如图3所示,可以看到分别在2007年和2015年,这两年经历了巨大变化。

表1 每月收盘价

图3 东方财富网月k走势图

在时间上,发帖量随着时间螺旋递增。2015年股市变化较大,并且由图4可知2015年的发帖量走势延迟一段时间后和上证指数大致相符。

图4 发帖数量和收盘价走势对比图

注:图4横轴为时间,分辨率为月,纵轴是发帖量。

为了量化发帖量和收盘价之间的关系,采用皮尔逊相关系数来衡量两组数据的相关性,如下公式所示,用两个变量的协方差除以它们各自的标准差:

实验将A股峰值两侧一段时间内的收盘价和发帖量进行了统计,如表2所示,分别以2015年6月12日收盘价达到最高点和7月7日发帖量达到最高点进行统计,相关行的计算结果均在中度相关以上。其中,在下降时期周的相关性最大,=0.84。

表2 上证指数和收盘价的相关性计算

2.4 收盘价和发帖量之间的关系

收盘价往往影响着股民的情绪,造成发帖行为的差异,使得幂指数也发生变化。如表3所示,表中给出了从2014年10月到2016年7月,股市涨落时的k线大幅涨跌时,幂指数在1.35左右;股市没有太大变化。k线相对平和时,幂指数在2.5左右。由此可见,股市的变化影响着股民在论坛的发帖行为。

表3 月指数统计

将不同的月份的斜率进行观察比较,幂指数在平时和股票涨跌时期是有明显区别的。双对数坐标如图5所示,通过线性回归拟合出图像的斜率,接下来取出k线波动和平静两种时期来进行比较,对比可知,股市波动时期幂指数较低,主要是由于用户发帖时间造成的,股票市场大幅涨跌时k线波动,群体用户发帖的时间间隔大的个数增加,造成了肥尾庞大,幂指数降低。

图5 双对数坐标系下用户在淘股吧发帖的时间间隔分布

注:图5是2015,2016和2019年各一个月群体用户时间间隔的群体数据集,其中时间分辨率为秒。

3 结论

本文研究发现,论坛发帖量服从幂率分布,按月统计后,发现在股市波动和平静时期幂指数分别为1.35和2.5。且发帖行为受股市波动具有时滞性,经计算,周发帖量和上证指数的相关系数可达0.84。

[1]池丽旭,庄新田.投资者情绪与股票收益波动溢出效应[J].系统管理学报,2009(04):367-372

[2]Fishier K L,Statman M. A behavioral framework for time diversification[J]. Financial Analysts Journal,1999:88-97

[3]Bandpadhyaya A,Jones A L.Measure Of Investor Sentiment:A Comparative Analysis Put-Call Ratio Vs. Volatility Index[J]. Journal of Business & Economics Research(JBER),2011.6(8).

[4]Han X P ,Zhou T,Wang BH.Modeling human dynamics with adaptive interest [J] .New Journal of Physics ,2008,10(7): 073010.

[5]周涛,韩筱璞,闫小勇,杨紫陌,赵志丹,汪秉宏.人类行为时空特性的统计力学[J].电子科技大学学报,2013(04).

[6]程薇,钟华,孙娇华.网络论坛中发帖行为的复杂性研究[J].系统工程学报,2009(04).

猜你喜欢
收盘价发帖股民
股神榜
英议会掏钱让议员学如何发帖
力量
股神榜
力量
股神榜
股神榜
悲催的股民
利用学校网络平台,培养学生写作兴趣
发帖与跟帖