人民日报微信公众号健康专栏的情感网络分析
——基于社会网络分析法

2022-04-26 08:49张学波
今传媒 2022年4期
关键词:评论者舆情节点

张学波 王 卿

(华南师范大学教育信息技术学院,广东 广州 510631)

一、研究背景及意义

2012年,微信开通了公众平台这一功能,如今已成为用户阅读新闻、表达意见和宣泄情绪的主要渠道之一,也成为网络舆论孕育和爆发的平台。人民网舆情监测处秘书长指出,互联网舆论已出现在人与人关系更为隐秘的微信中,如果继续不予重视,社会压力就会越积越多,更难以释放。据腾讯公司公布的2021年第一季度业绩显示,微信月度活动量可达到10.4亿,增长率为10.9%,可以说微信涵盖了大量的国内移动互联网受众群体。而对微信影响力进行研究后发现,将近80%的用户会订阅公众号,大部分用户会通过亲朋好友发布的朋友圈得知公众号信息,因此,朋友圈对微信公众号的影响程度在进一步扩大,以上数据都突出了微信公众号的影响力。

本文将采用新引入的新闻传播学文本情感分析法和社会网络分析法,通过Gephi绘制情感网络图,通过Pajek进行点度中心性分析,结合计算机学科以及心理学科方面的理论,着力研究公众号对健康议题事件的标题和公众的情绪表达之间的关系;同时针对《人民日报》这一主流媒体对健康议题的研究,了解用户的积极、消极情绪等,构建公众情绪网络图,为《人民日报》健康专栏的微信运营提供有益建议。

二、研究方法

(一)文本情感分析

近年来,文本情感分析研究成为备受各界关注的研究领域。所谓文本情感分析,是对一段文本所表达的情感倾向进行识别。理论上,人在文本中的情感表达是十分复杂的,但目前计算语言学的相关研究将倾向性划分为褒义和贬义,有时也包括中性或混合,等等。这种程度的简化在一定程度上满足了人们的需求,具有广阔的应用前景。文本情感分析以词汇作为特征,结合分类器 (如朴素贝叶斯模型、最大熵模型、支持向量机模型等)完成了有监督的训练和测试。

(二)社会网络分析

社会网络分析法是一种社会学研究方法。社会学理论认为,社会不是由个人而是由网络构成的,网络中包含节点及节点之间的关系,社会网络分析法通过对网络中关系的分析,探讨网络的结构及属性特征,包括网络中的个体属性及网络整体属性。网络个体属性分析,包括点度中心度、接近中心度等;网络整体属性分析,包括小世界效应、小团体研究、凝聚子群等。该方法目前在教育领域的应用比较广泛,主要探究信息技术环境下学习者所构成网络的特点,以及在此基础上对该网络的改进策略。

三、数据爬取及研究思路

笔者自行编写爬虫代码,抓取了 《人民日报》微信公众号2018年4月至12月的“健康”专栏报道的全部标题以及评论内容等数据,进行深入研究。研究过程分为5步:1.爬取数据;2.数据预处理,包括去除无关字符、文本分词等;3.情感分析并评估分类效果;4.导入Gephi软件,分别绘制以标题为核心和以评论者为核心的情感网络图,并进行分析;5.将2-模网络数据导入Pajek软件,对2-模网络点度中心性进行实证分析。

四、研究发现

(一)评论者核心情感网络

将度范围最小值调整到16,筛选出度范围16-110的数据,接着进行Fruchterman reingold布局渲染,在分类选项中以Modularity Class作分类标准,调整节点标签的颜色,可得图1。由图1可知,经常在 《人民日报》发表评论的用户主要有“顺其自然”“火苗”“邓”“云杰”“白桦林”“途路中”“暴走萝莉”,等等。图1中未命名的小节点代表每条新闻的标题,粗细不同的边代表每条评论的情绪值,根据评论情绪值的分布状况,边越细意味着其评论情感越倾向于负面,边越粗意味着其评论情感越倾向于正面。由1图可知,出现频率较高的用户相对应的边较粗,这意味着其正面评论多于负面评论,进一步表明 《人民日报》“健康”专栏的正面舆论引导效果较佳。

图1 评论者核心情感网络图 (度范围16-110)

(二)标题核心情感网络

由Gephi所构建的标题核心情感网络 (图2)可知,“L77”“L101”“L149”等大节点的编号代表着某个新闻的标题,大节点所连着的小节点表示每一条新闻下的评论者用户,而线条的粗细表示这条评论的情绪值大小。值得注意的是,Gephi在标题核心网络中虽未考虑将用户的评论次数作边,但在有的用户后面可以看到“.1”“.2”“.3”等这些“点 +数字”的后缀,这表示的是该用户在2018年4月至12月的第几次评论,意味着该用户在此期间不止一次评论了 《人民日报》“健康”专栏发布的文章,而未出现后缀的用户表示的是在这段期间内用户只评论过一次健康专栏发布的文章。对出现“点+数字”后缀的评论者需着重分析,若评论者后缀为“.1”,则很有可能该评论者是发布文章而成为 《人民日报》的忠实拥护者,发布的文章可能是其兴趣初始点。

图2 标题核心情感网络图 (规模前十)

纵观规模前十的网络,可发现在第706篇的新闻中,用户“火苗”的评论已经是其第76次的评论,说明“火苗”是健康专栏的忠实粉丝,这与前述以用户为核心的网络呈现的结果相吻合。在情绪值上,L254中“宝宝”对应的线条最粗,这意味着其作出的评论情绪值最大,表明该用户的评论字数很多,不同词组对应的正面情绪值相加后数值很大。

(三)巨人组件分析

通过点选Gephi菜单栏中的“巨人组件”,即可得到整个网络之中最大的子群 (图3)。由巨人组件网络图可知,L254新闻的评论者有28位,其中忠实读者有7位,第一次评论之后再也没有评论专栏文章的读者有20位,这表明 《人民日报》“健康”专栏有很大规模的隐藏读者群体,仍需优化内容设计以挖掘更多读者。从情绪值线条上面来看,“牛牛”的线条最细,很有可能表达的是负面情感,相反,“宝宝”的情绪线条最粗,表明其抒发的正面情感最大。

图3 巨人组件网络图

L254的标题是“【健康】别了,10级疼痛!国家卫健委宣布大消息,女性福音来了”,该文章主要是解读国家卫健委发布的新文件 《关于开展分娩镇痛试点工作的通知》,卫健委将在全国范围遴选一定数量的医院开展分娩镇痛诊疗试点工作,这标志着无痛分娩有望在我国逐步推广。对巨人组件中情绪极值的两条评论进行分析,可以小窥大看到公众在无痛分娩问题上的舆情状况,大部分公众都对国家卫健委新增无痛分娩试点的决议予以支持,这也为政策的发布和下达提供了舆情参考。

(四)2-模网络点度中心性分析

表示两种不同数据集节点之间的从属关系的复杂网络称为2-模复杂网络 (2-mode)。2-模复杂网络中存在着两种类型的节点:一类节点称之为行为者(actors),即本网络中的评论者;另一类节点称之为事件 (events),即本网络中的标题。中心性是社会网络图进行实证分析的重要指标,它主要用于探索网络中某节点或某子群的权力,即探测该节点或社群处在什么样的中心位置。因此,探测社会网络实证分析的中心性离不开三种中心性指标:其一是表示节点之间的直接联系程度的点度中心性;其二是探测网络图中的某个节点承担中介作用的中间中心性;其三是表示节点之间的平均最短路径的接近中心性。在本研究的2-模网络中,本文着重分析该网络的点度中心性。

点度中心性表示节点与其他节点直接相连的程度。点度中心性越高,节点的中心性就越强,因而具有更大的权力。抽选点度中心度最高的前十位评论者,将数据整理成Excel文件并排序后,结果如下:

表1 点度中心性最高的前十位评论者

从分析结果中可以看出,点度中心度较高的帐号分别是:“顺其自然”“火苗”“邓”“途路中”“白桦林”“暴走萝莉”等,较高的点度中心度说明上述用户在信息传播网络的过程中拥有较大的权力。

五、结 语

(一)优化内容设计,挖掘隐藏受众

文章内容是吸引读者阅读并提高读者黏性的重要渠道,通过分析 《人民日报》“健康”专栏的情绪网络图可知,目前仍有许多只评论过一次的潜在读者,因此,如何提高用户黏度是 《人民日报》“健康”专栏亟待解决的问题。纵观评论可发现,“健康”专栏的女性受众比男性受众多,并且女性受众的情绪波动普遍比男性受众大。因此,《人民日报》“健康”专栏需要在注重女性受众市场的同时,开辟男性受众市场,根据受众的年龄段来优化内容设计,达到挖掘隐藏受众、扩大内容市场的目的。

(二)建立网络舆情预警系统,侦测舆情走向

舆情预警机制是为应对化解危机而采取的,是有效行动系统化、制度化的完整体系。在网络信息与日俱增的当下,《人民日报》作为媒体的龙头企业,要利用好“微信公众号”这一平台,了解和把握网络舆情,特别是健康议题的网络舆情的动向和发展趋势,正面引导舆论,将恶意舆情及时扼杀在摇篮中。此外,灵敏高效的“报—政联动体系”,能够使政府对网络中潜在的舆情风险开展高效识别,并尽可能快速地对舆情信息进行高效率的反应以及高质量的报送,以便在舆情控制工作中占据主导优势。

(三)增强互动,提升受众对公众号的认同感

“微信公众号”是纸质媒体加强和读者互动的良好途径之一。然而,微信公众号的读者之间无法互相评论,以及一些媒体推送内容时较少重视读者的阅读感受和体验,造成了读者之间交流不畅以及读者对公众号认同度不高的问题。《人民日报》可以对公众号中自动回复的功能加以利用,这样不仅可以让信息得到反复传递,还可以增加用户的互动,让受众得到更好的体验,进而提升用户黏度和对公众号的认同感。

猜你喜欢
评论者舆情节点
网络新闻评论者的伦理责任问题及应对路径探析
基于移动汇聚节点和分簇的改进节能路由算法
CAE软件操作小百科(48)
基于点权的混合K-shell关键节点识别方法
消费舆情
新闻评论的写作方法讨论和研究
月度最热舆情事件榜11月
月度最热舆情事件榜9月
仲夏夜·轻时光生如夏花
新闻评论少不了科学精神