情感分析网络舆情研究综述

2021-12-26 14:18王高飞裴景昭宋壮壮
合作经济与科技 2021年2期
关键词:舆情期刊情感

□文/王高飞 裴景昭 宋壮壮

(黑龙江科技大学 黑龙江·哈尔滨)

[提要] 我国运用情感分析方法研究网络舆情的热度逐年上升,相关研究取得丰硕成果,对现有文献进行分析与梳理,能够更加清晰和系统地了解研究主体与研究热点。并从总发文量、期刊类别、作者与机构合作等方面进行总结,通过Cite Space V软件分析热点词的演变,提出现有研究存在的不足,并对未来研究方向进行展望。

互联网的快速发展改变了人们的交流习惯。随着即时通讯工具兴起以及自媒体的不断涌现,网民信息交互的渠道增多,网民通过多种方式表达自己对热点事件的态度,从而促进了网络舆情的传播与演化。一旦处理失当,网民的负面情绪会对社会造成严重的负面影响。而情感分析方法是对网民观点与情绪分析的有效方法之一,得到该领域研究者的重示并取得了一定的研究成果。

对我国基于情感分析研究网络舆情的文献进行统计分析和回顾整理。意在发现情感分析方法研究网络舆情中的热点、趋势和未来的发展方向,最后分析总结其存在的不足,为后续的深入研究提供参考与借鉴。

一、情感分析网络舆情研究现状

情感分析又称倾向性分析、情感分类、意见抽取、评论挖掘、情感挖掘或主观分析,是用户对商品、服务等评论内容的分析、处理、归纳和推理,对评论中表达的观点和情感进行分类,同时也被广泛运用在网络舆情的研究中,成为当前网络舆情研究中的主流方法之一。

(一)发文量趋势。通过CNKI期刊网数据库搜集相关文章,采用关键字“情感分析舆情”进行搜索,检索时间截至2019年12月,共检索到420篇,在此基础上清洗得到381篇有效文献,其中硕博士论文237篇,期刊140篇,会议论文4篇,如图1所示,图中横轴为年份,纵轴为文献发表篇数。(图1)

从图1可以看出,相关研究起步较晚,发文量由缓慢增长到快速增长。受当时理论发展水平、技术条件以及受重视程度的限制,在2007~2012年发展较为缓慢,6年内发表31篇。随着大数据新兴技术的迅速崛起,增加了网络热点传播速度和网民发表言论渠道,政府对网络舆情越来越重视,促使相关研究不断深入,从2013年发表数量快速上升,到2019年共发表350篇。情感分析网络舆情研究的增长不仅得益于政府对舆论的高度重视,还有早期研究为其奠定理论和技术上的基础。这表明了我国情感分析网络舆情研究逐步走向成熟。

(二)重要期刊分布。进一步运用上述检索的140篇期刊,从中选取重要期刊,排在前十名的期刊共有43篇相关文章。由图2期刊分布看出情感分析方法是一个跨学科领域的研究方法,主要涉及传播学、情报学和计算机科学等领域,其中情报学期刊共37篇,传播学期刊3篇,计算机学期刊3篇,情感分析在舆情中的应用以情报学相关研究为主。从整体来看,期刊分布较零散且发表高量文章数量还相对不多,表明我国运用情感分析方法研究网络舆情的方法运用与创新研究有待进一步提高。(图 2)

(三)作者、机构共现分析。作者、机构共现分析反映某一研究领域的核心作者、重点机构及其合作强度与互引关系。运行Cite Space生成情感分析我国舆情的研究作者、机构共现图谱,如图3所示,研究机构和作者名字字体越大,表明该机构和作者总体频次越高。由图3表明,吉林大学管理学院发表较多情感分析研究网络舆情的论文,其次是中国人民警察大学。但从图中可以发现,中国人民警察大学兰月新、张鹏等文章引用频次较高,吉林大学管理学院涉及此领域较早并为此奠定基础,研究学者很多但发文量均少于3篇且之间缺少合作,而兰月新、张鹏等发文量均大于3篇,提高了引用频次。图谱整体网络零散且密度较低,说明该研究领域作者、研究机构合作程度较浅,该学科领域尚未形成紧密的合作体系。(图3)

图1 文献发表趋势图

二、情感分析网络舆情研究热点分析

(一)关键词分析。在以上研究基础上,分析近些年来我国情感分析网络舆情的研究热点,运用检索到381篇文献进行分析,生成可示化结果如图4所示。(图4)

运用知识图谱能够较为有效地表达出该领域研究热点之间的关联性。图4中包括2008~2019年来我国情感分析舆情研究的热点领域,十字节点越大研究的热度就越高。图中最大的关键节点是“情感分析”,其余的关键节点依次为“网络舆情”、“舆情分析”等。这些现有文献大多以微博为研究主体,对网络舆情中的情感词进行不同的分类。冯时等以挖掘意见领袖为目的,提出了一种基于LDA模型的短文本子话题分类算法。曾佳妮等结合表情字符,提出了一种基于条件随机算法的对微博文本进行主客观分类和情感倾向性判断的方法。

(二)主题变迁。研究主题的变化趋势能够清晰地反映不同时段内研究热点分布及其演化过程。由图5所示,纵轴为节点所属聚类,同一聚类的节点按照时间顺序被排布在同一水平线上。从图中可以看出最大节点“情感分析”第一次出现在2008年,即有了网络舆情“话题发现”聚类的第一篇参考文献。从2008~2019年“情感分析”出现了222次,且“情感分析”一词与许多聚类上的关键词都有连线,说明情感分析在诸多方面得到运用。本文分成早期、中期、近期3个阶段。(图5)

1、情感分析我国网络舆情早期(2008~2012年)。这一时期是运用情感分析研究我国网络舆情的初级阶段,发文量较少且研究内容单一,研究的主题词包括“网络舆情”、“情感倾向性”等。对于情感分析的运用还在探索阶段,如庞俊基于情感极性对中文博客文本聚类研究,根据情感极性采用聚类技术将中文博客文本进行分组处理。巨慧慧针对网络舆情中文本倾向性分析进一步探索,根据网络舆情语料特性,通过机器学习的方法得到适合网络舆情的情感倾向性分析模型。

图2 重要期刊分布图

图3 作者与机构共现图谱

2、情感分析我国网络舆情中期(2013~2015年)。这一时期为我国网络舆情研究的发展阶段,文献数量相比研究早期有大幅上升,研究角度也逐渐增多。研究主题词则主要包括“微博”、“情感分类”、“突发事件”等。徐琳宏等结合现有的一些词典、语义网络资源以及情感语料,采用手工和自动获取两种方法构建了情感词汇本体。周莉等认为通用情感词典已难以适应当前突发事件文本情感分析的需要,针对突发事件中的舆情发展的多变性,建立了面向突发事件应急管理的专业情感词典。

3、情感分析我国网络舆情近期(2016~2019年)。这一时期我国网络舆情研究相对成熟,将情感分析与其他方法或模型相结合进行研究。研究的主题词包括“深度学习”、“情感传播”。王英等人基于情感维度,利用爬虫工具和文本分析技术,通过情感分析方法统计情感值,实现舆情预警研判。冷东梅等对情感迁移进行研究,在传统传染病SEIR模型的基础上并对其进行改良,并运用AnyLogic软件对模型进行仿真。

三、结论与展望

图4 2008~2019年情感分析舆情关键词

图5 情感分析舆情关键词时间线图

情感分析运用到网络舆情研究中,初步形成了研究体系。为提升政府网络社会治理能力提供了定量分析工具方法,具有一定的现实意义。但目前的相关研究仍存在着一些不足:第一,高质量文章有待增加。从发表期刊来看,多集中于信息类、传播类期刊,其中比较突出的如情报杂志和情报科学各8篇、图书情报7篇,其余期刊发文量均少于5篇。说明现阶段的研究仍主要集中于单一领域,跨学科领域的高质量文章有待加强。第二,研究内容、方法有待进一步创新。对热点词和主题词变迁进行分析,可以发现目前研究大多是基于情感词典对网络中的文本情感词汇进行分类,分析情感倾向性从而判断事件的走向。缺少对深度学习及多种方法相结合的运用。第三,研究者、机构之间的合作有待大力推进。运用情感分析网络舆情研究的机构和作者有限且作者之间的合作程度较浅,缺乏多方位、跨领域的合作。如何在统一的研究框架下探讨情感在网络中不同传播方式、交叉学科背景下深度剖析网络舆情是值得深入的课题。

将创新理论与分析技术运用到网络舆情的情感分析中,一方面在现有的理论基础上对研究内容进行多种学科的融合;另一方面在创新技术的推动下,研究方法将从单一逐步向各种研究方法交叉与融合发展,而研究内容也会从文本分类向音频、视频等内容转变。同时,上述研究趋势必将推动机构和学者之间的交流合作,以产生更多创新型成果。

猜你喜欢
舆情期刊情感
期刊更名启事
期刊简介
如何在情感中自我成长,保持独立
期刊问答
情感
如何在情感中自我成长,保持独立
舆情
舆情
舆情
微博的舆情控制与言论自由