社会媒体情绪感染模型研究*

2019-12-05 04:59柴艳杰刘婷婷
应用心理学 2019年4期
关键词:节点状态情绪

柴艳杰 刘婷婷 王 瑾

(1.宁波大学信息科学与工程学院,宁波 315211;2.宁波大学科学与技术学院,宁波 315211)

1 引 言

随着互联网2.0时代的到来,以Facebook、Twitter、微博为主的社会媒体迅速扩张,受到了广泛关注,它具有用户基数大、受众群体广、时效性强、传播迅速等特点(李栋,徐志明,李生,刘挺,&王秀文,2014)。大数据时代下的社会媒体已成为现实社会的投影,信息量的剧增充斥于人们日常生活的各方各面。在线社交网络通过用户之间的连接突破了时空的限制,使信息不依赖于传统面对面交流的方式而通过互联网实现跨地域传播。

突发事件的爆发导致情绪以信息为载体伴随信息同步传播(Bauch,Ferrara,& Yang,2015),网民负面情绪推波助澜,感染其他用户最终扩散至整个社交网络。例如2018年乐清女孩乘坐滴滴顺风车遇害这一热点事件在微博曝光后激起热议,网民的愤怒情绪迅速蔓延,网络舆论经社会媒体发酵后的影响力远大于报刊、电台等传统传播方式。由此可见社会媒体情绪感染的研究对于舆情监测和网络群体性事件的控制具有重要的现实意义。

情绪一直是心理学领域研究的重点与热点,近年来结合心理学情绪理论与人工智能技术对情绪的扩散过程进行建模仿真是情绪感染研究的一大热点趋势。现有社会媒体情绪感染研究步骤大致可分为以下三步(纪雪梅&王芳,2015):首先提取社会媒体的网络结构与信息的情绪特征(李寿山,李逸薇,刘欢欢,&黄居仁,2013);然后基于信息传播规律运用多种方法来构建情绪感染模型;最后,通过构建的情绪感染模型来控制网络舆情,避免网络群体性事件的发生。本文回顾了情绪模型相关研究成果,分析了社会媒体中情绪感染研究的理论与方法,并提出了未来研究的思路。本文的结构框架如下:第1节引入相关背景与研究意义、第2节介绍了相关概念、第3节总结与归纳现有情绪感染模型,第4节总结了现有研究的不足并对未来研究做出展望。

2 情 绪

2.1 情绪理论

情绪(emotion)广义上指人对客观事物的态度体验,狭义上指有机体受到刺激时产生的暂时性较剧烈的态度。情感(feeling)是一个与情绪既有区别又有联系的概念,情感与情绪一样是人对客观事物的态度体验,但两者并不完全相同,区别如下:

需要不同:情绪是有机体与生物需要相联系的体验形式;情感是人类特有与社会需要相关联的一种复杂的态度体验。

稳定性不同:情绪是短暂的、不稳定的;情感是长期的、稳定的。

获得方式不同:情绪是人类和动物先天与生俱来的;情感是人类社会特性发展到一定阶段才产生的。

2.2 情绪分类

从个体情绪体验的角度可将情绪简单划分为积极情绪体验和消极情绪体验。能满足人的需要、渴求、意向的肯定性的体验会产生积极情绪,而不能满足人渴求事物的否定性体验则产生消极情绪。Watson,Clark,和Tellegen(1988)编制了积极情绪消极情绪量表(PANAS),邱林,郑雪,和王雁飞(2008)修订了该量表使其具有更好的区分度,更加适合国内使用。

这种二分类方式不能划分具体的情绪类别,比如愤怒、悲伤、恐惧均被划分为消极情绪,而它们之间存在很大差别。心理学家们以基本情绪理论为基础,提出了离散情绪模型和维度情绪模型来对情绪做进一步细致的划分。表1对比总结了这两类情绪模型各自的优缺点。

表1 两种情绪模型对比

2.2.1 离散情绪模型

离散情绪分类将情绪以离散标签的形式划分为几种基本的类型,研究者们的分类多种多样,总结归纳如表2所示。

离散情绪模型的分类方法比较清晰简洁,符合个体的直观感受,普遍采用于早期的研究中。但该模型只蕴含了几种基本情绪类型,仅能有限的划分情绪类别,并且不能表达同一类型情绪的强度和不同类型情绪间的关系。

2.2.2 维度情绪模型

维度情绪模型在连续维度上从情绪的复杂性、微妙性、连续性三个角度对情绪进行建模与划分。将情绪定义为多维空间内的坐标点,通过连续且不间断的数值来描述情绪,因此维度情绪模型也称作连续情绪模型。

心理学家Wundt最早提出了三维情绪模型(Wundt & Judd,1897),该模型将情绪划分为快乐度、冲动度、紧张度三个维度。每一维度可以表示情绪对应的极性和强弱变化,每种基本情绪均可映射到该三维空间的某一点。在该模型的基础上学者们提出其他模型,总结归纳为表3所示。

表2 离散情绪模型研究进展

表3 维度情绪模型研究进展

2.3 情绪感染

情绪感染(emotional contagion)广义上来讲,是指因他人情绪影响自身情绪这一现象。截至目前,学术界从不同的角度对情绪感染做出了解释(张奇勇&卢家楣,2013),其总结归纳如表4所示:

表4 情绪感染概念研究

3 情绪感染模型

随着人工智能领域的兴起,学者们对情绪的感染过程展开研究,其研究领域涉及生理学、心理学、传播学、计算机信息科学等多个方面。早期的研究基于人群中成员之间的情绪传递构建情绪感染模型,最具代表性的是Bosse等(2009)以热力学理论为基础的情绪吸收模型。考虑到群体成员中个体之间的交互作用,Maitner,Mackie,Claypool,和Crisp(2010)提出了群际情绪理论。刘箴,金炜,黄鹏,和柴艳杰(2013)基于智能体(Agent)模型,计算人群拥挤事件中的个体情绪感染过程。

随着社会媒体的普及,情绪突破了时空的限制,伴随信息同步传播。这种传播过程感染原本无情绪倾向的个体,传播速度和范围远大于传统的群体情绪感染。在原有群体情绪感染模型研究的基础上,结合社会媒体信息传播特征,越来越多的学者们着重研究社会媒体中的情绪感染。通过对相关文献进行梳理,将现有情绪感染算法分为三大类:基于流行病动力学的情绪感染模型、基于信息级联模型的情绪感染模型、其他情绪感染模型。

3.1 基于流行病动力学的情绪感染模型

基于流行病动力学的情绪感染模型借鉴了经典传染病模型的思想,将情绪的感染类比为疾病的传播(谭娟,2015;张发,李璐,&宣慧玉,2011)。将人群分为三种基本状态:易感状态(Susceptible,S):暂未感染;感染状态(Infected,I):已感染;免疫状态(Recovered,R):感染后恢复稳定状态,不易再次感染。

传染病模型的主要思想是针对这三种状态的转变过程进行数学建模,利用动力学演化方程组抽象描述人群状态随时间的演化关系。基本模型为SI模型(S状态个体在与I状态个体接触时以固定概率β被感染为I状态)、SIS模型(被感染的I状态个体以概率y恢复为S状态)、SIR模型(被感染的I状态个体以概率y转换为R状态)、SIRS模型(R状态个体在恢复之后又以概率λ感染为S状态),如图1所示:

一些学者结合具体问题在此基础上提出了改进模型来研究社会媒体情绪感染现象,总结如表5所示。

3.1.1 基于SIS模型

Bergstrom等(2010)和Hill等(2010)提出了SISa模型,其贡献在于突出易感状态(S)转换为感染状态(I)不仅受周围的被感个体接触的影响,还增加了一个自发感染的过程。其缺陷在于并未对情绪进行划分,Liu等(2014)基于SISa模型将感染状态(I)嵌入情绪特征划分为乐观状态(O)和悲观状态(P),提出了SOSa-SPSa模型。该模型将乐观情绪和悲观情绪分开讨论,并证明悲观情绪更容易感染他人。但未考虑乐观情绪与悲观情绪之间的相互转换,Song等(2016)基于此问题做了进一步完善。

赵卫东等(2015)针对网络突发事件,结合多智能体的思想分析了情绪由个体扩散至群体的演化过程。Q.Wang等(2015)提出了ESIS模型,该模型将情绪分为七类,通过式1计算用户i传播给用户j的信息中每种情绪化信息o所占权重,证明了情绪的扩散取决于信息的传播概率和传播强度。不足之处在于在情绪化信息的传播过程中,情绪可能会发生变化,该模型不能还原多种情绪的演变过程。

表5 传染病改进模型

其中Ni,j,o表示用户i从用户j转发的情绪o的信息数量;Ni,j表示从用户i转发用户j的信息总数。

3.1.2 基于SIR模型

F.Xiong等(2012)将所有接受信息还暂未被情绪感染的状态定义为阅读状态(C),若感染了某种情绪则转换为感染状态(I),否则转换为免疫状态(R);赵剑华和万克文(2017)将易感状态(S)的用户划分了三种心理特征,结合粒子群算法构建了网络舆情传播动力学模型,实验结果的均方值远低于传统SIR模型,可准确预测舆情传播趋势;陈业华和张晓倩(2018)将情绪稳定状态(R)进一步划分为暂时稳定状态R1和永久稳定状态R2,并站在政府干预的角度为遏制消极情绪扩散提供思路;姚晶晶等(2018)综合分析情绪理论、信息偏差、转换速度等因素,通过实验得出当网络中积极情绪的用户的占比较大时,用户情绪会在短时间内趋于稳定的结论。史敏和石岩(2015)通过分析球场观众的情绪演化过程,构建了遏制球场观众暴力行为的动力学模型;张永和和凯(2018)加入一类假免疫节点(D),定义了三个传播概率函数提出SDIR模型,证明了初始传播概率会对传播过程产生重要影响。

3.1.3 基于SIRS模型

Fu等(2014)结合了元胞自动机方法提出CA-SIRS模型,定义个体i进行移动时受周边邻居j的情绪影响Dij如式2所示:

其中,E为情绪强度,Ai,j为接受率,Bi,j为传输率。L表示个体之间的距离。个体情绪M(i,t)为所有邻居情绪影响与个体前一时刻情绪的累加之和,计算方法如式3所示:

该模型模拟了移动人群中的情绪感染过程,但仿真结果的直观性较差,不能动态观察群体中不同情绪个体的数量变化。

X.Wang等(2016)加入潜伏和敏感状态提出SLIRS模型,通过结合最优控制策略,能够最大限度地抑制消极情绪扩散。

3.2 基于图论的情绪感染模型

基于图论的模型以社交网络结构为基础,运用复杂网络理论,通过分析网络结构中节点的连接来研究情绪的扩散过程。本节介绍以信息级联模型为基础的情绪感染模型,在信息级联模型中,将用户抽象为网络中的节点,用户之间的关系抽象为节点之间的连接。节点存在激活与非激活两种状态,节点的状态只受相邻节点的影响。信息级联模型主要可以分为两大类:独立级联模型(Saito,Nakano,& Kimura,2008)和线性阈值模型(Granovetter,1978)。

3.2.1 基于独立级联模型

在独立级联模型中,激活状态的节点只有一次机会以固定的概率去激活相邻处于非激活状态的节点,各节点之间的激活过程是相互独立的,节点被激活的顺序并不唯一。

情绪会影响用户是否转发某条信息(Chen,Liu,& Zou,2017),文献(Q.Wang,Jin,Yang,& Cheng,2017)基于用户与用户通过转发信息构建的单层网络,提出了一种基于独立级联模型的情绪感染模型(EIC),在Twitter数据集上分三步来研究情绪感染的过程。首先计算传播概率来预测用户是否会转发消息;然后综合考虑用户特征、结构特征、信息特征预测用户的情绪是否变化;最后通过计算转换概率预测用户变化后情绪。仿真结果表明17.9%的用户情绪发生了变化。该模型可以预测传播过程用户情绪的变化。仍存在的不足是仅考虑转发这一单一传播方式,而忽视了评论、点赞、提及等其他传播方式。

基于这一问题,学者们将社交网络看作由多个相同节点、不同连接的单层网络所组成的多重网络,X.Xiong等(2018)分析了多层社交网络交互机制,考虑转发、评论、提及这三种交互行为,提出情绪独立级联模型(eIC),将每种交互行为看作子网络层,用户节点的情绪值为各子网络层相邻节点影响的加权之和,计算公式如式4所示:

Ej其中为用户j的情绪值,α为三个行为层(转发、评论、提及)之一,εinα为情绪传输率,ΔEij为情绪差值,t为时间点。

该模型未计算“关注”关系对用户情绪传播的影响。文献(熊熙et al.,2018)进一步做了完善,在多层网络中引入时空特征,用精确数值定量的表达用户情绪值是社会媒体情绪感染研究极具突破性的一步,实验结果表明比单层网络传播模型更加贴近社交网络的情绪感染。

周东浩、韩文报和王勇军(2015)考虑到实际传播过程中存在的延迟时间,在对三大传播特征(主题特征、客体特征、信息特征)进行讨论分析后,构建了基于非同步独立级联模型的细粒度传播模型,实验证明能够提升预测的准确率。

综上所述,基于独立级联模型的情绪感染模型均以传播者为中心,用户是否被感染取决于自身的激活概率。

3.2.2 基于线性阈值模型

在线性阈值模型中,初始时有一组处于激活状态的节点会同步的激活处于非激活状态的相邻节点。每个非激活节点a都存在一个激活阈值θ,邻居节点b对节点a的影响为I_ba;当a受其所有邻居节点B的影响∑bBIba>θ时,节点a将会被激活。激活状态的节点有多次机会激活相邻处于非激活状态的节点。

Galuba,Chakraborty,Aberer,Despotovic和Kellerer(2010)通过分析网络结构与情绪化信息特征提出了一个传播预测算法,实验结果与真实数据对比具有较高的准确度。Gui,Sun,Han和 Brova(2014)通过不同的关系类型引入两个变量,来预测用户的传播行为。Khalil,Dilkina和Le(2014)通过改变线性阈值模型的网络拓扑结构,可以阻止消极情绪化信息的扩散。Bozorgi,Samet,Kwisthout和Wareham(2017)从信息接收者的角度出发,研究了多条信息在传播过程中的竞争,提出了DCM模型。郑蕾(2011)综合考虑用户的个性提出了基于节点影响力的计算模型,并将其应用到多条信息并行传播的过程中。

综上所述,基于线性阈值的改进模型均以信息接受者为中心,用户是否被感染取决于相邻用户的加权影响力之和是否超过给定的阈值(罗双玲,夏昊翔,&王延章,2015)。

3.3 其他模型

3.3.1 基于微分方程

Zhao等(2014)提出情绪感染过程中乐观情绪(“+”)与悲观情绪(“-”)、乐观情绪与乐观情绪、悲观情绪与悲观情绪之间都会相互影响,并建立了二元情绪转移方程。通过Runge-Kutta方法求解并在复杂网络中进行数值仿真,实验结果表明所有个体最终会趋于同一情绪。不足之处在于该模型单纯地使用加权的方法,所得结果与实际情况误差较大,如何使其更贴近现实,有待于在未来深入研究

3.3.2 基于系统动力学方法

李从东和洪宇翔(2014)以及李从东、洪宇翔和谢天(2013)通过系统动力学方法搭建了群体情绪演化模型,并结合元胞自动机模拟个体间的情绪感染,来预测突发事件的情绪感染过程。叶琼元、兰月新、王强、夏一雪和杨谨铖(2017)采用系统动力学建模方法,将网民情绪演化过程分为“萌芽-爆发-成熟-衰退”四个时期。通过分析用户自身、媒体环境、政府控制三个因素,得出突发事件下社会媒体情绪演化规律。不足之处在于对影响网民情绪演化的变量提取不够全面,且主要研究情绪强度的变化而未考虑多种情绪的演化,因此仅适用于特定舆情事件。目前基于系统动力学方法的情绪演化研究还有很大的挖掘空间,有待学者们进一步深入研究。

3.3.3 基于马尔科夫链

Dong,Pentland,和Heller(2012)提出了一种基于图形耦合隐马尔可夫模型(GCHMM)的情绪感染模型。Z.Du,Yang,Cai,Zhang,和Bai(2018)在此研究基础上提出了一种衡量个体消极情绪程度的指标,通过推断个体消极程度模拟不同个体之间消极情绪的扩散。使用Gibbs采样方法在合成网络数据集和真实网络数据集下验证了所提出的模型的有效性。不足之处在于主要采集用户手机端社交网络中的消极情绪,但个别用户无论积极还是消极情绪从言语中表述出的均为消极情绪,若可以筛选出这类用户则可以提高模型的准确率。

3.3.4 基于智能体(Agent)方法

基于智能体的方法将用户看作智能体,通过对智能体进行建模来模拟用户情绪的感染过程。最早的研究基于单个智能体(Agent),仅能模拟单一个体的情绪演化(Marsella & Gratch,2009)。为模拟群体成员随着时间推移的情绪感染过程,文献(Bosse,Duell,Memon,Treur,& van der Wal,2014)提出了基于多个Agent的情绪感染模型,侧重于群体间的情绪扩散。但只能模拟单一情绪在群体中的传播,不能模拟不同情绪的扩散。基于这一问题,文献(Rui Fan,Xu,& Zhao,2018)研究多种情绪(喜悦、愤怒、厌恶、悲伤)在不同关系的用户间扩散的过程,定义了传播阈值τ,若wuv*e(ci-1)>τ(wuv表示关系强度,ci表示情绪相关度),则认为情绪会扩散,仿真结果表明愤怒情绪比喜悦情绪更容易在陌生人中传播。不足之处为定义的传播阈值唯一,但对于不同Agent应定义不同的传播阈值来模拟不同情景下的情绪扩散过程。

3.4 模型对比

本小节首先从理论上分析不同方法的特点,然后比较其具体算法,最后对比分析各实验结果。

3.4.1 方法对比

基于流行病动力学方法通常用于从宏观角度描述群体情绪感染规律。此类方法侧重整体情绪感染情况,关注情绪感染过程中用户在几个状态之间的转移,比较适合估计整体范围内计算某时刻处于某状态个体的比例。缺陷在于用疾病接触感染过程表示情绪在用户之间的扩散过程过于简化,并没有考虑社交网络结构、用户之间的连接、用户个体之间的差异。

Q.Wang等(2015)优势在于比其他模型拥有更好的数据拟合性,情绪分类较全面。不足之处在于只考虑了情绪本身的因素,未考虑社交网络转发推送机制与多种网络行为对情绪传播的影响。

基于信息级联模型方法以社交网络结构为基础,将用户节点作为基本单元,综合考虑了节点之间的连接和不同节点之间影响力的差异构建情绪感染模型。适用于对某一个体某一时刻下情绪感染状态的估计。缺陷在于信息级联模型假设所有用户获取信息的渠道均来源与相邻节点,而现实社交网络中信息往往直接来源于自身搜索、媒体推送或热点话题。

熊熙等(2018)优势在于引入多层拓扑网络来表示社交网络的多种交互机制。与ESIS算法的时间复杂度一致,但与真实数据的拟合度更好,描述情绪传播特征更加充分,对社交网络中情绪传播预测效果更好。不足之处在于该算法仅划分积极和消极两种情绪,不能表示多种情绪的演化过程。

基于其他模型的方法各具特色,微分方程方法具有数学的严密性;系统动力学方法结合了定性描述与定量分析;智能体方法综合考虑了用户的独立性与自主性,其中最具代表性的算法为:

Rui Fan等(2018)优势在于通过考虑推送-重新发布机制、亲密度等多种特征,比其他模型模拟情绪感染效果更好,不足之处在于未充分考虑个性因素,不能表示群体情绪演化过程。

3.4.2 实验对比

针对实验部分存在两种情况:第一种为仿真实验,仿真实验将模型进行数值仿真。通过对仿真结果进行分析,结合现实生活中存在的一些问题提出一些建议;另一种为对比试验,与其他已有模型通过各类评价指标进行对比试验。本节总结了有关情绪感染算法的对比实验,如表6所示:

表6 情绪感染算法的对比实验

4 总结与展望

本文首先介绍了情绪模型相关研究成果,引入情绪感染的概念,通过总结大量相关文献发现目前学者们对于社会媒体情绪感染算法的研究主要有两大体系:基于传染病模型的情绪感染算法、基于信息级联模型的情绪感染算法。传染病模型由于其较高的灵活性衍生出大量的改进模型,通过构建用户各状态之间的转移模拟情绪感染规律,并可以在模型基础上为网络舆情监控提供控制策略,再由仿真实验验证其合理性。信息级联模型通过分析节点之间相互激活作用来研究情绪化信息的传播与演化,以用户节点为基本单位可以精准模拟情绪感染过程。其他的方法由于侧重点不同,各有千秋,但它们仍存在一些值得继续深入探索的问题。本节将在总结现有研究不足的基础上对未来研究做出展望,以期对深入开展社会媒体情绪感染算法提供借鉴。

(1)动态建模。

目前大多数情绪感染算法都基于静态的用户行为与网络拓扑结构。但是根据调查显示,个体在社区内的互动远大于社区间的互动,会使同一社区内用户的情绪越来越相近,联系也越来越紧密,便逐渐与不同情绪的用户断开连接。而社会媒体中不断产生的新用户与新信息也伴随着社交网络结构动态演化。现有研究基于历史数据集或静态网络拓扑关系,对动态网络建模研究不足。可以利用在线机器学习等动态预测模型对情绪演变进行建模,这仍需要在未来进行深入的研究。

(2)多元异构。

情绪感染过程中的异构性体现在用户、信息、网络三个方面。第一,用户具有异构性,通过研究不同用户在Instagram上观看陌生人积极帖子的情绪变化发现(Vries,Möller,Wieringa,Eigenraam,& Hamelink,2017):一部分用户在社交媒体上看到陌生人的积极帖子会受到鼓舞产生正面情绪,另一部分用户会对比自己不堪的现状而产生负面情绪。用户的情感复杂多样导致相同的信息对不同用户的影响不同。第二,信息也具有异构性,愤怒情绪比喜悦情绪更容易感染用户(R.Fan,Zhao,Chen,& Xu,2014)。第三,传播网络具有异构性,相同的信息会同时在不同的网络平台传播。而目前的模型未综合考虑这些不同角度的异构性,这对我们未来的研究工作来说也是一个很大的挑战。

(3)信息关联与竞争。

目前社交网络的信息量急剧增加,而大多数用户不会每时每刻查阅社交媒体,这会导致信息堆积,当用户再次进行查看的时候,已经积攒了很多未读信息。这些信息之间存在竞争,用户在心情烦躁时会在网络中寻找相同经历的信息导致消极情绪再度恶化,也有可能通过一些积极情绪信息来调整自己的心情。信息之间除了竞争关系外,信息关联现象也普遍存在。某一热点信息的爆发,通常会导致其他共同主体或主题的信息随之曝光,信息主体与其转发评论之间也存在关联。目前情绪感染算法研究中每条情绪化信息都是孤立存在,并未考虑信息的关联特征。如何定量分析信息间的关联与竞争有待继续深入的研究。

(4)舆情反转可视化。

大多数用户在社会媒体中围绕着一个主题或事件宣泄情绪。一些事件往往存在舆论倒戈现象,网民情绪因此受到影响。如今还不能在时间序列上直观地呈现某话题的情绪演变过程,若可以通过情绪可视化技术实时动态呈现群体情绪随时间序列的变化曲线,便可更好的观测舆论事件的反转与群众情绪的走向。

(5)多模态情绪感染。

目前的研究都是基于单条情绪化信息。人类的语言内涵较为丰富,汉语言也存在着歧义性。比如一句话可能暗含多种情绪,一条看似积极消息也许同时掺杂着挖苦与嘲讽。现有研究主要以文本信息为主,对图片、音频、视频等多媒体信息中情绪的挖掘十分罕见,未来的研究中可以融合消息中的表情、配图等综合考虑多种情绪的传播。情绪在传播过程中的不断演化也需要继续探索,这样可以更好地控制网络舆情。

社会媒体作为广大用户信息交流、情绪宣泄的平台,蕴含大量映射了用户心理行为的多媒体信息。利用心理学情绪结构理论与计算机模拟仿真相结合的方法研究社会媒体情绪感染这一社会现象,推动了心理学研究领域的发展。相信在学术界的不断探索和尝试下,社会媒体情绪感染模型在未来几年会取得更大的发展和突破。

猜你喜欢
节点状态情绪
基于图连通支配集的子图匹配优化算法
结合概率路由的机会网络自私节点检测算法
面向复杂网络的节点相似性度量*
采用贪婪启发式的异构WSNs 部分覆盖算法*
状态联想
生命的另一种状态
小情绪
小情绪
小情绪
坚持是成功前的状态