基于用户评论的情感量化评分模型研究

2019-09-25 13:22王龙葛王敏
数字技术与应用 2019年6期

王龙葛 王敏

摘要:用户的情感倾向在推荐算法中起到非常重要的作用,本文利用设计的情感模型对用户评论进行量化计算,并利用一定的公式计算用户情感值和用户评分所占的比例,构建最终用户评分矩阵模型。经过实验证明,该模型比单纯的用户评分更能反映出用户的情感倾向。

关键词:情感模型;用户评论;评分矩阵

中图分类号:TP277 文献标识码:A 文章编号:1007-9416(2019)06-0071-02

0 引言

互联网的飞速发展促使了推荐算法的快速发展[1]。然而,现有的推荐系统大多不考虑用户的真实情感,研究结果表明,情感对用户行为和喜好的决定有着至关重要的作用,在信息推荐过程中充分考虑用户的情感倾向和情感状态可以更好地适应用户的个性化需求,以更好地实现个性化推荐服务[2]。

1 国内外研究现状

电子商务的发展促使了推荐系统的快速发展,从本世纪初,不少的学者开始将情感分析和推荐算法结合起来取得不少成果。

Huettner等人[3]在2001年手工建立有极性标注的情感词典;Shanahan[4]等人通過词语间的搭配规则,利用情感标注语料库,找到文本中存在的情感词以及它们之间的规则关系。娄德成和姚天防[5]提出了联系全文,分析全文主题和各词语之间的关系,进行词语极性的计算从而从整体考虑全文倾向;王丙坤[6]为提高网络文本的在线分类效率,提出利用多粒度计算和多准则融合无监督的方法进行了情感分类。

本文在前人工作的基础上做了如下工作:(1)将深度学习的模型应用用户评论的切词中,提高了切词的准确率;(2)提出了情感计算的量化模型,并计算了用户评论和评分的权值比例,构建了最终的用户评分矩阵。

2 用户评论情感量化模型

2.1 情感词典的建立

文本情感分析必须以情感词典为基础,本文将对餐饮领域的用户评论进行分析,在传统的LSTM模型上,引入赵淑芳[7]等的方法,将输入门和遗忘门合成一个单一的更新门,延长LSTM的记忆时间;同时引入许宁[8]等的方法,在LSTM模型前加入多层神经网络,提高LSTM模型的特征提取能力。最终将改进得到的LSTM模型运用与中文切词技术中,提高中文切词的准确率。

2.2 用户评论情感评价量化模型

在对用户评论进行情感量化时,评论语句中往往还有其他的词语,这些词的出现会在很大程度上影响情感的倾向和倾向程度。在进行情感量化的过程中加入了否定词和程度副词的考虑。用户评论中的情感词分为两类:褒义词和贬义词。褒义设值为1,贬义设值为-1。利用已经获取的6个级别的程度副词和否定词表,进行情感值的计算。

在计算中发现,评论语句复杂难以控制,所以数值会出现很大的差值,最终要与评分进行结合时,会出现计算结果不和谐的情况。需要进行归一化处理,计算公式如式子(1)所示。

degree(pi)=*5            (1)

其中i指的是第i条评论,j表示第i条评论中的第j个情感词,褒义词设值为1,贬义词设值为-1。 K为否定词的个数,sj表示情感词的量化值,wj表示第j个情感词前程度副词的量化值,pmax,pmin表示单条用户评论的最大值和最小值。

3 基于评论和评分的最终评分模型

基于用户评论的评分模型是结合了用户评分和用户评论而得到的最终评分,最终评分的计算公式如式子(2)所示。

Score(i)=w1*scorei+w2*degree(pi)                     (2)

其中,Score(i)为用户对第i个门店的最终评分,w1评分的权重值,scorei为用户对该门店的评分,w2为用户评论的权重值,degree(pi)为式子(1)计算的结果。

接下来,利用式子(3)和式子(4)来计算w1和w2的值。

=n                                     (3)

degree(pi)+scorei=1                                  (4)

其中score(i)表示用户第i个用户的最终评分,scorei表示的是用户对第i个用户的五分制打分情况,degree(pi)表示的是用户对第i个用户的评论情感的份情况。利用抓取的美团数据进行验证,可计算出当评分的权重为0.242,用户评论的权重为0.758。美团数据的准确率最高,如图1所示。

在图2的基础上,可计算出用户评分的权重为0.242,用户评论的权重为0.758,得到基于美团抓取数据的最终的评分模型如式子(5)所示。

score(i)=0.242*scorei+0.758*degree(pi)                 (5)

利用美团外卖数据集来展示在将用户评论和用户评分进行结合后的推荐效果,如图2所示。

从图2中看到,在相同的数据集中,利用计算权重的建模公式进行权重设置后,将用户评论和用户评分结合后,再利用推荐算法推荐,结果比只单纯的使用评分和评论进行推荐的准确率要用明显的提升。

4 結语

本文以美团外卖数据为基础,对基于用户评论情感量化的评分模型进行了研究,其中,在情感词典的建立、情感值的计算以及最终用户评分矩阵等方面,本文都进行了改进和创新,通过实验验证,将用户评论和用户评分结合起来建立的基于评论的用户最终评分矩阵在实际的推荐算法中可以将推荐结果的准确率有一定的提高。

参考文献

[1] Andrew Y N.Feature selection l1 vs.l2 regularization,and rotationalinvariance[C]Proc of the 21st International Conference on MachineLearning,2004:78-85.

[2] Jain A K,Duin RPW,Mao Jianchang.Statistical pattern recognition:a review[J].IEEE Trans on Pattern Analysis and Machine Intel-ligence,2000,22(1):4-37.

[3] Subasic P ,Huettner A .Affect analysis of text using fuzzy semantic typing[J]. IEEE Transactions on Fuzzy Systems,2001,2(4):483-496.

[4] Shanahan JG, QuY,Wiebe J.Computing Attitude and Affect in Text:Theory and Applications[M].Springer Netherlands,2006.

[5] 娄德成,姚天昉.汉语句子语义极性分析和观点抽取方法的研究[J].计算机应用,2006, 26(11):2622-2625.

[6] 王丙坤,黄永峰,李星.基于多粒度计算和多准则融合的情感分类[J].清华大学学报(自然科学版),2015,55(5):497-502.

[7] 赵淑芳,董小雨.基于改进的LSTM深度神经网络语音识别研究[J].郑州大学学报(工学版),2018,05(6):48-51.

[8] 许宁,徐昌荣.改进型LSTM变形预测模型研究[J].江西理工大学报,2018,39(05):48-54.

Research on Emotional Quantization Scoring Model Based on User Comments

WANG Long-ge,WANG Min

(School of Software Henan University, Kaifeng Henan  475000)

Abstract:The user's emotional tendency plays a very important role in the recommendation algorithm. This paper uses the designed emotional model to quantify the user's comments, and uses a certain formula to calculate the proportion of user's emotional value and user's score, and build the end user. The scoring matrix model. Experiments show that the model can reflect the user's emotional tendency more than the simple user score.

Key words:emotion model;user review;scoring matrix