不同类型商品的在线评论排序模型研究综述

2019-03-29 02:13

福建质量管理 2019年12期

(华南理工大学经济与贸易学院广东广州 510006)

一、引言

21世纪是信息膨胀的大数据时代，海量的数据容易造成信息过载，导致用户花费更多成本获取有用信息。在线评论作为消费者获取商品有用信息的第三方数据，由众多消费者产生并发布，每个人对商品的感受不同，产生的评论也不同。这些评论在一定程度上会帮助消费者做出决策，但大量的评论反而混淆消费者对商品的认知，消费者翻阅这些评论不仅消耗大量时间成本，而且其对商品褒贬不一的评价甚至会让消费者放弃购买。

平台对评论排序使消费者能更快找到需要的信息，但当前在线评论排序机制仍存在问题，如排序依据单一，按星级排序只能看到星级最高或最低的评论排前，但该条评论不一定是有用的，按时间排序也存在类似的问题。如果按阅读者给的有用性投票对评论进行排序，排列靠前的是认为有用的评论，这在一定程度上帮助之后的阅读者获取有用信息，但是排在前面的评论被浏览的可能更大，获得的有用性投票也更多，这就是评论排序中出现的马太效应。马太效应使得新发布的评论曝光度减少，更有用的评论可能会被忽视，同时还可能影响消费者生成用户内容的积极性。本文将从在线评论有用性影响因素研究、在线评论排序两大方面对在线评论的相关研究进行综述，总结当前研究的不足，为未来的在线评论排序研究提供方向。

二、在线评论有用性影响因素研究

在线评论排序时需要选取对应特征构建模型，而这些特征多是对在线评论的有用性产生影响的因素。众多学者通过对影响在线评论有用性的因素做出假设并进行实证研究，试图找出哪些因素会影响评论有用性，从而针对性地提出建议。本文从评论的元数据特征和文本特征对评论有用性影响因素研究进行综述，为在线评论排序模型的指标选取提供参考。

(一)元数据特征

在线评论的元数据特征(meta-data feature)独立于评论本身，与语言特征无关，可以从网站上得到，包括评论标题、评论时间和评论效价(星级)等。

许多学者认为星级会对评论有用性产生影响，殷国鹏[1]认为中等星级的评论有用性会更大，廖成林[2]则提出极端星级的评论具有更高有用性。殷国鹏还将评论星级与平均星级之差作为影响因素进行实证研究，从从众效应的心理学角度解释了两者差异越大评论有用性越低这一结论。评论的发表时间作为评论的元数据特征之一，也被认为会对评论有用性产生影响，有学者认为评论的发表时间距离现在越近，有用性越高，也有学者提出评论发表的时间越久有用性越高。对于评论的标题，郝媛媛[3]认为评论标题中含有的情感更积极、表达更主观，对应的评论有用性更高。此外，还有学者考虑到评论中图片的数量会对评论质量以及消费者购买产生影响[4,5]。除了原有的评论，评论者在使用商品一段时间后追加的评论也会对原有评论的有用性造成影响。

除了以上提到的评论元数据特征，有学者认为发布评论的评论者特征也影响评论的有用性。殷国鹏[1]提出被他人的关注程度、发表评论的数量、加入群组的数目等变量都与评论有用性的高低有关系，廖成林[2]认为具有购买经验的消费者发布的评论更有用。

(二)文本特征

文本特征(text feature)区别于元数据特征，需要对文本内容进行处理获取，评论的情感倾向、评论的可读性等都属于评论的文本特征。

评论的情感倾向被认为是影响评论有用性的文本特征之一。郝媛媛[3]通过实证研究验证了评论的正向情感与评论有用性的正向关系，而Agnihotri & Bhattacharya指出，情感倾向存在一个理想点，当超过这个点时，评论包含的情感越正向，有用性越低[7]。评论可读性用来衡量阅读者阅读评论的难易程度，国内学者多采用平均句长衡量句子的可读性[3]，郝媛媛等[3]认为平均句长越长，即评论可读性越低，有用性越大。国外学者多采用Flesch Reading Ease(FRE)作为衡量可读性的指标，或是通过The Dale-Chall readability formula公式计算英文评论的阅读难易程度[6,8]。Agnihotri & Bhattacharya就以FRE作为可读性衡量指标，验证了可读性与有用性之间的曲线关系[7]。随着在线评论的有用性的关注度不断提高，越来越多的文本特征被列入有用性的影响因素。相甍甍等[5]将评论中包含的商品属性特征词和情感特征词列为影响有用性的因素，Saumya & Singh等学者将名词、动词、形容词等因素考虑在内，并将评论的信息熵列为影响有用性的新的因素进行了研究[6,8]。

三、在线评论排序研究

面对大量的商品评论，消费者很难做到全部浏览，大部分消费者只会浏览排列靠前的评论从而做出购买决策。这一行为导致了马太效应(Matthew Effect)的产生[6,8]，即排列靠前的评论更易获得有用性投票，有用投票数越来越多，而排列靠后的评论因排列靠后获得投票较少甚至没有，将一直排列靠后，最后被淹没。马太效应容易使新发布的有用评论淹没在大量评论中，一方面会对商品销售和消费者获取有用信息造成影响，另一方面，新评论的低曝光度也会降低消费者发布有用评论的积极性。在线评论的排序研究逐渐受到学者们的关注。

国内外众多学者采用不同的研究方法对在线评论排序进行了研究。相甍甍等[5]选取10个影响评论效用的指标，基于GA-BP神经网络设计效用评价方法。Saumya等[6]从评论、商品描述、消费者问答中选取特征，采用随机森林和梯度提升进行分类和预测。Singh等[8]使用集成学习(梯度提升算法)对选取的影响评论有用性的因素进行权重排列。张艳丰等[9]提取影响评论有用性的指标，采用模糊层次分析法进行指标赋权，结合并改进 TOPSIS 分析法进行在线评论有用性计算和排序。郭顺利等[10]基于加权灰色关联分析法构建排序模型。王倩倩[11]对文本型评论与数值型评论的一致性进行量化，与其他量化指标相结合，通过赋值权重计算可信度得分从而进行排序。Krishnamoorthy等[14]使用朴素贝叶斯NB、支持向量机SVM、随机森林RandF构建预测模型。Lee & Choeh[6]构建多层感知机神经网络(multilayer perceptron neural network model)预测评论有用性。Ghose & Ipeirotis[7]对比随机森林和支持向量机算法效果，最后采用随机森林构建预测模型。

对前人的研究进行综述发现，国内外对在线评论排序的研究主要分为两种，一种是采用模糊层次分析法对选取的在线评论特征进行指标赋权后，结合TOPSIS等方法进行排序，另一种是采用机器学习算法构建模型，采用文本分析等技术获取评论特征后进行排序预测。评论排序研究的数据多通过网页爬取获得，也有文献直接采用已有真实数据集进行研究。

四、结论与展望

对国内外的研究进行综述发现，大部分文献从评论的元数据特征和文本特征中选取影响因素对评论有用性进行研究，一些文献从信息源角度考虑评论者特征对有用性的影响。此外部分文献还将商品类型、品牌热度等作为调节变量研究其对其他因素的评论有用性调节作用。但是，当前对于文本特征的有用性影响因素研究尚不完善，评论中的一些文本特征，如信息熵、属性词等可以作为有用性影响因素进行研究。

评论有用性影响因素是研究在线评论的排序不可缺少的一部分，采用影响因素构建在线评论排序模型，以有用性验证模型有效性将是未来评论排序研究的一大研究方向。目前国内采用模糊层次分析法进行指标赋权后结合TOPSIS等方法进行排序，采用机器学习构建排序模型的研究较少，也较少有学者考虑商品类型对排序模型预测效果的影响。未来在构建中文评论排序模型时，可以结合国内电商平台的评论特征，借鉴国外的英文文本特征(如The Dale-Chall readability formula)，选取更多文本特征，从机器学习的角度研究在线评论的排序。