基于评论信息的淘宝服装类评分体系优化

2017-03-04 00:27车丹丹杨欣怡
商情 2016年32期
关键词:文本挖掘评价体系

车丹丹+杨欣怡

【摘要】电商行业正在蓬勃发展,人们越来越多地通过网络来购物,而淘宝网现有评价体系虽然有着简单明了,操作统计简便的特征,但是面对淘宝网巨大的交易量和复杂的交易情况,现有的信用评价体系已经不足以客观公正的评价交易双方的真实情况和意愿,而网购评价行为是电子口碑传播的一种方式,蕴含着消费者的网购目标导向及其行为反应特征,本文使用文本挖掘法,构建出了一个基于文本挖掘的二层评论指标体系(D-B-U-Q信用评论体系)并分别计算出了各项一级指标和二级指标的权重,其中商品细节、用户体验等为一级指标,商品色差、商品质量等14项为二级指标。再通过语义网络分析对模型进行改进,最后发放问卷统计数据对模型进证。【关键词】评价体系;文本挖掘;评论信息

1课题背景

淘宝网评分存在的问题

1.1评价过于简单

虽然淘宝的店铺评分规则已经考虑到了这点,规定了主要的评价内容和划分满意度,但是每一项指标具体代表的意思不够详细,所以直接进行评价会丧失掉一部分有用信息。

1.2评分体系不够科学

对于不同种类的商品,每一项指标反映信息的重要程度是有区别的,而目前的评分体系直接对四项指标得分简单加总,而没有权重之分,这对于商品的评价具有一定的不客观性。

2建立模型

2.1初步建立评价体系

研究表明,评论信息可以从一个侧面表达出购物者在网上购物过程中所关注的因素,且关键词提及数越多,表明购物者对其关注度越高,而这些评论信息反过来又会作用于其他购物者的购买决策,所以,本文利用评论信息中高频词提及数做指标的权重比,如下表1所示。

在此基础之上,将这14个指标划分为商品细节,用户体验,服务态度,交货质量等4个指标。并将其编码为A1-A4,将第二层指标划编码为B1-B14于是我们就构建好了二级指标体系。指标体系构建好后,我们首先计算每个二级指标所占的权重,例如与商品色差有关的词频比所有的与商品细节有关的词频就得到了商品色差这一指标所占商品细节的权重。以此类推得到所有二级指标占它所对应一级指标的权重。而一级指标,我们计算商品细节占全部词语的百分比就得到它所占的权重。

根据分析的结果,我们将A1、A2、A3、A4归为第一类指标,将B1、B2、B3、134、B5、B6、B7、B8、B9、B10、B11、B12、B13、B14归为第二类指标。构建出了一个基于文本挖掘的二层评论指标体系(D-B-U-Q)

2.2评价体系解释

如图2所示,该模型具体解释如下所示:

商品细节,即Details of the product,,商品细节是买家最重视的环节,商品本身如果不好,买家基本上不会买账。商品细节由商品色差,商品真伪和商品质量组成。

用户体验,即User experience,用户体验直接关系到用户的忠诚,好的用户体验会增加用户忠诚。用户体验则由价格体验,美学体验,知觉体验,惊喜体验,比较体验和享乐体验组成。

商家态度,即Business attitudes,商家态度在一定程度上会影响买家的选择,好的态度能够更好的吸引网购者。商家态度由回复速度,热情耐心负责组成。

交货质量,即Quality of delivery,交货质量也是不可忽视的一个環节,由包装完好,及时发货,售后服务组成。

2.3体系检验

为了对模型中商品细节、用户体验、商家态度和交货质量等各项指标权重的合理性进行判定,本文最后通过问卷星发放问卷进行调查,共收回有效问卷96份,通过问卷调查可以较为粗略对模型进行检验,检验结果显示模型良好。

3结论

构建淘宝信用评价体系,一套良好的信用评价体系是保证经济稳定运行的基础,它通过科学的统计方法和管理方法,以合法有效的信息为评价基础,促进电子商务领域的完善与发展,保障电子商务领域秩序稳定。交易完成后,不同的交易方对于同种交易有不同的感受,现有评论体系不够真实客观地反映买家的真实用户体验,本文通过数据分析与可视化分析对于淘宝网站中的用户评论的语义进行深入分析,我们得到了D-B-U-Q模型。

猜你喜欢
文本挖掘评价体系
数据挖掘技术在电站设备故障分析中的应用
基于LDA模型的95598热点业务工单挖掘分析
文本数据挖掘在电子商务网站个性化推荐中的应用
从《远程教育》35年载文看远程教育研究趋势
《UG NX机械产品设计》课程项目化教学的改革研究
评价体系小改革职业技能大提升
以心育推进学生综合素质评价体系建立的研究
自然资源资产离任审计评价体系研究
行政事业单位内部控制存在问题及对策
多元智能理论视角下高职院校体育课程评价体系的研究