新型生鲜电商用户满意度影响因素对比分析

2021-03-04 01:12黄官伟
全国流通经济 2021年31期
关键词:高频词盒马生鲜

黄官伟 王 谧

(同济大学经济与管理学院,上海 201804)

一、引言

2020年1月,农业农村部、中央网信办印发的《数字农业农村发展规划(2019—2025年)》提出到2025年数字农业农村建设取得重要进展,指出了包括深化电子商务进农村综合示范,实施“互联网+”农产品出村进城工程,推动人工智能、大数据赋能农村实体店,全面打通农产品线上线下营销通道等要求。根据艾瑞咨询在2021年发布的《中国生鲜电商行业研究报告》,2020年我国生鲜零售市场规模在超5万亿元,其中生鲜电商行业规模在2020年达到4584.9亿元,增速为64.0%。由此可见,随着中央和地方对 “互联网+”农业的大力推进,生鲜电商模式和技术的不断成熟,以及用户对生鲜类产品线上购买习惯的逐渐养成,生鲜农产品电商将在未来一段时间内拥有广阔的市场发展前景。

目前我国生鲜电商行业从传统的B2C模式逐渐转向多模式共存的局面,相继出现了例如O2O、前置仓、店仓一体化等多种新形态,代表性电商包括京东到家、每日优鲜、盒马鲜生等。如今,各类新型生鲜电商在获得新冠疫情下爆发式推进的同时,也面临愈发激烈的竞争环境。随着生鲜线上市场的不断打开,如何在加剧的市场竞争中赢得用户的支持与信赖,提高用户黏性以及满意度成为重中之重。鉴于此,本文拟通过高频词分析、情感分析、LDA主题提取等文本挖掘技术,提取各类新型生鲜电商的在线评论信息,对影响各类新型生鲜电商满意度的因素进行对比分析,并给出改善性建议。

二、文献综述

1.生鲜电商相关研究

随着各大平台资本在生鲜电商领域的投身热情不断高涨,越来越多的学者也开始对此展开相关研究。谭本艳等(2016)总结了中国生鲜农产品电商在发展中遇到的各类制约因素,提出了结合中国国情发挥政府企业共同作用的对策。李洁(2018)对生鲜电商各类盈利模式进行对比,指出了增加品类深度、降低品控成本、优化物流体系等优化路径。鲁钊阳(2021)对农产品电商问卷调查数据进行实证研究,得出网络直播通过降低电商店铺供求双方之间的交易成本、提高电商店铺的转化率以及培育电商店铺自有品牌等方式驱动生鲜农产品电商的发展。

由此可见,学者们已经在生鲜农产品电商领域进行了多方面研究,但大量集中在宏观层面,微观层面的研究较匮乏,且研究方法上以问卷调查等传统方式为主,存在来源滞后及可靠性不足等问题。

2.基于在线评论的用户满意度相关研究

互联网时代,消费者更加乐于通过在线评论分享他们的体验和感受,这些评论也为研究用户需求和满意度影响因素提供了海量的信息来源,目前有关评论挖掘的研究主要集中在挖掘有关产品服务的特征词和情感倾向分析。

在挖掘文本主题作为顾客满意度的影响因素时常用的方法是隐含狄利克雷分布模型。Guo等(2016)通过LDA模型挖掘出顾客对酒店服务满意度的影响因素,挖掘出一些以前所忽略的影响因素。Tirunillai和Tellis(2018)采用LDA模型挖掘出了不同市场中影响顾客满意度的因素,如手机市场中的影响产品顾客满意度的主要是使用便捷性、性能、短信等因素。Jung和Suh(2019)利用韩国某公司评论网站中的在线评论,基于LDA模型挖掘了 IT、金融等行业影响雇员工作满意度的关键因素,如假期、组织文化、工作时间等。

文本情感分析的目的,是判断已给的文本片段中所体现评论者的情感倾向,通常为积极,消极和中性。情感分析的技术方法主要有语义词典方法和机器学习法。基于情感词典的文本情感分析方法是指使用知网How Net、Word Net以及台湾大学情感词典NTUSD等词典来计算词语或者语句的情感值。机器学习法需要大量的训练样本以建立分类模型,目前情感分析的模型主要有朴素贝叶斯、支持向量机和最大熵等。

根据以上学者的研究可以发现,文本挖掘是近年来的热门课题,基于在线评论来研究用户满意度开始吸引越来越多的学者注意,但应用在生鲜电商领域上的研究还十分有限。因此本研究将文本挖掘方法结合到生鲜电商的研究中,丰富关于生鲜电商用户行为领域的研究成果。

三、研究对象与数据

1.研究对象

当前我国新型生鲜电商主要可分为4种,分别是与线下商超、零售店和便利店等合作的O2O模式,缩小前移仓库(配送中心)的前置仓模式,以门店为中心服务的店仓一体化模式以及以社区为核心的社区团购模式。其中前三种模式主要服务周边3公里内的消费者,在消费者下单后的1小时内快速完成生鲜产品配送,所解决的用户需求较为一致,具有一定的可比性。而社区团购模式一般为次日达,配送时效相对较长,暂不考虑为本研究对象。因此,本文特选取3种模式的代表性电商品牌京东到家、每日优鲜和盒马生鲜作为案例对象来进行研究。

2.研究数据

App Store是苹果公司于2008年7月份推出的应用商店平台,用户数超过10亿人,全面收集了用户对软件产品的评分及反馈,且允许进行一定程度的数据爬取。本研究通过Python设计爬虫程序从App Store分别采集京东到家、每日生鲜以及盒马鲜生在2020年8月至2021年9月的用户评论,经整理后得到所需语料共10972条。为保证数据的质量,消除由评论中的重复文本、表情符号、短句等噪音干扰,需要通过Python对采集到的数据进行预处理操作。数据预处理操作后,共得到9366条有效评论。

四、研究过程

1.词频分析

分别对3家生鲜电商的词频进行统计,表1展示了前10位的高频词语。

表1 在线评论词频

通过高频词可以从一定程度上了解用户的主要关注点,找出影响满意度的产品服务特征在哪里。从表中可以看出,价格、服务、配送是3家生鲜电商用户评论中共同出现的高频词,其中京东到家的用户最主要关注的是优惠、实惠等价格因素,每日优鲜的用户对生鲜产品本身的新鲜程度最为关注,配送等服务则是盒马鲜生用户评价重点。综合各家排名前十位的高频词可得,消费者对于价格活动、产品质量、物流配送、客户服务这四个角度较为重视,是满意度影响的重要因素。

2.情感分类

通过高频词统计可以看出消费者比较关注的一些特征,但是没有办法得知到底是哪些因素让用户感到满意,又是哪些因素导致用户给出差评,因此还需要运用情感分析技术来对评论语料进行正负面情感分类,以帮助我们获取关于用户对3家新型生鲜电商优缺点的评价信息。本研究选择基于情感词典的情感分析方法对生鲜电商评论大数据进行处理,使用知网How Net情感词表并进行扩充,把针对生鲜电商场景出现的“好评”“差评”“很快”“超时”“卸载”等词分别添加至对应词表。然后将正负面词的初始权重分别设为1和-1,载入否定词表,计算每条评论的情感值并赋予正负面评论类型。

使用词云图可以将文本的词频信息可视化,帮助我们直观地感知评论特征。使用Python中wordcloud和matplotlib库中的相关函数,将情感分类所得正负面评论经过分词处理后的数据通过词云图的方式分别展示出来,以此分析影响产品满意度的正负面特征。

从图1、图2可知,“优惠”“服务”“很快”是京东到家的用户好评中最常出现的特征词,“客服”“配送”“商家”是差评中最常出现的特征词。总体来看,吸引用户在京东生鲜电商购物的满意度因素主要是优惠的价格,持不满态度的主要因素来源于客服,物流配送相关的特征词在正负面评价词云图中均有出现,说明用户对此的评价褒贬不一。

图1 京东到家好评词云图

图2 京东到家差评词云图

从图3可知,水果是每日优鲜用户重要的购买品类,“新鲜”“配送”“价格”出现的频次较高,说明生鲜的新鲜程度、配送、价格是发起积极评价的主要因素。从图4中可以看出用户对每日优鲜的负面评价特征词并不集中,价格、配送、客服等各类因素均有涉及,但是出现了大量与企业信任有关的消极词,例如欺骗、骚扰、广告、忽悠等。

图3 每日优鲜好评词云图

图4 每日优鲜差评词云图

图5中观察盒马鲜生用户的正面词主要为“新鲜”“送货”“服务”等,说明消费者的积极情绪主要来源于盒马鲜生的生鲜品质、物流配送和服务。图6负面评价中较为明显的词有“配送”“客服”,以及京东到家和每日优鲜中未出现过的“会员”和“下载”。

图5 每日优鲜好评词云图

图6 每日优鲜差评词云图

综上所述,消费者对3家生鲜电商情感类别特征有所差别,但物流配送均同时出现于正负面的评论中,客服均出现于负面评论中。这说明各家生鲜电商的物流配送能力均未达到稳定可控的水平,另外电商客服的水准也需要着重提高。

3.LDA主题建模

通过词频分析、情感分类以及正负评论词云图,可以对影响用户满意度的因素有了粗略判断,接下来将利用情感分类完后的文本进行主题聚类,以挖掘评论背后的主题信息。

主题模型是用来发现文档中挖掘抽象主题的统计模型,其中最具代表性的是Blei等学者在2003年提出LDA模型概念及思想,得到了广泛应用。它是一种包含词、主题及文档的三层贝叶斯概率模型,由于引入了狄利克雷先验知识,不容易出现过拟合现象。因此本研究选择利用LDA主题模型对分类后的文本进行聚类,得到生鲜电商的特征主题词。

(1)寻找最优主题数

在对文本进行LDA聚类之前,首先需先确定LDA主题数量。计算不同主题数下的各主题之间平均余弦相似度,绘制主题平均余弦相似度图形,选择主题间的平均余弦相似度达到最低时的主题数量。

根据图7,最终选定京东到家正面评论主题数=2,京东到家负面评论主题数=2,每日优鲜正面评论主题数=3,每日优鲜负面评论主题数=3,盒马鲜生正面评论主题数=2,盒马鲜生负面评论主题数=3。

图7 主题平均余弦相似度曲线

(2)文本主题挖掘

使用Python中的gensim模块分别对3家生鲜电商的正负面评论数据构建LDA主题模型,生成每个主题下10个最有可能出现的特征词以及相应的权重,结果如表2所示。

表2 京东到家LDA聚类结果

根据京东到家的正面评论主题聚类结果来看,主题一模型中“喜欢”“优惠”“值得”等词权重较高,说明物美价廉的商品价格是用户产生满意的因素。主题二模型中“赞”“速度”“很快”等高频词体现了用户对配送速度快的认可。

根据京东到家的负面评论主题聚类结果来看,主题一模型中权重较高的“客服”“打电话”“配送”说明当配送问题出现时客服的解决方案并未使用户感到满意,甚至产生不悦。主题二模型中“客服”“下单”“商家”等高频词体现了用户对涉及到商家相关的客服的不满。

表3 每日优鲜LDA聚类结果

根据每日优鲜的正面评论主题聚类结果来看,主题一模型中“喜欢”“速度”“满意”等词权重较高,说明配送速度是用户发表好评的因素。主题二模型中“新鲜”“买菜”“疫情”等高频词体现了疫情期间仍支持给用户配送新鲜菜品是获得用户支持的原因。主题三模型中“水果”“不错”“值得”等高频词说明用户对水果品类性价比的认可。

根据每日优鲜的负面评论主题聚类结果来看,主题一模型中权重较高的“贵”“短信”“优惠券”说明每日优鲜在价格活动的营销手段上出现问题,使用户产生不满情绪。主题二模型中“高”“客服”“欺骗”“价格”等高频词说明客服并未在用户产生不满时发挥安抚作用。主题三模型中“垃圾”“配送”等词的权重较高,将影响用户满意度的因素指向配送服务。

表4 盒马鲜生LDA聚类结果

根据盒马鲜生的正面评论主题聚类结果来看,主题一模型中“东西”“送货”“喜欢”“质量”等词说明盒马鲜生整体的商品品质较高,用户对此感到满意。主题二模型中“新鲜”“配送”“准时”等高频词体现了用户认同盒马配送及时,食材新鲜度获得保证。

根据盒马鲜生的负面评论主题聚类结果来看,主题一模型中权重较高的“东西”“退款”“体验”说明盒马鲜生的商品退款链路不够畅通,使用户有不好的体验。主题二模型中“客服”“慢”“解决”等高频词说明客服并未在用户产生不满时发挥安抚作用。主题三模型中“垃圾”“配送”“超时”等词的权重较高,说明用户的部分不满情绪来源于配送超时问题。

综合上述结论,将各类主题与特征词关联关系汇总,得出影响新型生鲜电商用户满意度的核心因素,如表5所示。

表5 生鲜电商用户满意度影响因素

五、结论与建议

本研究通过运用高频词分析、情感分析、LDA主题模型等方法对新型生鲜电商的在线评论进行文本挖掘,研究影响生鲜电商用户满意度的具体因素并进行比较分析。研究发现,影响满意度的因素最主要有生鲜产品情况、物流配送水平以及平台功能服务三个方面,其中生鲜产品情况包括了产品的价格和品质,物流配送水平包括配送速度和与配送的服务态度,平台服务功能包含退款流程度、客服沟通以及营销活动,说明企业对这些维度应该着重关注和改善。根据三家生鲜电商的分析结果,京东到家主要以实惠的商品价格和配送服务态度上打动消费者;每日优鲜则是通过商品整体情况得到用户喜爱,但平台盒部分营销活动使用户产生不满情绪;盒马鲜生则是以高品质赢得消费者,但用户退款过程的顺畅度还需提高。综合分析三家电商的满意度情况,可以发现物流配送的速度以及平台客服质量是需要重点改进的因素。根据以上的分析结果,本文针对新型生鲜电商用户满意度的提高提出以下几点建议:

1.保证生鲜产品质量,提高生鲜物流配送水平

生鲜产品质量和配送速度是用户对生鲜网购消费最直观的感受,是用户最基本的需求,也是生鲜电商企业安身立命的必要条件。随着生活条件水平的提高,人们对生鲜产品的要求逐渐从温饱转向口感、营养等,因此企业必须加强对生鲜农产品的质量把控,做到供应链全流程的产品质量监控,并且提高“最后一公里”的配送能力,使消费者能够及时收到完好无损的商品。

2.通过垂直品类打造差异化竞争优势

在保证产品总体质量的前提下,可通过垂直品类打造平台的独特性,例如研究发现每日优鲜主要以水果被消费者熟知。人们可能因为对某类产品的偏好,而产生对品牌的认同和信赖。各生鲜电商可以根据新时代坏境下的消费者的消费偏好趋势,在产品品类上进行优化,提高自身品牌的独特性优势。

3.改善用户在平台的操作链路

生鲜电商平台功能在搭建时是否全链路闭环,用户在使用时操作是否简单易懂都会影响到用户的使用体验,从而影响消费过程的整体满意度。特别是涉及到用户退款等已影响到用户情绪的操作,必须搭建一个更完善的环路机制。补救性的服务若处理妥当,反而可以起到赢得用户的信任与喜爱。

4.完善服务人员培训体系

例如快递小哥、客服等与用户接触在第一线的服务人员,是影响用户评判生鲜电商服务水平的重要因素,服务人员的专业水准可以看出企业对用户的重视度。因此,对企业来说,完善服务人员培训机制,建立用户服务标准化体系,从而提高服务人员的整体素质,不仅能树立企业的优质形象,还能让消费者感受到企业对用户的体验关怀,提升满意度。

猜你喜欢
高频词盒马生鲜
全国首家“海上盒马村”落户庄河
走出温室的盒马,品质屡屡“破防”
30份政府工作报告中的高频词
省级两会上的高频词
28份政府工作报告中的高频词
省级两会上的高频词
生鲜灯的奥秘
盒马开启新玩法
中国生鲜消费趋势
我国生鲜乳连续7年三聚氰胺抽检合格率100%