基于评论文本的产品意象参数化评价方法

2022-07-04 03:12刘宝顺陈越
包装工程 2022年12期
关键词:感性神经网络调研

刘宝顺,陈越

基于评论文本的产品意象参数化评价方法

刘宝顺,陈越

(河北工业大学,天津 300132)

将评论文本挖掘方法与设计调研的多样化需求相匹配,将文本挖掘结果与设计方案的参数化分析与评价相结合。通过网络爬虫获取购物网站中的产品评论文本,明确调研目标,使用意象词汇进行描述,采用关键词提取与词汇相似度计算方法,计算产品在调研目标上的意象倾向,并进行参数化表示。分类提取产品的特征参数,使用BP神经网络构建产品特征参数与意象参数间的映射关系,形成产品评论模型,将产品特征参数输入映射关系中,得到调研目标上的意象参数,实现产品意象的参数化挖掘与评价。以手机为例进行验证,所得意象参数预测值与真实值之间的差异均值分别为0.016 0、-0.014 6、-0.013 7,评价模型较为有效。所提方法能够从评论文本中有效地提取意象倾向,并表示为调研目标上的倾向参数,加强了产品评论文本挖掘与设计调研之间的关系,提高了文本挖掘结果的可理解性。

产品评论;文本挖掘;设计调研;感性工学;BP神经网络

随着互联网浪潮的来临,网络购物也日益普及,目前已成为消费者选购商品的重要手段。在网络购物过程中,相应产品的已有评论是影响消费者购物决策的重要因素,因此,分析在线商城中消费者的评论文本,以此对产品进行改进,可以提高产品销量。

1 相关研究基础

1.1 产品评论文本挖掘

文本挖掘是数据挖掘领域的一个重要分支,指从大量的文本集合或语料库中抽取具有潜在实用价值的模型或知识。文本挖掘具有多学科融合的特点,涵盖信息技术、文本分析、统计学、数据可视化等多个方面[1]。

文本挖掘作为一种文本分析技术,被广泛应用于情感分析、自动摘要、对话系统等场景中,也有学者将文本挖掘方法应用于产品评论文本的分析挖掘中,如郝玫等[2]结合中文句法关系以及特征与观点的匹配关系,使用产品特征树来分析同类产品的观点差异;金吉琼等[3]通过主题模型对消费者评论文本的主题进行分类,分析了国内消费者对电子烟的关注点;赵志滨等[4]使用细粒度情感分析方法,分析了消费者评论文本中各个维度的情感倾向,以及消费者对产品整体的情感倾向。这些研究表明,文本挖掘能够有效提取产品评论文本中所包含的产品体验信息。

现有的产品评论文本挖掘方法大多是对评论文本进行分析,难以满足设计调研的多样化需求。同时,文本挖掘的结果主要通过词汇的形式进行表达,难以进一步参与设计方案的参数化分析与评价。

1.2 感性工学

感性工学起源于日本,指将较为模糊的感性需求及意象转化为细节设计的形态要素[5]。感性工学专家系统又被称为KE模型,其核心是产品特征与意象之间的关联关系,并以此实现感性意象与产品特征之间的转换[6],从而将消费者对现有产品的体验信息融入新产品的设计中。

目前,感性工学被广泛应用于产品的分析与设计指导,如王天赋等[7]采用语义差异分析法和Likert心理量表分析法,从造型、色彩、材质、功能和体验5个方面进行了感性意象分析,推导出了汽车内饰设计需求与形态的关联关系;付成杰等[8]分析了目前的镜框造型要素,调研了使用者对镜框的感性认知,采用了因子分析等方法筛选了符合意象的感性词汇,最后运用灰关联分析法,得到了造型与产品意象的关联程度;赵艳云等[9]以表带材质为例进行了调查分析,以感性工学为理论依据,量化了用户对材质的感性认知,构建了材质意象的决策模型,并验证了方法的有效性。这些研究表明,感性工学能够有效分析用户感性意象与设计要素之间的关系。

基于感性工学方法,通过分析产品体验信息与产品设计要素间的映射关系,形成KE模型,对新生成的产品进行评价,从而将消费者的评价数据应用于产品后续的设计参考。

2 基于评论文本的产品意象参数化挖掘与评价方法

现有产品评论文本挖掘方法难以满足设计调研的多样化需求,文本挖掘结果难以进一步参与设计方案的参数化分析与评价。针对上述问题,基于感性工学理论,结合关键词提取、BP神经网络等方法,提出了基于评论文本的产品意象参数化挖掘与评价方法,主要步骤为产品评论文本获取、目标驱动的产品意象参数化挖掘、产品特征参数提取、基于BP神经网络的KE模型构建、基于KE模型的产品评论。方法流程见图1。

图1 方法流程

2.1 产品评论文本获取

产品评论文本主要分散于各个购物网站的相关产品页面中,需要对其进行收集与汇总。网络爬虫是一种方便高效的网页信息获取工具。网络爬虫按设定的规则抓取特定的网页,再通过对网页内容的解析和提取来获取文本信息[10],是目前常用的信息收集方式,因此,可通过爬虫工具来获取网络购物网站中的评论文本。在得到相关产品的评论文本与产品信息后,对其进行整理与保存,以便后续进行分析。

为了保证产品评论文本挖掘的准确性,需要对获取到的产品评论文本进行预处理。由于部分购物网站会对参与产品评论的用户进行奖励,所以部分消费者为了快速获取相关奖励会选择复制他人的评论,导致获取到的文本会出现大量的重复文本。为了保证评论文本的唯一性,减小重复评论造成的影响,需要对文本进行去重处理。随后,对文本进行分词处理,以便后续进行文本关键词的提取。

2.2 目标驱动的产品意象参数化挖掘

首先,确定设计调研目标词汇,将其作为产品评论文本挖掘与参数化表达的基准。设计调研目标一般由多个意象词汇组合而成,若假设调研目标为,包含个感性意象,则设计调研目标:

形容词通常被用于表达人的主观感受,在产品评论文本中主要用来表示用户对产品的态度。通过提取评论文本中形容词性的关键词,并将其作为用户对产品的意象词汇,相应的关键词权重即意象词汇的倾向,能够反映消费者对产品的意象倾向。

TF-IDF由Salton[11]于1988年提出,是目前较为常用的无监督文本提取方法。TF为词频,表示该词条在文档中的出现频率。IDF是逆向文件频率,表示该词条在其他文档中的区分能力[12]。通过TF与IDF的乘积运算,能有效得到词条在文档间的区分效果。基于TF-IDF算法,提取到的样本感性意象词汇:

最后,结合样本意象关键词权重参数,对各个目标意象词汇与样本意象关键词之间的相似度进行汇总,样本感性意象表示如下:

如式(4)所示,产品评论文本意象挖掘结果被表示为设计调研目标上的倾向参数,以此为基础,能够实现以设计调研目标为基础的产品意象参数化挖掘。

2.3 产品特征参数分类提取

产品的色彩、形态、硬件配置等元素的提取方法,可按照是否由人工主观判断,划分为基于人工的方式和基于参数化的方式[6]。人工提取方式包括形态分析法、类目层次法等,旨在通过研究员的主观判断,将产品元素进行拆解和编号,该类方式除产品形态外,还可对产品配置和服务等特征进行分析,适用范围较广。基于参数化的方式包括参数模型法、曲线控制法等,通过对产品的特征进行描绘,得到连续型参数,该类方式多用于分析产品的外观细节。

基于参数化的提取方式要求产品特征较为统一,且无法提取配置类产品的特征参数,因此,此次研究采用基于人工的处理方式。类目层次法对产品进行编号时,容易因层级关系导致编号位数增长,在构建关联关系时,容易对部分数值敏感型算法的构建精度产生不利影响。为了扩大产品特征参数提取的适用范围,同时避免对后续关联关系的构建产生不利影响,使用形态分析法获取产品特征参数,对各个类别的特征进行人工分类编号,得到的产品特征参数:

2.4 基于BP神经网络的评价模型构建

神经网络是一种机器学习模型,通过将感知器进行相互连接,形成一种类似人脑神经元连接方式的网络结构,常用于处理分类问题,以及输入与输出变量之间的关系问题等[13]。BP神经网络是指使用反向传播算法(Back Propagation,BP)进行误差校正以实现网络训练的神经网络,是目前使用范围较广的神经网络之一。

由于神经网络能够自动学习数据中的知识与信息,并能够利用神经元之间的连接强度储存所学到的信息,所以能够自动逼近任何非线性函数[14],在产品设计研究中有着广泛的应用,如Guo等[15]使用BP神经网络,分析了感性意象参数与求职网站设计要素之间的映射关系。BP神经网络通过输入的数据,可以自动学习数据间非线性相关关系的特点,能够有效处理产品设计与感性工学专家系统的映射关系[16]。

BP神经网络一般包含输入层、隐含层、输出层,其中输入层的神经元数量一般与自变量的数量相等,输出层的神经元数量与因变量的数量相等,隐含层的数量:

BP神经网络一般通过梯度下降算法进行训练:

2.5 设计方案评价

在得到设计特征参数与产品意象参数的映射关系(前向式KE模型)后,可进行新产品的感性意象评价。首先,结合已有的各类产品特征中的编号依据,对新产品的产品特征进行分类编号,得到新产品的产品特征参数。随后,将得到的产品特征参数输入KE模型中,输出感性意象参数。

将计算得到的感性意象参数直接用于评价的效果不佳,需要与已有的样本数值对比进行分析。为方便直观地理解输出的感性意象参数,使用归一化法进行数据处理,将数据统一映射到0~1,并将有量纲的数据转化为无量纲的纯数值[17]。归一化的处理方式能保持原始数据排序不变,同时方便解读及评价,因此,归一化法常用于比较和评价指标处理。得到归一化的数据处理结果后,可从数值直观地感受到用户的情感倾向:归一值越接近1,代表消费者对应感性意象下的评价表现越好;归一值越接近0,代表消费者对应感性意象下的评价表现越差。归一化表达式:

通过代入产品特征参数来预测市场评价,能快速预测新产品的市场评价,从而确定新产品的宣传方式和定价策略。另外,研究员可结合公司战略设定产品评价倾向的目标,并不断调整输入的产品特征参数,直至达到预定的产品评价目标。

3 实例验证

3.1 文本数据获取

手机是一种在生活中被广泛使用的电子产品,同时也是网络购物中的重要商品,有关的产品评论文本较为丰富,因此,此次研究选取手机作为验证对象。为了避免不同品牌的印象造成的意象差异,因此,仅选定华为手机作为研究对象。首先,使用网络爬虫从京东商城中获取40款近期尚在销售的手机的评论文本,并将爬取到的数据进行分类保存。随后,从互联网上查找并保存所获取到的手机的配置信息,结合配置信息对手机进行编号,将同一名称、不同配置的手机视为不同的样本,共计75个样本。对各个样本的评论文本进行预处理,删除其中的重复文本,并使用Jieba工具包对其进行分词处理。

3.2 产品评论文本意象参数计算

在进行产品意象参数计算时,需要首先确定调研目标。选定手机中较为重要的3个感性意象作为调研目标,分别为“流畅”“清晰”“漂亮”。随后,结合各个样本编号所表示的机型,选取对应的评论文本,然后,使用TF-IDF算法提取各个样本的关键词。设定每个样本评论文本中提取的关键词数量为5,关键词提取的部分结果见表1。

表1 关键词提取结果(部分)

Tab.1 Key words extraction results (partial)

为了计算产品意象词汇与调研目标词汇之间的相似度,需要构建能够表达部分语义关系的文本词向量模型。对预处理后的文本进行汇总,使用word2vec工具构建词向量模型,设定维度为50。以词向量模型为基础,对感性意象词汇与调研目标词汇进行参数化表示,通过式(3)计算感性意象关键词与调研目标词汇之间的相关度,通过式(4)计算相应样本的感性意象参数,所得到的感性意象参数见图2。

图2 感性意象参数分布

3.3 产品特征提取

通过互联网获取75个样本的配置信息,结合京东商城中手机的部分分类方式,对样本的产品特征进行分类,见表2。得到的产品特征参数部分结果见表3。

3.4 评价模型构建

由于实例中参与分析的产品特征有处理器、运行内存、存储容量、后置相机像素、前置相机类型、屏幕分辨率(短边)、屏幕尺寸等7类,所以设定输入层的神经元数量为7。由于调研目标中的目标意象词汇有3个,所以设定输出层的神经元数量为3。随后,基于式(6)设定隐含层的神经元数量为8,相应的BP神经网络模型结构见图3。

结合输入和输出的数据特点及其取值范围,通过多次优选,设定输入层、隐含层、输出层的激活函数分别为tanh、tanh、relu,损失函数:

在样本中进行随机抽样,将总样本的20%(15个)作为验证集,剩余的样本(60个)作为训练集。使用训练集样本来训练BP神经网络,由于神经元数量较少,所以训练次数也相应减少,设定训练次数为200,损失函数值随训练次数的变化见图4。

3.5 方案评价

随后,对所得BP神经网络的有效性进行验证。将验证样本作为新的设计方案,将其产品特征参数依次输入训练完成的BP神经网络中,随后,将输出的各个调研目标意象词汇上的预测参数与相应样本的真实值进行对比,见图5。经过验证得到预测值与真实值之间差异的均值分别为0.016 0、–0.014 6、–0.013 7。

表2 产品特征编号

Tab.2 Product feature number

表3 产品特征提取结果(部分)

Tab.3 Extraction results of product feature parameters (partial)

图3 BP神经网络模型结构

图4 损失函数值随训练次数变化情况

图5 评价模型有效性验证结果

根据图5所示结果,结合预测值与真实值之间差异的均值大小,可以看出在3个调研目标意象上的预测值与真实值较为相近,评价模型能够较为有效地对输入的产品配置组合进行评价。

最后以测试样本6为例,输入产品特征参数后,在流畅、清晰、漂亮3个调研目标上的倾向参数值分别为0.276 5、0.363 3、0.328 7。对得到的数据与训练样本的参数值进行归一化处理,通过式(8)得到的结果分别为0.462 6,0.632 2,0.735 9,可知该样本在调研目标上的表现情况为:在流畅方面该样本表现较差;在清晰方面该样本表现一般;在漂亮方面该样本表现较好。

若数值表现不符合新产品的战略规划,可设定产品评价的倾向目标,随后逐步调整设计参数,并输入模型生成相应的意象参数,不断循环直至达到设计目标,完成新的方案设计。

4 结语

网络购物的普及产生了大量的产品评论文本,为产品评价提供了新的数据基础。针对现有产品评论文本挖掘方法难以匹配设计调研的多样化需求、文本挖掘结果难以进一步参与设计方案的参数化分析与评价等问题,提出了基于评论文本的产品意象参数化挖掘与评价方法。通过网络爬虫等方法获取互联网中的产品评论文本数据,确定调研目标,通过关键词提取与词语相似度计算,对调研目标的产品意象进行参数化表示。分类提取产品配置参数,使用BP神经网络构建产品评价模型,通过输入产品配置来输出产品在调研目标上的感性意象参数,实现了产品意象的参数化挖掘与评价,以手机为例验证该方法的有效性。该方法能够从调研目标的角度对产品进行参数化评价,从而增强设计调研目标与产品评论文本挖掘间的联系,使产品评论文本挖掘的有用性更高。同时,产品评论数据挖掘结果通过设计调研目标进行参数化表达,提高了文本挖掘结果的可理解性。此外,基于评论文本的感性意象参数化模型,能够辅助设计方案的评价以及新设计的指导。

目前主要使用基础的TF-IDF算法进行关键词提取,主要针对产品整体来提取意象词汇,在未来的研究中,需要对意象关键词的提取方法进行深入研究,实现更细致的感性意象分析。此外,文中对所提方法在设计方案的优选与迭代方面的研究尚不深入,有待后续进一步改进。

[1] 梅馨, 邢桂芬. 文本挖掘技术综述[J].江苏大学学报(自然科学版), 2003(5): 72-76.

MEI Xin, XING Gui-fen. On Technology of Document Mining[J]. Journal of Jiangsu University(Natural Science Edition), 2003(5): 72-76.

[2] 郝玫, 马建峰. 在线评论中基于动态窗口提取特征观点对的产品推荐模型[J]. 系统工程理论与实践, 2018, 38(9): 2363-2375.

HAO Mei, MA Jian-feng. Product Recommendation Model Based on Dynamic Windows for Feature Opinion Pair Extraction in Online Reviews[J]. Systems Engineering-Theory & Practice, 2018, 38(9): 2363-2375.

[3] 金吉琼, 刘鸿, 郑赛晶. 基于在线评论文本挖掘技术的电子烟市场消费热点分析[J]. 烟草科技, 2019, 52(12): 106-114.

JIN Ji-qiong, LIU Hong, ZHENG Sai-jing. Analysis of Consumption Hotspots of Electronic Cigarette Market Based on Online Comment Text Mining Technology[J]. Tobacco Science & Technology, 2019, 52(12): 106-114.

[4] 赵志滨, 刘欢, 姚兰, 等. 中文产品评论的维度挖掘及情感分析技术研究[J]. 计算机科学与探索, 2018, 12(3): 341-349.

ZHAO Zhi-bin, LIU Huan, YAO Lan, et al. Research on Dimension Mining and Sentiment Analysis for Chinese Product Comments[J]. Journal of Frontiers of Computer Science and Technology, 2018, 12(3): 341-349.

[5] 谭傲楠, 李洪海. 产品情感化设计研究文献综述[J]. 设计, 2016(1): 74-75.

TAN Ao-nan, LI Hong-mei. A Summary of Product Emotional Design Researches[J]. Design, 2016(1): 74-75.

[6] 林丽, 张云鹍. 感性工学中的参数化设计方法关键技术研究现状与展望[J]. 图学学报, 2019, 40(5): 936-944.

LIN-Li, ZHANG Yun-kun. Key Technologies in Parametric Design Methods in Kansei Engineering: State of Art and Progress[J]. Journal of Graphics, 2019, 40(5): 936-944.

[7] 王天赋, 徐子豪. 基于感性工学的汽车驾驶空间内饰优化设计[J]. 包装工程, 2020, 41(24): 98-103.

WANG Tian-fu, XU Zi-hao. Optimal Interior Design of Car Driving Space Based on Perceptual Engineering[J]. Packaging Engineering, 2020, 41(24): 98-103.

[8] 付成杰, 毕延刚, 沈学会. 基于感性工学的框架眼镜造型意象研究[J]. 包装工程, 2020, 41(2): 269-275.

FU Cheng-jie, BI Yan-gang, SHEN Xue-hui. The Shape Image of Frame Glasses Based on Kansei Engineering[J]. Packaging Engineering, 2020, 41(2): 269-275.

[9] 赵艳云, 边放, 李巨韬. 基于感性工学的产品材质意象研究[J]. 机械设计, 2015, 32(8): 117-121.

ZHAO Yan-yun, BIAN Fang, LI Ju-tao. Image Research of Product Material Based on Kansei Engineering[J]. Journal of Machine Design, 2015, 32(8): 117-121.

[10] 李德源. 电商在线评论的文本情感倾向性分析[D]. 长春: 吉林大学, 2019.

LI De-yuan. Emotional Inclination Analysis of E-com­merceOnline Commentary[D]. Changchun: Jilin University, 2019.

[11] SALTON G, BUCKLEY C. Term-weighting Approaches in Automatic Text Retrieval[J]. Pergamon, 1988, 24(5): .

[12] 黄承慧, 印鉴, 侯昉. 一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J]. 计算机学报, 2011, 34(5): 856-864.

HUANG Cheng-hui, YIN Jian, HOU Fang. A Text Similarity Measurement Combining Word Semantic Information with TF-IDF Method[J]. Chinese Journal of Computers, 2011, 34(5): 856-864.

[13] SU J N, JIANG P Y, LI H Q. Research on Kansei Image- driven Method of Product Styling Design[J]. International Journal of Product Development, 2009, 7(1): 113-126.

[14] PALIWAL M, KUMAR U A. Review: Neural Networks and Statistical Techniques: A Review of Applications[J]. Expert Systems with Applications, 2009, 36(1): 2-17.

[15] GUO F, LIU W L, CAO Y, et al. Optimization Design of a Webpage Based on Kansei Engineering[J]. Human Factors And Ergonomics In Manufacturing & Service Industries, 2016, 26(1): 110-126.

[16] 李永锋, 朱丽萍. 基于神经网络的产品意象造型设计研究[J]. 包装工程, 2009, 30(7): 88-90.

LI Yong-feng, ZHU Li-ping. Research on Product Image Form Design Based on Neural Network[J]. Packaging Engineering, 2009, 30(7): 88-90.

[17] 宋勇, 蔡志平. 大数据环境下基于信息论的入侵检测数据归一化方法[J]. 武汉大学学报(理学版), 2018, 64(2): 121-126.

SONG Yong, CAI Zhi-ping. Normalized Method of Intrusion Detection Data Based on Information Theory in Big Data Environment[J]. Journal of Wuhan University (Natural Science Edition), 2018, 64(2): 121-126.

Parametric Evaluation Method of Product Image Based on Review Text

LIU Bao-shun, CHEN Yue

(Hebei University of Technology, Tianjin 300132, China)

The paper aims to match the product review text mining method with the diversified demands of design research and to combine the text mining results with the parametric analysis and evaluation of design schemes. Product evaluation on the network shopping website is retrieved by crawlers. The research objectives are defined and described with imagery words. Keywords extraction and word similarity calculation method are used to calculate the image orientation of product on the research target, and are parameterized. Feature parameters are extracted by classification, and the mapping relationship between feature parameters and image parameters is constructed by BP neural network to form a product review model. The product feature parameters are input into the mapping relation to obtain the image parameters of the research objective, and realize the parametric mining and evaluation of product image. Taking mobile phone as an example, the mean differences between the predicted value and the real value of the image parameter output by the evaluation model are 0.0160, –0.0146 and –0.0137 respectivel, indicating that the evaluation model is effective.The method can effectively extract the image tendency from the evaluation text and express it as the tendency parameter on the research target, strengthen the relationship between product evaluation text mining and design research, and improve the intelligibility of text mining results.

product evaluation; text mining; design research; Kansei Engineering; BP neural network

TB472

A

1001-3563(2022)12-0142-07

10.19554/j.cnki.1001-3563.2022.12.016

2022–01–10

刘宝顺(1982—),男,博士,教授,主要研究方向为设计艺术学。

责任编辑:马梦遥

猜你喜欢
感性神经网络调研
基于神经网络的船舶电力系统故障诊断方法
理性的反面不是感性
基于人工智能LSTM循环神经网络的学习成绩预测
理性的反面不是感性
MIV-PSO-BP神经网络用户热负荷预测
南方周末读者调研
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
近半月以来机构调研最多的前50家公司
近半月以来机构调研最多的前50家公司(05.24—06.07)
感性理性不拔河