大数据背景下的旅游目的地情感评价方法探究

2018-07-18 17:52俞俊男

智富时代 2018年5期

俞俊男

【摘要】随着人们物质生活水平的不断提升，对精神享受的重视程度逐渐增加，旅游作为一种普遍的休闲放松方式，受到越来越多人的认可与青睐，加之电子信息技术的发展，利用智能移动终端通过建立数学模型的方式，分析游客出行、消费的特征，预测游客的满意度与市场需求，进而对游客对目的地的情感进行评价。基于此，本文将选择五个旅游目的地，对游客的情感进行评价和分析。

【关键词】大数据；旅游目的地；情感评价法

一、引言

在以往传统的旅游目的地分析中，主要采用定量模型的方式，通过设计调查问卷来获取数据信息进行评价。而在大数据背景下，地理学家可以借助GIS与GPS等新技术，通过对个体行为与信息的采集，获取到整个群体的空间规律与综合评价，在互联网中捕捉游客的满意度、喜好、愉悦度等情感信息，进而获取到游客对旅游目的地的整体评价。

二、游客情感研究

20世纪90年代，游客情感研究兴起，主要侧重于基本维度与因素界定方面，经过学者的研究发现，游客在旅行的过程中，既存在着正面情感也存在负面情感，二者相互交织、互为金拓，客户满意度作为游客情感中的一部分，能够代表整体情感一项，但是在评估内容上存在诸多不确定性，也受到评估者自身感知能力的限制。而在实际旅游过程中，由于尚未建立专用于收集游客情感的词库，游客对于情感的分类方式又各不相同，例如有些游客表示的“惊讶”属于负面情感，而“刺激”大部分属于正面情感等，加之受到语言表达中连词、副词对于情感描述方面的影响，很容易产生误判，因此需要对情感强度进行进一步准确把握。

三、旅游情感评价研究方法

本文构建了科学有效的游客情感分析模型，建立旅游情感评价专属词库，选择国内5个旅游目的地进行数据采集，分别为黄山、洛阳、焦作、成都与张家界，并且通过“UNWTO监测数据”方式，对上述旅游场地的数据分析结果进行抓取和分析。

1、数据来源

在数据来源方面，主要选择国内评论量较多的旅游电子商务门户网站，经过对团队进行阅读与分析后，选择具有较高知名度与用户群体的：去哪儿网、携程网与途牛网。通过网络爬虫工具对评论进行抓取，截止到2017年底，共计抓取评论120731条。

2、模型构建

为了更加科学准确的对游客情感逻辑进行评估，在本次研究中通过建立游客情感分析模型的方式，采用词汇匹配技术，收集旅行评论中的情感词汇，包括正面和负面两种，然后进行数学统计和分析，模型构建具体分为以下几个步骤：

一是建立游客情感词库。本文采用的词库为知网发布的HowNet词典，包括91016个中文词语、85295个英文词语，涉及到正面评价、负面评价、程度级别等多个类型。同时，采用人工阅读筛选的方式，对旅游词库中的词语进行进一步提炼，通过吃住行游购娱六个方面着手，共计获取到正面词汇与负面词汇分别为317个与185个。

二是构建语义逻辑规则。首先，对于程度副词来说，将其划分为绝对与相对两种类别，绝对词能够单独体现出程度，而相对词需要进行对比来表示程度。在程度上共计分为极量、高量、中量、低量四种类别，分别给予0.5-3的倍数级别。其次，在否定词方面，对文本情感分析起到十分重要的作用，能够对整个句子的情感倾向起到决定性作用，并且否定句存在“范围”与“焦点”，并且同一个句子中可以包含不同的否定对象。另外，转折连词也将对情感产生一定的影响，分为“狭义转折”与“广义转折”两种，其中以侠义转折为重点，如“虽然……但是……”“可是”等[1]。

三是情感乘数拟定。在社交网站中，公众的表达可能会受到一定的限制，积极向上的表达将获得更多社会的认同，因此在表达中将会不自觉的向着积极的方向表述，这将导致对负面情绪的判断不够科学，夸大正面评论的效果，因此需要对正负面词汇的比例系数进行校正。在本文研究中选择的5个数据采集地中，正面评论是负面评论的7.19倍，本文从实验角度出发对误差程度进行测定，并且拟定三个情感系数，分别为3/4/5倍，当评论中正面评价与负面评价相比超过3/4/5倍时，此条评论才能够被真正判定为是正面评论。

3、模型规则

在上述所构建的模型基础上，根据游客在网站中发表的评论，对目的地进行评分情况进行判断与分析。针对不同网站采用统一化的评分方式，分值从1到5，1为最低分，5为最高分，满意程度由1到5是极其不满意到非常满意，在分值中以3为界限，4-5分属于正面评论，3分属于中性评论，1-2分属于负面评论，采用的规则为：

（1）“词频法”主要是指抓取到的网友评论，对其中的中文分词进行集合后，采用纸机统计的方式，划分每个评论的正面与负面词汇的数量，当正面与负面相比词汇数为1.5倍时，则属于正面评论；没有超过1.5倍为中性评论，超过1.5倍属于负面评论。

（2）“词频逻辑法”主要是指语义逻辑与词频统计相结合的情感分析，该规则被建立在上一规则的基础上，并且以情感词前后的词性为参考标准，与系数相乘后，计算最终得分。当正面与负面词汇单独出现时，则正面得1分，负面得-1分。

四、评价研究的结果与校验

本文共计选择了5个旅游目的地，对游客情感的正面与负面评价进行分析，对于单个目的地来说，焦作的情感评价最为负面，获取的正面评价比例最低，而负面评价比例最高。另外，采用“词频法”进行计算时，黄山获得情感评价的正面比例最高，而采用“词频逻辑法”进行计算，则成都获得的情感评价最高。从整体上来看，两种规则对目的地的判断中，正面评论占总体的比例处于不断下降状态，但始终能够保持在65%以上；中性比例则不断增加。通过“UNWTO”对数据进行进一步深入分析和校验。

1、单年度校验

按照上述5个旅游目的地在情感判定规则中，正面评论的比例来看，对游客满意度的方差计算公式为：

规则X与监测结果的方差=

式中，Ai属于第i个目的地中游客的滿意程度；Xi代表的是第i个目的地中正面评价的比例。

通过对两个规则绝对方差结果的对比研究可知，第一种规则中绝对方差的数值最小，这将意味着其与监测结果之间的距离最小，更能够准确的测试出游客的真实情感。另外，第二种规则中存在较大的绝对方差值，这将意味着通过计算正负词汇数量的方式进行情感判断存在较大缺陷，因此不可行[2]。

2、多年度校验

由于各个年份之间存在一定的变化，因此选择进三年的监测结果对5个目的地进行监测，同样采用计算公式的方式，求取年度绝对方差，计算公式为：

规则X与监测结果的方差=

式中，Ai与Xi代表的含义同上；J代表监测年限。

根据公式计算结构可知，三年内游客对目的地的满意程度分析效果为第二种规则大于第一种，因此对于多年度校验将采用第二种监测方式，使其更接近与监测结果。

五、结论

综上所述，通过本文的调查研究可以得出以下结构，一是游客在线评论的情绪表达较为倾向于正面，不同年份中游客正面情绪表达的程度不同，但总体均高于64%；二是建立旅游情感专属词汇、情感乘数等有利于提升调查结果的科学性，缩减其中存在的误差；三是在单年内差异校验中，采用“词频法”规则效果要高于“词频逻辑法”；而在多年校验中，采用“词频逻辑法”要更优于“词频法”。

【参考文献】

[1]李君轶，张妍妍.大数据引领游客情感体验研究[J].旅游学刊，2017， 32（9）：8-9.

[2]李艺.大数据时代背景下旅游目的地的营销发展研究——以贵阳市为例[J]. 贵阳学院学报（社会科学版）， 2017，12（2）：39-43.