基于网络文本分析的航空小镇旅游形象维度分异研究

2020-07-04 02:54龚先洁
河南科学 2020年5期
关键词:建德高频词目的地

张 阳, 靳 雪, 龚先洁

(1.西安航空学院经济管理学院,西安 710077; 2.长安大学经济与管理学院,西安 710064;3.西安航空学院通用航空产业研究中心,西安 710077)

随着中国通用航空产业的逐渐成熟以及低空空域改革的不断推进,在区位上依托通用机场,功能上以通航为核心业务,建设生活、商务、休闲、旅游、养生等多要素融合的通航小镇成为热点. 目前,国内已有浙江建德、湖北荆门、石家庄栾城等多个加快建设通航小镇,积极探索“通航+”模式. 其中,浙江建德航空小镇作为集通航休闲旅游、通航制造与通航服务于一体的综合性通航小镇,在一众通航小镇中脱颖而出,特别在“通航+旅游”的方向上发展势头强劲. 目前,与通航小镇蓬勃发展现状不相符的是其研究现状. 以往对于通航小镇的研究主要聚焦于两方面:一是基于通航旅游、通航产业的宏观角度对通航小镇进行规划研究[1-4],虽全面系统,但缺乏针对性;二是采取文献调查、资料收集等定性研究方法对某个案例地进行现状[5-6]、模式[7-9]、功能[10-11]等的调查研究,虽然具体有代表性,但所收集的样本数量小,不能贴切的反应游客诉求,具有很大的局限性. 而在移动互联网时代,旅游者可以自由方便地在网络上发表对旅行体验的评价和描述,这些游客自发生成的内容易获取、真实可信且数量广泛,对这些数据进行分析,即运用网络文本挖掘方法,可以有效地解决以往研究所面临的问题. 因此,选取建德航空小镇为案例地,借助ROST.CM文本挖掘软件,对主要旅游网站上建德航空小镇的游客评论和游记文本进行高频词统计、社会语义网络分析和情感测度,探究建德航空小镇感知形象维度的差异性和层次性,分析网络文本反映的建德航空小镇感知形象成分和感知情感测度,为以建德为代表航空小镇旅游形象的塑造和管理提供科学依据.

1 建德航空小镇发展概述

目前,我国有近200个城市或地区计划建设通航小镇,但只有少部分初具规模,如浙江建德航空小镇、珠海三灶通航小镇、荆门爱飞客综合体、四川彭州“3D通航小镇”,其他大部分还处于规划和建设中. 在现已建设的通航小镇中,建德航空小镇的发展势头最强劲. 2015年,建德市政府以建德千岛湖通用机场为支撑,规划了3570 m2的土地,投资52.8亿元,重点建设建德航空小镇(以下简称“小镇”). 小镇坚持“产业、文化、旅游”共同发展,“生产、生活、生态”融合一体的观念,整合旅游资源,突出主题文化,开发航空、温泉、旅游、生态等多种产品,小镇不断完善基础设施和旅游服务设施建设,通过引进高端人才推动产业融合发展,打造小镇品牌IP,利用通航科普吸引游客,通过低空旅游新亮点聚集人气,实现旅游人数和收入的爆发式增长[12]. 据统计报告显示,2018年小镇累计接待国内外游客50余万人次,旅游产业收入8500多万元. 其中共计接待参与低空旅游项目的游客8500多人次,接待了来自全国各地参与研学夏令营的中小学生2.5万名,共带来旅游产业收入2500万元. 小镇于2019年正式被列为国家4A级旅游景区,是浙江省第一个成为4A级旅游景区的通航类特色小镇. 因此,选取最具代表性的建德航空小镇,通过实证研究对未来小镇的旅游形象塑造提供一定的参考,对其他通航小镇的建设也有借鉴作用.

2 研究方法及样本选取

此次研究主要借助网络爬虫技术法[13]对数据进行收集,利用八爪鱼采集器高效灵活、方便快捷的特点设置流程图自动提取网页信息. 样本网站主要选取携程网(www.ctrip.com)、马蜂窝网(www.mafengwo.cn)和去哪儿网(www.qunar.com)3 个国内知名旅游网站. 马蜂窝网是专注于用户生成内容的旅游社交分享网站,强调用户的原创和自发反馈内容,具有主动性和可信度,而以携程网和去哪儿网为核心的携程系拥有超过60%的市场份额,占据了线上旅游行业的半壁江山,更能保证样本数量庞大,真实性高. 为了保证样本数据的时间有效性,选取2016年1月—2019年12月期间的游客评论和游记,收集了携程网、去哪儿网、马蜂窝网3个网站上所有用户关于建德航空小镇的游记和点评,形成本地大数据库.

首先利用网络爬虫工具抓取了在建德留下足迹的用户评论文本和游记,在携程网、去哪儿网和马蜂窝网上收集的旅游评论文本分别为321条、47条和14条,收集的游记数据分别为13篇、2篇和48篇. 其次,对收集到的数据进行剔除无效评论、合并重复游记和评论的处理,最终一共抓取了375条旅游在线评论文本和26篇旅游游记,获得有效数据401条,总字数42 809个. 最后,对于所收集到的样本数据,运用网络文本挖掘法[14-16],通过ROST.CM软件对样本数据进行高频词分析、社会和语义网络分析以及情感定量测度,探究建德航空小镇的旅游形象感知.

3 建德航空小镇感知维度分异探析

3.1 感知维度的高频词分类

选取的高频词来源于游客对建德航空小镇的评论,记录旅游经历的同时也描述了自身感受,内容涉及旅游过程中食、住、行、游、购、娱等多方面,这些碎片化信息从语言上虽不通顺,但所提供的主观、真实和信息也反映了小镇的旅游形象. 感知维度是衡量和评估小镇形象的主要方式,而每个维度在游客感知的重要性方面存在差异. 通过分析游客的评论,可以看出游客对吸引物、设施和环境等各大维度的讨论存在词汇量及篇幅的差异. 因此,从6个感知维度对高频词进行分类,即旅游吸引物、公共基础设施、旅游基础设施、休闲和娱乐、旅游环境和地方氛围(表1). 通过分析与各个形象维度相关联的高频词的数量和频次,对6个感知维度进行层次划分,研究各个感知维度的重要程度.

表1 旅游目的地形象高频词分类Tab.1 High-frequency words classification of tourist destination images

3.2 感知维度的高频词分析

3.2.1 旅游吸引物维度 研究结果显示,该维度的高频词数量最多,占总体高频词数量的比例最高,是小镇目的地形象维度的第一层次. 在研究中将旅游吸引物划分为自然和人文两大类,自然类旅游吸引物包含6个词汇,占词汇总数的8.3%,人文类旅游吸引物包含12个词汇,占词汇总数的36.7%. 首先,小镇打造的以“航空”为主题的特色小镇是核心旅游吸引物,是吸引广大游客的最主要因素,是建德对外宣传和依托的重要根基. 其次,小镇联动周边打造的通航空中旅游景观圈是重要的旅游吸引物,该小镇位于杭州新安江寿昌镇,北邻千岛湖,南接江南悬空寺大慈岩,东连新安江水电站,西接灵栖洞,地理位置优越,环境优美,距离杭州市区仅有1个小时车程,周围旅游景点众多,旅游资源丰富,是游客感知目的地旅游形象的重要依据. 最后,以健康养生为目的的旅游吸引物,如航空小镇温泉,也是各个年龄段旅游者的首选,温泉的水温、水质、元素、功效等也因此成为影响游客感知目的地形象的重要因素. 综上,小镇的旅游吸引物既包括地文景观、水域风光等自然旅游吸引物,还包括古建筑、温泉、美食等人文旅游吸引物. 其中航空特色是小镇最为突出的核心旅游吸引物. 总体来看,该小镇人文旅游吸引物所占的高频词最多,频次最高,是游客感知建德航空小镇目的地形象的重要维度.

3.2.2 公共基础设施维度 该维度共有4个与其相关的高频词,占词汇总数的4.3%,高频词的比例最低. 公共基础设施包括公共交通(飞机、铁路)、交通站点(机场)、公共场所(公园). 在不同的交通方式中,飞机的关注度最高,火车、高铁、公交、地铁的关注度极低. 产生这种现象有3个原因:一是小镇所依托的千岛湖机场不仅承担着原有传统的交通运输功能,还致力于打造华东地区最大空域的通用机场. 通过设立“千岛湖-横店-舟山”运营基地,开通飞往黄山、东阳等地的旅游路线,在建德境内旅游景点设立直升机临时起降点,谋划水上飞机和第二机场等全面布局,大力发展低空旅游,所以飞机、机场这些公共基础设施是游客感知小镇目的地形象的重要因素. 二是杭黄高铁的开通受时间、宣传力度、旅游者感知等多方面要素影响,旅游者虽然短时间内对高铁的关注度高,但是使用人数和频次受限制,所以短时间内游客自发生成内容中所提及的高铁的频次较少. 三是因建德市距离杭州市区仅1个小时车程,且周边旅游景点丰富,所以有部分旅游者选择自驾出行或者骑行的方式来小镇游玩.

3.2.3 旅游基础设施维度 共有9个与旅游基础设施相关的高频词,占词汇总数的14.7%,仅次于“旅游吸引物”,是目的地形象维度的第二层次. 旅游基础设施中对于火车酒店的感知度最高,游客对于该酒店的客房、配餐、装饰、建筑特色有明显的关注,说明小镇打造的东方红火车主题住宿设施得到了游客的认可和喜欢.但在旅游基础设施里面游客未感知到酒吧、俱乐部等设施,说明小镇的旅游基础设施虽然主题突出,深入人心,但是种类单一,缺少多样化的住宿设施和酒吧这种性质的娱乐设施.

3.2.4 休闲和娱乐维度 有15个与该维度相关联的高频词,占词汇总数的12.6%. 游客喜欢的休闲娱乐活动主要包括3 种:一是以高空跳伞、卡丁车漂移、热气球低空飞行等体验式冒险活动;二是以参观游玩为目的,以亲子乐园、鱼池、汽车公园、航天基地等为代表的主题公园;三是观看文艺演出的休闲活动,如“千岛湖水之灵”. 由此可见,游客所感知的休闲娱乐活动相对丰富,既包括了主题公园、休闲活动,还包括了冒险活动、体育活动等,类型多样,体验性强,参与度高.

3.2.5 旅游环境维度 有9个与其相关的高频词,占词汇总数的11.1%,旅游环境划分为自然环境(方便、卫生、干净、夏天、温度)、社会环境(朋友、热情)和政治经济环境(性价比、优惠). 自然环境包含了卫生状况、交通状况和气温状况,“干净卫生”和“方便”反映了游客对于卫生和交通状况的评价是正面的,“夏天”、“温度”反映了游客对于“17度的气温”、“17度的建德”的正面认可,不论是夏天还是冬天建德都是出游旅行的理想去处. 社会环境反应了当地居民的热情友好程度(朋友、热情),说明游客对当地社会环境的感知形象是积极的. 政治经济环境包含了物价状况(性价比、优惠),说明游客认为小镇的食、住、行、游、购、娱方面定价合理,性价比较高,但政治经济环境中没有涵盖安全、犯罪率、经济发展、政治稳定方面的情况.

3.2.6 地方氛围维度 有10个与其相关的高频词,占词汇总数的12.3%. 特色、体验、好玩、刺激、有趣,反映了游客对于小镇开发的低空旅游项目和其他惊险刺激类的体验项目的深刻记忆. 舒服、开心、放松反映了游客对于小镇的住宿、餐饮、温泉等旅游基础设施和配套设施的认可. 小镇打造的低空旅游示范区、特色小镇、通航休闲旅游目的地的形象深入人心,激活了建德原有的通用机场、温泉、工业遗存等低效闲置资源,将通航产业和旅游、体育、健康等产业跨界融合,走出了一条特色之路,形成了体验、刺激、舒服、放松等独特的休闲氛围,得到了广大游客的高度认可.

通过上述基于高频词对小镇感知形象的分析,得出旅游形象感知维度的重要程度存在差异的结论:旅游吸引物的高频词数量和频次都占据首位,这是游客对小镇旅游形象维度感知的第一层次;旅游基础设施的高频词数量和比例仅次于旅游吸引物,是游客感知小镇旅游形象维度的第二层次;休闲和娱乐、旅游环境和地方氛围在形象感知维度中同样占据着相对重要的地位,共同构成了第三层次;公共基础设施所拥有的高频词数量最少,频次最低,是第四层次.

4 感知形象分析

4.1 感知形象整体分析

游客对目的地形象的感知来自不同的感知维度,形象反映了游客对于目的地的具体观点和评价,感知维度则反映了这些观点(或评价)的形成途径,将二者结合起来进行分析,能更深入了解目的地形象及其形成过程[17]. 高频词是通过提取出的词组的属性来反映事物的主要领域,但它们没有办法反映词组在意义上的联系和文本深层次的结构关系[18]. 社会语义网络是通过概念和语言之间的关系来表达知识的一种网络图,由一组节点和一组连接节点的弧构成,其中节点用来表示事物、概念、属性、动作、状态等,弧用来表示所连接节点之间的语义联系[19]. 基于共现词频的结果来构建社会语义网络图,将处理后的数据文本输入ROST.CM内容挖掘软件中,人工剔除部分无意义的词条,保留前50位共现高频词,并通过社会与语义网络工具生成游客对小镇的评论和游记文本的语义网络图(图1).

图1 网络文本的语义网络图Fig.1 Semantic network diagram of web text

图1中,方块的大小代表共现词频出现频率的高低,方块越大代表共现频数越高,游客对其的感知越强烈. 观察图1发现,“航空”“小镇”所在方块最大.“航空”连接的节点有27个,“小镇”连接的节点有29个,说明有接近一半的共现词频都与这两个词有着语义联系,其中相关联的词频包括“温泉”“千岛湖”“杭州”等旅游吸引物的高频特征词、“酒店”“餐厅”等旅游基础设施的高频特征词、“旅游”“公园”“乐园”“项目”等休闲和娱乐的高频特征词,以及“舒服”“体验”“特色”等地方氛围的高频特征词. 除了“航空”“小镇”核心词之外,“温泉”“酒店”所在方块大小仅次于这两个词. 与“温泉”相关的高频特征词(16个)“舒服”“服务”“适合”“环境”,表明了游客对温泉有积极的正面印象;与“酒店”相关的高频特征词(15 个)“东方”“火车”“车厢”“特色”“房间”“餐厅”等,说明小镇的东方红火车主题酒店给游客留下了深刻印象,酒店的建造风格、配套餐饮、硬件设施、特色之处都得到了游客的一致认可.

综上,图1中,“航空”和“小镇”为一级高频核心词,“温泉”和“酒店”为二级核心高频词,说明从感知形象的整体角度出发,游客对该小镇感知的旅游地整体形象是人文类新兴特色旅游地,这与小镇自身资源特色和营销宣传所追求的旅游地形象基本一致. 游客感知形象认知成分包括航空文化、特色小镇、休闲娱乐、旅游基础设施4个主题;情感成分整体保持为正面,包括“适合、选择”的意动形象成分,形成了正面的网络口碑效应. 同时,对比感知维度发现,旅游吸引物(航空、小镇)维度仍然是游客感知小镇形象维度的第一层次,仅次于它的是旅游基础设施(酒店)维度. 基于社会语义网络对小镇旅游形象维度的分析与基于高频词分析的结果保持了一致,再次验证了小镇形象感知维度的重要程度存在差异性.

4.2 小镇感知情感测度分析

按照Hunt John 的定义,旅游目的地形象(Tourism Destination Image,TDI)是游客对旅游目的地的观点、看法和印象的总和[20]. TDI对游客目的地选择行为和旅游满意度有着直接而重要的影响. 为进一步根据小镇的旅游形象探究游客的选择行为和满意程度,从情感分析的角度,将ROST.CM 和NLPIR 大数据语义分析系统的情感分析结果结合起来,了解游客对小镇的感知情感分布状态,结果见表2和图2. 观察图2发现,游客对小镇的整体印象是较为肯定的.据表2 可知,72.59%的游客持积极情感,其中一般积极态度占32.09%,中度积极态度占21.18%,高度积极态度占19.31%;17.3%的游客持消极情感,其中一般消极态度占12.15%,中度消极态度占3.12%,高度消极态度占0.62%;10.28%的游客保持中性情感.

结合数据分析结果和图表显示状态,说明小镇旅游形象的感知情感成分以积极情感为主,中性情感和消极情感成分占比少、程度低,说明大部分游客对小镇是较为满意的,对该地的评价是正面积极的,不满意的游客中不满意程度也较低.但在各类情感的具体表现方面,积极情感的中低强度情感比例较高,在整个积极情感中占多数,说明小镇的正面旅游形象打造虽卓有成效,但还有较大的发展空间. 根据高频词分析的结果,游客在旅游吸引物、旅游基础设施、休闲和娱乐以及地方氛围等维度上感知到的高频词基本保持了较大的正面评价. 此次情感分析的结果与基于高频词分析的结果保持了一致性,小镇的情感分布状态与营销宣传所追求的目标相吻合.

虽然游客对小镇较为包容,消极情绪的占比较低,强度不高,但为了营造更好的旅游形象,这些为数不多的引起游客消极情感的关键因素更值得关注和探讨,因为这些不足将直接制约着以航空小镇为代表的航空旅游发展的高度和深度,稍有不慎,这些消极情感带来的负面口碑效应就会使前期精心打造的旅游目的地形象崩盘. 观察游客评论和游记文本情感分析中的消极因子(图3)发现,游客对小镇的消极情感感知主要在温泉. 温泉的水温、水质、硬件设施、软件设施、服务是游客负面情感中最关注的问题,这指出小镇在未来发展建设中应着重注意旅游吸引物硬件设施和软件设施的完善,在服务中坚持人性化和个性化,提升整体服务水平和水准.

表2 情感分布—ROST.CMTab.2 Emotional distribution—ROST.CM

图2 情感分析—NLPIRFig.2 Emotional analysis-NLPIR

图3 负面感知的高频词汇及频数Fig.3 High frequency words and frequencies of negative perception

5 结论

以建德航空小镇为案例地,采用网络爬虫技术法和网络文本挖掘法,对游客评论数据和游记文本进行分析,探索了游客对小镇的感知形象、感知维度和感知情感. 相比以往对旅游目的地形象的研究,此次研究更真实有效,从理论上和实践上都完善了目的地形象的文本研究方法,并且通过实证研究得到了关于小镇旅游形象的结论:第一,小镇旅游形象维度的重要性存在差异,按重要程度由上到下排序,旅游吸引物是第一层次,旅游基础设施是第二层次,休闲和娱乐、旅游环境和地方氛围暂居第三层次,公共基础设施是第四层次,这在以往学者研究的基础上进一步界定了维度的层次性. 第二,通过社会语义网络分析,游客对小镇的整体感知是人文类新兴特色旅游地,游客感知形象认知成分包括航空文化、特色小镇、休闲娱乐、旅游基础设施4个主题,情感成分整体保持为正面,意动形象成分包括“适合”“选择”这样的正面推荐词语,说明小镇形成了正面的网络口碑效应. 第三,通过感知情感测度,游客对小镇的旅游形象以积极情感为主,大部分游客对小镇较为满意,评价是正面积极的;但在各类情感的具体表现方面,积极情感的中低度情感占优势,还存在一定的消极情感因子,例如温泉设施和服务等,因其带来的负面口碑效应将会影响已精心打造的旅游目的地形象.

此次研究从网络文本大数据收集的角度切入,将定性研究和定量研究方法相结合,能在一定程度上减少以往对有限样本数量进行定性分析的误差,提高结论的准确度和可信度,增强结论的科学性和可靠性. 但是依网络文本大数据研究也有一定的局限性,覆盖的人群主要是习惯对目的地在网上评价的年轻人,而忽略了那些不经常在网站上评价的人群. 此外,此次研究只针对建德航空小镇这一旅游目的地,对其他的通航小镇虽有一定的借鉴意义,但缺乏针对性的指导. 今后的研究可以选取更多的样本群体和案例地,拓展到通航小镇、通航旅游的方向,并进行更大范围的数据分析和研究.

猜你喜欢
建德高频词目的地
宿建德江
建德五星
30份政府工作报告中的高频词
省级两会上的高频词
恋爱中的城市
迷宫弯弯绕
28份政府工作报告中的高频词
省级两会上的高频词
宿建德江
宿建德江