江苏省国家级风景名胜区游客感知形象
——基于在线点评的内容分析

2020-05-20 12:59唐晓岚夏茹雪相西如
国土与自然资源研究 2020年3期
关键词:高频词名胜区长尾

唐晓岚 ,夏茹雪 ,胡 刚 ,相西如 ,4

(1.南京林业大学风景园林学院,江苏南京210037;2.南京林业大学中国特色生态文明建设与林业发展研究院,江苏南京210037;3.江苏省林业局,江苏南京210036;4.江苏省城市规划设计研究院,江苏南京210036)

图1 江苏省国家级风景名胜区区位图

引言

1979年国家城市建设总局提出了建设全国风景区体系的建议[1],得到了国务院的认可,明确了建立全国风景名胜区体系纳入国务院城建主管部门管理序列[2]。1985年6月国务院颁布了《风景名胜区管理暂行条例》,明确了风景名胜区的相关概念,并制定了国家、省市、县的三级管理制度。据统计,截止2017年共计244个国家级风景名胜区。江苏省共计5处国家级风景名胜区,分别为太湖风景名胜区、南京钟山风景名胜区、蜀冈瘦西湖风景名胜区、云台山风景名胜区、三山风景名胜区,总计面积为1130.24km2。针对风景名胜区游客方面研究主要以行为方式研究[3,4]、时空分布研究[5,6]、感知价值[7,8]、客流分析[9,10]、游客体验[11,12]方面。鲜少从游客网络评论的角度对风景名胜区进行相关研究。

随着大数据的普及和不断发展,网络日益成为企业和个人检索信息和发布信息的渠道,因此网络评价的影响不容忽视。网络文本的研究中多以单个目标为研究对象[13-15],而缺少在较大范围内整体性的研究。因此选取江苏省国家级风景名胜区为研究对象,获取网络点评数据,对游客的感知形象进行分析,以提升江苏省国家级风景名胜区的整体形象和景区服务质量。

1 研究范围

研究范围为江苏省国家级风景名胜区。研究对象为江苏省国家级风景名胜区:太湖风景名胜区、南京钟山风景名胜区、蜀冈瘦西湖风景名胜区、云台山风景名胜区、三山风景名胜区,总面积为1130.24km2。具体位置如图1。

2 研究方法与数据来源

2.1 样本选取

在数据获取方面,针对主要的旅游网站(途牛、去哪儿网、携程、马蜂窝、驴妈妈)进行主要业务服务范围分类。得出途牛网主要针对旅游产品更倾向于旅游定制方面。去哪儿网主要提供游客的机票、酒店、度假和签证的深度搜索。携程网也是倾向于旅游定制。马蜂窝针对自由行、酒店、机票、签证等旅游产品。而驴妈妈主要业务范围针对景区门票、周边游等,对于研究国家级风景名胜区而言,驴妈妈更有针对性。驴妈妈作为国内知名综合性旅游网站,是中国景区门票在线预订模式的开创者,在景区信息板块,向游客提供了全面的景区产品信息,具有较好的代表性。因此以驴妈妈(www.lvmama.com2019.10.16 3:00)作为获取评价数据的来源网站。

2.2 研究方法与过程

网络文本分析方法是一种能够将不系统的、却代表一定本质思想的“符号”(网络文本、图片、音频等)转化成系统性数量化分析的研究方法,也是旅游学研究的一个重要方法。它借助武汉大学团队研究的ROST CM6.0软件,对文本内容进行分词、词频统计、社会网络语义分析等,实现资料内容的挖掘、处理和关系研究,并将定性的资料转为数量化[16]。

研究过程:首先对文本进行预处理,删除中英文字符、不相关的内容等;对主要内容进行规范化处理,再使用ROST CM6.0软件对文档进行分词和词频统计,并对词汇进行编码分类,以清晰的了解游客感知高频词、出游伙伴高频词、设施服务高频词。再通过长尾词提取,获取长尾词汇,了解景点认知情况,再结合语义网络构建和情感分析,了解游客感知与情感状况,最终得出规划建议。

3 结果分析

3.1 词频分析

词频分析主要关注两个方面,一个是游客对江苏省国家风景名胜区的总体形象感知,二是针对不同的国家级风景名胜区的形象感知。词频分析采用ROST CM 6.0软件对网络评论中高频词汇进行提炼,主要针对排序前50的高频词汇进行总结。

3.1.1 风景名胜区形象感知词频分析。首先对从驴妈妈网站获取的18215条游客评论进行总体词频分析,从而对国家级风景名胜区感知形象进行整体识别,然后对不同的国家级风景名胜区进行单独分析,发现各个风景名胜区的感知形象。主要研究发现:①从50个高频词,游客关心的多为内心感受、游玩时间以及设施服务三个方面。②风景名胜区形象感知高频词可以分为3大类型,包括游客感知、出游伙伴、设施服务,其中具体词频分析见表1。

游客感知高频词:包括“优美”“漂亮”“美丽”“不错”“遗憾”等词、其中“不错”反映了游客感知的核心体验,表明整体上对于江苏省国家级风景名胜区的感知体验是出于积极。而“遗憾”一词出现在连云港云台山以及镇江三山,而这两处的高频词发现关于时长的“小时”“分钟”“时间”数量较多,反映了观光时间不充裕,行程安排过于紧凑和匆忙,说明旅游线路规划的时长可能成为影响游客对于景区形象认知的短板属性。

出游伙伴高频词:主要包括“老人”“小朋友”“朋友”等词,老人词频数:252条,小朋友、孩子、小朋友词频总数:723条,朋友词频总数:341条。得出在出游伙伴中以亲子出游为多数。相关评论“中山景区的景色还是很漂亮的,适合老人团”以及“里面喂鸽子小朋友很有兴致”等。

设施服务高频词:包括“服务”“好”“停车”“导游”等词,相关评论有“租个语音介绍或找个导游会受益匪浅”以及“停车场很多”,“导游”频率较高,表明导游对于游客的体验起到关键作用。现有研究也表明,在游览观光过程中的导游服务对游客满意度、重游意向和口碑推荐行为具有正向的影响作用[17]。

3.1.2 各个风景名胜区的景区形象感知分析。上文的词频分析发现,不同风景区的50个高频词的形象存在相似性,无显著差异性,因此针对不同国家级风景名胜区中评论数据的前200位高频词汇的序号和频数作为变量进行曲线拟合,发现高频词汇符合幂指数分布。模拟方程判定系数 R2分别为 0.987、0.994、0.978、0.953和0.994,表明模型拟合度很高。根据长尾理论可以推断出,江苏省国家级风景名胜区的词频分布呈明显的“长尾”分布特征。

从不同国家级风景名胜区的长尾曲线来看,国家级风景名胜区形象感知由核心形象和边缘形象构成,其中拟合曲线头部的特征词属于核心形象,反映了各个国家级风景名胜区的整体形象特征。长尾词则可以看作是形象感知的边缘形象[18,19],能够反映游客对不同风景名胜区景源的形象认知,具体词汇如表2。因此在风景名胜区形象构建中,边缘形象成分往往代表潜在的市场,应给予重视(图2至图6)。

表1 前50高频词

从表中可以看出,游客对于景点形象认知不明显,提到关于景点的相关词汇较少,比如南京钟山景区中的梅花山只出现51条,属于典型的长尾词。此外三山景区由金山风景区、焦山风景区、北固山风景区组成,金山的关注度显著高于其他两个部分,并且三山中的寺庙词汇出现42次,也是典型的长尾词。瘦西湖主要景源由大虹桥、长堤春柳、吹台、五亭桥、凫庄、小金山、望春楼、熙春台组成。而提到的景点更多的是楼阁与花园。以及太湖风景区主要由东山景区、穹窿山景区、旺山景区、太湖湖滨国家湿地公园组成,但仅提到了与太湖湖滨国家湿地公园相关的候鸟。云台山景区则以万寿谷、云台石林、悟道庵、楸林花海、海天一览以及法起寺等,关于景点相关的只有寺庙一词。因此从以上分析来看,词频分析结果反映出游客对于景区的整体大致印象与感官,但对于不同景区的景点感知并没有显著性的差别。因此景区建设中应重视长尾词为代表的辨识属性,深入挖掘自身特色,加强品牌形象建设。

表2 景区形象感知关键词

3.1.3 语义网络分析。语义网络分析则能通过构建概念和语义关系的网络图来直观展现要素之间的关系。语义网络分析时,首先对游客的评论数据进行高频词并过滤部分无意义词之后,进一步生成VNA文件,最后将VNA文件导入到ROST CM6.0软件,最终生成游客对江苏省不同国家级风景名胜区的语义网络图,分别如图所示。从层级结构来看,语义网络图呈现“核心—边缘”特点,图中重要节点周围形成了一层或多层子群。词语距中心节点(核心节点)距离越近,与中心节点词语的联系就越紧密[20]。而线条的疏密代表共现频率的高低,线条越密,表明共现次数越多[21]。

图2 南京钟山风景名胜区高频词长尾分布

图3 扬州瘦西湖风景名胜区高频词长尾分布

图4 苏州太湖风景名胜区高频词长尾分布图5 连云港云台山风景名胜区高频词长尾分析

图6 镇江三山风景名胜区高频词长尾分析

整体来看,语义网络分析展现的是一种“核心—边缘”结构,具体可以分为三个层次。第一圈层是核心层,由“瘦西湖”“风景”“景点”等词构成,主要体现了游客在江苏省国家级风景名胜区的偏好程度。第二层为过渡层,以“值得”“二十四”“时间”等词构成。表现出游客对部分景点的直观感受。第三层为边缘层,主要包括“门口”“排队”“优惠”“便宜”等词构成。因此游客的语义网络分析通过“核心—过渡—边缘”三层结构将整体认知和感知展现出来。分别针对五个国家级风景名胜区进行网络语义分析,可以看出,南京钟山语义网络图边缘层出现“建议”一词,追溯网络原文,相关评价“不过景区太大了,景点比较分散,体力不好的不建议买套票,因为根本走不动的”,“建议自带午餐,中山陵没什么吃的,结束后去明孝陵”,“去灵谷寺也建议乘观光车前往,由于到灵谷寺时间已经较晚,只得仓促游览”。而在云台山语义网络图中可以发现停车场属于过渡圈层,相关评论反映“停车免费很给力”,“停车场有免费车可以直接到景区里”表明游客对于云台山免费停车政策较为满意。对于太湖语义网络分析可以得出整体良好,但出现“小时”,相关评价“一路兜下来1个小时。慢慢走恐怕至少半天”,“慢慢逛一圈也要好几个小时,总的来说还可以吧”。蜀冈瘦西湖的语义网络图过渡圈层出现了“门票”,相关评价“门票就很贵,性价比不高”“就是节假日人是真多,门票太贵”,表明在门票方面,部分游客对其存在消极情绪。三山中“门票”也占据了过渡层,相关评价“和门票的价格不成正比,没有什么特色的景点就是烧香拜佛”,“散步的好去处,但是门票太贵了。名气太大了,没办法”,“挺不错的,风景很好,换票特别方便,比现场买便宜,60~70之间的老人是半价,建议现场去买”表现了游客对三山的门票价格存在质疑(图7至图12)。

图7 总体语义网络图

图8 南京钟山语义网络图

图9 太湖语义网络图

图10 蜀冈瘦西湖语义网络图

图11 三山语义网络图

图12 云台山语义网络图

3.1.4 情感分析。通过文本进行情感分析捕捉游客情感的感情色彩。使用ROST CM 6.0的情感分析工具对江苏省国家级风景名胜区评价进行分析。

游客对于风景名胜区的情感认知是形象认知的重要组成部分。研究表明,积极情感高的游客认为旅游产品更具吸引力和独特性[22]。使用ROST CM 6.0中的情感分析工具对江苏省国家级风景名胜区进行分析。研究结果得出积极情感中南京钟山比例较高,为80.01%,其次分别为太湖、云台山、蜀冈瘦西湖、三山。在消极情感中云台山比例较高,为13.84%,其次为三山、太湖、蜀冈瘦西湖、钟山(图13,表3)。

4 结论与研讨

4.1 结论

基于驴妈妈网的游客点评数据,采用词频分析、语义网络分析、情感分析方法对现有江苏省国家级风景名胜区感知形象进行了系统的研究。整体而言,(1)核心词汇反映出游客整体认知、出游伙伴、设施服务三类。整体认知体现了游客对于景区的内心感受,大部分表达了愉悦心情,部分因分配时间多为半天、一天而导致时间紧凑无法浏览整个景区而表现的遗憾心情。表明游客游览时间为半天或一天。出游伙伴中以亲子游占多数。设施服务方面集中关注在停车、导游、门票获取方面。(2)在景点认知当中,运用长尾理论得出长尾词,了解到游客对于各个景区认知度较高的景源。总结为:南京钟山:梅花山、陵园、苜蓿园。蜀冈瘦西湖:以楼阁及花园为主的望春楼、熙春台、万花园。太湖风景区:太湖湿地公园。云台山:以寺庙为主的悟道庵、法起寺等。三山:金山的关注度显著高于其他两个景区,以寺院为主,金山寺等。(3)语义网络分析得出整体呈现“核心—边缘”结构,整体语义网络分析得出,蜀冈瘦西湖是五个国家级风景名胜区中,关注度最高的。在单个语义网络分析中,均显示了核心—过渡—边缘的层次结构。(4)情感分析得出整体游客处于积极情绪。但各个景区中,游客对南京钟山的情感在五个国家级风景名胜区当中处于最优,太湖与瘦西湖其次,云台山与三山的消极情绪较高。

图13 各景区情感分布图

表3 各景区情感比率

4.2 研论

结合相关研究,提出相应建议。(1)品牌形象塑造风景区作为城市形象的名片,各地努力通过增强景区形象带动经济发展,提升城市竞争力。然而本文中发现,游客对于各景区的形象感知不存在显著差异,即辨识度低,核心评论均是针对游览过程本身,而较少提及相关景源,具有明显的长尾效应。因此各个景区需关注长尾效应中的词汇,加强品牌建设,提升特色。(2)完善游览线路在情感分析中发现消极情绪部分来源于时间分配问题,而产生没有游览完的遗憾情绪,景区应该针对不同时间、游览群体,即家庭一日游、朋友半日游、亲子一日游等开展相应游览线路的设定,以便游客在有限的时间段游览到心仪的景色,而尽量较少负面情绪的产生。(3)增强导游质量。本文发现游客点评中“导游”词汇出现较高,部分游客反映导游服务不热情、没有责任心、讲解不到位的问题。因此景区需加强对导游的相关技能培训,安排有经验、能力强、热情的导游,提高游客的体验程度。

本文以江苏省国家级风景名胜区为研究对象,借助网络平台,获取评论数据,进行了感知形象的相关分析。然而由于样本数据为大量网络点评数据,在词库抽取以及情感词抽取部分难免出现主观意识的影响。因此未来可以通过问卷来与网络点评进行实证分析比较,来进一步提升准确性和普适性。

猜你喜欢
高频词名胜区长尾
上饶集中营名胜区
30份政府工作报告中的高频词
省级两会上的高频词
马陵山风景名胜区红色文化教育园
28份政府工作报告中的高频词
省级两会上的高频词
长尾直销产品图鉴
长尾豹马修
追踪长尾豹马修
某风景名胜区悬索吊桥检测探讨