基于大数据的昆明主城区旅游景区社会服务评价研究

2018-08-14 02:22张颖莹
中国名城 2018年8期
关键词:翠湖词频昆明

王 贺 张颖莹

1 绪论

1.1 研究背景

昆明市作为传统旅游城市,自然人文旅游资源丰富,占全省比例较高(表1)[1],但是据旅游部门统计分析,昆明正在由传统的重要旅游目的地逐步沦为旅游中转站和过境地,来昆旅游人数有1/3属于过客,在昆停留时间平均不超过两天[2]。一方面,主城区(五华区、官渡区、盘龙区、西山区)范围内积聚了众多旅游景区,以短期旅游为主的游客时空选择距离缩短,因此主城区会成为更加重要的旅游场所;另一方面,昆明作为老牌旅游城市,相对于全国其他城市旅游收入较低。同作为西南地区的成都、重庆旅游总收入超过昆明市的一倍,贵阳旅游总收入也赶超昆明(图1)。昆明市正面临旅游收入较低、游客满意度偏低、游客滞留时间较短、旅游项目同质化、旅游项目定位不突出等问题[3]。相对于这些问题,在游客的社会评价中清晰直观的体现出来,那么从旅游者的视角出发,通过旅游景区进行客观科学的社会服务评价研究,挖掘景区旅游景观形象、游客情感印象、景观倾向等,有助于昆明市旅游规划研究和景区服务管理层面的提升。

然而主城区内旅游景区众多,同时区位环境、发展模式、景区类型存在明显的差异,用传统的调研方法进行研究,面临样本少、采集面小、时间人力成本高等困难。然而,大数据分析技术近年来发展迅速,人们行为轨迹研究、网络舆情文本分析等大数据分析方法逐渐被运用到了规划研究领域[4]。国务院大数据宏观课题组、中国城市规划设计研究院、北京城市实验室等大数据研究实验室与设计院进行展开合作,众多相关课题对城镇总规修规、城市设计、交通规划、旅游规划、历史街区的保护规划研究等提供规划依据与数据支持。

图1 2017年主要城市旅游总收入排名图

因此,从大数据的角度出发,以海量数据作为分析源,对昆明主城旅游景区社会服务评价可以得到更加直观科学的分析结论。

1.2 研究对象

由图2可知,昆明市主城景区核心分布在市中心、东北、西南片区,同时根据网络热度,选取三个片区的重点景区作为主要研究对象,具有研究典型性与代表性。翠湖公园、云南大学、金马碧鸡坊、大观公园、海埂公园、西山森林公园(国家4A级旅游景区)、云南民族村(4A级)、金殿风景区(4A级)、昆明世博园(5A级)、官渡古镇(4A级)。

1.3 数据获取与研究方法

以马蜂窝旅游网和高德地图作为数据源,对其游客网络社会评论、POIs (point of interest)兴趣点,利用node.js运行环境编写代码进行数据爬取,最后利用,词频分析软件——微图数据处理平台和Arcgis软件进行POIs空间密度分析,文本情感分析、词频(TF-IDF)分析数据分析以及图像可视化。游客社会评论数可以代表该景区的旅游吸引力,而文本情感倾向分析可以表现旅游目的的情感形象、游客满意度等,而词频分析可以直观的表现出旅游目的地的认知形象。

2 基于POIs空间分布的区位交通条件的大数据分析

在高德地图上采集昆明主城五区2848条公交车、224条景点POIs,再将POI的坐标信息导入Arcgis软件进行空间核密度分析,最后将计算结果形成数据可视化图像。

将景点POI的地理坐标信进行可视化可以发现,昆明主城区旅游景区分布重心偏西,主要分布于市中心、西南滇池片区、东北片区,形成三点一线“东北-西南”格局(图2)。

图2 昆明主城景区景点POI分布图

公交站点密集的程度可以表现该区域的公共交通的便捷程度。将研究景区与公交站点核密度图进行地理叠加,发现市中心旅游片区公交站点最为密集,西南滇池风景区一带和西北金殿风景区一带公交站点较为稀疏(图3)。由于昆明南部和北部客运站承载了主要的陆运交通,西部客运站由于面积过窄,承载力有限。地铁1、2号线贯通南北,而东西走向的地铁3号线于2017年8月开通,历史载客数量有限。从数据分析可以看出,昆明的主要交通重心偏东,贯通南北走向(图4)。由此可知,公共交通对于景区交通来说便捷度较低,旅游交通需求与实际交通存在明显的结构缺陷,不相匹配。

表1 昆明市旅游资源类型结构及比重[3]表

图3 昆明主城公交站点POI核密度图

图4 交通与研究景区地理位置关系图

3 基于情感分析技术的昆明主城景区旅游社会服务评价大数据分析

文本情感分析(text sentiment analysis),又称为倾向性分析、意见挖掘等,主要是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程[5]。情感倾向值是基于以NPL自然语言处理系统,基于海量的数据人工智能运算,算出每一条评价的正负面性以及情感倾向:0.5分为中性评价,分数越高,情感倾向越为积极,反之,情感倾向越为负面。

3.1 旅游片区的评论数量与倾向分析

评论数最多的为市中心片区,其次为西南滇池片区,西北片区较为落后,整体综合分和好评率最高的是市中心片区,其次为西北区(表2)。造成片区之间的游客到访度、好感度、旅游吸引力差异极大的原因主要是由旅游景观元素、交通因素、服务设施、旅游者旅游行为和情感偏好因素多方面影响的,由交通大数据分析对比可知,交通便捷度与景区游客到访量呈正相关性。

3.2 典型景区的评论数量与倾向分析

从单个的旅游景观元素来分析(表3),翠湖公园评论数最多,游客到访度最高、人气最高,其次是海埂公园,云南大学位居第三。但是从世博园往后,评论人数明显大幅减少,金殿风景区评论数据与翠湖公园相差13倍,表明昆明主城区域内旅游景点旅游者分布空间极为不均衡,游客行为空间活动主要分布在市中心和西山滇池一带。国家的景区级别评价标准并未对旅游者对其的社会服务评价产生影响,两者无正相关性。

以人文景观著称的云南大学好评率最高,虽然不是传统意义上的旅游景区,但是却具有较大的旅游吸引力和较高的社会评价。作为市民公园的翠湖公园,游客到访量在主城景区中最高,好评率也居上,不仅吸引了外地旅游者,大批本地游客也是到访主力军。除去交通因素影响,通过翠湖和云南大学的旅游景观社会评价可以发现游客更加注重旅游体验、景观环境,偏爱人文景观、市民休闲文化景观。西山森林公园评论数较低,吸引力不足,但是评价满意度较高,超过同区位的海埂公园游客好评率,与大观公园持平。金殿风景区具有同样的森林公园性质,虽然评论数较低,游客到访数较少,可达性较弱,但是好评率居于第三,这表明自然森林景观对游客体验感较好。

但是在传统旅游景区中,社会评价却不太理想。民族村作为具有浓郁的民族特色旅游景区,评论数1500多条,说明虽然民族特色文化景观对于游客吸引力较大,但是游览观光后,游客对于民族村社会评价较低。世博园作为5A级景区,2000年初,带动了昆明旅游业发展,发挥了巨大的景观与社会效益,但是如今社会评价排名倒数第二。金马碧鸡坊作为昆明地标性建筑,游客满意度最低。

表2 旅游片区评论与情感倾向表

表3 景区评论与情感倾向表

由此可见昆明市主城区传统景区缺乏核心吸引力,自然森林景观由于交通因素,游客可达性较弱,但是游客好感度较高,同时,人文景观和休闲文化成为了当今旅游景区不可或缺的旅游景观内涵。

4 基于词频分析技术的昆明主城景区社会服务评价的大数据分析

词频(TF-IDF)分析是一种用于情报检索与文本挖掘的常用加权技术[6]。对研究景区相关的13839条评论,进行查重和拟合,例如“红嘴鸥”拟合成“海鸥”,“云大”拟合成“云南大学”等,然后进行词频分析和图像可视化(图5)。词频分析主要有两个分析指标——词频(TF)和权重(Score),①②最后得出词频较高的且权重大的核心关键词。

图5 景区综合词频权重图

4.1 综合词频权重分析

对文本进行综合词频分析,可知旅游景区整体形象、景区核心竞争力等。

综合所有景区的社会评价(图5),核心关键词为:海鸥、滇池、门票、建筑、特色、少数民族、西山、景色、漂亮、冬天、校园等。“海鸥”共被提到了3876次,接近总评论数的1/4,其次是门票,1239次。建筑和特色紧随其后1177次,再次是滇池。关于气候的词汇——冬天出现频率较高。由此发现,昆明四季气候宜人,虽然7-8月是传统云南旅游旺季,但是昆明冬季景观元素突出,游客景观评价较高,旅游特色鲜明,具有不小的旅游吸引力。

翠湖公园的综合关键词为“海鸥”“荷花”“陆军”“大学”“冬天”“滇池”“西伯利亚”“陆军讲武堂”“面包”“市区”“休闲”等。翠湖公园是位于市中心的市民公园,每年11月至次年3月,都是来自西伯利亚红嘴鸥到昆明度冬。陆军讲武堂和云南大学紧邻公园,所以这三者景区不仅从空间上联系密切,在游客印象中也紧密不分。从海鸥和荷花可以看出翠湖公园呈现出季节差异化的旅游景观,反应出翠湖公园最受游客喜爱的行为活动是“冬季观鸥、夏季观荷”。

云南大学的综合关键词为“翠湖”“银杏”“建筑”“历史”“漂亮”“松鼠”“气息”“文化”“民国”“古朴”等。银杏最佳观赏季节为秋冬季节,正好与翠湖观鸥季节重合。云南大学与翠湖公园在游客感知中呈现出的是一种密不可分的内聚性。

金马碧鸡坊的综合关键词为,“市中心”、“地标”、“步行街”、“商业街”、“广场”、“繁华”、“标志性”、“特色”、“逛逛”等。金马碧鸡坊位于市中心的金碧广场上,对面就是南屏繁华热闹的步行街,是属于昆明地标性建筑。分析结果直观的表明了金马碧鸡坊在昆明旅游中处于重要地位,但是根据上述游客评价分数,游客情感倾向较差。

海埂公园的综合关键词为“海鸥”、“西山”“门票”“民族村”“缆车”“污染”“缆车”“湖水”“冬天”等。海埂公园与西山隔湖相望,与民族村相邻,做索道缆车可以到达西山。海埂公园与翠湖公园具有相似游客行为——冬季观鸥,这两者之间存在潜在的竞争关系。对“污染”一词,进行评论查阅后发现,主要是从16年之前的出现较多,而17年之后的游客评论对“污染”提到的相对较少,大多数游客在感叹滇池壮观的同时,对于“滇池污染”保持的是惋惜态度,说明游客对于滇池水质有较高的容忍度。

大观公园的综合关键词为“大观楼”“游乐园”“海鸥”“对联”“荷花”位于昆明市以西的滇池湖畔,始建于明朝洪武元年(公元1368年)。清康熙三十五年(公元1696年)建大观楼,公园也因此而得名。大观楼最有名的是“大观楼长联”为清朝名士孙髯翁所著,共180字,把滇池风光和云南数千年历史生动地展示在世人面前,被誉为“海内第一联”。“海鸥”和“荷花”表明了大观公园在景观元素与翠湖公园具有相似性,然而大观公园内包含一个游乐园,又与翠湖公园有着直接的差异性。

金殿风景区社会评价的综合关键词为“吴三桂”“陈圆圆” “历史”“世博园“美不胜收”“铜殿”“茶花”“杜鹃花”“门票”等。金殿名胜区位于昆明北郊,因大殿用黄铜铸成,阳光照耀下,光芒四射,映得翠谷幽林金光灿烂,故而得名金殿。金殿属于道教太和宫的一部分,创建于明万历三十年(1602年),康熙十年(公元1671年)平西王吴三桂重新修葺,也成为了吴三桂故居,历史十分悠久。吴三桂和陈圆圆的故事是游客的社会评价中提到最多的词汇,旅游者对景区历史故事表现出了浓厚的兴趣。铜殿和茶花是金殿风景区比较突出的人文景观元素和自然景观元素。

4.2 不同词性的词频权重分析

将文本数据进行划分词性分析,对形容词进行词频分析,可知游客在景区旅游的空间感受,以及对景区的情感认知形象等。对动词进行词频分析,可知游客在景区的旅游空间行为,对名词进行词频分析,可知游客对于景区最直观的旅游认知物质形象,以及景区核心景观元素等。

4.2.1 形容词词频权重分析

对权重词频率靠前的形容词(表4)进行差异化对比分析。翠湖公园壮观、热闹、悠闲、惬意和可爱,给游客营造出一种热闹、惬意的景观氛围。对于海埂公园游客感知到的是“壮观”“失望”“不干净”和“最大”,滇池虽然具有波澜壮阔的景观,但是水质污染依然是带给游客不好的旅游体验核心的要素之一。云南大学更为突出的是一种古朴、安静、悠久、幽静的景观特质。民族村较为突出的词汇并不多,其中包括“不同”“不便宜”“热闹”等,说明民族村给游客留下的印象比较平庸,也留下了旅游消费不便宜的负面影响。相比,西山森林公园的结果就较为积极,除了一般性正面评价,带给游客的感受有“壮观”“非常好”“有意思”“秀丽”等,游客感知度较为新颖。官渡古镇同样给游客来了差异化的体验,“热闹”“悠久”“著名”“好吃”“便宜”“丰富”“深厚”等,给游客的印象是官渡古镇是一座历史悠久、热闹丰富、底蕴深厚的旅游景区,但是游客评分较低,存在一定的印象偏差,过度商业化是带给游客负面评价主要的问题之一。

表4 景区前15个形容词关键词表

表5 景区前15个动词关键词表

4.2.2 动词词频权重分析

翠湖公园比较突出的词汇是“散步”“跳舞”“唱歌”“喂食”等,游客旅游行为是喂食、散步、跳舞、唱歌等,表明翠湖游客行为丰富多元。云南大学为“绿化”“绿树成荫”“漫步”,表现出云南大学生态友好,绿化环境丰富,其景观气质,最具特点的词汇是“漫步”。翠湖公园和海埂大坝给出的关键词是“散步”,同样都是行走行为,游客却明显给出不同的语言词汇。“漫步”是指悠闲地散漫的随意走,“散步”是指为了锻炼或娱乐而随便走动徘徊,漫步偏向于闲适的心境,散步偏向于放松的状态[7]。所以云南大学比起其他景点更能给游客一种散漫、闲适的情感认知体验。

民族村更多的是“表演”“展示”“体验”等词汇,游客来这里的大部分活动是观看民族表演,体验民族生活等,游客行为较其他景区具有独一性。世博园主要是跟展览相关的词汇,“博览”“举办”和“展览”,虽然这些游客行为跟民族村同样具有独一性,但是也表明游客行为也相对单调。西山森林公园的游客行为主要是登山、远眺,讲解一词也高频率出现的原因是公园会提供游客景点讲解器,会精准的定位游客所处景点位置并同时进行录音讲解。金马碧鸡坊的游客行为主要是“购物”,但是“路过”表明游客到访驱动力较弱。西山森林公园和金殿风景区游客行为相似,都是“爬山”和“远眺”,也都为道教圣地,二者呈现出相似的竞争关系。西山森林公园的评价数量却为金殿的三倍,这是由于整体西北片区的旅游吸引力偏弱造成的。

4.2.3 名词词频权重分析

名词关键词清晰而又直观展现了景区的突出特色的景观元素和旅游目的地认知形象(表6)。翠湖的名词关键词:海鸥、荷花、老人、季节、城市、市民,这些元素共同组成了翠湖公园的和旅游景观气质,海鸥便成了翠湖的旅游认知形象。云南大学有校园、建筑、历史、翠湖、银杏、气息、文化、学生、民国,建筑作为云南大学的最主要的旅游载体,这些词组成了云南大学的旅游景观气质。官渡古镇的旅游形象更为贴切是它的特色小吃——官渡粑粑。园艺和植物成了世博园的典型代表词,金殿的历史故事和茶花是核心的景观元素。

表6 景区前15个名词关键词表

5 对昆明主城旅游景区的规划与景区管理建议

对于POI兴趣点的空间核密度分析,可以清晰而直观的反应出影响昆明主城旅游景区的社会服务评价的外部因素和交通区位条件。而影响社会评价的内部核心因素,主要是旅游者对于景区本身的景观元素、服务设施、旅游内在需求等。同时,又从社会服务评价中直观的体现出来。

昆明公共交通结构与旅游交通存在空间上不相吻合的情况,从而影响了游客的可达性,应当加强“东北—市中心—西南”走向的公共交通粘合度。

在针对整个昆明主城区的来说,昆明主城区的旅游景观形象主要的是由“海鸥”“滇池”和“翠湖”构成,同时重视冬季的旅游景观元素,发展冬季度假休闲旅游,形成冬夏两季旅游差异化。

游客情感偏好主要是充满生活气息的人文景观和风景秀丽的自然景观,西山森林公园和金殿风景区属于自然景观旅游“价值洼地”,将会更大发展空间。游客对于旅游产品的丰富程度要求较高,景区旅游产品单一化是游客最不能接受的问题,其次是过度商业化。根据游客评论的词频分析,发现也存在在不同类型的景区之间存在同质化问题,旅游产品重合度较高。对于传统封闭式旅游景区,游客好感度较低,应当丰富旅游产品,优化游客消费结构,同时避免过度商业化,改善服务和提升旅游景观品质。

注释:

①TF指标,是指一个词在文章中出现次数,出现的次数越多,一般越重要。

②Score权重指标,是指一个词在文章中重要性,主要由TF词频,IDF倒转文档频率,和Other三个指标决定。IDF——“倒转文档频率”,表示词的区分能力,区分能力越差的词其主题代表性越弱,比如各种常用词如“如果”,“我”“因为”等;Other,词在文章中与其他词的语义聚合程度等。

猜你喜欢
翠湖词频昆明
岳池翠湖
翠湖心影
雪中昆明 一梦千年
基于词频分析法的社区公园归属感营建要素研究
昆明美
쿤밍(昆明)에 로봇이근무하는 주차장 등장
我在翠湖等你
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索
以关键词词频法透视《大学图书馆学报》学术研究特色