基于社交网络数据的智慧景区客流分析与情感探测
——以黄山风景名胜区为例

2019-01-11 14:06李苗裔
中国园林 2018年12期
关键词:客流黄山景区

李苗裔

曹哲静

党安荣*

曹越皓

1 研究背景

伴随信息技术的迅速发展和景区规划管理的智慧化需求增长,智慧景区已经逐渐成为景区信息化规划与建设的主旋律[1-2]。智慧景区旨在基于物联网和遥感技术建设景区的信息和数据基础设施,并基于空间信息技术、云计算平台和大数据建立景区的精明规划、精细管理、精准服务和科学决策系统。

在理论研究方面,党安荣[2]、陈建斌[3]、张凌云[4]等从不同维度剖析了智慧景区的本质内涵并提出了总体框架。在实践应用方面,国内已经形成了智慧黄山、智慧九寨沟、智慧普陀山、智慧颐和园等较为成熟的智慧景区的总体规划、信息基础设施建设和智慧应用体系[5]。此外,不少学者,如汪侠[6]和盛方清[7],通过定性与定量结合的研究优化了智慧景区的评价指标体系。党安荣等提出了智慧景区框架中的3个平台和五大系统[2],并对时空大数据进行了类别梳理[5]。在景区旅游管理方面,基于经典理论与传统方法的旅游地理学主要通过统计数据、问卷调研、模式总结等方法对出行选择与客源地、旅游空间结构、游客行为特征等方面进行描述,并提出相应的旅游管理优化对策[8-11]。

国外也开展了基于信息技术支撑的智慧旅游实践。美国宾州POCONO山脉景区利用频射识别技术(RFID)腕带系统对各个景点进行人数统计,便于客流管理和游客路径选择;布鲁塞尔推出了基于智能手机的微电子旅游“标识都市”(Tag City)项目,鼓励市民发现城市趣味景点,进行互联网众包标注并分享。

近年来,多种新型时空大数据的出现催生了新的研究方法与解析视角,社交网络数据、POI数据、微博签到数据等网络大数据逐渐应用于智慧景区的研究:Waldhor K等使用网络点评数据分析用户对旅游景点的评价,为旅游产质量提高提出对策[12]。García-Palomares J C等利用Flickr数据识别欧洲主要旅游城市中游客与居民的行为差异,探讨2种人群在城市活动的聚集与离散关系[13]。马威等利用互联网搜索数据建立了以搜索关键词为核心的分析模型,揭示了不同客源地游客数量随时间的变化规律[14]。

图1 基于社交网络服务的景区客流研究模型

图2 黄山风景名胜区实证研究范围

以上需求的满足需要精细化的游客轨迹数据和属性数据。移动智能设备和多种网络应用的普及产生了大量的社交网络(Social Network Service,SNS)数据,具有精度高、覆盖广、更新快、信息量大等特征,提供了新的契机。一条完整的社交网络数据带有用户属性、地理位置、发布时间、使用设备和文本照片等内容,包含了对时空行为的客观描述,更体现了人们的主观情感。利用社交网络数据不仅可以弥补传统研究中数据获取方式单一、数据规模小、精度不足、反馈周期过长等问题,实时精细化地分析景区客流的时空变化特征,更能通过情感分析得出人们对景区环境的情感偏好与态度意见,形成有价值的信息反馈,进一步辅助智慧景区规划建设与管理服务。本文以黄山风景名胜区为例,构建了基于社交网络服务的景区客流研究模型;通过获取2015─2016年的新浪微博社交网络数据,针对黄山景区客流的客源地、时间特性、空间分布和情感探测进行了分析;进而提出智慧黄山景区的资源保护、业务管理、旅游服务和应急救援等四方面的建议。

2 黄山风景名胜区概况

黄山位于安徽省南部黄山市境内,是世界文化与自然遗产、世界地质公园,是国家级风景名胜区、全国文明风景旅游区、国家5A级旅游景区。山境南北长约40km,东西宽约30km,总面积1 200km2。其中黄山风景区面积160km2。资源核心保护区包括弱干扰区和干扰区。资源低强度利用区包括生态探险区、步行观光区、宿营区;资源高强度利用区包括机动车观光区、索道建设区、住宿服务区和各类交通卡口点。

黄山风景名胜区作为智慧景区的典范,于2011年制定了《智慧黄山风景区总体规划》,提出了景区信息中心和三大平台(信息获取与传输平台、数据管理与计算平台、信息共享与服务平台),并开展了无线网络建设和数据仓库建设,从而提供资源保护、业务管理、旅游服务、防灾减灾和综合决策的服务[15-16]。智慧黄山提出了基于物联网的景区基础设施建设、基于云计算和数据仓库的智慧黄山景区数据中心和共享服务平台、基于数据挖掘与知识发现的决策支持与服务系统、基于规范和共享的标准体系规范。其中智慧黄山景区决策支持系统提出了利用空间数据挖掘技术分析游客时空行为对景区环境的影响的运用,通过对游客旅行路线历史信息挖掘形成对景区旅游线路规划的反馈信息,通过对游客数量、客源地、景区购物偏好信息的分析形成指导景区旅游营销的辅助决策,通过对游客轨迹追踪形成动态旅游提示信息等多种需求[17]。

3 研究方法

3.1 基于SNS的景区客流研究模型

本文提出了基于社交网络服务的景区客流研究模型(图1),包括数据获取与管理、时空挖掘与情感探测、实践支持应用3个流程模块。

社交网络模型获取与管理模块的主要内容为从互联网开放API中获取数据,在进行检查、筛选后将目标数据按一定的格式进行存储与管理,形成社交网络数据库。时空挖据与情感探测主要通过GIS时空分析与自然语言处理等技术对空间数据、时间数据、文本数据进行时空行为建模与情感探测建模,从而获得客源地分析、时空特征分析、空间特征分析与游客情感探测等结果。实践支持应用中以支撑旅游景区的精细化管理与优化建设为目标,包括知识发现、情景预测和管理优化等内容。

3.2 社交网络数据特征分析

社交网络数据是用户在使用社交网络服务过程中储存与发布的公开数据,包括用户的基本属性与动态信息。截至2017年一季度末,新浪微博日活跃用户达1.54亿,月活跃用户3.4亿,使用移动端的用户占比达91%;其开放的社交网络数据已被广泛应用于城市功能区识别、城市规模研究等领域。本文利用新浪微博开放平台提供的位置服务动态读取接口①,获得了在特定时间段某空间点周边一定距离范围内发布的微博信息。

4 实证研究

4.1 研究范围

本文以黄山风景名胜风景区作为例进行客流分析与情感探测研究,总面积约为160.6km2,包括温泉、云谷、玉屏、北海、松谷、钓桥、浮溪、洋湖和福固9个管理区(图2)。

旅游旺季,黄山景区游客人数的大量增加给景区环境带来较大压力,相应地对交通调度、信息发布、客流管理、服务设施配套、游客安全保障、优质服务提供和环境保护提出更高要求。通过分析某一特定节假日黄山景区的客流和舆情,可以更直接反应景区在高峰期时的游客需求。

4.2 SNS数据获取

本文通过新浪微博开放平台获取了黄山市内2015年1月1日─2016年12月31日期间带有文字内容和位置信息的微博数据,共计65 536条。依据空间、时间、主题的判定,筛选出位于黄山景区内部的微博数据共计8 727条,包含了发布时间、使用设备、文字内容、照片数量、转发次数、评论次数和常住城市等23项信息;最终优化选取用户ID、常住省市、发布时间、经度、纬度和文本内容6项字段,进行游客行为时空分析与情感探测。

4.3 游客行为时空分析

4.3.1 客流的客源地分析

图3 黄山景区微博数据客源地分析

图4 黄山景区微博数据时间特性

图5 黄山景区微博数据空间分布特征

通过微博数据中的常住城市可获得游客客源地信息(图3),黄山景区主要的游客以安徽省内游客为主,其次是临近的江苏、浙江、上海等周边省市,广东、 北京、福建等省份和海外也有较多游客。客源地的分析有助于精准的旅游营销,并为配套服务业和交通管理提供重要参考依据。大多数省内游客通常以1~2日短途游为主,多采取自驾的方式,因此可根据需求打造多种的短期旅游项目、合理安排私家车停车场设施。针对外省游客可联合临近景点打造3~7日中长期多站点旅游项目,并根据海外游客比例配给多种语言的旅游导览设施。

4.3.2 客流时间特性分析

选择2016年国庆黄金周的微博数据,进行节假日高峰时期黄山景区游客流量的时间特性分析。每日微博发布数量显示(图4):国庆假期每日游客数量较为接近,其中10月2─4日为客流高峰期,10月5─7日游客数量逐渐减少。从微博的发布时间来看,假期内游客发布微博的时间特性较为明显,7:00─12:00微博发布数量逐渐增加,然后进入平稳期,19:00开始发布数量再次上升,在23:00达到日最高点,24:00后微博发布数量急速下降。可以看出黄山景区在社交网络的夜间活力甚至超过了日间活力,可能是日间人们专注登山较少发微博,也可能是部分夜间旅游项目较受欢迎,这也表明,游客对景区内过夜的住宿餐饮服务设施存在较大需求。此外,时间特性分析有助于为重点时段景区管理人力资源调度、物资分配、交通疏导等提供参考。

4.3.3 客流空间分布特征

游客在黄山景区呈现点状聚集分布(图5),主要分布在黄山风景区南大门汤口镇、黄山景区内部玉屏索道山下区域、黄山光明顶区域、翡翠谷区域4处,沿京台高速、黄山登山路径形成线型分布。这和游客使用微博的习惯有一定关系:在出发和达到的区域发布微博,而在爬山过程中较少发微博。微博数据的空间分布间接反映了客流在空间的集聚情况,有助于对热门景点的识别和客流的统计。

未来可将微博密集区与实际环境进行比对,评估景点的餐饮、休闲、零售、紧急救助设施是否满足客流要求,并通过语义分析提取典型微博文本了解游客对空间环境的意见。对于景区外围零星的微博点簇区域,同样应给予重点关注,一是进一步挖掘次热点区域的空间潜力,满足旅游服务、客流疏散、紧急救灾和资源保护的需求,防止被忽略的灰色区域;二是可将邻近的热点区域形成资源整合联动发展,优化人力物资配置。

4.4 游客情感探测

空间与环境能够影响人的情感与行为,同时人在特定空间中所表达的情感与空间环境有着很高的关联性,当数量规模较小时,这种关联性并不强,结论的偶然性大于关联性,但当数量规模增大的时候,这种关联性就愈发明显[18],当以海量数据作为研究基础时,则可以用微博语言所表达的情感作为对该空间情感评价的依据。

本研究选取玻森中文语义开放平台API②,通过深度学习算法对文本的语言逻辑和词汇特性进行分析辨别,返回非负面指数与负面指数,通过该指数的数值则可判断文本的情感倾向,以此判断游客对该空间的情感评价。将空间情感评价按照非负面指数的数值分为3类:0~0.4是负面情感,表明游客对该空间的情感评价较低;0.4~0.6是中性情感,表明该空间对游客的情绪引导、游览体验、行为活动等没有积极或者消极的影响;0.6~1则是正面情感,表明该游客对该空间的情感评价较好。

本文对景区内8 727条微博文本数据进行处理,得到每条微博的情感分值,其中情感平均值为0.66,标准差为0.32。整体上,黄山景区的情感评价以中性偏正面为主,从频数分布(图6)来看,数值为0.9~0.95的正面评价最多,同时,负面评价部分0~0.1的频数较高,整体呈极化分布。

进一步将研究范围划分为50m×50m的栅格,得到每个栅格内微博情感平均值(图7),可以看出山脚汤口镇和山顶区域的空间情感更偏向正向,而山腰区域空间情感偏向负面,可能游客爬山过程中山腰处的风景较为单调,或爬山过程较为劳累,导致负面情感在山腰区域的聚集;因此可进一步调查需求,增加山腰沿路景点的趣味性,丰富餐饮休憩设施和紧急救助设施,开辟短途登山路线和特殊人群登山设施,提供满足不同人群需求的多种路线组合。未来可进一步细化负面情绪较高的具体空间单元,通过对微博文本关键信息的提取了解引起负面情绪的环境因素,从而采取针对性措施。

4.5 黄山景区管理与服务建议

利用微博社交网络数据,可形成游客的时空行为分析和空间情感探测,并针对黄山景区的旅客信息、热点区域、旅游空间结构和景区评价进行精细化的描摹,有助于提升智慧景区的精细管理和精准服务。

1)环境影响评估与资源保护。

高峰时段景区承载力是景区资源保护的关键所在。景区出入口的卡口数据往往只能对游客总量进行控制,难以了解个体在景区内部的具体分布状态,微博社交数据可以作为精细化描摹热点区域和场所分布的参考,有助于生态敏感区的客流控制。未来可根据生态敏感区的客流实时反馈控制游客数量,如采取票务预约、动态地合理调整票价等措施。同时通过识别微博的热点区域有助于发现一些尚未开发但客流旺盛、或被开发但客流稀少的“关键区域”,有利于景区资源进一步整合与保护。

2)客流需求细分与业务管理。

不同的游客群体有不同的景区旅游体验需求,如长者需要便捷的登山通道,串联精华浓缩的重要景点,并和索道、休憩设施良好衔接;越野爱好者偏好充满野趣和挑战的登山路线,串联鲜为大众发现的自然景点,沿途需要物资的补给;教育和科研团体则需要人文与自然结合的路线设计,登山路途中不仅领略风光,更了解景区的保护与发展。此外不同年龄、性别、客源地、教育背景、观光目的的个人或团体对线路的选择均有不同的要求,微博标签的进一步划分可以辅助对游客类型进行细分,并通过语义分析挖掘其需求,从而调整旅游路线的规划设计、增加旅游基础设施、优化解说教育系统、强化安全保障措施,并对热门和冷门的景点进行搭配组合与推荐,构建时空分流机制等,实现精细业务管理。

图6 黄山景区游客微博情感评价频数分布

图7 黄山景区游客微博情感评价空间分布

3)景区旅游营销与精准服务。

以游客为导向的景区精准化服务是推行智慧景区的关键,游客的常见服务包括停车服务、票务服务、餐饮服务、住宿服务、购物服务、卫生服务、景区电子地图与解说服务、景区天气信息服务、游客反馈与社交平台服务、全域WiFi服务,以及安全监控服务等。微博社交网络数据一方面可以为各项服务的需求总量和需求类型提供依据,另一方面能有效支撑景区的自助导览功能和信息服务功能的实现:通过将地图和景点标识功能嵌入微博应用中,不同的游客可对各个景点进行评论、推荐和标注,发布景区体验感受,形成开放共享平台,并将对景区的建议反馈到官方微博平台,其他游客在出行之前便能掌握景区的天气状况、食宿服务、客流等信息。

4)景区客流控制和应急救援。

山岳型风景名胜区由于景区范围大、地形复杂、游客数量大,存在较高的管理人力成本,且一旦险情发生紧急救援存在困难。基于互联网移动设备的社交网络数据的分析运用为主动干预和精准服务提供了契机。景区的安全保障与应急救援是智慧景区建设的重要内容[2,5]。特别是高峰期和热点景区需要实行游客限量及客流控制,防止大规模游客滞留和拥挤踩踏事故的发生出现,并对自然灾害和紧急伤亡情况进行及时救助。在视频监控网络和客流监控网络的基础上,微博社交网络数据能作为补充,更为实时地反映客流分布信息,并发现潜在的灾害或事故舆情,从而辅助景区的客流疏散和紧急救助。此外,运用某一时刻的微博发布时空特征数据和文本实时分析数据,还可对下一时刻的景区人流状态进行预测,如预测未来人流大规模聚集的区域,并结合天气等自然条件分析可能存在的安全隐患,从而加大景区安防管理调度。

5 结语

本文在对智慧景区解读的基础上,以黄山风景名胜区为例,提出了社交网络数据对于智慧景区旅游管理新需求的可能性,构建了基于社交网络服务的景区游客研究框架;通过新浪微博社交网络数据,对黄山景区进行客流分析和情感探测,提出了景区智慧管理在环境影响、旅游线路规划、旅游营销与服务、客流控制与应急方面的建议。

建立以人为本智慧景区不仅在于基础设施的搭建,更在于基于游客体验的信息反馈和主观干预,进而提高景区的服务水平和综合管理水平,如何更好地将此功能模块与已有的智慧景区框架嵌合仍然需要不断探索和完善。社交网络数据也存在个人信息的隐私问题,如何规范数据使用权限,并通过官方的渠道与已有的管理平台进行对接,将是未来突破的瓶颈。景区管理的技术实现中,社交网络数据样本存在有偏性问题,由于微博用户不能涵盖所有游客,因此未来需要丰富多种其他来源的社交网络数据,与景区传统的卡口客流统计数据进行结合。景区存在WiFi信号覆盖较差的区域,部分微博是事后补发,难以反映签到地点的真实情况,需要进一步清洗与校对,同时提高景区信息基础设施的全域覆盖与共建。微博文本的语义分析往往蕴含了游客对景区丰富的意见、态度、偏好与建议信息,本文的情感指数分析仅能反映情感取向的正负,未来需要对文本信息进行精细化提取,提升文本信息的分析挖掘价值,并建立游客画像,精准了解不同属性类别游客在不同时空对观景、游憩、服务、住宿、交通、安全等各方面的需求。社交网络数据目前仍然是以历史信息反馈作为分析基础,具有一定的延时性,未来若能建立动态更新的及时反馈,将有利于景观管理部门进行多项精准服务和生态敏感区实时人流干预,实现多时态各类服务供给与需求的平衡、景区保护与开发的平衡。

注:文中图片均由作者绘制。

注释:

① 引自https://api.weibo.com/2/place/nearby.json。

② 引自http://bosonnlp.com/。

猜你喜欢
客流黄山景区
客流增多
云南发布一批公示 10家景区拟确定为国家4A级旅游景区
城市轨道交通节假日期间大客流行车组织思考与实践
黄山日落
《登江阴黄山要塞》
『摘牌』
黄山冬之恋
“摘牌”
某景区留念
基于自学习补偿的室内定位及在客流分析中的应用