旅游景点人气指数的区域差异化预测方法

2019-08-23 01:52吴旭云
沈阳大学学报(自然科学版) 2019年4期
关键词:旅游景点人气景点

龙 睿, 吴旭云

(上海师范大学 旅游学院, 上海 200233)

旅游产业是近年来发展最为迅猛的产业之一,对旅游景点不同时段的游客数量进行准确预测,既可以整合分配景区各种资源,减少人力、物力资源的浪费,又能够有效避免由于游客过多而导致景区的准备工作不足,最终给游客带来不良旅游体验的风险[1].为了将游客数量预测活动量化处理,引入了旅游景点人气指数指标,通过对该指标变化趋势的准确预测,而达到合理控制旅游景点人员流动的目的[2].旅游景点人气指数是一个动态的量化指标,基于网络大数据[3]和现代信息技术[4]采集旅游景区人数流通的相关指标,并采用特定的方法对这些指标数据进行综合评定与分类识别,最后能够相对准确地预测出一段时期内景点游客数量的变化情况,协助旅游景区管理人员事先做出计划和安排,并协调好控制游客的出行活动.传统旅游景点游客数量的预测方法,多以历史数据和数据库数据为预测基础,并未考虑到区域差异化程度与其他的影响因素,因此该种预测方法是一种静态的预测方法,与真实的结果偏差较大.BP神经网络方法[5]在数据预测的准确性上有所提升,但该方法预测的泛化能力较弱,有时会陷入局部最优,影响对旅游景点人气指数预测的准确性.而实际上不同旅游景区和临近旅游景区的区域差异化程度,对于景点人气指数会产生重要的影响,为此本文基于旅游区域差异化理论,对景点旅游人数的空间分布进行聚类分析,将各个影响因素和空间聚类结果输入极限学习方法模型,能够准确预测出未来一段时期内被研究旅游景点的人气指数,实验数据结果也验证了基于区域差异化的人气预测方法的准确性和适用性.

1 相关概念

旅游景点人气指数是指利用最新的技术手段,在对旅游景区的各类指标进行采集之后,通过一定的模型算法计算对其进行度量,并对其进行综合性和总结性的识别和评判,最终以一个较为通用的等级标准来衡量某个景区或景区中某个景点的客流量和旺盛程度,根据这一结果对旅游景区人气趋势等方面作出预测,以便给出因地制宜的发展建议.旅游景区人气指数这一概念是在旅游信息化基础之上构建起来的,是对旅游景区管理、开发、治理、游客旅游活动给出宏观指导和建议的重要指标[6].

旅游景区人气指数形成的过程:①从某个景区或景区中某个景点中选择出一批具有代表性的、能体现当地特色文化的旅游景点;②根据影响人气指数的各类因素指标对这些旅游景点进行信息的采集和整理;③根据已建立的旅游景区人气指数预测模型,再通过一定的计算机算法对结果进行测度,最终形成可发布的旅游景区人气指数[7].

影响旅游景区人气指数的因素主要有如下几个方面:①气象条件,如天气、温度、风力、能见度、光照强度等;②季节、节气;③节假日,如周末、法定假日、各类小长假等;④其他条件,旅游景区所在位置、旅游景区周边交通环境、旅游景区类型、旅游景区的特色主题活动、当前的影响力,等等.

2 旅游景点的区域差异化水平测度

2.1 信息采集

对影响景区发展的因素信息进行采集,是预测旅游景区人气指数的重要工作之一.实现这一过程的前提是旅游产业的信息化和技术化,只有满足了这一条件,才能更好地完成旅游景区人气指数信息的采集和后期的预测.为了准确地对旅游景区人气指数进行预测,首先要进行旅游景点的区域差异化水平的测度[8].根据上文已经探讨过的影响旅游景区人气指数的各项因素,进行有关于旅游景点的区域差异化信息的采集.

主要考虑从以下几个方面进行信息采集.

① 旅游景区当前的营业状态信息采集.主要包括各旅游景区门票销售情况采集、游客入园情况采集和门票减免信息的采集.这些信息能够较为直观地反映出各旅游景区的客流量和经营情况.

② 交通状况信息采集.主要包括旅游景区所在的地理位置采集、去往旅游景区的道路交通实时情况采集、旅游景区周边交通便捷度信息采集.

③ 季节因素和天气情况信息采集.主要包括季节因素信息采集、不同天气状况对景区的影响信息采集 (如,阴天、晴天、雨雪天气、雾、霾等对景区人气的影响)、能见度信息采集、旅游景区常年温度变化信息采集、旅游景区常年风力变化状况信息采集、旅游景区常年空气湿度变化状况信息采集、旅游景区紫外线强度信息采集等.

④ 旅游景区优惠活动信息采集.主要包括旅游景区固有的特色景色信息数据采集、某一特定时期旅游景区特色旅游活动信息采集、某一特定时期旅游景区优惠活动信息采集等.

通常来说,对于上述各方面的信息采集方式选择性较多.如:对旅游景区营业状态信息的采集可通过汇总各个景点的售票终端的信息而得到.对旅游景区周边交通便捷度信息的采集,可以通过多媒体呼叫中心实时传播方式得到.季节因素和天气变化情况的信息采集相对来说比较方便,由于目前气象服务的范围较广、实时性较好,因此可以通过与气象台等单位取得联系而得到[9].

2.2 过程描述

为了使区域差异化分析结果更加清晰和直观,本文先选用了多个指标进行测量和研究,这些指标包括不同区域旅游景点样本数据之间的极差x1、标准差x2、变异系数x3、集中指数x4、景点所在地区的经济发展水平x5、景点所在地经济发展速度x6.这些指标构成指标集{xn},n=1,2,3,…,6.其中极差指标为样本数据最大值与最小值之间的差值;标准差为各变量值与均值之间的离散程度,离散程度越大表明各旅游景点之间区域差异化程度越大;变异系数为标准差与样本均值之间的比值;地理集中指数揭示出旅游景点之间的空间集聚程度;旅游景点所在地的地区经济发展水平和经济发展速度也是影响区域差异化水平的重要因素.聚类分析方法是一种研究区域差异化程度的有效方法之一,按照样本数据的特征,建立多元统计分析模型.将旅游景点相关的样本指标进行整理,并通过欧式平方距离方法获得相关的系数矩阵.

(1)

其中,ci和cj分别代表旅游景点所在地区与邻近的地区,Dij为i地区和j地区之间的欧式距离,也是区域差异化的空间聚类结果,D为平方欧式距离.以研究样本指标xn之间的空间距离作为极限学习方法模型的输入项,就能够实现对旅游景点的区域差异化测度和人气指数的预测.

3人气指数预测方法研究

由于旅游景点的人气指数分布具有明显的动态性特征,明确了旅游景点之间的区域差异化程度,有助于提高对旅游景点人气指数的预测精度.旅游景点游客人数统计分布的相关历史数据信息不完备,因此在研究区域差异理论的基础上,本文构建了一种极限学习方法模型,实现对无序性人气指数分布数据的准确预测.

3.1 旅游景点人气指数样本数据的预处理

文章通过旅游景点的差异度测量,能够掌握临近景点的区域差异度水平对当地旅游景点差异度的影响,但当地景点本身的一些影响因素也会制约人气指数预测的准确性.这些影响因素主要包括景点营业状态y1、景点周围的交通状况y2、季节因素y3、天气因素y4、促销互动y5.将景点之间的差异度指标集合xi和景点内部的影响因素集合yi,进行数据汇总和预处理并测量人气指数的未知度.令zn为样本景点的集合,λik表示k个影响景点人气指数的监测值,λik的值可以通过对xi和yi指标值的综合评价得出,用矩阵形式可以表示为

(2)

经过预处理后的人气指数监测值集合λik,可以作为原始数据输入极限学习模型,并准确预测出不同的旅游景点未来一段时间的旅游人气指数的变化趋势.

3.2 旅游景点人气指数精准预测过程的实现

极限学习方法是一种针对前馈神经网络的监督型学习方法,与传统的BP神经网络预测模型不同,该方法将经过预处理后的人气指数监测值输入网络输入层之后,输入层与中间隐含层的权值系数就不再变动,因此只要事先确定好隐含层的神经元数目,就能够获取到一组唯一的最佳预测值.极限学习方法弥补了原有神经网络预测方法泛化能力弱的缺点,具有更快的学习速度和预测精度.极限学习方法也克服了传统寻优方法易陷入局部最优的不足,能够准确地预测出旅游景点未来一段时间的人气指数的变化趋势.神经元是极限预测方法模型的基本单位,其结构示意图如图1所示.

图1 极限学习方法神经元的基本结构图

某个神经元上的刺激量为其他临近神经元传递过来的刺激量的加权和,经过预处理后的旅游景点的相关信息可以作为神经元上的刺激量来考虑.极限神经元模型是一种单隐层前馈的神经网络模型,其基本结构相对于传统BP神经网络模式更为简洁,有输入层、输出层和单隐层组合而成,由于中间隐含层的神经元数目是事先确定的,因此可以根据不同神经元之间的权重比例指定刺激量的传递规则,输出层接到单隐层的刺激指示之后输出最终的旅游景点人气指数预测结果[10].假定一共有j个样本监测值集合表示为(λj,tj),其中t为监测时间变量.

(3)

如果设极限学习方法模型中一共有M个隐含节点,则此时输出的神经元Oj可以表示为

(4)

其中:g(x)为极限学习方法模型的激活函数;wi为中间层的权重比例;γi为输出层的权重比例;μi中间隐含层的神经元偏差.极限学习模型的最终目的是使对旅游景点人气指数预测值的输出误差最小,即满足下列条件:

(5)

用矩阵的形式表示模型的期望输出E=H·γ,其中E为期望输出矩阵,H为中间隐层的节点输出矩阵,γ为输出层的权重集合,那么极限学习模式中间隐层节点输出可以表示为

(7)

经式(7)求出最优的旅游景点人气指数期望输出值

(8)

(9)

其中,H+为极限学习模型中间隐含层节点输出矩阵的广义逆.中间隐层是极限学习模型中最重要的结构,也是实现对旅游景点人气指数预测的关键环节,由于隐层节点一旦确定后就不能够更正,以保持模型在预测中的准确度和泛化性能,因此在中间层节点数量的选定方面要格外慎重,如果中间隐层的节点数量选择过少,可能会无法充分地显示出全部景点样本的特征规律;如果选择的节点过多,不仅运算复杂,也很难在众多的期望中识别出最优解,影响模式的泛化处理能力.在确定最优中间隐含层节点数量时,要经过多次的尝试和训练,首先设置一个数量较小的节点数量,之后在一定的范围内逐渐尝试增加节点数量,使用相同的样本数量进行反复迭代循环,在监测过程中观测误差项的变化情况,在误差最小的情况下得到的中间隐含层节点数量即为最优的节点数量,节点数量k的确定过程如下:

(10)

图2 基于区域差异化的模型最优拓扑结构选择

旅游景点的人气指数预测过程较为复杂,会受到景点之间区域差异性因素的影响,也会受到单个景点交通情况、季节天气等因素的影响.为此,本文先基于区域差异性理论确定出景点之间相互影响的指标因素,在对景点内部的各个影响因素展开系统分析,将不同旅游景点之间的区域差异性指标因素和内部的各个预处理后的影响因素进行汇总分析,形成了监测数据集合.在人气指数预测方法上,本文选用了具有更强泛化能力和运算简洁性的极限学习方法,该方法由于在初始阶段就确定的中间隐层节点的数量,因此更适用于指标较多的海量模糊数据处理.为提高极限学习方法的预测准确性,对中间隐层的节点数量确定过程和模型的拓扑结构确定过程进行了系统优化,能够降低方法的预测成本和代价.

3.3 旅游景区人气指数的发布

旅游景区人气指数的预测和发布应该是一个连续、智能的信息采集、分析、预处理、预测和发布的过程,通常存在1~3 h的时间间隔.在旅游旺季,这个时间间隔可能会缩短一半来满足对旅游市场分析的需求.对于上文旅游景区人气指数预测模型已得到的数据,其发布渠道通常有下面几种:①利用广播电视、报纸等传统的媒体传播手段,在一个特定的时间或者特定的频道进行发布;②利用新媒体技术进行数据的实时广播;③利用多媒体数字接收设备,如移动端,游客可以根据自己的需求和意向进行查看,即时得到自己所需的旅游景区的相关信息.

4 实验结果与分析

为验证基于区域差异化的旅游景点人气指数预测方法的实际应用效果,设计了1组数据对比试验,参与对比预测的传统方法包括基于历史数据库的预测方法和BP神经网络预测方法.用于试验的样本数据来源于A自然风光旅游景区,在该旅游景区的200 km半径范围内还存在3个风格不同的景区,因此能够形成一定程度的区域差异化影响.首先确定研究对象的实验周期为2017年6月—2018年5月的12个月时间,每1个月选择3组人气指数预测值,并与真实采集的人气指数预测值进行对比,基于区域差异化的景点人气指数预测方法的预测结果,如表1所示.

从基于区域差异法的景区人气指数预测值与真实值的数据统计分布情况能够分析出,3组预测值与真实统计值的差距较小,误差能够控制在2%之内,此外统计结果表明A景区在6—10月的旅游人气指数较高,是旅游的黄金季节,临近景区影响指标因素和景点内部的各影响因素,也会对旅游人气指数的预测产生重要的影响.由于基于区域差异法的旅游景点人气指数预测方法考虑到了多种指标的共同影响,同时极限学习法还具有较强的泛化能力,因此在预测准确性方面能够获得较为满意的预测结果.为了从横向的角度对比不同的旅游景点人气指数预测方法准确性,对不同预测方法下,1 a时间内各月的旅游人数进行测度,测度结果分别如图3~图5所示.

表1 基于区域差异化的人气指数预测值与真实值对比

图3 传统基于历史数据的各月旅游人数预测结果分析

图4 基于BP神经网络方法的各月旅游人数预测结果分析

图5 基于区域差异化的各月旅游人数预测结果分析

从3组实验数据的人气指数预测浮点分布图能够分析出,基于区域差异化的景点旅游人数预测结果最为接近真实值走向,可以证明其对景点人气指数的预测效果较好;而传统基于原始数据的预测方法的偏差较大,因为旅游景区人气指数的影响因素是一个动态的变化过程,历史数据只能够作为参考项,而不能够作为预测人气指数的决定性因素;而BP神经网络方面在预测效果上优于传统方法,但优于该方法的数据泛化能力较弱,只有在个别月份的预测效果较好,长期预测不具备优势.

5 结 论

随着人民生活水平的提高和旅游产业的发展,旅游景点的开发程度越来越高,观光人数也呈现逐年攀升的态势.但是由于受到景区之间区域差异化和旅游景点内部各因素的影响,旅游景点的人气指数会随着季节和时间的变化而出现一定程度的波动,因此准确预测旅游人气的变化情况能够实现景点各种旅游资源的优化配置,降低人力成本消耗,更有利于旅游产业的发展.针对传统旅游景点人气预测方法的缺点和不足,本文从区域差异化特征出发,基于极限学习方法能够准确地预测出一段时间之内旅游景区人气指数的变化情况,预测的实际效果要优于传统预测方法.

猜你喜欢
旅游景点人气景点
贫民窟也能成旅游景点?
美人鱼
打卡名校景点——那些必去朝圣的大学景点
人气“日抛脸”
英格兰十大怪异景点
没有景点 只是生活
景点个股表现
Skin Food人气果蔬系列体
人气指数
人气指数