旅游在线搜索与客流波动的动态关联研究

2021-12-15 06:22刘培学朱知沛张捷张晓婉曾湛荆
旅游学刊 2021年11期
关键词:中山陵GARCH模型波动

刘培学 朱知沛 张捷 张晓婉 曾湛荆

[摘    要]波动是旅游流的重要特征和研究重点,为探索日际时间尺度下景区客流与在线信息流的波动差异和关联性,文章利用手机大数据长期监测的南京钟山景区游客量与两种客户端搜索量的3种旅游流数据,使用GARCH族方法测算不同旅游流的年内波动性,采用时差相关系数法和滚动相关系数的协动性分析和交叉相关分析方法研究了旅游流之间的整体和动态相关性,并基于VAR的脉冲响应函数研究了游前搜索对景区客流的冲击效应。分析结果表明:在日际尺度的波动上,电脑客户端(PC端)上的旅游景区搜索量序列较为平稳,移动客户端的搜索量与游客量序列具有尖峰厚尾分布和波动丛集性特征;景区客流量和移动搜索量波动均不具有长记忆性,移动搜索指数的高波动影响略长于客流量,两种波动的假日经济现象明显,均具有正向非对称性,节假日冲击促进短时集中出游,但不会带来长期客流或搜索量的显著增长;旅游搜索与客流波动在不同滞后/领先时差上具有交叉相关性,PC端搜索的波动冲击会引起游客量在滯后5期达到响应峰值,响应时序动态与移动端相反;法定节假和高温等季节性因素会引起搜索与客流相关程度在年内的动态变化。

[关键词]旅游流;百度指数;波动;GARCH模型;中山陵

[中图分类号]F59

[文献标识码]A

[文章编号]1002-5006(2021)11-0095-12

Doi: 10.19765/j.cnki.1002-5006.2021.11.012

引言

旅游流是游客及其相关和伴生的信息流、资本流等在空间区域内的迁移现象[1]。对旅游流变化规律的深入分析,有助于揭示旅游系统内部各要素间相互作用的关系。波动性是旅游业最为显著的特征之一,各种旅游信息流和客流在不同时间尺度呈现不同的波动状态并相互影响[2-3]。旅游需求波动的测量与分析是旅游需求研究的一个重要方面[3]。国内大众旅游愈加普及,黄金周、寒暑假等节假日造成的短期、集中、高强度的出行对旅游目的地生态和服务系统形成了巨大的波动冲击。而学界对目的地的季节性关注较多[4-5],对波动性的关注较少,且集中于国家层面、月度尺度的入境客流波动,对国内游客在中小尺度目的地和细粒度时间内的波动特征还不太明确。

信息空间与现实物理空间的相关关系受到学界的长期关注,旅游活动具有异地性特征,潜在游客对旅游景区信息的掌握不充分,搜寻和关注旅游景区相关资讯是其出游前重要的准备活动,而通过网络搜索引擎获取信息来辅助决策往往是最主要方式[6-8]。旅游相关的搜索研究逐渐丰富,成为大数据研究中的一大类型,国外在旅游信息搜索(travel information search,TIS)范畴内展开讨论[9],国内较为偏重其作为“网络关注度”的价值[10]。现有研究除了分析旅游搜索关注的空间分布特征外[11],主要集中于探究旅游网站访问量或网络搜索量指数(search volume index,SVI)在时间维度上与旅游客流的关系,即网络信息流的前兆效应[12-15]及耦合关系[16],进而作为一些社会经济和旅游问题的预测指标[17]。王硕等对比庐山、华山和八达岭长城风景名胜区,分析黄金周景区客流量与网络关注度的变化规律及两者相关性,总结其网络前兆期为4天[18]。马丽君等分析了国内游客量与游客网络关注度受气候舒适度因素的影响及两者的相关性[19]。研究还发现,搜索引擎数据可以呈现不同酒店品牌在信息空间中的竞争格局[20],旅游经营主体可以通过搜索引擎优化提高在线关注度和口碑[21]。

智能手机的普及和手机网民人数的增加,带来搜索用户逐渐由个人电脑端(PC端)向移动端转移,移动搜索变得日益重要和普遍,百度和Google的移动端搜索量已然超越其PC端,调查显示,手机搜索用户数为6.54亿,使用率高达80.0%,在各类手机应用使用率中排名第二(中国互联网络信息中心《中国互联网络发展状况统计报告》,2018年)。在近年的移动互联网高速发展中,感知移动性、场景性和低转移成本促使了大量的用户从PC搜索到手机搜索转移。不同的潜在游客人群的搜索行为各不相同,在决定采用何种搜索方式时会综合考虑时间、位置、需求等具体的情境要素,在复杂事件处理时,PC搜索的使用率高于手机移动搜索[22]。学者们已然注意到不同搜索引擎[23]或客户端[10]搜索量对游客流的预测效果有所不同,移动平台相对于传统平台的使用行为偏好的差异,带来的信息流波动与目的地客流波动特征差异和关联程度变化亟待研究[24]。

旅游需求分析的准确性和时效性对于旅游管理部门和企业都至关重要,但学界对旅游流波动性的研究以低频长期的指标描述为主,对高频波动的量化研究较少。居民节假日期间的出游热潮和前后的剧烈波动,在日际尺度的分析更有价值。城市及景区的游客流量波动在日际尺度下具有明显的“节日效应”以及由重大事件产生的“刹车效应”[25-26],对旅游监管部门的应急能力提出更高要求,而这部分研究受数据获得性的限制也更高。借助于细粒度的手机漫游数据,王茜雅等分析了不同节假日对南京客源市场格局的差异影响[27]。

识别时间序列数据的波动特性的方法上,时间序列法和计量经济学法是较为有效的旅游客流研究方法,在变异系数和基尼系数等描述性统计方法外,随机波动模型、广义自回归条件异方差(generalized autoregressive conditional heteroskedasticity,GARCH)系列方法及其组合方法已被广泛应用于旅游研究中,对旅游需求的波动性进行建模。学者还往往选择使用非线性的Hodrick-Prescott滤波[28]、经验模态分解方法(empirical mode decomposition,EMD)和小波分析[29]分解目的地的客流波动的趋势和季节性特征。内容上主要关注时间序列的整体特征,研究视野较狭窄地聚集在入境客流群体,而且大都以月为时间尺度,较金融领域的日际、小时尺度高波动性的广泛研究存在一定差距[30]。学界开始对旅游流中存在的多时间尺度波动和高频波动特征的研究开始了探索,对黄山风景区[25]、林芝地区[26]客流进行多尺度波动提取,而Baggio和Sainaghi从复杂性理论视角研究了意大利米兰23家酒店客房入住率和价格波动的长期记忆性和标度高稳定性[31]。

通过文献梳理还可以发现,现有研究对物质流、信息流与客流的动态关联的关注不足,游前行为与实际出游之间长期缺乏基于详尽数据的动态关联性研究,这些限制在大数据时代通过获取大量的旅游数字足迹得到改善[32]。本文基于手机漫游定位大数据获取的南京市钟山风景区2017年日际接待长三角地区客流量数据,研究公共节假日等事件对景区中短距离市场日际旅游流波动的冲击效应,对比相应客源市场不同客户端搜索指数的波动特征,分析潜在游客需求波动及搜索行为差异,进一步地对旅游客流与信息流之间的协动性和动态关联特征进行分析。

1 研究数据获取

南京市钟山风景名胜区位于南京东北郊紫金山,享有江南四大名山的美誉,是中国四十佳旅游胜地之一,景区以中山陵园为中心,包含各类名胜古迹200多处,如明孝陵景区、中山陵景区、头陀岭景区、灵谷景区和钟山植物园、紫金山天文台等。钟山风景区在长三角游客中有较高知名度,客流量大,波动明显,节假日拥挤风险一直较高,而且兼具自然和人文旅游资源,可以避免单一旅游资源的网络关注度受到季节因素限制而导致网络搜索数据缺失或过于集中于某些月份的情况,因此,选择钟山风景区作为本研究的案例地。微博签到数据[33]、地理标记照片数据[34-35]在研究景区客流时间特征中已被广泛应用,但数据的代表性和有偏性问题有待商榷[36]。因而,笔者选择具有海量、及时和覆盖度广等优势的手机信令监测数据[37],使用江苏移动公司与南京文化和旅游局合作的大数据监测平台提供的旅游客流数据[38],平台根据漫游信息和常驻地属性,统计停留在景区范围基站地理围栏内的非本城市用户。相关手机信令研究中信令间隔规则以0.5~1小时为主[39],在平台建设初期与常规统计手段匹配校对后,综合判定景区内信令间隔停留超过30分钟的游客记为1人次较为合适。

远距离游客在搜索行为上与近距离游客存在时间差异[40],而外来游客在南京的搜索无法剔除,为减少这些干扰因素,研究客源区域限定为可以当天内到达和游览钟山景区的长三角地区(包含江苏省、安徽省、浙江省和上海市),并去除其中的本市居民(通过手机定位判断常驻地),取每日到访钟山景区的游客量。本文主要研究旅游流的年内每日波动特征,故选择手机监测平台稳定运行一段时期后的2017年全年。

百度是最大的中文搜索引擎,百度指数以网民在百度的搜索量为数据基础,以关键词为统计对象,分析并计算出各个关键词在百度网页搜索中搜索频次的加权和[11]。通过百度指数平台(www.index.baidu.com)可快速准确地获取客源地每天的目的地关注程度,与实际旅游客流方便对应关联。本文参考相关文献研究[15,41],根据景区名称、主要景点和其他旅游要素初步确定备选关键词,并根据用户在出游前同时搜索4~9个关键词的习惯[8],借助关键词挖掘工具(https://ci.aizhan.com/)选取搜索量排名前6的“南京中山陵”“中山陵门票”“明孝陵”“中山陵”“灵谷寺”“梅花山”等关键词组成搜索指数。与实际游客量数据相对应,分别收集了6个关键词在长三角地區移动搜索和PC搜索不同平台来源(根据用户设备类型确定平台,根据设备IP地址确定搜索来源地)的2017年每日百度指数,并去除同期来自南京本地的搜索,将6个关键词的不同客户端百度指数分别按日期相加,得到综合反映其网络搜索整体情况的两类搜索指数。

数据显示,样本期内钟山风景区共接待除南京本地外的长三角地区游客859.9万人次,平均每日接待23559人次,长三角地区作为主要客源地占景区接待外地游客量的61.1%。来自长三角客源地的日均搜索指数达到2481,以移动端搜索为主,游客量和移动搜索指数受节假日和季节影响而波动显著,而PC端搜索变化较为平稳(图1)。

2 研究方法

2.1 波动性分析方法

传统波动性的度量方法都假设样本的方差是固定的,然而伴随经济理论和实证检验的发展,逐渐有学者开始证实许多时间序列数据的方差并不是恒定的,而是会随时间而发生变化,即异方差性。在自回归条件异方差(autoregressive conditional heteroskedasticity,ARCH)模型基础上,学界还提出了广义自回归条件异方差(GARCH)及多个衍生模型[42]。

本研究对景区客流时间序列是否存在条件异方差进行检验,并基于旅游时间序列数据波动的稳定性和收敛性问题,采用GARCH和指数GARCH(exponential GARCH,EGARCH)模型[43],分析信息流和客流时间序列波动的特点。一般GARCH模型是GARCH(1,1)模型,其均值方程和条件方差方程,分别为:

[yt=xtyt-i+ut] (1)

[σ2t=ω+αu2t-1+βσ2t-1] (2)

其中,[xt]为1×(k+1)维解释变量向量,[k=1,][2,…,T],[ut]是误差项,[σ2t]是[ut]的条件方差,w为波动方程的均值。式(2)为条件方差方程,表示在时刻t,条件方差可依赖于t-1时的随机误差项的平方[u2t-1](ARCH项)和上一期方差的预测值[σ2t-1](GARCH项)。将GARCH(1,1)模型扩展到GARCH(p,q)模型,其条件方差方程为:

[σ2t=ω+i=1pαiu2t-i+j=1qβjσ2t-j] (3)

式(3)中,p是ARCH项的自相关阶数,q是GARCH项的滑动阶数,要求:ω>0,α≥0,β≥0,α+β<1,1≤i≤p,1≤j≤q。

冲击的不均衡性也是研究的重点[44],主要是分析积极和消极事件冲击的不对称性,或者如果一般模型不能满足两个平稳条件(即ARCH和GARCH参数均大于零,且ARCH和GARCH参数之和小于1),EGARCH可以成为另一种对波动率进行建模的方法。EGARCH(p,q)模型为:

[ln(σ2t)=ω+i=1pαiut-iσt-i+i=1pγiut-iσt-i+j=1qβjln(σ2t-j)](4)

若[γi]不等于0,則时间序列波动具有非对称性,即好消息和坏消息对波动的影响程度是不同的;αi表示规模效应,表明波动性的大小随冲击的方向(正向或负向旅游需求冲击)而增大;βj表示波动持久性的程度。

判断滞后期通常有3种方法:LR似然比(likelihood ratio)统计量、AIC信息准则(Akaike information criterion)和SC施瓦兹准则(Schwarz criterion)。大部分研究中,时间序列很难满足LR统计量所要求的随机误差正态分布状态,常用AIC或SC值最小准则选择滞后期。

2.2 协动性分析方法

协动性是用来测量两种序列在波动方向一致性和相互联系紧密性的特征,表达各变量间同涨同落,具有共同波动趋势。两两之间波动的Pearson相关系数显示了协动性特征。当相关系数为正值且数值较大时,说明两序列的波动方向一致,并且相互联系紧密,即可以定量确证两种序列间的波动具有较强的协动性。由同期相关系数衡量的是旅游需求线上与线下波动的同步程度,而协动性是比同步性内涵更宽泛的概念,线上线下传导往往存在时滞,因而本研究主要采用交叉相关(cross correlation)方法分析不同时滞的相关系数衡量景区客流与搜索流之间的协动性水平[45]。为了更好地分析3种序列之间的波动冲击的时间滞后关系,本研究通过建立游客量与不同平台的搜索指数的VAR(vectro autoregression)向量自回归模型,利用脉冲响应函数(impulse response function)分析在线搜索对旅游流的动态影响,即将到访游客量作为因变量时,来自搜索指数一个标准差的随机扰动所产生的影响,得到脉冲响应函数图、客流响应峰值和对应期数。脉冲响应函数是基于VAR模型分析变量间动态影响关系的工具。由于VAR模型中的系数只能反应局部的动态关系,无法通过分析系数估计值来评价VAR模型回归结果,利用脉冲响应函数可以了解研究中各变量间动态影响的关系。

进一步地,使用滚动相关系数考察协动性随时间推移的动态演化情况,对于样本观测区间为[{1,2,…,N}]的序列{xt}和{yt},在滚动窗口长度为m时,在T时刻两个序列x和y的滚动相关系数为

[ρx,y,T=covxt,ytvar(xt)var(yt)] (5)

式(5)中,[var(xt)]为m期内xt的方差,[t=T-g+1,][T-g+2,…,T],而T=g,g+1,…,N。

3 旅游信息流与客流波动特征

3.1 时间序列基本统计特征

首先要对时间序列的统计特征进行分析,以便了解研究样本的基本统计特征及规律,一般包括数据的均值、标准差、中位数、峰度、偏度等。游客量和搜索指数的基本统计量如表1所示,游客量和移动搜索指数偏度(skewness)分别为3.966和2.715,游客量序列呈明显左偏性,峰度(kurtosis)分别为27.374和11.662,远大于3,序列显著异于正态分布,具有典型的“尖峰(leptokurtic)厚尾(thick-tailed)”特征,即均值附近与尾区的概率值比正态分布大,而其余区域的概率比正态分布小;同时,J-B统计量为在0.05的水平下显著,拒绝原假设,两时间序列不服从正态分布。而PC搜索指数则为正态分布,波动较为平稳,峰值不明显。

然后,对3种序列使用单位根检验(ADF)进行平稳性检验,得到的结果如表2所示。结果显示,t统计量在0.01的水平下显著小于临界值,序列存在单位根的零假设不成立,即3种时间序列均是平稳序列。然后,进行ARCH-LM检验,以各序列及其一阶滞后项分别建立OLS回归方程,然后用得到的残差进行ARCH-LM检验(滞后期lag=7),发现F和LM统计量(T×R?)对应的P值小于0.05,故拒绝原假设,该时间序列存在明显的ARCH效应,适合采用GARCH模型对客流与移动搜索序列波动进行 拟合。

3.2 旅游流波动记忆性的GARCH模型分析

3.2.1    客流波动的GARCH模型

GARCH波动模型需要建立两个方程:一个均值方程和一个方差方程。根据序列滞后15项的自相关图确定序列具有较高的自相关性和偏相关性(partial correlation,PAC),客流和移动搜索指数序列滞后1期的PAC分别为0.682和0.847,因而以当期客流或移动搜索与前值的线性回归为均值方程AR(1)式(6)和式(8)[43]。GARCH(p,q)中p与q的确定原则为在各项拟合显著(各项的概率小于0.05)的基础上,且SC值最小与R2较高[44],并对残差进行ARCH-LM检验确认,GARCH(2,1)模型比GARCH(1,1)模型更好地消除了游客量序列的异方差性 (表3),拟合效果更好的式(7)表明,客流波动具有显著的异方差效应,波动丛集性(volatility clustering)明显,即幅度较大的变化相对集中在某些时段里。

[TOURt=14930.438+0.751TOURt-1+μt                 (12.594)        (19.287)  ] (6)

[σ2t=1.330E+08+0.316u2t-1+0.632σ2t-1-0.354σ2t-2         (14.357)                       (11.530)       (26.683)     (-14.229)](7)

根据式(7),[μt]为扰动项,[σ2t]为[μt]的条件方差。系数α与β的和为0.584,即GARCH(2,1)模型中ARCH项和GARCH项系数之和远小于1,说明景区日际客流的波动不具有长记忆性,节假日冲击对后期预测关联性一般。而且,滞后1期的信息加大波动的效果(b1)超过了滞后2期减少波动的效果(b2)。

3.2.2    移动搜索指数的GARCH模型

类似地,对移动搜索指数波动建立GARCH模型,按照SC最小的规则确定p与q(表3),选取GARCH(1,1)模型即可在0.05水平下各项拟合显著,且残差序列不再存在ARCH效应,拟合结果为以下两个方程。

[MOSt=361.033+0.791MOSt-1+μt                   (5.317)          (21.846)  ] (8)

[σ2m(t)=28461.26+0.498u2m(t-1)+0.157σ2m(t-1)              (10.017)                 (7.888)            (2.379)] (9)

根据式(9)显示,GARCH项系数为0.157,远小于1,说明当期的条件方差较少的取决于其自身的滞后项。系数α与β之和为0.655,移动搜索指数的波动同样不具有长记忆性,对比可见,移动搜索指数的高波动影响期略长于客流量。

3.3 旅游流波动非对称性的EGARCH模型分析

为了考察两种旅游流序列是否存在非对称性,即利空消息对需求造成的下降影响是否和利好消息的带动影响一致,采用了EGARCH模型[3]。同样根据各项拟合显著且SC最小等原则,分别为游客量序列和移动搜索指数序列确定了EGARCH(1,2)和EGARCH(1,1)模型,拟合结果为式(10)和式(11)。

[lnσ2t=1.674-0.112ut-1σt-1+0.571ut-1σt-1+            (6.349)      (-5.922)          (23.821)             1.157ln(σ2t-1)-0.238ln(σ2t-2)                (420.879)            (-18.322)] (10)

[lnσ2m(t)=1.249-0.094um(t-1)σm(t-1)+               (3.867)      (-4.943)               0.408um(t-1)σm(t-1)+0.889ln(σ2m(t-1))                   (18.628)              (31.109)] (11)

结果显示,在无明显危机影响的情况下,旅游流波动主要受节假日催化的正向冲击影响,这与金融领域常见的负面冲击“杠杆效应”不同。客流的负向波动主要受節前抑制作用和淡季影响,并不明显,客流量波动的非对称性系数γt=0.571,而移动搜索指数的系数γm=0.408,显示出客流量的非对称性更强。参数bt和bm分别为1.157和0.889,表明两种序列都是波动集中出现的,而且客流波动的丛集性稍强于移动搜索波动。

4 网络关注与客流波动的动态关联

4.1 网络搜索与客流波动的时差相关分析

采用交叉相关分析,计算15期(d)内3个序列两两之间的时差领先滞后的关系,滞后(lag)和领先(lead)是相应的交叉相关系数,最大系数出现的滞后期为领先/滞后期。根据表4,游客量与移动搜索指数波动趋于一致,在7d内的相关性均超过序列的2倍标准差(±0.105),表明两者显著相关性,游客量在当天或滞后1d的相关性较高。游客量与PC搜索指数在滞后12d内的多数时间具有显著相关性,在游客量当期或滞后2d的相关性较高,在0d、7d、13d等间隔的相关性较低,两者波动在两周左右时间内存在时差性。

4.2 网络搜索与客流波动的脉冲响应分析

使用平稳的3种时间序列建立VAR模型,根据SC最小的准则选择滞后期为2,进而利用脉冲响应函数可以了解研究中某变量的当期冲击引起的其他变量15d内的动态响应关系(图2)。景区接待游客游览后,引起PC端搜索指数响应的峰值为第4期(图2c),而移动端为第3期(图2b);同等冲击水平下,PC端搜索指数的响应更强更持久。移动搜索指数对游客量的带动主要是前两期,而后促进实际出游的效应逐渐下降(图2d),PC搜索指数对游客量的带动则从第4期后开始显现正向影响(图2g),两种搜索具有明显的响应时序差异。

4.3 时间序列的滚动窗口动态关联

本文中计算滚动相关系数时采用的滚动时窗长度m设为14 d,这是考虑到着重于客流和搜索指数的年内波动主要集中以7 d为周期,根据上文分析,时差相关显著相关最长在14 d,而且部分节假往往跨两个周,采用2倍平均周期的滚动时窗,既可以比较全面概括时间序列的关联性特征,又避免了由于时窗长度过短导致的动态趋势表现不充分的问题。根据式(5)计算两序列当期的滚动关联系数,为减少偶然波动和方便呈现,将其按每周平均后结果如图3。

3种波动之间的关联系数整体稳定,出现显著变化的时间段体现在春节(第4周,简记为W4)、8月暑期及灵谷寺萤火虫季节(W28~W30)、国庆中秋(W39~W41)和年底(W49~W50)期间。在春节、清明(W14)、国庆的附近时段,两种搜索流与客流的关联(ρ-tp与ρ-tm)变化是同向增减的,假日出游旺盛使得两种不同客户端的搜索行为有所趋同。PC搜索指数与客流量的关联(ρ-tp)机制较为复杂,一般情况下两序列当期间存在明显不同步的滞后效应,因此以负向关联为主,系数一般在-0.4到-0.6附近波动,仅春节期间(W4)、暑假特别是大暑节气附近(W30)和国庆期间(W41)为正值,两次黄金周跨时较长能够实现同向波动,而大暑前后的搜索指数较为稳定,但高温抑制了潜在出游,人们取消或者延后了出游计划,实际客流量下降较大。移动搜索与客流关联系数ρ-tm能够反映网络出游意愿和实际到达的关系,在4月清明节(W14)之后到劳动节假期(W18)之前的3周(W15~W17),移动搜索与游客量的关联性降低,应为潜在游客在为“五一”出游进行搜索准备,而并未实际出游,小长假之后又迅速回落;W45之后旅游市场进入传统淡季,潜在游客的移动端的在线搜索意愿逐步降低,而且下降幅度快于实际客流减少的幅度,因而与客流量相关性减弱。

5 结论与讨论

5.1 主要结论

本文以钟山风景区的长三角地区每日到访游客量与不同平台的搜索指数作为研究对象,利用GARCH族模型分析了3种时间序列的波动率差异,采用时差交叉相关、滚动相关分析与VAR模型的脉冲响应函数对近距离旅游流与网络搜索信息流的日际时间动态相关性进行研究,得到以下结论。

(1)景区客流量和移动平台搜索指数的年内日际序列分布具有尖峰厚尾特征,而波动具有丛集性。PC端搜索指数波动较为平稳,呈现正态分布。在一定程度显示出潜在游客的游前搜索已部分迁移到移动端搜索平台,并具有差异化搜索行为特征。

(2)景区客流量和移动搜索指数在日际尺度的波动均不具有长记忆性,移动搜索指数的高波动影响略长于客流量。两种波动的假日经济现象明显,均具有正向非对称性,但节假日冲击并不会带来长期客流或搜索量的显著增长,主要节假前会存在仅搜索准备而暂未实际出游的客流抑制效应。

(3)景区客流量与不同平台搜索在不同时差上具有交叉相关性。客流量与移动搜索指数的日际尺度波动趋于一致,在当期或滞后1d的相关性较高,与PC搜索指数在滞后2d的相关性较高并存在以7d为间隔的“周”期性关联。移动端与PC端搜索指数冲击引起游客量响应的动态变化,表现出两种搜索指数对应的搜索行为习惯的差异,而客流带来的PC端搜索响应程度更强更持久。

(4)法定节假和季节性因素会引起搜索与客流相关程度的波动变化。两种搜索指数与客流的当期相关性为正负对应关系,仅春节、清明节和国庆节前后是同向变化的。高温带来的气候舒适限制会抑制潜在出游意愿,冬季的潜在游客的移动端的在线搜索意愿逐步降低,会减弱与实际到访客流量的相关性。

5.2 讨论与展望

本文探索性地比较了不同平台网络搜索数据的波动特征差异,研究了在线搜索与景区实际接待游客量的整体和动态协动性关系。搜索引擎作为目的地营销的重要手段,针对不同平台的搜索引擎营销策略差异有着广泛的实践需求。研究结果可以为景区营销和管理实践工作提供指导,利用不同平台网络信息搜索与客流量在时间维度上的耦合关系,适时开展多种旅游营销推广活动,在节假日前期应加强PC端搜索优化和对应网络信息的完善,提高游客从线上搜索行为向线下旅游体验行为的转化,实现精准营销。今后还应利用游前搜索與客流的节假日波动特征,开展客流预测和拥挤预警等方面的研究和应用。

国内研究对在线旅游信息流是游客流的因果关系的“导引”[13],还是仅为“前兆”现象仍有争论[17]。针对搜索数据和客流量的时序相关分析和脉冲响应分析,结果倾向于搜索指数是反映客源地潜在游客出游计划行为的指标。搜索指数(与网站访问、目的地的网络营销内容关注量不同)指示的不是客源地所有居民接受的信息,而是大量实际游客(已预订相关旅游产品)和潜在游客(搜索后可能因距离、花费、安排等原因而放弃或推迟)制定游前计划这一阶段的旅游行为。游前搜索作为游前行为的一部分,反映了旅游异地消费和体验的特性。另外,与部分研究将旅游流序列的波动的长记忆性与重游联系起来的结论不同[46],本研究认为旅游流在日际时间尺度上不存在长记忆性,且与具体到个人游客的重游行为并无关联,仅反映客源市场与目的地的群体性特征。

然而,搜索引擎大数据研究的是大样本条件下的统计特征,并不能完全解释游客搜索行为的特征,搜索主体与出游主体存在不一致。同时,游客信息搜索行为的内在机制复杂,不同游客在关键词搜索的频率、时间上应有较大差异,有待采用实验方法和大规模问卷调查进一步探索。另外,案例地在研究期内客流量稳定且未发生明显负面影响,其波动性特征特别是非对称性,对其他景区的参考性可能存在一定限制,有必要对突发危机事件(如新冠肺炎疫情冲击)影响及恢复过程中产生的高频数据进行深入研究。而对于手机信令监测所得的详尽客源地数据还有待在未来研究中细化分析,在中短程客源市场内,不同生命周期或者季节性目的地,在不同客源地的协同性应有所不同,未来应拓展进行更多其他类型目的地的案例研究。

参考文献(References)

[1] 章锦河, 张捷, 李娜, 等. 中国国内旅游流空间场效应分析[J]. 地理研究, 2005, 24(2): 293-303. [ZHANG Jinhe, ZHANG Jie, LI Na, et al. An analysis on spatial field effect analysis of domestic tourism flows in China[J]. Geographical Research, 2005, 24(2): 293-303.]

[2] 余向洋, 沙潤, 朱国兴, 等. 基于EMD的景区客流波动特征及其组合预测——以黄山风景区为例[J]. 地理科学进展, 2012, 31(10): 1353-1359. [YU Xiangyang, SHA Run, ZHU Guoxing, et al. Research on fluctuation characteristics and combined forecasting of tourist arrivals in Huangshan scenic areas[J]. Progress In Geography, 2012, 31(10): 1353-1359.]

[3] KIM S S, WONG K K F. Effects of news shock on inbound tourist demand volatility in Korea[J]. Journal of Travel Research, 2016, 44(4): 457-466.

[4] 张捷, 都金康, 周寅康, 等. 观光旅游地客流时间分布特性的比较研究——以九寨沟、黄山及福建永安桃源洞鳞隐石林国家风景名胜区为例[J]. 地理科学, 1999, 19(1): 50-55. [ZHANG Jie, DOU Jinkang, ZHOU Yinkang, et al. A comparison approach to temporal characteristics of tourist flows to sightseeing destinations: With case samples of national parks of Jiuzhaigou, MT. Huangshan and Taoyuandong—Lingyin Stone Forest Park [J]. Scientia Geographica Sinica, 1999, 19(1): 50-55.]

[5] 万田户, 冯学钢, 黄和平. 江西省山岳型风景名胜区旅游季节性差异——以庐山、井冈山、三清山和龙虎山为例[J]. 经济地理, 2015, 35(1): 202-208. [WAN Tianhu, FENG Xuegang, HUANG Heping. Differences of tourism seasonality among mountain resorts in Jiangxi: Examples of Mt. Lushan, Jinggang Sanqing and Longhu[J]. Economic Geography, 2015, 35(1): 202-208.]

[6] PAN B, XIANG Z, LAW R, et al. The dynamics of search engine marketing for tourist destinations[J]. Journal of Travel Research, 2011, 50(4): 365-377.

[7] XIANG Z, PAN B. Travel queries on cities in the United States: Implications for search engine marketing for tourist destinations[J]. Tourism Management, 2011, 32(1): 88-97.

[8] 李君轶, 杨敏. 基于关键词选择的在线旅游信息搜寻行为模式研究[J]. 旅游学刊, 2013, 28(10): 15-22. [LI Junyi, YANG Min. The keywords-based online information seeking behavior of tourists[J]. Tourism Tribune, 2013, 28(10): 15-22.]

[9] ZHENG X, KARL W, DANIEL R F. Representation of the online tourism domain in search engines[J]. Journal of Travel Research, 2008, 47(2): 137-150.

[10] 孙烨, 张宏磊, 刘培学, 等. 基于旅游者网络关注度的旅游景区日游客量预测研究——以不同客户端百度指数为例[J]. 人文地理, 2017, 32(3): 152-160. [SUN Ye, ZHANG Honglei, LIU Peixue, et al. Forecast of tourism flow volume of tourist attraction based on degree of tourist attention of travel network: A case study of Baidu index of different clients[J]. Human Geography, 2017, 32(3): 152-160.]

[11] 邹永广, 林炜铃, 郑向敏. 旅游安全网络关注度时空特征及其影响因素[J]. 旅游学刊, 2015, 30(2): 101-109. [ZOU Yongguang, LIN Weiling, ZHENG Xiangmin. Spatial-temporal characteristics and influential factors of network attention tourism security[J]. Tourism Tribune, 2015, 30(2): 101-109.]

[12] DAVIDSON A P, YU Y M. The Internet and the occidental tourist: An analysis of Taiwans tourism websites from the perspective of Western tourists[J]. Information Technology & Tourism, 2005, 7(2): 91-102.

[13] 路紫, 趙亚红, 吴士锋, 等. 旅游网站访问者行为的时间分布及导引分析[J]. 地理学报, 2007, 62(6): 621-630. [LU Zi, ZHAO Yahong, WU Shifeng, et al. The time distribution and guide analysis of visiting behavior of tourism website users[J]. Acta Geographica Sinica, 2007, 62(6): 621-630.]

[14] 路紫, 刘娜, ZUI Z. 澳大利亚旅游网站信息流对旅游人流的导引: 过程、强度和机理问题[J]. 人文地理, 2007, 21(5): 88-93. [LU Zi, LIU Na, ZUI Z. The guiding effect of information flow of australian tourism website on tourist flow: Process, intensity and mechanism[J]. Human Geography, 2007, 21(5): 88-93.]

[15] LIU P, ZHANG H, ZHANG J, et al. Spatial-temporal response patterns of tourist flow under impulse pre-trip information search: From online to arrival[J]. Tourism Management, 2019, 73: 105-114.

[16] 冯娜, 李君轶. 外向在线旅游信息流与入境旅游流的耦合分析——以美加入境旅游流为例[J]. 旅游学刊, 2014, 29(4): 79-86. [FENG Na, LI Junyi. A couple analysis of the extraversion online tourism information and inbound tourist flow: A case of the American and Canadian inbound tourist flow[J]. Tourism Tribune, 2014, 29(4): 79-86.]

[17] 李山, 邱荣旭, 陈玲. 基于百度指数的旅游景区络空间关注度: 时间分布及其前兆效应[J]. 地理与地理信息科学, 2008, 24(6): 102-107. [LI Shan, QIU Rongxu, CHEN Ling. Analysis on inbound tourism market and its development measures of Gansu province[J]. Geography and Geo-Information Science, 2008, 24(6): 102-107.]

[18] 王硕, 曾克峰, 童洁, 等. 黄金周风景名胜区旅游客流量与网络关注度相关性分析——以庐山、华山、八达岭长城风景名胜区为例[J]. 经济地理, 2013, 33(11): 182-186. [WANG Shuo, ZENG Kefeng, TONG Jie, et al. A correlative analysis of the relationship between tourists and tourist network attention for scenic spots in special session[J]. Economic Geography, 2013, 33(11): 182-186.]

[19] 马丽君, 孙根年, 黄芸玛, 等. 城市国内客流量与游客网络关注度时空相关分析[J]. 经济地理, 2011, 31(4): 680-685. [MA Lijun, SUN Gennian, HUANG Yunma, et al. A correlative analysis on the relationship between domestic tourists and network attention[J]. Economic Geography, 2011, 31(4): 680-685.]

[20] ZHENG X, ROB L. Online competitive information space for hotels[J]. Journal of Hospitality Marketing & Management, 2013, 22(5): 530-546.

[21] PARASKEVAS A, KATSOGRIDAKIS I, LAW R, et al. Search engine marketing: Transforming search engines into hotel distribution channels[J]. Cornell Hospitality Quarterly, 2011, 52(2): 200-208.

[22] 陈明红, 温杰尧, 曾庆彬, 等. 从PC搜索到手机搜索的用户转移行为意向研究[J]. 情报科学, 2018, 36(7): 71-77. [CHEN Minghong, WEN Jieyao, ZENG Qingbin, et al. A study on user switching behavioral intention from pc search to mobile search[J]. Information Science, 2018, 36(7): 71-77.]

[23] YANG X, PAN B, EVANS J A, et al. Forecasting Chinese tourist volume with search engine data[J]. Tourism Management, 2015, 46: 386-397.

[24] KIM D, LEHTO X Y, MORRISON A M. Gender differences in online travel information search: Implications for marketing communications on the internet[J]. Tourism Management, 2007, 28(2): 423-433.

[25] 余向洋, 汪丽. 黄山风景区客流波动的多时间尺度特征分析[J]. 旅游科学, 2014, 28(2): 1-11. [YU Xiangyang, WANG Li. An analysis on multiple time scale features of the fluctuations of tourist arrivals in Huangshan scenic areas[J]. Tourism Science, 2014, 28(2): 1-11.]

[26] 吴江, 张秀香, 叶玲翠, 等. 不同时间尺度周期的旅游客流量波动特征研究——以西藏林芝市为例[J]. 地理研究, 2016, 35(12): 2347-2362. [WU Jiang, ZHANG Xiuxiang, YE Lingcui, et al.   A time scale study on the tourist flow in Nyingchi, Tibet[J]. Geographical Research, 2016, 35(12): 2347-2362.]

[27] 王茜雅, 张建新, 刘培学, 等. 大数据视角下城市客源市场空间结构动态研究——以南京市为例[J]. 资源开发与市场, 2018, 34(1): 77-82. [WANG Xiya, ZHANG Jianxin, LIU Peixue, et al. Study on spatial structure of urban tourist market from perspective of big data: A case study of Nanjing city[J]. Resource Development & Market, 2018, 34(1): 77-82.]

[28] HODRICK R J, PRESCOTT E C. Postwar U.S. business cycles: An empirical investigation[J]. Social Science Electronic Publishing, 1997, 29(1): 1-16.

[29] 袁林旺, 俞肇元, 黄震方, 等. 游客变化的多尺度波动特征及作用过程分析——以盐城麋鹿生态旅游区为例[J]. 旅游学刊, 2009, 24(7): 27-33. [YUAN Linwang, YU Zhaoyuan, HUANG Zhenfang, et al. An analysis of multi-fluctuation characteristics and functional process of tourist flow[J]. Tourism Tribune, 2009, 24(7): 27-33.]

[30] GUO Y, ZHANG J, YANG Y, et al. Modeling the fluctuation patterns of monthly inbound tourist flows to China: A complex network approach[J]. Asia Pacific Journal of Tourism Research, 2015, 20(8): 942-953.

[31] BAGGIO R, SAINAGHI R. Complex and chaotic tourism systems: Towards a quantitative approach[J]. International Journal of Contemporary Hospitality Management, 2011, 23(6): 840-861.

[32] 李君軼, 唐佳, 冯娜. 基于社会感知计算的游客时空行为研究[J]. 地理科学, 2015, 35(7): 814-821. [LI Junyi, TANG Jia, FENG Na. Tourists spatio-temporal behavior based on socially aware computing[J]. Scientia Geographica Sinica, 2015, 35(7): 814-821.]

[33] 陳晓艳, 张子昂, 胡小海, 等. 微博签到大数据中旅游景区客流波动特征分析——以南京市钟山风景名胜区为例[J]. 经济地理, 2018, 38(9): 206-214. [CHEN Xiaoyan, ZHANG Ziang, HU Xiaohai, et al. Characteristics of tourists flow in scenic spots based on Weibo check-in big data: A case study of Zhongshan scenic spot in Nanjing city[J]. Economic Geography, 2018, 38(9): 206-214.]

[34] 杨兴柱, 蒋锴, 陆林. 南京市游客路径轨迹空间特征研究——以地理标记照片为例[J]. 经济地理, 2014, 34(1): 181-187. [YANG Xingzhu, JIANG Kai, LU Lin. Urban tourist path trajectory spatial characteristics: An empirical analysis of geotagged photos[J]. Economic Geography, 2014, 34(1): 181-187.]

[35] 秦静, 李郎平, 唐鸣镝, 等. 基于地理标记照片的北京市入境旅游流空间特征[J]. 地理学报, 2018, 73(8): 1556-1570. [QIN Jing, LI Langping, TANG Mingdi, et al. Exploring the spatial characteristics of Beijing inbound tourist flow based on geotagged photos[J]. Acta Geographica Sinica, 2018, 73(8): 1556-1570.]

[36] YUAN Y, LU Y, CHOW T E, et al. The missing parts from social media-enabled smart cities: Who, where, when, and what?[J]. Annals of the American Association of Geographers, 2019, 110(2): 462-475.

[37] 黄潇婷, 柴彦威, 赵莹, 等. 手机移动数据作为新数据源在旅游者研究中的应用探析[J]. 旅游学刊, 2010, 25(8): 39-45. [HUANG Xiaoting, CHAI Yanwei, ZHAO Ying, et al. On the application analysis of mobile data source in the study of tourists[J]. Tourism Tribune, 2010, 25(8): 39-45.]

[38] 顾秋实, 张海平, 陈旻, 等. 基于手机信令数据的南京市旅游客源地网络层级结构及区域分异研究[J]. 地理科学, 2019, 39(11): 1739-1748. [GU Qiushi, ZHANG Haiping, CHEN Min, et al. Hierarchical network structures and regional differentiations of tourist source destinations of Nanjing based on cellular signaling data[J]. Scientia Geographica Sinica, 2019, 39(11): 1739-1748.]

[39] 申卓, 王德. 基于手机信令数据的大型足球赛事球迷当日空间行为特征研究[J]. 人文地理, 2018, 33(3): 34-43. [SHEN Zhuo, WANG De. A research on the spatial behavior characteristics of fans of large football matches based on cell phone signaling data[J].Human Geography, 2018, 33(3): 34-43.]

[40] 马莉, 刘培学, 张建新, 等. 景区旅游流与网络关注度的区域时空分异研究[J]. 地理与地理信息科学, 2018, 34(2): 87-93. [MA Li, LIU Peixue, ZHANG Jianxin, et al. Research on spatial and temporal difference of tourist flow and web search behavior in scenic spots[J]. Geography and Geo-Information Science, 2018, 34(2): 87-93.]

[41] 黄先开, 张丽峰, 丁于思. 百度指数与旅游景区游客量的关系及预测研究——以北京故宫为例[J]. 旅游学刊, 2013, 28(11): 93-100. [HUANG Xiankai, ZHANG Lifeng, DING Yusi. Study on the predictive and relationship between tourist attractions and the Baidu index: A case study of the forbidden city[J]. Tourism Tribune, 2013, 28(11): 93-100.]

[42] 陈婷婷. 人民币实际有效汇率波动与我国进出口贸易的动态关联性研究——基于TVP-VAR模型[D]. 杭州: 浙江财经大学, 2016. [CHEN Tingting. Dynamic Relationship between RMB Real Effective Exchange Rate Volatility and Chinas Import and Export Trade-based on TVP-VAR Model[D]. Hangzhou: Zhejiang University of Finance and Economics, 2016.]

[43] BALLI F, CURRY J, BALLI H O. Inter-regional spillover effects in New Zealand international tourism demand[J]. Tourism Geographies, 2015, 17(2): 262-278.

[44] BALLI H O, TSUI W H K, BALLI F. Modelling the volatility of international visitor arrivals to New Zealand[J]. Journal of Air Transport Management, 2019, 75: 204-214.

[45] 余向洋, 沙润, 胡善风. 近邻景区客流季节性比较及其动态关联研究——以西递、宏村、黄山为例[J]. 地理研究, 2013, 32(1): 191-200. [YU Xiangyang, SHA Run, HU Shanfeng. Dynamic relation and comparative analysis of tourism seasonality of neighbor scenic areas: Case studies of Xidi, Hongcun and Huangshan[J]. Geographical Research, 2013, 32(1): 191-200.]

[46] AL-SHBOUL M, ANWAR S. Long memory behavior in Singapores tourism market[J]. International Journal of Tourism Research, 2017, 19(5): 524-534.

Dynamic Correlation Analysis of Online Travel Information Search and Volatility in Daily Tourist Arrivals: A Case Study of Zhongshan Mountain National Park in Nanjing

LIU Peixue1, ZHU Zhipei1, ZHANG Jie1, ZHANG Xiaowan1,2, ZENG Zhanjing1

(1. School of Geography and Ocean Science, Nanjing University, Nanjing 210023, China;

2. School of Business, Anhui University, Hefei 230601, China)

Abstract: The volatility in tourist arrivals has been the focus of tourism research. Search engines have become an important tool for destination marketing, as they can satisfy a wide range of practical needs with different marketing strategies from various platforms. The dynamic correlation analysis among information, material and passenger flow has become focus of attention in the information/digital age. As technology usage becomes more widespread, it is possible to acquire large digital footprints of tourists. This study examines the difference and correlation between tourist volume forecasting based on Baidu index and fluctuations in tourist arrivals based on mobile signal data at the interdiurnal timescale. To do this, GRACH model was applied for modeling and forecasting the volatility of yearly tourist arrivals. Pearson correlation and cross-correlation analysis were used to analyze the overall and dynamic correlation between tourist volume. The impulsive effect of online travel information search on tourist volume was investigated by using impulse response function in the VAR model. The results show the volatility of tourist volume at the destination and mobile search is similar, with “peak thick tail” distribution characteristics and volatility clusters. To a certain extent, it illustrates that tourists online travel information search behaviors have partially transferred to mobile device. Moreover, the volatility in tourist volume and mobile search at interdiurnal timescale has no long-term memory. However, the influence of high volatility of mobile search index is slightly longer than that of tourist volume. In addition, national holidays and seasonal factors could lead to the changes in the correlation between online search behavior and actual tourist volume. Specifically, the effects of holidays on short-term tourist flow are significant, but without significant effects on long-term tourist flow. The high temperature could constraint tourists potential travel intentions, and the willingness of mobile search behaviors gradually declines during winter. Lastly, the fluctuation effect of PC search causes the peak response of tourist volume at a lag of 5. The dynamic sequence of response time by PC is opposite to that of mobile devices, representing the differences of online search behavior habits corresponding to the two search indexes. Search engines have become a central part of destination marketing strategy and, as such, it is essential that different platforms with different search engines should differentiate marketing strategies. It can realize the precision marketing by applying the coupling relations between online travel information search and tourist volume at timescales, organizing a variety of tourism marketing activities, optimizing PC search index and improving online information at the early stage of holidays, and promoting the conversion rate from tourists online search behavior to offline tourism experience.

Keywords: tourism flow; Baidu index; volatility; GARCH; Sun Yat-sen Mausoleum

[責任编辑:刘    鲁;责任校对:吴巧红]

猜你喜欢
中山陵GARCH模型波动
游中山陵
羊肉价回稳 后期不会大幅波动
微风里优美地波动
2019年国内外油价或将波动加剧
干湿法SO2排放波动对比及分析
风雨90载中山陵
人民币汇率波动对我国国际贸易的传导效应分析
人民币汇率波动对我国国际贸易的传导效应分析
铜期货市场风险变异性实证研究
基于HP滤波和Garch模型的股票价格波动研究