基于网络大数据建模对甘肃旅游现状分析

2023-05-24 15:09孙玲达举霞
科技资讯 2023年8期
关键词:大数据

孙玲 达举霞

摘要:甘肃省有绝美的自然地貌和独特的丝路文化,拥有许多天然草场,草原碧绿,湖泊清澈的夏季景观,多样的地貌,大漠的风光,本文运用大数据方法分析各个因素数据,找出决定性因素,对甘肃旅游市场现状、旅游资源特色和未来发展趋势进行了剖析,做出了预测指标,并评价深度学习方法、灰色神经网络等机器学习技术在不同周期下对旅游需求建模与预测中产生的效果。

关键词:大数据 灰色神经网络 Topsis方法 甘肃旅游

中图分类号:F832.51          文献标识码:A

Analysis on the Current Situation of Tourism in Gansu Province Based on Network Big Data Modeling

SUN Ling  DA Juxia

(Lanzhou Resources & Environment Voc-Tech University, Lanzhou, Gansu Province, 730021 China)

Abstract: Gansu  Province has beautiful natural landforms and unique Silk Road culture, and has many natural grasslands, summer landscapes with green grasslands and clear lakes, diverse landforms and desert scenery. This paper uses the method of big data to analyze the data of various factors and find out the decisive factors,  analyze the present situation, the characteristics of tourism resources and the future development trend of the tourism market in Gansu and make prediction indexes, and  evaluate the effects of machine learning techniques such as deep learning methods and grey neural network on tourism demand modeling and prediction in different periods.

Key Words: Big data;  Grey neural network; Topsis method; Tourism in Gansu

1  國内外研究的现状和趋势

旅游需求的研究,吸引了大量的来自不同学科的研究人员,鉴于准确预测动态和复杂的旅游市场的重要性,在过去几十年中,相关研究者发表了600多篇有关旅游需求建模和预测的论文,这些研究主要集中在模型构建和性能评估上,其中一些研究提出了新颖的混合模型或者使用了多种方法的组合。目前,人们普遍认为,预测旅游需求的量化方法可分为三类,分别是时间序列模型,计量经济学模型,人工智能(AI)的模型。

时间序列模型推断感兴趣的变量的过去模式来预测未来值,常用的方法有包括UCM模型,ARIMA模型,GARCH模型等。计量经济学模型通过使用权威的解释变量以提高预测精度,例如经济指标,气候温度指标,大数据指标和市场情绪指标。一些前沿的计量经济学技术应用于旅游预测建模包括时变参数、混合数据抽样和贝叶斯模型等。随着AI技术的发展,许多相关的方法被引入到旅游需求建模与预测。这些方法包括人工神经网络方法,核极限学习方法,粗糙集模型和支持向量回归等。在大数据时代,大数据已成为开发基于AI的预测模型的重要驱动力。传统预测方法中使用的数据通常是自然聚合的,具有时滞。而来自谷歌趋势、谷歌分析和百度索引等来源的搜索引擎数据已成为旅游需求预测的新数据源。

现有的旅游需求研究主要集中与于ARIMA模型的应用,但是ARIMA模型并不总是优于其他模型,近期的研究表明,一些基于机器学习技术的人工智能方法在预测性能上优于传统的时间序列模型与计量经济学模型。Pai等在香港和台湾的旅游需求预测中发现支持向量机的性能优于ARIMA模型。Claveria 等的研究同样验证了支持回归向量回归,高斯过程回归和神经网络模型均优于传统方法。由于国际旅游的研究相对较少。同时,国内外该领域的研究者大多使用经济学和管理学的理论开展研究,很少有学者结合优化算法对于模型参数估计的应用。随着AI技术的兴起,优化算法在模型效率提升中起到了关键作用,将机器学习技术与优化算法相结合也是未来研究的趋势之一。

2  预备知识

采用参与式观察、深度访谈、问卷调查等方法整理出近几年旅游景点营业额相关数据,从历史数据中提取影响旅游的特征信息,建立旅游评价模型,选择甘肃省6个相对较大的旅游景点,建立旅游景点营业额的月预测模型,并通过历史数据评价该模型。

对于数据分析,我们选择考虑旅游景点的需求频数、景点的需求量、景点的变化趋势、景点门票四个特征,对于大大小小取284个旅游景点,计算这些景点在每个月的具体收益额,月平均收益额以及历史周期内的总和。选择适当的目标,建立景点相关信息库。

对于景点选择,基于得到的景点信息库,选择影响较大的一些指标赋予权重,建立评价模型,按模型评分从高到底的顺序選择6种相对较大的旅游景点。

对于预测模型,基于调查历史数据的时序性及特征信息较少的特点,选择基于AI方法的时间序列预测模型,以及历史数据作为训练集和测试集来检验模型的预测结果。

3  模型的假设

由于部分旅游景点的收益额会受特殊原因的影响,比如,近两年疫情的影响历史数据失效,我们可以考虑正常情况下的历史数据。

4  模型的建立与求解

4.1 景点的评价指标

查看177个月期间的历史数据,从旅游景点的需求频数、景点的需求量、景点的变化趋势、景点门票四个角度,建立评价指标来衡量各个景点的关注度。

4.1.1 景点的需求频数

4.1.2 景点的需求量

为第 i 个景点的月平均需求量。

4.1.3 变化趋势

对于景点的趋势,考虑需求量的相对变化量,即对第 i 个景点,我们计算其每一个月与前一个月之间需求量的差值。建立趋势矩阵

其中为第 i 个景点在第 j 个月相对于第 j-1 个月需求量的改变量,其中

同时规定,即初始阶段第一个月的变化量记为 0。

4.1.4 景点门票

价格是衡量景点重要性的一个核心因素,它影响到购买门票时的资金准备。通过历史数据发现,有一部分景点门票在不同需求下的销售单价有波动,为了方便计算,取其平均值作为销售单价。记为第 i 个旅游景点的销售单价。

4.2 基于熵权法的 Topsis 模型

基于熵权法对 Topsis 模型是一种常用的综合评价方法,能充分利用原始数据的信息,客观进行权重幅值,其结果能客观地反映各评价方案之间的差距。该方法的步骤如下:数据标准化;进行归一化处理;计算每个指标的信息熵,并计算信息效用值,并归一化得到每个指标;计算信息效用值(信息熵冗余度);计算指标的权重系数。

4.3 灰色神经网络预测模型

灰色神经网络的拓扑图如下:

其中,t为输入参数序号为网络输入参数;为网络权值;为网络预测值;LA、LB、LC、LD分别表示灰色神经网络的四层。

灰色神经网络的学习流程如下:

(1)根据训练数据特征初始化网络结构,初始化参数 a,b,并根据a,b的值计算u。

(2)根据网络权值定义计算。

(3)对每一个输入序列(t,y(t)),t=1,2,3,...,N,计算每层输出。

(4)计算网络预测输出与期望输出的误差,并根据误差调整权值和阈值。

(5)判断训练是否结束,若否,返回步骤 3。

5  模型求解

利用 Excel 软件以及 Matlab R2019a 软件对附件数据进行量化分析,得到 284个大大小小的旅游景点在 177 个月内的景点需求频数,景点需求量,景点需求变化量以及景点门票。将这 284 个旅游景点相关信息汇总,得到 284 种方案,每一种方案由一个向量表示,它指某个景点对应的统计信息。然后利用 Matlab 软件,通过基于熵权法的 Topsis 方法,对上述 284 个方案进行评价,选取评分最高的六个景点作为重点关注的景点。

综上,再结合图2可以看出,通过基于熵权法的 Topsis 评价模型,选取出的景点综合考虑了景点的频数、门票的影响,并没有表现出某种特性的数值集中于某一区间的特性,比需求量、变化率以及起对某一特性的数值倒序排列的方法,更具有合理性。 基于历史数据,使用灰色神经网络作为景点需求的月预测模型,将模型能够很好地追踪需求量的变化趋势。

6  结语

该文以当前的相关研究成果为基础,理论上,紧紧围绕大数据与人工智能的时代背景,将机器学习方法引入到旅游之中,基于甘肃省各市州旅游市场发展的现状,调研了影响旅游市场发展的因素,建立有效的预测指标体系,开发高精度的预测模型,对未来甘肃省旅游市场的发展趋势进行了分析与预测。实践上,利用机器学习技术构建的高效预测模型有助于甘肃省旅游市场的合理规划,避免过度开发以及开发欠缺,降低旅游需求各种波动带来的负面影响。

参考文献

[1] SONG H,QIU R T R,PARK J. A Review of Research on Tourism Demand Forecasting[J].Annals of Tourism Research,2019,75:338-362.

[2] 韦瑾.基于网络文本的民族旅游体验特征研究[J].中国市场,2021(14):122-125.

[3] 李琼. 旅游大数据与挖掘分析研究[J]. 当代旅游:下旬刊,2018(5):104-106.

[4] GAO Y.A Study on the Satisfaction of Practice and the Willingness to Stay in the Post of Students in Tourism Management Major Based on Big Data Analysis[J],Journal of Physics Conference Series,2021,1744(3):032070.

[5] 王強进. 基于大数据分析的智慧旅游研究[D].长春:长春工业大学,2021.

[6]LIM C,MCALEER M.Time Series Forecasts of International Travel Demand for Australia[J]. Tourism Management,2002,23(4):389-396.

[7]DU PREEZ J, WITT S F. Univariate Multivariate Time Series Forecasting: An Application to International Tourism Demand[J]. International Journal of Forecasting, 2003,19(3):435-451.

[8]CHAN F,LIM C,MCALEER M. Modelling Multivariate International Tourism Demand and Volatility[J]. Tourism Management,2005,26(3):459-471.

[9]SONG H,WITT S F. Forecasting International Tourist Flows to Macau[J]. Tourism management,2006,27(2):214-224.

[10]王小川,史峰,郁磊等.MATLAB神经网络43个案例分析[M].北京:北京航空航天大学出版社,2013.

[11]胡运权. 运筹学基础及应用[M].7版.北京:高等教育出版社,2021.

[12]GIORDANO F R,FOX W P,HORTON S B.数学建模[M].原书5版.北京:机械工业出版社,2014.

猜你喜欢
大数据
基于在线教育的大数据研究
“互联网+”农产品物流业的大数据策略研究
大数据时代新闻的新变化探究
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索