基于运营商角度景区游客流量数据误差的分析和对策

2021-11-10 05:55范琴
科学与生活 2021年12期
关键词:运营商景区

范琴

摘要:在疫情常态化防控的当下,各景区的安全运营都离不开对景区人流的实时监控,运营商的信令数据具备规模大、实时性高、覆蓋面广的优点,可快速为景区提供实时的人流监控,但由于运营商数据的定位原理依赖基站工参、出于成本考虑采集的信令字段有限、运营商用户的市场占比动态波动等原因导致景区客流统计不准确,同时由于游客统计口径的差异、景区类型的不同以及景区边界圈选等问题,加深了基于运营商数据实现客流统计时的误差。本文详细阐述了当前各种景区客流监控方式的优缺点,深入分析了基于运营商数据实现客流统计的主客观原因,基于可实操的层面提出了采用运营商数据实现客流精准统计的改进方案以及每种方案的优缺点,以期为景区提供更便捷可靠、低成本的精准客流实时监控,助力景区实现数智划转型。

关键词:人流统计、信令数据、运营商、景区

一、研究背景

景区作为大型的人流量聚集地之一,体现着一省服务业的发展水平,加强景区营运管理,利用数据实现对景区的监管,对提升旅游行业服务整体品质是非常必要的。建立景区人流量监测系统目标在于解决景区游客流量的监控分析,为景区的规划发展、营销决策提供了科学的数据依据。

利用运营商基站定位技术,对游客数量、游客属性、景区粘度等维度的数据进行统计分析,实现景区客流负荷实时监控预警、景区游客各类统计分析等功能,为各级旅游监管部门的日常管理及公众安全提供科学的决策依据[1]。由于基站统计方法的局限性,部分景区存在地理边界不匹配、周边环境复杂等原因,导致统计数据和实际情况存在偏差。

二、现状分析

1. 监控方式

当前部分景区还没有开始智慧景区建设,客流统计的主要方式还是以闸机为主,开放式景区则没有客流统计的手段。闸机统计方式数据精准,能够准确反映出景区接待量,但是只能反映景区范围内的游客总数,无法分地段进行统计,同时也不能对游客进行大数据挖掘,无法分析游客的年龄、性别、客源地等信息[2]。

相较于传统的闸机计数方式,部分景区着眼于建设智慧旅游平台,在客流监控模块采用的主要是具有前置统计功能的摄像头监控和运营商基站监控。

此外,还有一些景区会和互联网公司进行合作,利用游客在景区使用开启了GPS定位功能的APP应用来进行游客统计。此种方案利用游客终端设备的GPS定位数据,准确性高,但是同样无法获取较为全面的游客属性信息,而且数据获取成本和后期系统运维成本较高,不推荐景区使用。

四种监控方式优劣势如下:

2.误差情况

但是由于客观原因,运营商数据对于景区的监控预测和实际数值仍有一定差距,下面以安徽省黄山风景区为例:

如图所示,系统摘取了2019年6月28日至7月7日黄山景区累计游客数据,与对应的黄山景区闸机数据进行对比,可以看出,双方系统数据差距较大,趋势基本相同,比例基本相同。

(注:移动数据暂未考虑运营商三方占比的问题,数据来源于互联网公布数据)

三、误差原因分析

针对以上事例不难发现,单独使用运营商的数据很难实现对景区游客的精确统计,这其中的误差原因包含了各类分析算法本身的精度原因、也有运营商数据定位的主观原因等。

1.客观原因分析

1.1运营商数据及定位算法的原理导致数据统计的不准确性

首先,用来实现游客统计的运营商数据均来自于运营商网络侧用户与基站发生通信时的交互数据中所携带的位置信息,实际上定位到的是用户所连接的基站的位置而非用户实际准确的GPS位置。

1.2运营商数据采集不全

运营商本质上作为通信服务的提供商,其目标是保证网络的稳定和高速,所以其采集的数据以能够达到分析网络质量为基础目标。虽然某些通信数据、路测数据等所产生的附加价值可以被用来做人流统计与分析,但如果采集和存储这些数据需要付出较大的成本(如MDT数据),则不在运营商数据采集的考虑范围内。

1.3运营商数据的片面性

目前国内通信服务市场下,三家运营商各自瓜分了一部分市场,即使作为4G市场占有率最高的移动,其用户占比大概在60%~75%,这个数值在各个地市区县都有一定的区别,使用运营商数据来统计的游客数也只是能一部分,并且很难单纯地通过一个比例来还原真实的游客数。

其次,三家运营商的数据很难做到融合。如双卡双待终端插入了两张异网卡时,会在两边运营商处重复统计。

2.主观原因分析

2.1游客识别算法的精准度

目前通用的方法是以驻留时间来识别游客。但不同景区游客的驻留时间不同,无法完备地枚举各类景区的游客特征[3],导致了游客统计的不准确。

2.2景区及游客的类型、行为会影响准确度

某些景区的类型和游客的行为也会影响统计的精准度[3]。如内含酒店或民宿的景区,游客跨天旅游时,闸机或者门票只会在当天记录进去有这名游客,而第二天则不会记录,但是运营商的数据仍然会在第二天将该名游客作为一名游客进行统计,从而导致运营商统计的游客和景区门票统计的游客在某些情况下对不上。

2.3无法准确圈定出景区边界导致统计不准

运营商网络管理部门在监测到网络质量波动后,经过综合分析,确定需要调整哪些基站的功率大小、方向角等参数,而且各地市区县在执行调整策略的时候,很有可能存在“先干活再记录”的方式,即先进行基站参数的调整,再在系统上修正基站的工参信息。工餐的实际情况与记录内容不符导致景区包含的基站信息胡准确,影响统计结果。

四、解决方案探讨

为更好地挖掘运营商数据价值,为文旅委、旅游局、景区提供更加准确的游客流量统计数据,辅助政府单位规划省内旅游资源,布局全域旅游战略,实现智慧旅游的全面转型,可以从以下三个方面着手,优化提供的数据接口,逐步提供游客流量统计精度:

方案一:提升运营商数据位置解析精度:运用运营商基于信令的解析能力以及大数据实时计算技术的发展,提升回填经纬度的準确性,从而提高区域人口统计、区域人员画像的准确性;深入地图类APP解析,辅助精准定位。

方案二:硬件辅助优化:依靠具有前置算法的高清摄像头、室内小基站及其他传感设备捕获更精确的数据,用于运营商数据拟合和纠偏。

方案三:数据建模分析:将区域进行细类划分,根据不同区域的特征进行建模优化,提升区域人数统计的精准度;运用多种大数据算法和模型,拟合人员轨迹,补充人员画像,优化统计算法。

下面将对三类方案进行细化,并初步估算了实施计划及完成时间。

1.提升解析精度

1.1E-CID(TA+AOA)定位技术

适用场景:室外地区定位较准;

定位精度:误差在100m~200m;

定位原理:根据TA估算基站和移动台(手机)之间的距离,再根据AOA的角度信息获取终端的位置信息;

数据需求:全面的基站工参数据、信令数据;

实现难度:现有部分基站工参数据不全,计算复杂度较高、对资源开销较大,定位非实时,有2h以上的延迟(具体视投入资源情况而定);

实施方案:

(1)估算基站和手机之间的距离:主要是根据测量接收信号在基站和移动台之间的到达时间,然后转换为距离,从而进行定位。该方法至少需要三个基站,才能计算目标的位置。三个基站测的与 MS 的距离分别为R1、R2、R3,以各自基站为圆心测量距离为半径,绘制三个圆,其交点即为 MS 的位置。当三个基站都是 LOS 基站时,一般可以根据最小二乘(LS)算法计算 MS 的估计位置[4]。

(2)测量信号移动台和基站之间的到达角度:以基站为起点形成的射线必经过移动台,两条射线的交点即为移动台的位置。该方法只需两个基站就可以确定 MS 的估计位置。当基站装有天线阵列时,天线阵列根据移动台发送的信号来确定入射角度。两个基站的入射角分别为a1、a2,以各基站为起点,入射角方向构造直线的交点,即为 MS 的位置。

(3)结合前两步得出的数据,利用矩阵计算的方式,得出最终MS(手机)的位置。

1.2RF fingerprint定位技术:基于指纹库的定位方法

适用场景:更适合复杂的室内环境,能够较准确地区分室内外用户,并实现室内分层的定位;

定位精度:误差在25m~200m,受室内信号强度影响较大;

定位原理:通过本小区及邻小区的信号质量特征与覆盖地图特征库进行指纹特征匹配实现定位;

数据需求:MR数据、基站工参数据;

实现难度:数据量较大,资源开销较大,目前MR数据的采集是以月为单位,实时性较差;

实施方案:

(1)数据采集,形成指纹库:室内定位中的位置指纹法,就是事先把各个位置上的信号特征(各Wi-Fi的信号强度)测量一遍,存入指纹数据库。定位的时候,将当前的信号特征与指纹库中的进行匹配,从而确定位置。

(2)指纹匹配:是通过实际采集的数据与数组库中保存的位置指纹进行匹配,算出距离,比较常用的算法有 k阶类聚算法,加权k阶类聚算法,神经网络算法[5]。

1.3采用技术手段实时更新景区基站静态数据

适用场景:较为通用;

定位精度:误差在25m~3km,受基站覆盖范围影响较大;

定位原理:通过圈定更准确的景点范围,筛选出更精确的基站列表,从而统计游客绑定到更精确基站的数据进行游客定位,进而实现统计;

数据需求:信令数据、基站工参数据;

实现难度:已实现;

实施方案:

建立省运营商级别的位置库平台,平台与省运营商的网络优化部门工单系统打通,尽量保证景区所对应的基站工参信息更新能够及时。

方案优势:静态数据刷新流程简化,方便快捷,通常从实施层面预估,在提出需求后三个工作日内即可刷新数据接口中基站数据。

方案劣势:无法判断景区周边及景区内部基站分布情况;目前技术尚不能剔除周边基站部分覆盖情况,也无法判断部分覆盖的比例。

2.硬件辅助优化

对接景区已建设的视频监控系统,利用深度学习算法对视频内容进行解码,提供静态、动态两种人流统计的手段,辅助景区进行特定场所的人数统计工作,实现智慧景区管理。

静态人流统计:对摄像头监控的视频内容进行拍照记录,对照片进行人脸识别,从而实现人流统计。

动态人流统计:将摄像头动态视频数据接入现有的AI分析平台,实时识别视频监控区域内走过的人群从而实现人数统计。

采用辅助硬件手段提供客流参考数据,其结果可直接反馈给景区使用,也可作为校准数据,进入基于信令数据进行客流分析的模型[6],提升运营商信令数据统计的准确性。

3. 数据建模优化

通过大数据分析的方法,在现有数据质量的情况,以最少的硬件及额外资源投入,持续优化客流量统计算法[7]。

(1)区分常驻、流动:常驻人口定义口径:用户当前时间往前推15天,在这15天内出现7天以上即定义为常驻人口。应用场景:在最终统计景区游客数量时,剔除常驻人口。

(2)参考停留时长:在统计景区游客数量时,将停留半个小时以上的人群作为游客,去除那些偶然路过的人群因素。

(3)用户轨迹拟合:底层基于位置拉链数据结构,存储用户行动的轨迹;

基于隐马尔科夫(HMM)模型,维特比(Viterbi)动态规划算法实现用户道路轨迹的匹配,从而推测用户在景区的驻留情况,辅助优化基站定位的结果。

(4)第三方数据校准:参考闸机口售票类数据、定义为游客的在景区附近基站旅游类app(景区相关app)启动次数数据、地图类app解析出来的GPS数据以及可以调用的其他数据资源,对运营商定位数据进行优化。

3.1第三方数据校准

采用相关性分析方法,结合各景区门票数据或经验数据,一次拟合或二次拟合得出基站数据与门票数据的相关性公式(相关性指数0.95以上),后期基站数据通过相关性公式计算后输出,基本可贴合景区门票数据。

方案优势:通过简单线下计算即可大幅提高景区监控准确性,开发工作量较小;只要能收集到基础数据的景区,都可通过个性化相关性公式调增或调减景区人数,而且公式还可根据不同时间段调整。

方案劣势:所有数据的计算都要基于原始景区数据的准确性,风险较大;前期需要收集大量景区统计数据,数据越多,计算公式越准确,但收集工作量越大;计算过程的调增或调减无法通过实际影响因素解释,只能体现准确性提高,但无法找到影响景区人数的原因。

五、结束语

基于运营商信令数据来实现景区客流监控,具备投入低、见效快的优点,可快速帮助景区在疫情常态化防控的社会背景下实现景区安全生产经营。但结合信令数据在各种不同情况下的统计误差,需结合不同的方法加以改进,根据景区类型,采用合适的误差修正办法,提高景区客流监控的准确性,助力景区实现数智化运营。

参考文献:

[1]中国移动MDT技术应用指导意见

[2]谢坚.客流量统计在旅游行業的应用[J].信息系统工程,2015,000(009):86-87.

[3]项译.基于手机信令数据的旅游交通客流特征分析研究[D].东南大学,2017.

[4]柴满,刘坤杰.一种基于信号强度分析的移动端三角定位修正方法和装置:,CN109089214A[P].2018.

[5]常建萍,杨大成,张健明.蜂窝无线网络中移动台定位算法Fingerprint的研究[J].2013.

[6]吴秋琴.基于大数据的景区客流量统计评估系统及方法:,CN111369394A[P].2020.

[7]赵新波.基于基站位置定位的客源分析系统的研究[J].信息系统工程,2015,000(012):16-17.

猜你喜欢
运营商景区
长假也救不回的景区破产
华为与运营商、医院共建标准 “5G+医疗”
一张图看三运营商政企业务
“摘牌”
黄金周
微评
国庆节前157个景区将迎来降价
运营商们的4G时代—急需向消费者证明自己