基于时间序列分析的航站楼安检旅客流量预测

2020-04-24 08:56赵立强
计算机工程与设计 2020年4期
关键词:相空间延迟时间维数

冯 霞,赵立强

(1.中国民航大学 计算机科学与技术学院,天津 300300;2.中国民航大学 中国民航信息技术科研基地,天津 300300)

0 引 言

随着民航旅客出行需求增加,机场安检旅客流量也随之增长,而在高峰期安检旅客等待时长不断增加。安检旅客等待时间过长往往是旅客到达人数随时间呈现出一定波动和安检通道等资源调度不合理所致。若准确预测安检旅客流量,便可根据客流动态配置安检通道资源以及安检人员数,进而保证多数安检旅客能在短时间内通过安检,从而减少由旅客等待所致航班延误、聚集事件的发生,提高资源利用率、工作人员服务水平和旅客满意度。

国内外学者从民航客运量、机场旅客吞吐量和在某个时间段内离港旅客到达航站楼流量预测等方面展开了研究。Lijuan Liu等提出了一种基于深度学习的客流预测模型[1],Engin Pekel等采用POA-ANN以及IWD-ANN方法预测旅客流量[2],Wai Hong Kan TSUI等对香港国际机场客运量进行预测[3],王翠等利用基于灰色理论的RBF神经网络方法,分别对串并联、嵌入型模型和在民航客运量预测中的应用进行研究[4]。以上有关客运量预测的研究,没有充分考虑数据时间序列特性或序列粒度未精确化,致使预测精准度不准。王婷婷等运用灰色马尔科夫模型对龙洞堡机场旅客吞吐量进行预测,预测效果较好[5]。以上有关旅客吞吐量的研究,只是进行长期预测或长时段的预测,未考虑短时流量预测。邓双龙等基于判别分析法构建客流异常预警模型,并对风险函数定义以及解析[6]。Robertson CV等提出可预测未来一星期每隔半小时航站楼旅客到达流量的优化模型[7]。以上研究虽然涉及到不同时间段内旅客的不同到达特性,但是由于数据源不够充分,导致预测精准度不够。

受航班时隙安排等影响,航站楼安检客流往往会呈现出短时剧烈变化,致使传统线性方法不能很好应用在安检旅客流量预测中。而混沌理论作为非线性动力系统所研究领域,常用于处理复杂而不确定性问题。基于混沌理论的时间序列预测在非线性系统预测方面得到广泛应用,例如在水文资源领域的径流预报[8]、经济现象[9]、大气现象[10]等。

基于此,本文重点研究混沌理论与时间序列分析相结合的安检旅客流量预测,主要工作包括:①采用Wolf定量方法分析了安检旅客流量时间序列的混沌特性;②采用基于GABP的安检旅客流量预测方法对安检旅客流量混沌时间序列预测;③考察了安检旅客流量时间序列不同尺度划分对预测精度的影响。

1 安检旅客流量时间序列混沌性判别

受航班时隙安排等影响,航站楼安检客流在不同时段呈现不同规律,为考查安检旅客短时流量随时间变化所呈现的时间序列特性,本文收集北京首都国际机场T3航站楼4月至9月的安检旅客短时间流量时间序列,正如图1至图3 所示。图1至图3中,纵轴表示安检旅客流量,单位为人;横轴是不同天但同一时段,其中,图1时间间隔是2 min(以6点30分至6点32分为例),图2是时间间隔为5 min(以6点30分至6点35分为例),图3是时间间隔为10 min(以6点30分至6点40分为例)。

图1 2 min粒度下不同天相同时段安检客流走势

图2 5 min粒度下不同天相同时段安检客流走势

图3 10 min粒度下不同天相同时段安检客流走势

从图1至图3不难看出,短时安检旅客流量具有一定随机性,即混沌信号所具有的特征。为了更好地定量分析安检旅客流量时间序列所具有的混沌性,为此先用相空间重构法重构安检客流时间序列,从而获得相空间,之后通过Wolf法定量分析其特性信息即最大Lyapunov指数,以判断其是否具有混沌性。

1.1 重构相空间

相空间重构的定义、基本思想请参见文献[11]。

相空间重构有导数重构法以及延迟重构法两种方法。

本文通过后者对安检旅客流量时间序列进行相空间重构,具体如下:

其中,安检旅客流量时间序列即:x={x(ti),i=1,2,…,n},n是时间序列样本个数。需要构建M=n-(m-1)τ个m维相空间矢量X(ti), 如式(1)所示

X(ti)=(x(ti),x(ti+τ),…,x(ti+(m-1)τ))T
i=1,2,…,M

(1)

重构的相空间X(t), 如式(2)所示

X(t)=[X(t1),X(t2),…,X(tM)]

(2)

其中,m、τ分别是嵌入维数、延迟时间,X则是m×M的矩阵。

通过后者重构相空间,其中,要确定好τ和m, 为此,本文通过自相关函数法给出延迟时间τ, 和通过伪邻近点法给出嵌入维数m。

1.1.1 采用自相关函数法确定延迟时间

自相关的定义、基本思想请参见文献[12]。

已知时间序列x, 且均值为μ、 去均值为h(i)=x(i)-μ,i=1,2,…,n、 样本数n、 循环次数td(1≤td≤100), 则自相关函数是关于时间延迟τ的函数C(τ), 正如式(3)所示,其中,第一个极小值点τ为安检客流时间序列相空间重构所用到的最佳延迟时间

(3)

1.1.2 采用伪邻近点法确定嵌入维数

伪邻近点法(false nearest neighbor,FNN)是确定嵌入维数最常用的方法,其相关定义、基本思想请参见文献[13]。

1.2 Wolf方法获得最大Lyapunov指数

Wolf方法的定义、基本思想请参见文献[14]。

由式(1)所得到的X(ti) 即为重构相空间中的点,t0时刻,取初始点X(t0), 设其与最邻近点X0(t0) 的距离为L(t0), 追踪这两点的时间演化,直到t1时刻,其间距超过某个规定值ε>0,L′(t1)=|X(t1)-X0(t1)|>ε, 保留X(t1), 并在其邻近寻找一个能使L(t1)=|X(t1)-X1(t1)|<ε并且与之夹角足够小的点X1(t1)。

继续上述步骤,直至X(t) 到达时间序列末端终止,此时追踪演化过程的迭代总记H, 其Lyapunov指数λ, 正如式(4) 所示

(4)

2 基于GABP的安检旅客流量预测

2.1 算法的提出

考虑安检旅客流量时间序列具有一定混沌特性,本文提出基于GABP的安检客流预测方法。此方法不仅可避免BP神经网络预测模型容易陷入局部极小,而且使得BP神经网络收敛速度快。图4为GABP算法流程。

图4 GABP算法流程

图4中,左半部分是使用遗传算法来优化初始权值、阈值分布,右半部分是利用基于优化的权值和阈值的BP神经网络进行预测。

2.2 遗传算法

遗传算法的定义、基本思想以及所涉及到的选择、交叉和变异等操作请参见文献[15]。

2.3 BP神经网络

BP神经网络的定义、基本思想请参见文献[16]。

2.4 GABP算法相关步骤

采用GABP算法对安检旅客流量预测的具体步骤如下:

(1)对所获取的安检旅客流量历史数据进行归一化预处理。

(2)设置种群规模、染色体长度等参数。对种群初始化,通过实数编码法来编码BP神经网络的初始权值、阈值。

(5)

(6)

(4)利用轮盘赌法给出选择概率pi, 正如式(7)所示

(7)

式中:fi=1/fitnessi,P为种群规模。

(5)利用实数交叉法。其中第k个基因wk以及第l个基因wl在j位完成交叉,如式(8)所示

(8)

式中:b为[0,1]的随机数。

(6)变异操作。对第i个个体的第j个基因进行变异操作,正如式(9)、式(10)所示

(9)

f(g)=r2(1-g/Gmax)

(10)

式中:wmax、wmin分别为基因wij的最大值、最小值,r是[0,1]中的随机值,r2是当中的一个随机值,g为当前迭代次数,Gmax为最大进化代数。

(7)算法终止条件判断,若符合结束条件,则返回全局最优个体,否则,进化代数加1,且转向(3)继续优化。

3 实 验

3.1 实验数据及预处理

实验数据为北京首都国际机场T3航站楼2013年4月至9月累计6个月的旅客安检数据,经预处理,得到不同时间尺度(2 min,5 min,10 min)的安检旅客流量数据。表1给出了以2 min时间粒度为例的4月1日至9月30日部分安检旅客流量数据样例(共有183个安检旅客流量时间序列数据,实验训练样本为前176个,后7个为测试样本)。

表1 安检旅客流量数据部分样本

3.2 实验设置及实验评价

3.2.1 实验参数设置

经大量实验,确定BP神经网络参数设置:训练次数35 000,训练目标0.000 01,学习率0.01;遗传算法参数设置:种群规模100,进化代数120,交叉概率0.4,变异概率0.2。

3.2.2 实验相关评价

本文预测评价指标为相对误差,如式(11)所示

(1≤i≤28)

(11)

Perr(i) 为相对误差,Real_Value(i) 为真实值, Predicted_Value(i) 为预测实际值,i是下标(1≤i≤28)。

3.3 实验过程以及实验结果分析

进行了如下实验:①采用Wolf方法进行安检旅客流量时间序列混沌性判别;②采用GABP预测方法对安检旅客流量时间序列进行预测,基准算法选择BP预测方法。

3.3.1 安检旅客流量时间序列混沌特性判别

首先,通过自相关函数法获得延迟时间τ和通过虚假邻近点法获得嵌入维数m。 最佳延迟时间为自相关函数的第一个极小值点,最佳嵌入维数为伪邻近点百分比将骤然降至(或接近0)且不再随m增大而变化的骤变点处的m0值。其次,进行相空间重构。最后采用Wolf法计算最大Lyapunov指数。

3.3.1.1 计算最佳延迟时间τ以及最佳嵌入维数m

篇幅所限,表2列出了2013年4月1号至9月30号以10 min为时间间隔从上午5点30分至晚上19点30分安检旅客流量数据所对应的最佳延迟时间τ以及最佳嵌入维数m。 表2中,T1代表5∶30-5∶40,T2代表5∶40-5∶50,…,以此类推,T84代表19∶20-19∶30。

3.3.1.2 重构相空间

其中所构造出的安检旅客流量时间序列相空间形如公式(12)所示

(12)

其中,i为m维相空间矢量个数 (1≤i≤N-(m-1)τ),N即安检旅客流量时间序列样本数,m是最佳嵌入维数,τ是最佳延迟时间。

获得最佳时间延迟、最佳嵌入维数后,对相空间重构,正如式(13)所示(以7∶00-7∶10为例,相空间重构中的各个元素值是时间尺度为10 min不同天相同时间段下安检旅客流量时间序列样本值,其中τ=6,m=4)

X={X(1),X(2),……X(t)}=

(13)

将具体数据代入式(13)中得到,如式(14)所示

(14)

3.3.1.3 计算最大Lyapunov指数

使用Wolf法,求得每个时段相应的最大Lyapunov指数。表3给出了最大Lyapunov指数λ,其中表3中的T1至T84的含义同表2。

表2 10 min粒度下最佳延迟时间τ、最佳嵌入维数m

表3 以10 min为时间间隔序列最大Lyapunov指数λ

安检客流时间序列混沌特性判别的定量依据是最大Lyapunov指数是否为正,通过Wolf方法获得最大Lyapunov指数均为正。(以7点至7点10分为例,最大Lyapunov指数为2.447,为正),因此该时间段安检旅客流量时间序列具有混沌特性。

3.3.2 采用不同预测方法多时间粒度对安检旅客流量混沌时间序列预测

以9月24日为例,表4给出了不同粒度不同预测方法以半小时为单位的预测相对误差值。表4,TT1表示5∶30-6∶00,TT2表示6∶00-6∶30,…,以此类推,TT28表示19∶00-19∶30。

从表4可以看出,时间尺度为2min、预测方法为GABP,相对误差更小,预测精度更高。图5也以9月24日为例,给出了不同粒度不同预测方法在不同时段的预测结果。从图5可看出,尽管在不同时段,不同尺度不同预测方法的性能不同,但总体来讲,还是以 2 min 为粒度,使用GABP预测方法效果更好,性能更稳定。

表4 不同粒度不同方法的相对误差

图5 9月24日主要时段5∶30至19∶30不同时间尺度不同预测方法预测结果比较

4 结束语

围绕安检旅客流量预测问题,本文通过对安检旅客流量时间序列数据进行相空间重构,采用Wolf方法量化分析了安检旅客流量时间序列数据的混沌特性;在此基础上,考虑数据集特有的混沌特性,从而提出一种遗传算法优化BP神经网络的GABP安检旅客流量预测方法,在首都机场实际数据集上的实验结果表明,较之基准方法,本文算法能取得更好的预测精度。

猜你喜欢
相空间延迟时间维数
β-变换中一致丢番图逼近问题的维数理论
二氧化碳对乙烷燃烧着火延迟时间的影响
LTE 系统下行链路FDRX 节能机制研究
一类齐次Moran集的上盒维数
基于分层COX模型的跟驰反应延迟时间生存分析
相干态辐射场的Husimi分布函数在非对易相空间中的表示
延迟时间对气辅注射成型气体穿透行为影响的数值模拟和实验研究
非对易空间中的三维谐振子Wigner函数
相空间中含时滞的非保守力学系统的Noether定理*
具强阻尼项波动方程整体吸引子的Hausdorff维数