自动机器学习工具Auto-Keras在机场跑道视程预测中的应用

2022-04-16 06:21朱国栋孙建杰刘晓明
科技创新与应用 2022年9期
关键词:量级训练样本能见度

朱国栋,孙建杰,刘晓明,梁 艳

(1.民航新疆空中交通管理局空管中心气象中心,新疆 乌鲁木齐 830016;2.民航新疆空中交通管理局气象服务部,新疆 乌鲁木齐 830016)

在机场运行中,机场能见度直接关系到航空器能否起飞和着陆,它是保障航空器安全飞行的重要气象要素,尤其是大雾、沙尘等造成的低能见度天气,会严重影响航班的正常运行。目前在机场低能见度天气下,民航气象服务机构以主导能见度的预测服务为主,但是在机场启用II类和III类运行的情况下,跑道视程(简称RVR)直接决定航空器是否能够起飞和降落[1-2],虽然已有相关研究表明,主导能见度与跑道视程有一定的关系[3],但是在低能见度天气下,跑道视程放行标准远低于主导能见度,因此研究跑道视程的预测,改善现有的气象服务产品的种类,对低能见度天气下机场运行有着积极的作用[4-5]。随着近些年数值预报技术和机器学习的发展,机场能见度方面的预测由原先的天气形势预测和要素外推[6-8],逐渐结合大数据分析、机器学习等方法,构建历史数据模型,输出客观的要素预报产品[9-13]。本文通过利用乌鲁木齐机场自动观测系统历史数据,使用自动机器学习工具Auto-Keras进行建模训练,为气象服务人员提供客观的跑道视程预测产品,丰富低能见度天气下的气象服务产品。

1 资料引用

本文使用乌鲁木齐机场2010年1月至2021年2月的机场自动观测系统逐分钟跑道视程观测数据,通过数据筛选和质量控制,结合乌鲁木齐机场低能见度气候特征,筛选11月至次年3月的数据,获得247万行历史数据用于建模训练。其中165万条记录用于自动机器学习模型的训练,81万条记录用于检验模型的预测效果。

考虑逐分钟历史数据规模庞大,为提高建模效率,确保后续业务化的运行速度,本文仅将跑道视程作为因子,为尽可能包含过去跑道视程的演变过程,将预报时效之前2 h的逐分钟跑道视程作为因子。

2 方法介绍和模型训练

传统的机器学习方法中,在给定的数据集中实现最佳的预测模型,通常需要进行数据预处理、特征选择、模型构建及参数寻优等业务流程,这些处理通常非常复杂,需要具备机器学习背景知识的专家来完成,随着近些年机器学习的不断发展,越来越多的预测方法和模型被开发出来,选择合适的模型变得越来越困难,并且参数调优需要遍历所有可能的值,这些都需要大量的人工操作,这些工作都会导致机器学习业务转化困难,流程难于管理。为改善这些问题,自动机器学习方法就应运而生,它能够简化机器学习业务流程,消除常规手动的模型选择和参数寻优,帮助非机器学习专家能够轻松处理相关任务。

Auto-Keras使用高效神经架构搜索(ENAS),对候选模型进行训练,通过参数共享提升训练速度,最终获取最优的模型参数。本文使用Nvidia P6000 GPU进行Auto-Keras的模型构建和运算加速,解决神经架构搜索的计算耗时问题。结合整体计算资源和建模时效性,本文使用Auto-Keras工具包,设置迭代寻优次数后进行模型训练,其中代码主要部分如图1所示。

图1 Auto-Keras方法建模流程代码

通过上述代码,使用GPU进行加速运算,经过近10 h的模型训练和参数寻优,Auto-Keras方式自动获取最优模型,具体模型参数见表1。

表1 Auto-Keras的最优模型及参数

3 结果检验

3.1 不同量级下跑道视程预测效果分析

为了评定Auto-Keras工具建模的预测效果,本文利用平均绝对误差来评估模型的预测效果,具体计算方法如下:

其中:Fj为预报值,Oj为观测值。

本文根据机场运行需要,将跑道视程按照100 m量级进行分类检验,分别计算不同量级下,训练样本和检验样本的平均绝对误差,评估模型在低能见度天气下,尤其是跑道视程低于500 m情况下的预测能力。

从误差统计表(表2)中可以看到,乌鲁木齐机场跑道视程大于等于1 000 m的样本总体较多,训练样本占比达89.23%,检验样本占比达93.92%,因此模型对该量级情况下的训练最为充分,得到的模拟效果最好,平均绝对误差仅为4~6 m,但是考虑该量级下飞行活动不受影响,故此处不讨论该量级下的预测效果。分析其余跑道视程量级的预测效果可以看到,跑道视程在[100,200)、[200,300)、[800,900)、[900,1000)范围内预测误差相对较小,训练样本和检验样本的平均绝对误差均维持在100 m以内,其中训练样本跑道视程在[200,300)范围内平均绝对误差最小,仅为70 m;检验样本跑道视程在[100,200)范围内平均绝对误差最小,为68 m。跑道视程在[0,100)、[300,400)、[400,500)、[500,600)、[600,700)、[700,800)范围内的误差偏大,训练样本和检验样本的平均绝对误差均超过100 m,其中训练样本和检验样本在[500,600)范围内最大,达到180 m以上。具体误差统计见表2。

表2 不同区间范围内的跑道视程预测误差分析

通过分析预测模型对不同量级下跑道视程的平均绝对误差可以看到,Auto-Keras构建的预测模型能够较好地预测出跑道视程,在跑道视程小于1 000 m的时候,训练样本和检验样本的平均绝对误差维持在70~180 m,考虑到训练样本中不同量级的跑道视程数量差异,构建模型对于不同量级的跑道视程预测能力也不同,在实际应用过程中,需要结合误差分析表,额外考虑不同量级跑道视程的预测能力,综合分析获得跑道视程的预测结果。

3.2 跑道视程预测效果月度变化分析

由于乌鲁木齐机场冬季不同月份下低能见度天气差异较大[14],因此需要单独评估不同月份下,跑道视程预测的效果。通过表3可以看到,不同月份下各量级的跑道视程数量差异较大,其中11月、12月、1月出现的低跑道视程情况较多。

表3 跑道视程预测效果逐月变化分析

构建的模型对跑道视程的预测在11月效果最好,训练样本的平均绝对误差在58~156 m之间,检验样本的平均绝对误差在42~167 m之间,其中训练样本在[200,300)区间范围内预测效果最好,平均绝对误差约为58 m,检验样本在[100,200)范围内平均绝对误差约为43 m;另外,考虑跑道视程1 000 m下对飞行活动没有影响,该情况不单独进行分析。12月、1月、2月整体误差较为稳定,训练样本的平均绝对误差在66~197 m之间,最低出现在2月跑道视程区间[900,1000),检验样本的平均绝对误差在56~290 m之间,最低出现在12月跑道视程区间[100,200)。3月份部分量级下的跑道视程样本数量较少,整体误差偏大,训练样本的平均绝对误差在65~172 m之间,检验样本则在45~192 m之间,部分量级下跑道视程预测误差较大。

3.3 逐分钟跑道视程预测效果分析

为了评估模型对逐分钟的跑道视程预测效果,以及模型对低能见度天气的预测能力,本文挑选乌鲁木齐机场的2次大雾天气,分析大雾天气下跑道视程的演变以及模型预测效果。

2017年11月10日乌鲁木齐机场跑道视程00:22至05:30(UTC,下同)持续低于800 m,期间跑道视程最低150 m,通过分析模型预测的跑道视程可以看到,实况00:22之前跑道视程大于等于1 000 m,之后突然降低,并长时间维持在200 m左右,05:30之后跑道视程逐渐好转至1 000 m以上。通过分析模型输出的跑道视程实况与预测结果对比图(图2)可以看到,模型预测的跑道视程整体趋势与跑道视程实况演变较为一致,跑道视程预测值转差的时刻在00:27附近,转好的时刻在05:30附近,能够较好地预测出能见度转差、转好的时间段,同时也预测出跑道视程长时间持续维持在200 m的区间,此次跑道视程预测效果能够为预报人员提供较为客观的预测支持。

图2 乌鲁木齐机场2017年11月10日逐分钟跑道视程预测结果

虽然模型能够较好地预测出持续长时间的低能见度情况,但是还需要评估跑道视程大范围波动变化的情况,通过筛选判断(图3),可以看到2021年2月14日至15日,乌鲁木齐机场出现大雾天气,跑道视程出现较大范围的波动变化和长时间低于运行标准的情况,模型预测的跑道视程能够描述出此次天气过程中跑道视程的整体变化趋势,包括跑道视程在14日23:58逐渐转差,15日02:00附近的短时好转以及15日03:15的逐渐好转,说明模型具备对复杂变化的跑道视程预测的能力。

图3 乌鲁木齐机场2021年2月14日至15日逐分钟跑道视程预测结果

通过分析2次不同特征的天气个例预测效果可以看到,模型预测的跑道视程能够描述出跑道视程的变化趋势,并对跑道视程持续偏低的情况有较好的预测能力。但是,通过对比分析,也能够发现模型的一些问题,在跑道视程转差、转好的时间点预测方面,模型预测的跑道视程与实况存在一定的时间滞后性,大致在5~10 min,且跑道视程的预测值还存在100~200 m的误差,这些需要在使用过程中进行综合分析和判断。

4 结论

(1)通过采用自动机器学习工具Auto-Keras构建乌鲁木齐机场跑道视程预测模型,简化了常规机器学习中的特征筛选、参数寻优和模型验证等流程,降低了机器学习在气象领域的应用难度。

(2)将乌鲁木齐机场自动观测系统的历史数据作为训练样本,并对跑道视程进行预测,通过对跑道视程预测结果的分析可以看到,模型预测的跑道视程效果较好,能够反映出跑道视程的变化趋势,可以作为预报人员用于预测跑道视程的业务参考。

虽然自动机器学习构建的模型能够较好地用于预测跑道视程,但是局限于计算资源,本文仅选取跑道视程历史演变作为因子进行建模训练,实际上跑道视程的变化还与机场风速、温度、湿度和背景光强度等要素有关,在后续的研究中,应该增加上述要素作为因子进行训练,充分考虑其他要素的演变对跑道视程变化,对比分析不同要素作为因子对整体模型预测准确性的影响,改善模型预测的准确性。同时,本文预测的跑道视程虽然趋势预测比较准确,但是在开始、结束时间上仍然有一定的滞后性,后续研究同样需要调整因子数量,改善预测效果滞后的问题。

猜你喜欢
量级训练样本能见度
大兴机场低能见度变化特征分析
能见度仪在海陀山的应用
人工智能
21连胜
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
低能见度下高速公路主动诱导技术的应用
低能见度下高速公路主动发光诱导设施设置