深度学习方法在农业产业园区气象要素预报中的应用

2020-03-12 05:39饶莉娟陈清峰
江西农业学报 2020年1期
关键词:气象要素蓝莓产业园

张 星,饶莉娟,陈清峰,张 恺

(1.青岛市黄岛区气象局,山东 青岛 266400;2.青岛市气象灾害防御工程技术研究中心,山东 青岛 266100)

0 引言

现代农业产业园区是指以带动农民持续增收为目标,根据区域优势、集中连片发展主导农业产业,培育建设规模化、标准化的优势农业产业集聚区[1]。目前,国内对现代化农业产业园区的研究大多集中在规划设计方面[2-6],从气象服务方面进行的分析研究工作较少。事实上,准确的气象要素预报在保障现代化农业产业园区健康发展中起至关重要的作用,农作物生长发育与气象因子密切相关,农业是对气象条件最为敏感的行业之一。异常的气象条件变化会对农业产业园区造成重大损害,严重影响了农业生产和农民收益。因此,针对不同区域的农业产业园区的精细化的气象要素预报是提升农作物品质、提高农作物产量的关键条件之一。

以蓝莓产业为例,青岛市黄岛区自2000年以来大力发展蓝莓种植产业,建立了多个现代化农业产业园区,目前已成为全国县域种植面积最大、产业化程度最高的蓝莓主产区。然而,蓝莓是一种对气象要素变化非常敏感的果树,早春冻枯、抽梢,花期低温败育、干热风败育,夏季高温干枯等因素都可能导致蓝莓大幅减产、绝收,严重影响了蓝莓产业。如同其他农业产业园区一样,黄岛区蓝莓产业园区面积广大、分布广泛,不同区域形成比较明显的局地小气候特点,造成不同区域产业园区的气象要素有显著的差异。之前气象部门发布的常规气象要素预报主要是为主城区提供气象服务,缺少直接服务于农业产业园区的气象产品。由于黄岛区国家气象观测站位于主城区沿海地区,同西部丘陵地区的蓝莓产业园区的气象要素差别很大,如果将气象部门发布的针对主城区的气象要素预报直接应用到蓝莓产业园区,则会导致较大的预报误差。因此,目前的常规气象预报业务已经远远不能满足服务现代农业生产的需求。又考虑到目前业务化的农业产业园区气象要素预报尚处于起步阶段,国内外相关理论研究结果也较难直接应用于常规的气象业务[7-10]。因此,开展能普遍适用于农业产业园区的气象要素预报研究具有重要的实际应用价值。基于以上考虑,本文尝试将深度学习方法应用于农业产业园区的气象要素预报中。

作为机器学习的一个分支,深度学习在近年来发展十分迅速,并且在人工智能的很多子领域都取得了巨大成功。深度学习可以从有限样本中通过算法总结出一般性的规律,并应用到新的未知数据上。因此,我们可以从历史气象数据中总结出不同地区气象要素之间的关系。当已知针对主城区的气象要素预报值后,便可以利用主城区与农业产业园区气象要素之间的关系,来计算出农业产业园区的气象要素预报值。

由于深度学习采用的模型一般比较复杂,样本的原始输入到输出之间的数据流经过多个线性或非线性的过程,每个过程的权重大小会直接影响到最后的建模效果。目前可以比较好解决权重分配问题的模型是神经网络模型,神经网络模型也因此成为深度学习中主要采用的模型。如果我们把神经网络看作是由一组参数控制的复杂函数,并用来处理一些非线性模型识别任务(比如两个不同地区气象要素之间的非线性关系)时,神经网络的参数可以通过机器学习的方式来从历史数据中学习得到。

本文以黄岛蓝莓产业园区气象要素预报为例,探讨深度学习方法在农业产业园区气象要素预报中的应用。通过神经网络方法建立了蓝莓产业园区气象要素预报模型并对预报结果进行检验。本文介绍了使用的数据及神经网络方法,以蓝莓产业园区为例,探讨了深度学习方法在农业产业园区气象要素预报中的应用。通过敏感性试验探讨该方法推广到其他地区农业产业园区的适用性。

1 资料与方法

1.1 资料说明

为了给蓝莓产业发展提供气象技术支撑,黄岛区气象局于2016年在六汪镇蓝莓产业园区建立了气象要素观测系统,对蓝莓产业园区内的气温、地温、10 cm深地温、20 cm深地温和空气相对湿度这些对蓝莓有重要影响的气象要素进行观测,目前已积累了3年的逐小时气象要素观测资料。本文以2016年4月20日至2018年4月20日蓝莓产业园区气象要素观测站和黄岛区国家气象观测站积累的历史观测资料为训练数据,利用深度学习方法找寻蓝莓产业园区气象要素与以黄岛区国家气象观测站为代表的主城区气象要素之间的关系。利用两者之间的非线性关系,建立蓝莓产业园区气象要素预报模型。预报模型建立后,只需将日常气象业务中针对主城区的气象要素预报值输入,便可得到蓝莓产业园区的气象要素预报值。之后,利用2018年4月21日至2019年4月20日的数据对建立好的蓝莓产业园区气象要素预报模型进行检验,来考察深度学习方法对预报结果的改进程度。此外,为了考察该方法在其他农业产业园区的推广效果,利用2010~2018年青岛地区的青岛国家基本气象站、黄岛国家气象观测站、平度国家气象观测站和崂山国家气象观测站观测的日平均气压、日平均气温、日最高气温、日最低气温、日平均相对湿度和日平均风速这些气象要素,来验证该方法在其他地区农业产业园区的预报效果。

1.2 方法

本文使用反向传播神经网络算法(BP神经网络算法)来进行深度学习,BP神经网络是一种按照误差反向传播算法训练的多层感知器网络,又称为误差方向传播算法,是监督式深度学习方法的一种[11]。BP神经网络算法本质是优化计算中的梯度下降法,利用误差对于权、阈值的一阶导数信息,应用误差反传原理不断调整神经网络中不同的线性或非线性过程的权重,使神经网络输出值与期望值之间的误差平方和达到最小(或小于设定精度)。BP神经网络由一个输入层、至少一个隐含层、一个输出层组成。理论上,只要隐含层数和每层的节点数足够多,神经网络就具有模拟任意复杂非线性映射的能力[12]。但在实际应用中,隐含层层数和节点数与需解决问题的复杂程度、转换函数型式以及样本数据的特性有关,合理的隐含层数和节点数可在确保网络收敛精度的同时,亦使网络具有良好泛化能力[13]。由于BP神经网络具有很强的非线性映射能力,因此可以用来映射不同两地气象要素间的非线性关系。

2 深度学习方法在蓝莓产业园区气象要素预报中的应用

目前,黄岛区气象局每日发布的气象要素预报主要针对以黄岛国家气象观测站(参考站)为代表的城区气象条件。假设针对城区气象要素的预报没有预报误差,那么将预报结果应用到蓝莓产业园区(预报站)后,城区与蓝莓产业园区气象要素之间的差异即可认为是蓝莓产业园区气象要素的预报误差。经过深度学习后,可以根据参考站与预报站气象要素之间的非线性关系建立神经网络订正模型。将针对参考站的预报结果经过神经网络模型订正后便可得到预报站的预报结果。预报站的预报结果与真实值之间的偏差为订正后的预报误差。本质上,深度学习方法是通过找寻参考站和预报站气象要素间的非线性关系来建立神经网络模型,从而订正农业产业园区的预报结果,减小预报误差。

2.1 训练神经网络模型

鉴于蓝莓产业园区气象要素观测站已积累了3年的气温、地温、10 cm深地温、20 cm深地温和相对湿度这些气象要素的逐小时数据,黄岛区国家气象观测站也一直日常观测这些气象要素,因此本文采用这5个气象要素组建模型训练样本。训练数据采集时段为2016年4月20日到2018年4月20日,另将2018年4月21日至2019年4月20日的数据留做建模效果检验。将训练数据质量控制后进行归一化处理,输入计算机进行深度学习,通过BP神经网络方法计算出各节点的权重,得到神经网络模型。在训练神经网络模型过程中,我们采用不同的神经网络拓扑结构进行反复试验,以使神经网络模型在训练效果与检验效果间取得最优平衡[14]。这样可在保证模型具有足够收敛精度的同时,又确保其具有相应的泛化性能。经过反复试验,最后确定采用含有3个隐含层、每层各20个节点的神经网络拓扑结构(图1),并使用Sigmoid函数作为网络的激活函数。将训练数据输入神经网络模型进行循环运算,采用精度与循环次数双层控制,当达到一定精度或循环次数后,利用计算所得的节点权重即可构建最终的神经网络预报模型。

图1 神经网络模型示意图

其他一些说明:(1)黄岛国家气象观测站为国家级气象站,气象观测设备有专人日常维护,异常数据每天会进行人工质控,气象数据可用性高。而蓝莓产业园区气象观测站为无人监管的小区域站,存在数据缺测的情况。因此在数据建模前要对数据进行预处理,剔除缺测时间段的数据。(2)为提高模型训练速度、有效避开Sigmoid函数的饱和区,并使神经网络模型具有一定的外推能力,对数据进行归一化处理,使训练数据输入值在-1.0~1.0之间。对神经网络模型输出值进行反算即可得到实际值。(3)训练模型参数:最大收敛次数设为1000次,学习速率设为0.01,收敛误差设为0.01。(4)由于单次训练建立的模型有可能会收敛到局部极值,因此对数据进行10次建模,选取效果最好的模型作为最终的预测订正模型。

2.2 神经网络模型预报结果

将2018年4月21日到2019年4月20日逐小时气象要素作为检验样本,用来检验神经网络模型对预报误差的改善效果。由于以前气象业务上一直将黄岛国家气象观测站气象要素的预报结果直接用于蓝莓产业园区,因此黄岛国家气象观测站(参考站)气象要素与蓝莓产业园区气象观测站(预报站)气象要素间的偏差即可认为是原始的预报误差(以下称原误差)。将参考站的气象要素预报值输入神经网络模型进行订正后的结果与预报站实际气象要素间的偏差即为订正后的预报误差(以下称订正后误差)。通过原误差与订正后误差的对比即可体现出神经网络模型对预报误差的改善效果。

图2为未经订正前原温度预报误差(实线)与经过神经网络模型订正后的温度预报误差(虚线)的时间序列。可以发现,经过订正后预报误差明显减小,平均绝对误差由原来的1.62 ℃减小为1.13 ℃,平均绝对误差减小了30.25%。一些原先预报误差较大的时段,经过神经网络订正后可以很大程度上得到改善。比如在18年4月30日10时至16时期间,原预报误差均超过10 ℃,分别为:-11.2、-12.7、-13.1、-11.4、-12.9、-11.6和-10 ℃;而经过神经网络模型订正后,该时间段预报误差分别减小为-2.59、-2.56、-1.16、2.42、2.29、3.11和2.94 ℃。需要说明的是:由于大气是强非线性系统,神经网络模型订正后也会出现预报误差变大的情况。但整体上来说,经过神经网络模型订正后气温预报误差显著减小,原本预报效果较差的时段也通常会有大幅度改善。

图2 原气温预报误差(实线)与订正后的气温预报误差(虚线)

图3为未经订正前原相对湿度预报误差与经过神经网络模型订正后的相对湿度预报误差的时间序列。总体上,经过神经网络模型订正后,相对湿度的平均绝对值误差由原来的10.64%减小为7.06%,误差减小了33.65%,预报效果改善明显。图4、图5和图6分别为订正前后地表温度、10 cm深地温和20 cm深地温预报误差的时间序列(实线为订正前的原误差,虚线为订正后的误差)。经过神经网络模型订正后:地表温度的平均绝对值误差由原来的4.18 ℃减小为1.46 ℃,误差减小了65.07%;10 cm深地温的平均绝对值误差由原来的2.43 ℃减小为0.74 ℃,误差减小了69.55%;20 cm深地温得平均绝对值误差由原来的2.81 ℃减小为1.46 ℃,误差减小了48.04%。可以看出,相对于气温和相对湿度,地表温度、10 cm深地温和20 cm深地温的改善效果更好。这也是容易理解的:大气作为运动流体,不同地区空气间得热力因子和湿度因子在平流作用下互相影响,非线性作用强、变化幅度大;而不同地区土壤环境相对独立、非线性作用弱、变化幅度小。因此神经网络可以更好地捕捉到不同地区土壤温度之间的关系,经过神经网络模型订正后,原预报误差可大幅度减小。考虑到目前气象部门常常在预报业务中把2 ℃作为气温误差的预报上线,而经过神经网络模型订正后蓝莓产业园区的气温、表层地温、10 cm深地温和20 cm深地温的平均绝对值误差都在2 ℃以内,基本满足了业务运行的要求。

图3 原相对湿度预报误差(实线)与订正后的相对湿度预报误差(虚线)

图4 原地表温度预报误差(实线)与订正后的地表温度预报误差(虚线)

图5 原10 cm深地温预报误差(实线)与订正后的10 cm深地温预报误差(虚线)

3 不同地区农业产业园区的敏感性试验

我们利用深度学习方法建立了蓝莓产业园区气象要素预报订正模型,一年时间段的数据检验结果表明:该模型可以很好减小预报误差、提高预报技巧。经过神经网络模型订正后,气温、地表温度、10 cm深地温、20 cm深地温的平均绝对值误差都减小到2 ℃以内,相对湿度平均绝对值误差减小到7%,预报模型基本满足了蓝莓产业园区业务化运行的要求。为了验证该方法在其他地区的适用性,我们设计了如下敏感性试验:假设已知参考站的气象要素预报值,用深度学习方法构建神经网络预报订正模型,从而得到位于不同地区预报站的气象要素预报值。我们将青岛国家基本观测站设为已知预报值的参考站,另假设3个不同的农业产业园区分别位于黄岛国家气象观测站、平度国家气象观测站和崂山国家气象观测站附近,将以上3个国家气象观测站作为预报站。利用积累的历史气象数据进行训练建模,得到各预报站的神经网络预报模型。

图6 原20 cm深地温误差(实线)与订正后的20 cm深地温预报误差(虚线)

表1 各气象要素原预报误差和订正后的预报误差

项目气温/℃相对湿度/%地表温度/℃10 cm深地温/℃20 cm深地温/℃原误差1.6210.644.182.432.81订正后误差1.137.061.460.741.46

在对逐小时气象要素的建模效果检验的基础上,对逐日气象要素的建模效果进行了检验。此外,由于蓝莓产业园区气象站只有温度和湿度数据而缺乏气压、风速等气象数据,为了对这些气象要素的订正效果进行检验,因此,选取气压、日平均气温、日最高气温、日最低气温、相对湿度和风速这些气象要素进行敏感性试验。

表2展现的是位于黄岛的农业产业园区的气象要素预报值经过神经网络模型订正后的改善情况。可以看出,经过神经网络模型订正后,各气象要素的预报误差都有大幅度减小。其中,气压的平均绝对值误差由原来的8.11 hPa下降到0.47 hPa,误差减小了94.2%,在所有气象要素中改善效果最好。这是因为原气压误差主要是由于参考站(青岛站)与预报站(黄岛站)之间海拔高度差异引起的。与其他气象要素相比,不同地区气压间的关系更多的是线性关系,因此神经网络模型订正后的改善效果最好。当然,经过模型订正后,其他气象要素的预报效果也得到大幅度提升:日平均气温的平均绝对值误差由0.86 ℃降低至0.76 ℃,误差减小了11.63%;日最高气温的平均绝对值误差由1.38 ℃降低至1.04 ℃,误差减小了24.64%;日最低气温的平均绝对值误差由1.49 ℃降低至1.10 ℃,误差减小了26.17%;相对湿度的平均绝对值误差由4.65%降低至4.11%,误差减小了11.61%;风速的平均绝对值误差由1.30 m/s降低至0.42 m/s,误差减小了67.69%。

表2 黄岛站气象要素原预报误差和订正后的预报误差

表3和表4分别呈现的是位于崂山和平度的农业产业园区的气象要素预报误差的改善效果。可以发现,通过深度学习方法建立各自的气象要素预报订正模型后,气象要素的预报效果都有大幅度的提升。其中,崂山预报站气压的平均绝对值误差减小了90.89%,日平均气温的平均绝对值误差减小了44.55%,日最高气温的平均绝对值误差减小了55.22%,日最低气温的平均绝对值误差减小了25.00%,相对湿度的平均绝对值误差减小31.68%,风速的平均绝对值误差减小了60.69%。而位于平度预报站气压的平均绝对值误差减小了67.76%,日平均气温的平均绝对值误差减小了33.33%,日最高气温的平均绝对值误差减小了28.63%,日最低气温的平均绝对值误差减小了49.63%,相对湿度的平均绝对值误差减小28.69%,风速的平均绝对值误差减小了53.28%。

在3个预报站中,平度站位于内陆地区,黄岛站位于沿海地区,崂山站位于崂山山区附近。可以发现,深度学习方法在不同地区都具有普遍适用性。可以利用深度学习方法针对位于不同地区的农业产业园区建立各自的神经网络订正模型,进而减小气象要素的预报误差。

表3 崂山站气象要素原预报误差和订正后的预报误差

表4 平度站气象要素原预报误差和订正后的预报误差

4 总结与讨论

本文将深度学习方法应用于农业产业园区的气象要素预报中,利用深度学习方法建立了预报气象要素的神经网络订正模型。经过神经网络模型订正后,各气象要素的预报误差均大幅度减小。以蓝莓产业园区为例,详细介绍了如何利用深度学习方法建立农业产业园区气象要素的神经网络模型。模型建立以后,预报员只需把参考站的气象要素预报值输入神经网络模型,就可以得到蓝莓产业园区的气象要素预报值。该方法简单易行、适用性好,可以推广到不同地区的各种农业产业园区。

需要说明的是,本文是在假定参考站气象要素预报值为准确的情况下,利用参考站和农业产业园区气象要素间的关系,对参考站气象要素预报值进行订正,从而得到农业产业园区的预报结果。考虑到参考站的预报值本身也存在一定的预报误差,实际农业产业园区的预报误差还要加上参考站本身的预报误差。事实上,参考站的预报误差主要是由数值预报模式的模式误差导致,随着天气预报数值模式的进一步发展,模式误差会进一步减小。

在训练气象要素的选取上,样本数据的好坏直接关系到建模效果的好坏。因此,在实际业务使用中,不仅要考虑模型的预报精度,也要考虑在业务运行时能否获得稳定可靠的数据。简而言之,数据不一定要“多”,但一定要“精”。

近几年来,深度学习方法已经应用于各类行业并取得了良好的应用效果。本文探讨了深度学习方法在农业产业园区气象要素预报中的应用,结果表明:深度学习方法简单易行、针对不同地区的适用性强,可以应用到各地区不同的农业产业园区中。下一步,我们将对神经网络算法进行改进,进一步减小农业产业园区气象要素的预报误差,提高气象为农服务水平,促进现代农业产业园区的发展。

猜你喜欢
气象要素蓝莓产业园
成都电网夏季最大电力负荷变化特征及其与气象要素的关系
山西打造首个电商快递产业园
苏格兰:种植者呼吁推广本地蓝莓
山西首个快递+农产品产业园将于10月建成
江苏宿迁建成扶贫产业园
甜甜的蓝莓果
蓝莓的光泽
河蟹养殖水温预报模型研究
探测环境变化对临沭站气象要素的影响
中国文化产业园100强名单