基于神经网络的农作物产量预测方法

2022-02-10 08:37计雪伟霍兴赢伍晓平
南方农机 2022年2期
关键词:植被指数农作物卷积

计雪伟 , 霍兴赢 , 薛 端 , 伍晓平

(六盘水师范学院,贵州 六盘水 553004)

0 引言

随着社会的不断发展,世界人口数量的不断增长,人们对农作物的需求量也在不断增加。因此,准确地预测农作物产量对于全球的粮食安全具有重要意义[1]。

传统的预测产量的方法是建模,通过拟合过去的数据统计出结果,然后预测未来的数据。这种方法一般精度不高,而且很难用于大范围的预测。随着人工智能技术的不断发展,关于农作物产量预测研究也取得了一定的进步[2]。深度学习算法能够自动提取图像特征,并且能够很好地利用这些特征信息。因此,不少研究者将深度学习技术应用到了农作物产量预测上并取得了一定的成绩,如邢聪仁[3]用机器学习方法预测产量、宗宸生等[4]用BP网络预测产量、李昂等[5]利用无人机影像预测农作物产量。

本文利用公开的遥感图像数据对搭建好的神经网络模型进行训练,发现其对农作物产量预测有较好的效果,其实验结果及分析可以为农作物产量预测研究提供一定的参考。

1 实验方法

实验一共分为三部分,第一部分是影响农作物产量的关键因素分析,第二部分是图像预处理,第三部分为搭建、训练神经网络并分析结果,详细内容如下。

绿色植物中的叶绿素对不同的波段吸收能力是不一样的,对于红光波接收率达到85%以上,对于近红外波段接收率就很低,利用这一特点建立了植被指数的概念。它能够反映绿色植物中叶绿素的含量,因此植被指数是体现作物生长状况的重要指标之一,常用的植被指数有NDVI、LAI、EVI等,其中EVI的计算公式如下:

式中:ρBLUE、ρRED、ρNIR分别表示作物在蓝光波段、红光波段、近红外波段上的反射率,引入蓝光波段是为了进一步加强作物的反射率;C1是校正参数,用于弥补红光波段接收信号弱的缺点,C2是蓝光校正参数,L是土壤校正参数。EVI指数通过去除大气分子、水汽、大气残留物等实现了对大气环境的校正,同时它还解决了观测区域实际覆盖缺乏线性关系的问题。

目前用于农作物产量预测方面的主要特征参数有归一化的植被指数(NDVI)、增强型植被指数(EVI)、土壤湿度(Soil Moisture)、地表温度(LST)以及温度植被干旱指数(TVDI)等。作物在不同的生长阶段具有不同的特征,早期,土壤肥力和地表温度是预测的关键;中期,植被指数尤为重要。正确的特征选取可以使得模型的精度和鲁棒性得到提高,反之会使得模型的性能下降。因此,本文采用多个特征叠加的方法来进行训练模型。

由于气候条件和云层的影响,遥感图像中会含有许多噪声,噪声会覆盖图像中的有用信息,所以在将图像送入神经网络训练前需要对图像进行相应的处理。另外,实验部分样本数目分布不均衡,这将会导致训练好的模型对样本的识别存在较大的偏差。为了使数据平衡,实验中采用了图片翻转、裁剪以及加权的损失函数等措施使得数据得以均衡。

本文分析了卷积神经网络(CNN)和长短期记忆网络(LSTM)的结构特点以及优缺点,并混合这两种结构搭建了一种新结构进行作物产量估计研究,最后通过拟合问题的分析以及神经网络参数设置来优化神经网络以满足实验的需求。

1.1 实验数据

农作物产量的主要影响因素常常是温度、土壤、光照等。文中使用的实验数据来自于Google Earth Engine提供的公开卫星数据集,其中包含关于植被指数、地表温度、土壤湿度、土地年产量数据等。

1.2 神经网络结构

CNN卷积神经网络由输入层、卷积层、池化层等构成。该网络的主要优点在于能够通过卷积层从输入图像中自动提取图像特征,并不需要人为干预,这给整个实验带来了很大便利。另外,它通过卷积核实现了网络参数的权值共享,能够在一定程度上减少网络参数,从而降低网络模型的复杂程度。

LSTM网络是一种RNN网络的改进型,在该网络中数据流动成一个环状,这使得当前数据不仅能够受前面数据的影响还能受到后面数据的影响。通过这种结构网络能够很好地处理具有时间相关性的序列数据。

本文利用遥感图像来进行农作物产量预测[6],而卷积神经网络[7]在处理图像方面具有很大的优势;对于同一区域的农作物来说,其每一年的产量[8]具有一定的时间相关性,LSTM能够发挥一定的作用。结合以上两点,本文在搭建神经网络模型时采用了CNN与LSTM网络相结合的方式。具体来说,模型一共由五个部分组成,CNN层主要负责的是图像特征自动提取,LSTM层和全连接层负责预测输出。详细模型结构图如图1所示。

图1 模型结构图

1.3 训练的神经网络

本文采用基于 Windows 的 tensorflow深度学习框架对卷积神经网络进行搭建,神经网络的训练参数为learning rate=0.001,epochs=50,batch size=300。

1.4 实验结果及分析

为了评估神经模型的有效性,本文将与另外的神经网络进行比较,其中包括DNN、CNN,使用同样的数据集,做同样的数据预处理,对预测结果进行评价,评价标准是均方根误差,即预测结果与实际产量的偏差程度,计算公式如下:

式中:yi为对应该县的大豆实际产量,xi为该县的预测值,n是共选取该县的总数。

不同模型的误差率如表1所示。由实验结果可以发现DNN网络模型的效果没有CNN和CNN+LSTM好,而CNN网络由于在特征提取阶段受各种因素影响,对输入数据的要求高,而且很难学习到数据间的时间相关性,因此采用CNN和LSTM结合的模型来弥补单一网络在某些方面的不足,使得其效果有进一步的提升。

表1 不同模型的误差率

2 结论

本文采用了深度学习的方法来搭建神经网络模型,并且通过公开的[9]遥感影像[10]数据集来训练模型。最后通过相关的数据表明,本文中提出的方法相对于传统方法有一定的优势,不仅准确率高于传统方法而且鲁棒性也优于传统方法,能够为以后的农作物产量预测[6]的相关研究[7]提供一定的参考。

猜你喜欢
植被指数农作物卷积
高温干旱持续 农作物亟须“防护伞”
俄发现保护农作物新方法
夏季农作物如何防热害
基于无人机图像的草地植被盖度估算方法比较
厉害了!农作物“喝”上环保酵素
基于3D-Winograd的快速卷积算法设计及FPGA实现
冬小麦SPAD值无人机可见光和多光谱植被指数结合估算
卷积神经网络的分析与设计
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法