深度学习在水稻秧苗识别中的应用

2024-01-18 18:50邹立雯梁春英李圳鹏张荣丹
热带农业工程 2023年4期
关键词:秧苗卷积神经网络

邹立雯 梁春英 周 正 李 普 李圳鹏 张荣丹

(1 黑龙江八一农垦大学工程学院 黑龙江大庆 163319;2 黑龙江八一农垦大学信息与电气工程学院 黑龙江大庆 163319)

水稻是我国主要的粮食作物之一,种植面积较大[1]。目前,由于水稻种植田块高低不平、秸秆残留、插秧机操作不当等问题,常发生水稻秧苗漏插、漂秧等情况,目前水稻田间秧苗识别还主要依赖于人工评估,这种传统方式不仅费时费力,而且效率低下。随着计算机信息技术的广泛应用,运用图像识别作物成为了可能,深度学习(Deep Learing,DL)是相对支持向量机、最大熵等“浅层学习”而言非线性、层级更多的新型学习模式,通过建立模型,模拟人类大脑对接收的信息进行识别、处理与解释。深度学习通过数据集训练和学习,特征提取,可以快速准确识别秧苗,在精度和实时性方面远超传统作业方式,对水稻秧苗识别具有重要意义。

本文综述了近年来国内外水稻秧苗识别领域深度学习的相关研究,以期为研究者提供更多参考。

1 深度学习概述

深度学习的优势在于特征学习,即从初始数据中自动提取特征,由较低阶特征组合成更高层次特征[2]。不同的深度学习由各种不同组件构成,具体取决于所使用的网络类型。当前网络主要有卷积神经网络(Convolutional Neural Network,CNN)[3]、递归神经网络(Recursive Neural Network, RNN)[4]、栈式自编码网络(Stacked Auto Encoder)[5]、深 度 置 信 网 络(Deep Belief Network, DBN)[6]等,其中卷积神经网络是农业中最常用的一种网络模型。

深度学习网络基本构成为卷积层(Convolution layer)、池化层(Pooling layer)、全连接层(Fully connected layer)、损 失函 数(Loss function)、激活函数(Activation Function)等。卷积层包括多个卷积单元,用于从原始图像中提取复杂特征;池化层可以有效提取复杂特征信息,通过权矩阵集成局部信息,并输出降维信息;全连接层在整个网络中起“分类器”作用,将每一节点与上一层的节点相连,进行特征提取;损失函数用于判断模型输出与实际值间的误差,常用的损失函数有最小二乘损失函数、指数损失函数等;激活函数是深入学习建模的重要组成部分;神经网络通过激活函数进行非线性学习,常用功能包括Sigmoid、Tanne、Relu等。

1.1 卷积神经网络

目前,卷积神经网络是发展比较成熟的深度学习网络[7],20 世纪90 年代LeNet5 的出现标志着卷积神经网络已经初步成熟[8]。卷积神经网络包含输入层、隐含层、输出层,其中输入层可以处理多维数据,一般对原始数据进行初步处理,经过灰化度与归一化,使数据特征更加显著;隐含层为卷积神经网络的核心,经卷积层提取特征数据,由池化层选择和过滤信息,优化网络结构并输出降维信息,最后由全连接层分类整合传递给输出层,由输出层结合逻辑函数或归一化函数输出分类标签。

1.2 递归神经网络

递归神经网络是空间上的展开,处理的是树状结构的信息,分为全局反馈递归网络、前向递归神经网络、混合型递归网络。递归神经网络可以描述系统的动态特征,使动态数据在网络中循环,并将动态特征与信息储存[9];递归神经网络的隐含层环环相扣,对于上一结点的数据有记忆功能,并添加到当前的计算中。

1.3 栈式自编码网络

栈式自编码网络是基于自编码神经网络改进而成[10],由多层训练好的自编码器组成,有效减少了自编码网络由于数据随机初始化而造成的参数无法调节问题,保证了数据的稳定性;这种每层都由自编码器单独训练的好处是提高了算法准确性,收敛效果更好。

1.4 深度置信网络

深度置信网络[11-12]是由无数个受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)与单层反向传播神经网络构成,为生成概率模型;通过对数据高阶相关性描述,得到联合分布概率,推断样本的分布,常用来进行文字检测、人脸识别、遥感图像分类等。

2 深度学习在水稻秧苗识别中的应用

水稻秧苗识别对提高插秧质量、预测产量等有重要意义。李爱传等[13]通过监测水稻的生长指导水稻生产。景卓鑫等[14]使用神经网络与雷达结合实现水稻参数的估算,绘制水稻不同时期的空间分布图,实现水稻生物量的生长监测。迟德霞等[15]基于模糊C均值聚类对水稻秧苗进行图像分割,发现对水稻图像与背景像素的不同聚类点进行分割,平均误差率在1.5%,大大改善了插秧机的精确度。陈信新等[16]基于机器视觉对水稻的发育形态和生长环境进行识别,采用聚类算法对图像进行分割,结合Hough 预处理,秧苗识别准确度达到87.5%,秧苗形态参数误差不超过7%。Wang Y Y等[17]利用线性混合模型对水稻生物量进行估测,与传统机器学习算法进行比较,结果表明,线性混合效应模型可以准确估计水稻生物量和叶面积指数,固定翼无人机在监测大规模农田作物生长状况方面很有前景。Vlaminck L 等[18]通过自动计算机分析水稻幼苗的相关参数,这种新型、稳健、快速基于表型的水稻筛选方法与预期的植物生长调节一致,揭示了该装置在重现性方面的稳健性。王姗姗等[19]提出基于特征点邻域Hough 变换的水稻秧苗检测方法,结合Faster RCNN 网络对水稻秧苗的特征点进行提取,这种方法对测试秧苗的平均识别准确度达到92%,对曲率较大的秧苗行也能准确识别。陈旭君等[20]提出基于YOLO 卷积神经网络对水稻秧苗的行线检测,通过YOLO网络对水稻图片训练,对秧苗进行定位,检测行线标准,相比Faster R-CNN和Res Net101,该方法泛化能力更强、鲁棒性更好。Ramadhani等[21]开发了一个自动绘图工作流,使用多源遥感数据(Sentinel-2、MOD13Q1和Sentinel-1)以10 m 空间分辨率绘制水稻生长阶段的近实时多时相地图,基于Sentinel-2的模型分类给出了90.6%的总体准确率,融合模型MOD13Q1/Sentinel-1显示了78.3%,Sentinel-2/MOD13Q1/Sentinel-1 的集成精度为84.15%。Ramadhani 进行改进[22],提出Sentinel-2 分类过程中的一些变化,以提高总体绩效,这将为农业决策者提供更好的信息。Yang M D等[23]将卷积神经网络与无人机结合,介绍了一种利用ExGR 索引生成水稻幼苗训练数据的半自动标注方法,采用k倍交叉验证,以获得训练与测试比数据为80/20 的分割比。网络的精度随着历元的增加而增加,交叉验证数据集的所有划分均达到0.99的精度。Ramadhani F等[24]提出了光学(PROBA-V)和雷达(Sentinel-1)图像的集成,用于水稻生长阶段的时间地图绘制,PROBA-V 的水稻生长阶段模型的总体准确率为83.87%,使用支持向量机分类器的Sentinel-1模型的准确率为71.74%。植被面积和收获面积之间的平均相关性为0.50,滞后时间为89.5 d,这一结果与当地统计数据相似。徐建鹏等[25]提 出 一 种 基 于Rectified Adam 优 化 器 的ResNet50卷积神经网络图像识别方法,对水稻生育期 进 行 自 动 识 别, 并 于VGG16、 VGG19、ResNet50 和Inception v3 进行对比分析图像识别能力,结果表明,在真实场景下,Rectified Adam 优化器的ResNet50 卷积神经网络分类识别准确率在97.33%,稳定性好、收敛速度快、鲁棒性强。朱伟等[26]提出一种基于卷积神经网络Google Net 对水稻秧苗进行形态识别,采用无人机进行低空拍照,Google Net 训练数据,对单穴秧苗分类识别,平均识别正确率为91.17%,平均耗时0.27 s,与传统支持向量机、BP神经网络相比,分类精度分别提高21%、13%,时间分别缩短了1.09、0.58 s。

3 结论

本文介绍了深度学习在水稻秧苗识别中的应用,前期试验表明,深度学习在水稻秧苗识别上的准确度可达90%以上,可帮助插秧机有效规避错误,实现水稻的优质高产。深度学习是目前最具潜力的图像识别方法,具有良好的泛化能力和鲁棒性,在水稻秧苗识别中可以有效提取图像特征,扩展数据集,节省更多的人工成本。

4 展望

目前,有关深度学习的研究大多还处于试验阶段,仅简单将采集到的图片发送给终端,在水稻图像集收集及前期处理过程中还存在很多问题亟待解决,如田间图片背景复杂,光线造成阴影斑驳等,后期训练过程中也出现数据集样本不典型、过拟合等问题。

猜你喜欢
秧苗卷积神经网络
DA-6对番茄秧苗生长的影响
基于3D-Winograd的快速卷积算法设计及FPGA实现
神经网络抑制无线通信干扰探究
从滤波器理解卷积
农民
基于傅里叶域卷积表示的目标跟踪算法
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于Meanshift和Hough变换的秧苗行中心线提取
基于支持向量机回归和RBF神经网络的PID整定