基于K-means聚类和分区寻优的秸秆覆盖率计算方法

2021-11-09 08:35安晓飞罗长海孟志军陈立平张安琪
农业机械学报 2021年10期
关键词:覆盖率分区灰度

安晓飞 王 培 罗长海 孟志军 陈立平 张安琪

(1.北京农业智能装备技术研究中心, 北京 100097; 2.国家农业智能装备工程技术研究中心, 北京 100097)

0 引言

农田秸秆覆盖率是保护性耕作评价的重要指标之一,实现秸秆覆盖率快速检测对黑土地保护评价非常重要。保护性耕作是以秸秆覆盖地表、免少耕播种为主要内容的现代耕作技术体系,具有防治农田扬尘和水土流失、蓄水保墒、培肥地力、节本增效、减少秸秆焚烧和温室气体排放等作用[1-4]。2020年4月,农业农村部发布的《东北黑土地保护性耕作行动计划(2020—2025年)》中提出,到2025年,保护性耕作实施面积达到9.33×106hm2,形成较为完善的保护性耕作政策支持体系、技术装备体系和推广应用体系。

秸秆覆盖率作为保护性耕作重要技术指标,更是秸秆还田补贴的重要依据,准确高效的秸秆覆盖率检测对于推进保护性耕作具有重要作用。而国标GB/T 20865—2017《免(少)耕施肥播种机》中采用人工“拉绳法”进行秸秆覆盖率测量,作业效率低,劳动强度大,已严重落后于当前农机“互联网+”模式下的实际生产需要。

随着大数据、云计算、物联网等新一代信息技术在现代农业中的推广应用,将这些技术与农业场景深度融合,利用计算机图像处理技术快速而准确地识别秸秆覆盖图像已成为一种趋势。图像法成本低且效率高,成为秸秆检测的热门研究方向和手段。国内外很多学者都致力于这方面的研究,并取得了重要成果[5-23]。文献[5-7]基于航拍图像,提出一种图像自动分割的优化算法多阈值差分灰狼优化算法(DE-AS-MOGWO),运用该算法可以实现对图像的多阈值分割处理,并对秸秆覆盖率进行精确的检测。文献[8-9]基于卫星遥感影像开展了地表秸秆覆盖度估算研究,但遥感图像尺度较大,缺乏地面数据验证,尚无法成为秸秆还田补贴依据。文献[10-11]将纹理特征的熵值结合反向传播神经网络,进行秸秆覆盖度检测,该方法计算耗时较长,无法满足商业化检测要求。目前基于图像的秸秆覆盖度识别研究多针对静态条件下,秸秆纹理清晰、特征明显的情况,但农机田间作业真实环境复杂,土块、沟壑等因素影响识别;秸秆形状、尺寸、姿态各异,细碎秸秆难于精准辨别。传统机器视觉算法泛化能力弱,难以解决田间不同环境中的秸秆精准识别问题。

本文针对农田秸秆形态多样、细碎秸秆难以识别的问题,提出一种基于K-means聚类和分区寻优方法结合的玉米秸秆覆盖率算法,并通过不同天气、不同种植模式、不同地块条件进行田间实际验证。

1 试验材料与方法

1.1 图像采集设备

采集农田秸秆图像的设备为自主研发的前后双置摄像头的保护性耕作作业计量远程监测系统,系统主要由前置摄像头(采集农田秸秆图像)、后置摄像头(采集机具图像)、机具识别传感器、数据采集器、显示器和卫星定位天线组成(图1)。该装置可以实现保护性耕作作业面积计量、秸秆图像采集、机具图像采集、作业质量分析等功能。

其中秸秆图像采集摄像头选用广州谱泰通信科技有限公司PTC02-200型200万像素串口防水摄像头,5 V供电,图像传感器类型为CMOS,模块核心DSP芯片集成了新一代ISP算法,图像尺寸为1 920像素×1 080像素,输出格式为标准JPEG格式,拖拉机田间行进速度为3.6~5.0 km/h,采样间隔10 s,串口通信速率为115 200 b/s。

本批图像采集时间为2021年4月26—28日,选取吉林省长春市双阳区10个地块,采集100幅不同时间段、不同天气、不同种植模式下的秸秆覆盖图像,其中阴天、晴天秸秆图像数量比为2∶8,垄作、平作秸秆图像数量比为1∶3,土块根茬与平整秸秆图像数量比为1∶9。图2为6种典型条件下的农田秸秆图像。

1.2 农田实际秸秆覆盖率人工获取方法

采用人工拉绳法测定秸秆覆盖率,用长2 m的绳子,每隔10 cm做记号,测定时沿地块对角线铺放绳子,统计标记点上有秸秆的点数,将统计点数除以总标记点数,即为秸秆覆盖率,具体计算公式为

(1)

式中F——人工法秸秆覆盖率,%

D1——测定有秸秆的点数

D2——测定点数

图3为人工拉绳法获取玉米秸秆覆盖率示意图。

由于田间秸秆覆盖变异性比较大,同一地块变异系数达到0.71,采用人工拉绳法,无法与采集的秸秆图像做到严格一一对应,本研究中进一步采用了“人工标注+二值化识别”方法获得玉米秸秆图像覆盖率真实值,与采集到的秸秆图像实现真值、测量值严格一一对应。图4为人工标记法获得秸秆覆盖率方法。

1.3 基于K-means聚类的秸秆覆盖率计算方法

1.3.1经典K-means方法

聚类是无监督学习的一种重要形式,其主要作用是将数据对象分为多个簇,保证同一簇内的数据对象相似度尽可能大,而不同簇间的数据对象相似度尽可能小。其中,K-means聚类是解决聚类问题的一种经典算法,使用非常广泛。

由于图像分割可以看成聚类问题,即图像中像素点类别未知的前提下,根据像素点的特征值,将图像划分为若干个区域。因此,本文利用K-means聚类算法实现对秸秆图像的分割,即将其分为2类:秸秆和背景。

1.3.2分区寻优聚类迭代

K-means聚类有2个参数确定比较困难:聚类数量、聚类中心。在玉米秸秆图像中,目标物和背景清晰,聚类数量可确定为2。聚类中心在经典K-means聚类算法中是随机确定的,造成了聚类算法效果不稳定,无法达到最优。本研究在一次聚类基础上,提出了一种分区寻优的方法确定了新的聚类中心,并进行聚类迭代,直到秸秆聚类中心收敛不再发生变化时停止聚类迭代。

首先将原始图像(1 920像素×1 080像素)分隔为16区;然后依次判断各分块中第1类(秸秆类)和第2类(土壤类),通常情况下,土壤背景灰度小于100,秸秆灰度大于160,如果每个分块中均有2类,则利用统计学方法分别计算各区秸秆中位数和众数灰度平均值,如果分块中只有一类,则判断类别属性后计算对应类别的灰度平均值,并计入对应类别总数组中。根据16分区中的秸秆中位数和众数灰度平均值及数量,按照公式

(2)

式中Ci——秸秆中心灰度

Aj——各区众数灰度

Mj——各区中位数灰度

n——实际有效分区个数

计算获得秸秆中心灰度,同理获得土壤中心灰度。

在获得16区平均值后分别获得秸秆中心灰度和土壤背景灰度后,将其作为新的分类中心,重新采用K-means聚类方法对玉米秸秆图像进行分割,直到秸秆中心灰度不再发生变化,则停止K-means聚类迭代。

K-means聚类迭代停止后,基于灰度差异判断秸秆和土壤背景,对秸秆像素和土壤背景像素分别进行二值化,并计算秸秆像素数量,则玉米秸秆覆盖率计算式为

(3)

式中Pi——分区寻优K-means聚类法计算的秸秆覆盖率,%

Ti——秸秆像素点数

N——图像像素点总数

图5为分区寻优聚类迭代流程图。

1.4 评价方法

为了评价农田秸秆覆盖率计算方法,采用相关系数、相对误差和误判率3个指标进行,其中相关系数用于评价农田秸秆覆盖率计算结果和人工检测结果相关程度;相对误差用于判断本计算方法的误差偏离程度;误判率是结合实际作业补贴发放场景,根据计算结果和实际补贴档次结果的判断准确率。相关系数r、相对误差E、误判率Je计算式为

(4)

(5)

(6)

式中x1k——农田秸秆覆盖率标准值

x2k——农田秸秆覆盖率检测值

Pc——秸秆覆盖率检测值

Jn——等级判断错误数

Jr——等级判断正确数

2 结果与讨论

2.1 K-means和分块寻优法结合的图像处理结果

从图6中可以看出,分块寻优聚类迭代后秸秆分割效果和一次聚类相比较,细碎秸秆部分的识别效果得到提高。通过对不同场景的100幅图像分别进行分区寻优聚类迭代,获得结果如图7所示,与人工拉绳法和人工标记法相关系数分别为0.716 1和0.906 8。如图8所示表明该方法可以有效获取玉米秸秆覆盖率。

相关系数差别大的原因主要是田间秸秆变异系数较大,拉绳法覆盖区域与图像采集区域无法做到严格一一对应,造成相关系数较低,但也仍然达到了0.70以上,采用人工标记识别提高了一一对应度,相关系数达到0.90以上。

2.2 与Otsu及经典K-means方法对比

运用Otsu方法、经典K-means方法、分区寻优K-means聚类迭代法对100个样本分别进行处理,与人工标记法进行比较,结果如表1所示,结果表明分区寻优K-means聚类迭代法在平均误差和误判率上明显优于Otsu方法、经典K-means方法,其中平均误差降低了45.6%和29.2%,误判率最小,为7%。与Otsu方法和经典K-means方法相比较,本文算法由于增加了中心点优化更新、聚类迭代的环节,所需时间最长,为810 ms,但处理时间小于1 s,可以满足田间条件下的图像检测响应速度。

表1 秸秆覆盖计算方法性能比较Tab.1 Performance of different corn straw coverage detection algorithms

该方法实现了在不同环境条件下(不同天气、不同种植模式)均可实现秸秆的准确识别,在农机上连续稳定运行,具有一定的普适性。但在根茬裸露条件下,分区寻优聚类迭代容易将根茬底部识别为土壤,主要是因为只有根茬的地块中,根茬造成的阴影部分和根茬底部颜色与土壤背景相近,两者叠加影响,容易将秸秆错误识别为土壤,此种情况还需要进一步研究。

3 结论

(1)基于机器视觉技术,提出了一种基于K-means聚类和分区寻优结合的玉米秸秆覆盖率检测算法,实现了秸秆覆盖率快速检测,在不同环境条件下(不同天气、不同种植模式)均可实现秸秆的准确识别。

(2)该算法与人工标记法相关系数达到0.906 8,平均误差为6.8%,误判率为7%,该算法为秸秆覆盖率在线计算提供了一种新的技术手段。

猜你喜欢
覆盖率分区灰度
民政部等16部门:到2025年村级综合服务设施覆盖率超80%
采用改进导重法的拓扑结构灰度单元过滤技术
贵州省地质灾害易发分区图
上海实施“分区封控”
我国全面实施种业振兴行动 农作物良种覆盖率超过96%
天津港智慧工作平台灰度发布系统和流程设计
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
Arduino小车巡线程序的灰度阈值优化方案
电信800M与移动联通4G网络测试对比分析
大型数据库分区表研究