图像处理在玉米虫害识别系统中的应用研究

2019-03-28 07:56
牡丹江大学学报 2019年2期
关键词:识别率灰度边缘

戴 宁

(伦敦大学国王学院,伦敦 WC2R 2LS)

0 引言

据相关资料显示,全世界每年通过使用农药可以挽回农产品20%-25%的产量损失。[1]但大量的农药喷洒容易造成严重的生态环境污染,农产品的产量也受到很大影响,因此精准施药势在必行。精准施药即利用图像识别技术对农作物病虫草害的图像进行处理,通过提取特征参数,有针对性地对病虫的种类和位置合理喷药。[2]

基于图像的病虫识别技术结合了模式识别技术和图像处理技术,虽然研究时间并不长,但却得到快速的发展。[3]国外方面,Keagy最早利用图像对甲虫进行病虫识别研究。C.Karunakaran 通过提取面粉甲虫的特征对其进行识别分析。美国科学家利用人脸识别的原理对几个属于姬蜂科种类的昆虫进行识别,以及通过人工神经网络系统对某几种病虫进行识别,都获得了不错的效果。[4]国内方面,徐昉等[5]通过提取玉米象的周长、面积、复杂度三个特征,对这两种昆虫进行分类识别。赵汗青等[6]通过分析昆虫的形态特征,将面积、形状参数、偏心率等几个特征按照其重要性进行排序,作为分类的依据。张洪涛等[7]对病虫原始图像进行预处理,得到阈值分割的图像后再提取出球形性等几个特征进行分类。

基于以上学者研究,本文以玉米作物虫害玉米象为研究对象,利用基于K-means硬聚类算法的图像分割技术,通过提取玉米象的周长、面积、复杂度三个特征,对玉米象进行识别,对虫害图像预处理,提取虫害的形状特征,使用模糊识别来区分虫害,为智能化喷雾与精准施药的研究奠定基础。

1 图像的采集及处理

1.1 图像的采集和灰度化处理

正常条件下,在北京市郊区玉米田进行了图像采集,相机固定在距离地面1.5m处的三脚架上,要求相机镜头距离叶面1m,平行拍摄玉米叶面图像,将得到的图像以24位 BMP格式写入计算机中,以获得实验的原始图像。首先我们将获得的原始图像进行了灰度化处理,通过采用三原色R、G、B来对图像的灰度值进行描述,其中R为像素的红色分量值,B为像素的蓝色分量值,G为像素的绿色分量值。由于均值G在背景中所占比重较大,便于进行玉米象与背景的分割。在实验中,通过比较G、G-R、G-B、2G-R-B和 2G-R-B的 转 换 效 果 图,我们发现采用超G绝对值法时,可以得到效果最好的以绿色背景为主的进行灰度化处理的图像。

1.2 二值化和噪声滤除

由于采集的图像仅包括玉米象与玉米,可采用灰度直方图的方法。害虫的颜色相对于农作物颜色较深,即害虫的灰度比作物深,因此其直方图是双峰。为了将目标与背景更好地区分开来,我们选取两个峰之间的灰度值T作为阈值,这个阈值采用灰度直方图统计的方法计算出来。由于玉米象目标较小,采用简单统计法求阈值。

图像进行分割以后, 得到简单统计

进行分割以后, 得到简单统计法的阈值t 的计算公式如式(1)所示。

得到二值化图像之后,通过采用5×5的单位矩阵,对二值图像进行开、闭运算的方式,把图像中的杂点去除,修复图像中的断点,实现对目标的识别。

2 图像分割技术

我们所得到的图像是由农作物和空块区域组成的,因此为了进行有效特征的提取,我们需要将空块区域从所得图像中提取出来。

传统的边缘检测算法有Roberts、Sobel、Prewitt和Laplacian算子等。其中,Roberts边缘检测算子是使用局部差分算法来实现的,它通过对模板的利用来计算Roberts梯度幅度G,进而获得合适的阈值T,当G〉T时,该点即为阶跃边缘点,从而可获取边缘图像。Sobel算子和Prewitt算子具有类似的特点,都是通过考察各个像素的邻域加权差,加权差值最大的点就是边缘点。对于Laplacian边缘检测算子则是通过在边缘处产生陡峭的零交叉来达到边缘检测的目的。

但是,传统的边缘检测算子提取的边缘很粗,无法得到精确的边缘像素。因此,我们通过分层K-means硬聚类算法来实现对所得图像的分割。经典的K-means 算法基本思想是,以空间中k个点为中心进行聚类,对最靠近他们的对象归类,并通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。其实现步骤为:

(1)确定像素大小为n 的样本空间数据集,使迭代次数为R,依据指定的聚类数k, 随机选取k个像素作为初始聚类中心Cj(r),其中:j=1,2,3,…,k;r=1,2,3,…,R;

(2)计算样本空间中每个数据对象与初始聚类中心的相似度距离 D(Xi, Cj(r));其中,i=1,2,3,…,n,形成簇Wj,如果满足式(2)。

式(2)中,Xi∈Wj,Xi 记为w,ε为任意给定的正数;

(3)计算k个新的聚类中心,其表达式如式(3)所示:

依据式(4)可计算聚类准则函数值,其表达式如下所示:

依据式(5)判断聚类是否合理,其表达式如下所示:

若合理则迭代终止;若不合理则返回(2)(3)步继续迭代。

我们从得到的图像中选取一幅图进行分割。从分割结果来看,K-means聚类算法可以较为准确的将空块区域从图像当中分离出来,且效果比较理想,分割的精度也较高,因而得到的分割图像可以更加方便的用于后续图像的特征提取。

3 图像的特征提取

在图像分析的过程中,由于区域描述子特征具有很强的实用效果,于是作为粮虫识别模型的输入特征,我们采用粮虫图像的八种区域描述子特征,分别如下所示:

(1)面积A:图像中需识别对象面积的像素点个数总和,其表达式如(6)所示:

(2)周长P:除识别对象的周长如式(7)所示:

公式中SUM(in)是4邻域内像素均为需识别对象的像素个数总和。

(3)相对面积RA:待识别对象面积占图像总体比例,其表达式如(8)所示:

(4)延伸率S:待识别害虫玉米象图像的最小外接矩形的宽度与长度值之比,其表达式如(9)所示:

(5)复杂度C:待识别对象紧凑性,其表达式如(10)所示:

(6)占空比B:反应待识别对象的复杂程度,其表达式如(11)所示:

(7)等效面积圆半径R,如式(12)所示:

(8)偏心率E:待识别对象的长轴与短轴长度之比,表明了待识别对象的紧凑性,利用Tenebaum近似计算公式求解偏心率E:

平均向量求解:

j+k阶中心矩求解:

方向角求解:

偏心率E近似求解:

4 图像识别实验

4.1 特征提取实验

我们选取了常见的粮虫—玉米象作为研究对象,并通过 K-means的方法对其进行了边缘检测,同时提取其图像的面积 A、周长P、相对面积RA、延伸率 S、复杂度 C、占空比B、等效面积圆半径 R和偏心率 E这八个特征用于对玉米害虫的识别, 具体特征值如下表。

表1 面积周长等特征对玉米虫害的识别

4.2 识别结果

我们选取了十幅图像,并分别用含有2个、3个、4个、5个聚类中心时可K-means算法识别这十幅图像,得到的识别率和误判率如下表。

表2 识别率和误判率表

由上述表格可以看出,含2个聚类中心的K-means聚类法对有的图像的目标识别率较低,对有的图像误判率较高,对10幅图像中粮虫的平均识别率为40.0%;平均误判率为485%,识别率一般且误判率较高。含3个聚类中心的K-means聚类法能够正确识别大部分图中的目标,但分类数量较少导致算法难以彻底消除背景杂点的影响,对少数几幅图像误判率仍较高。含4个聚类中心的K-means聚类法对其中五幅图片的识别率可达到100%,对所有图像误判率均为0%。含5个聚类中心的K-means聚类法对其中七幅图片的识别率均可达到100%,并且误判率为0%。由上述数据我们可以看出,K-means聚类算法对于图像的识别能力较高,且所包含的聚类中心越多,识别率越高,且误判率也越低。

5 结论与展望

本文将计算机图像识别处理技术应用于农业生产研究,试验一种基于图像识别处理的玉米害虫检测方法,选取常见的玉米象作为研究对象,对其进行图像识别。

(1)采用基于 K-means硬聚类算法的图像分割技术,成功地对所获得图像进行空块区域分割,获得了空块区域的二值分割图像和彩色分割图像,比较准确的将空块区域从图像中分割了出来,分割精度较高,效果达到了预期目的。

(2)提取了所得图像的周长、面积、相对面积、复杂度、延伸率、占空比、偏心率和等效面积圆半径这八个特征用于对玉米害虫的识别。

(3)通过使用K-means的算法并改变聚类中心的个数,我们发现聚类中心较多时识别率高且误判率低,在含有5个聚类中心时,识别率可达到95.7%,且误判率为0%。

(4)将来我们拟在此方法的基础上,进一步开发利用该图像识别技术系统,使这种技术不仅能够检测到粮虫,还能检测出粮虫的密度信息和种类归属;随着进一步的深入研究, 我们还可以利用该系统拓展检测范围和对象,比如该系统将具有测量温度、测量湿度、测量水分等综合功能,把该系统建设成为一个具有智能综合控制的专家系统。

猜你喜欢
识别率灰度边缘
采用改进导重法的拓扑结构灰度单元过滤技术
天津港智慧工作平台灰度发布系统和流程设计
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
Arduino小车巡线程序的灰度阈值优化方案
档案数字化过程中OCR技术的应用分析
一张图看懂边缘计算
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别
人工智能现状和发展
在边缘寻找自我