马铃薯典型病害图像自适应特征融合与快速识别

2018-01-17 07:59肖志云
农业机械学报 2017年12期
关键词:降维识别率病斑

肖志云 刘 洪

(内蒙古工业大学电力学院, 呼和浩特 010080)

引言

近几年中国马铃薯种植面积逐年上升,马铃薯已成为重要的粮食兼用作物[1]。乌兰察布市位于内蒙古中部,马铃薯种植面积占全区40%左右,享有中国“薯都”之称。然而,马铃薯生长环境复杂多变,极易遭受病害的威胁。传统马铃薯病害识别方法多靠人眼判断,检测范围小,费时费力,效率低,难以及时处理与预防,导致马铃薯减产减量。及时准确识别马铃薯病害,并采取相应防治措施可有效减少马铃薯产量损失。

随着计算机技术和农业信息化发展,国内外专家与学者运用机器视觉技术,在农作物病害识别方面进行了大量研究[2-6]。PUJARI等[7]对辣椒、棉花和甘蔗等真菌病害彩色图像,提取小波域特征,选择PCA主分量特征[8],并结合概率神经网络模型,识别率达86.48%。GULHANE等[9]提取棉花病叶绿色通道特征,通过PCA降维,KNN分类,取得了95%的识别率。翟志芬等[10]提取棉花病斑颜色、形状、纹理等9个特征,采用朴素贝叶斯分类器,识别率为90%。濮永仙[11]提取烟草病斑的25个颜色、形状、纹理特征,采用双编码遗传算法[12]和支持向量机法降维到17,按照图像距离相似度分类,取得了较高识别率。夏永泉等提取小麦叶部病斑的8个纹理特征和6个颜色特征,采用SVM识别模型,获得了95%的识别率。李超等[13]提取苹果叶部病斑颜色、形状、纹理特征,使用局部判别映射算法[14]进行特征降维,并结合SVM,识别率较高。

综上所述,大多研究是在实验室可控光条件下进行的,对自然条件下的病害研究较少,多数研究的病害识别精度与速度不能兼顾。因此,本文将自然环境下采集的马铃薯病害图像,通过K-means、Hough变换与超像素算法定位叶片,利用二维Otsu与形态学法分割病斑,提取124个颜色、形状、纹理特征,选择13个自适应融合特征,进行SVM病害识别,进而提高马铃薯病害识别精度。

1 材料与方法

1.1 马铃薯典型病害类型

本文在自然环境条件下,固定镜头采集264幅马铃薯病害图像,并对采集的图像进行处理,分辨率统一为200像素×220像素。马铃薯图像中,病害类型有早疫病、晚疫病、病毒病,样本数量分别为102、114、48,每类病斑有大有小,朝向、位置不同,形状、颜色有差异,背景复杂度也不同,如图1所示。3类病害中,早疫病常发生于叶内、叶缘部位,形状近似圆形,周围轮纹同心,颜色呈现暗褐色,边缘明显;晚疫病常发生于叶尖、叶缘部位,呈现萎垂、卷缩姿态,质脆易裂,颜色发黑发褐;病毒病常发生于叶脉、叶柄、叶茎等部位,病斑连接成坏死条斑,叶绿素分布不均,颜色呈浓淡黄绿相间。

图1 马铃薯典型病害类型Fig.1 Types of potato typical diseases

1.2 马铃薯病害图像分割

为快速、准确提取病斑特征,增强病斑识别的有效性,需要最大限度地简化图像数据,从复杂背景中分割出病斑区域。病斑图像分割包括:叶片与背景分离;病斑分割。

1.2.1叶片与背景分离

首先,马铃薯病害图像在采集过程中,通常会受到一定程度的噪声干扰,选择HSI颜色空间I通道进行中值滤波,达到较好的清晰效果。利用Lab颜色空间a通道进行K-means聚类[15],得到图像绿色区域。通过区域填充法与移除小对象算法,可填满绿叶内部病斑,消除与绿叶颜色相似的背景,形成含内部病斑的绿叶图像。然后,采用腐蚀算子提取绿叶边界,根据Hough变换[16]定义

(1)

式中 (x0,y0)——圆心坐标

(x,y)——边界坐标

θ——圆心角r——半径

以每个边界点为圆心、半径r画圆,选择相交最多的前10个点作为潜在圆心,进行叶片曲线拟合,最后结合超像素区域提取含病斑的完整叶片。其效果如图2所示。

图2 叶片与背景分离过程Fig.2 Process of blade and background separation

1.2.2病斑分割

根据叶片提取图像,选择Lab颜色空间a通道进行二维Otsu法分割[17],可有效抵抗干扰,正确分割,再经过形态学处理,实现病斑完整分割,其结果如图3所示。

图3 马铃薯典型病害分割结果Fig.3 Results of potato typical diseases segmentation

由图3可以看出,病斑分割还存在少量的欠分割与过分割情况,但病斑的大部分已经分割出来,效果较好,可用于病斑的特征提取。

1.3 马铃薯病害图像特征提取

1.3.1颜色特征提取

RGB颜色模型是一种通用的面向硬件的模型,其红、绿、蓝3种分量[18]可表达丰富的颜色信息,因此,提取病斑R、G、B的均值、方差、三阶矩,共计9个颜色特征。 HSV颜色模型是人们从调色板或颜色轮中挑选出来的彩色模型之一,色调、饱和度、明度分别表达色泽、明暗、调色的颜色信息,故提取病斑H、S、V分量的均值、方差、三阶矩,共计9个颜色特征。

1.3.2形状特征提取

几何区域描述符[19]度量病斑的几何属性,计算简单有效,本文提取病斑二值图像的面积、周长、紧凑度、矩形度、延伸率、离散度、区域密度,共计7个特征。中心矩描述了病斑形状的平移不变性,本文提取3个二阶矩、4个三阶矩,共计7个中心矩。Hu不变矩描述了病斑形状的平移、尺度、旋转不变性,本文提取2个二阶矩、5个三阶矩,共计7个Hu矩。

1.3.3纹理特征提取

灰度共生矩阵是基于空间性质的一种重要的纹理分析方法,本文提取0°、45°、90°、135°方向上能量、对比度、熵、相关性、逆差矩的均值与方差,共计40个特征。

小波变换的高低频图像低阶矩是基于频域性质的一种重要的纹理提取方法,本文对病斑灰度图像进行3尺度分解,每尺度选择低频图像以及水平、垂直、对角图像的均值、方差、三阶矩,共计36个特征。

小波分解的水平、垂直、对角子带图像具有相关性[20],系数都近似服从高斯分布,建立三维变量的高斯概率空间

(2)

其中

x=(xh,xv,xd)

(3)

μ=(μh,μv,μd)

(4)

(5)

(6)

式中x、μ——3×1高频子带向量、均值向量

xh、xv、xd——水平、垂直、对角子带分量

μh、μv、μd——水平、垂直、对角子带均值

xs、μs——子带变量、均值

Σ——3×3协方差矩阵

m、n——图像高度、宽度

假设协方差特征值为λk,k∈(h,v,d),则λk通过齐次线性方程组进行求解

(Σ-λkI)y=0

(7)

式中I——3×3单位矩阵

y——3×1高频子带特征向量

利用小波变换,提取3尺度高频图像的协方差阵特征值以及以上3尺度9个低频图像低阶矩,组合成18个高频协方差阵特征值与低频低阶矩(HELM)特征。

通过以上特征提取,得到18个颜色特征,21个形状特征,85个纹理特征,共计124个马铃薯病害特征,为病害特征融合奠定基础。

1.4 马铃薯病害图像自适应特征融合

特征融合属于特征选择,其目的在于用少量的特征达到较高识别率[21]。传统特征融合方法有人工方法与自适应方法,人工方法耗时耗力,自适应方法识别率较低。基于此,本文提出了一种基于PCA特征加权融合的自适应算法。如图4所示,首先根据提取的颜色、形状、纹理特征自动分块,通过识别率与维度进行特征块选择。然后按照PCA降维分量的贡献、识别率、识别上升率,提取主分量。最后,基于主分量识别率,对颜色、形状、纹理主分量加权,利用权值分配公式对每个分量加权,得到自适应融合特征。

图4 PCA特征加权融合算法流程图Fig.4 Flow chart of PCA features weighted fusion algorithm

1.4.1特征块选择

根据病害提取的颜色特征(C),自动分为RGB特征块(C1)、HSV特征块(C2)。同样,形状特征(S)分为几何量特征块(S1)、中心矩特征块(S2)、Hu矩特征块(S3)。纹理特征(T)分为灰度共生矩阵特征块(T1)、小波域高低频低阶矩块(T2)、1层分解HELM块(T31)、2层分解HELM块(T32)、3层分解HELM块(T33)。颜色、形状、纹理特征块进行识别,分别选择

(8)

其中

α∈((C1,C2),(S1,S2,S3),(T1,T2,T31,T32,T33))

式中δ——特征块容忍度

R(α)、R(β)——特征块、备选特征块识别率

D(β)、D(χ)——备选特征块、选择特征块维度

识别率较大、维度低的特征块作为对应的颜色、形状、纹理特征块,试验中δ取5%。

1.4.2PCA主分量提取

特征块内的特征之间通常具有相关性,进行颜色、形状、纹理特征PCA降维,有助于提高病斑图像的识别效果。

假设降维前的特征为Xi(i=1,2,…,N),N为降维前特征维数,降维后的特征为Yj(j=1,2,…,K)(K≤N),K为降维后特征维数,则Xi可由Yj线性表示为

(9)

式中aNK——矩阵系数

根据PCA降维后颜色、形状、纹理特征的不相关性,从K个Yj中选择M个不相关的特征主分量,满足

(10)

其中

(11)

式中C(M)、T——主分量贡献、贡献阈值

λt、λs——特征块协方差矩阵特征值

R(M)——主分量识别率

R(t)——前t个主分量识别率

ε——主分量容忍度

R(r)——前r个主分量识别率

V(M)——主分量的识别上升速度

试验中,经分析比较,T取90%、ε取5%时,可取得较好效果。

1.4.3加权融合

根据颜色、形状、纹理主分量的识别率,计算其权值

(12)

式中w(η)——主分量权值

R(η)——主分量识别率

再利用权值分配公式,计算主分量中的分量权值

(13)

其中

(14)

式中d——权值步长

通过颜色、形状、纹理主分量加权,每个分量加权,得到自适应融合特征,进而用于马铃薯病害识别。

1.5 马铃薯病害图像快速识别

SVM模式识别方法,采用不同的核函数完成不同特征下的权值快速学习,可以较好地解决小样本、非线性、高维数的分类问题,并且具有良好的推广和泛化能力。

SVM分类器作为本文识别模型,其决策函数为

(15)

式中ω*、x——权值行向量、测试样本特征向量

xi、yi——训练样本特征向量、类标签

k(xi,x)——非线性核函数

SVM核函数中,径向基核函数[22]沿径向对称,参数少于多项式核函数,正确率高于Sigmoid核函数,适用于样本与类标签的非线性问题,可作为本文识别模型的核函数。

2 试验结果与分析

本文对马铃薯早疫病、晚疫病、病毒病3类典型病害识别进行仿真,所选软件平台为Matlab 2012、Windows 7;硬件平台为计算机,其处理器为Intel(R)Core(TM)i3-3220(主频为3.3 GHz)。试验采用交叉验证方式,按照1∶1比例随机分配训练集与测试集,进行20次SVM模式识别,求取平均识别率。SVM采用一对一投票策略,设置径向基核函数参数σ=0.125,错误代价系数C=32。

2.1 马铃薯病害图像自适应融合特征SVM识别结果

提取马铃薯典型病害图像的颜色、形状、纹理特征,采用本文图像特征融合方法,可得到病斑自适应特征。如表1所示,通过特征块选择,得到RGB颜色块C1、几何量形状块S1、1层HELM纹理块T31。PCA主分量提取,分别得到C1、S1、T31的5、5、3个主分量,其识别率下降较少,但总的特征维度下降了9个,总的融合特征识别率由92.2%上升为93.6%。通过对13个主分量的加权融合,识别率为95.2%,进一步提高了识别精度。

通过本文自适应特征融合方法,选择13个马铃薯病害加权主分量,并结合SVM分类器,具有一定的识别优势。

2.2 马铃薯病害图像自适应特征融合与识别比较试验

为验证本文自适应特征融合算法的有效性,试验采用了PCA降维、特征排序选择等自适应特征融合方法,进行SVM模式识别。PCA降维方法分直接降维与特征块降维。PCA直接降维方法是将124个病害特征,分别降维到指定维度13以及最佳维度。最佳维度是指该数量的特征识别率最高。PCA特征块降维方法是将颜色、形状、纹理的特征块选择出来之后降维到指定维度13、最佳维度。特征排序选择方法也分直接排序选择与特征块排序选择。直接排序选择方法是将124个特征进行识别率从大到小排序,选择前13个指定维度特征以及前最佳维度特征。特征块排序选择方法是将特征块选择出来,然后按识别率大小进行22个特征排序,选择前13个指定维度特征以及前最佳维度特征。其识别效果如表2所示。为验证本文识别算法的有效性,试验利用13个自适应病害特征进行人工神经网络(ANN)以及贝叶斯(Bayes)模式识别。ANN[23]网络结构为3层BP,13个输入层节点,10个隐含层节点,3个输出层节点,隐含层传递函数选择Sigmoid型。Bayes[24]窗函数选择高斯窗,宽度设置为0.1。其识别比较结果如表2所示。

从表2中可以看出,本文自适应特征融合算法识别马铃薯早疫病、晚疫病、病毒病,平均识别率分别为94.3%、95.1%、97.5%,相比PCA直接降维、PCA特征块降维、直接排序选择、特征块排序选择方法,不仅特征维度相对较小,而且识别率相对较高,总体识别率提高了1.8个百分点以上。对于不同模式识别方法,ANN对病毒病、早疫病识别较高,Bayes对早疫病、晚疫病识别较高,而本文识别算法对3种病害的识别率都为94.3%以上,总体识别率为95.2%,比ANN提高了3.8个百分点,比Bayes提高了8.5个百分点。在运行时间方面,本文识别算法为0.600 s,稍慢于Bayes的0.425 s,但比ANN的3.60 s缩短了3 s。

表1 马铃薯典型病害图像自适应融合特征SVM识别结果Tab.1 SVM recognition results of adaptive fusion features for potato typical disease images

表2 马铃薯典型病害自适应特征融合与识别方法比较结果Tab.2 Comparison results of adaptive features fusion and recognition methods for potato typical disease

比较试验可以得出,本文自适应特征融合算法结合SVM快速识别模型,识别率高,运行时间短,可保证马铃薯典型病害图像识别的有效性。

3 结论

(1)自然环境中的图像经中值滤波、K-means聚类、区域填充与移除小对象,得到含内部病斑的叶片。利用Hough变换寻找叶缘潜在圆域,并结合超像素区域,得到完整叶片。通过二维Otsu法与形态学法分离出病斑区域,可为马铃薯病害图像特征提取奠定基础。

(2)提取病斑图像的颜色、形状、纹理特征,进行PCA特征加权融合,得到13个互不相关的自适应融合特征,可有效刻画马铃薯典型病害。

(3)不同的自适应融合算法进行马铃薯早疫病、晚疫病、病毒病的SVM识别,本文自适应特征融合算法相比PCA降维、特征排序选择等传统自适应方法,平均识别率至少提高了1.8个百分点。

(4)13个自适应融合特征采用不同的模式识别方法,本文识别算法平均识别率为95.2%,相比ANN、Bayes的平均识别率,分别提高了3.8个百分点和8.5个百分点。与此同时,本文识别算法运行时间为0.600 s,稍高于Bayes的0.425 s,但比ANN的3.60 s缩短了3 s,优势明显,可准确、快速地识别马铃薯典型病害。

1 吕金庆,尚琴琴,杨颖,等.马铃薯杀秧机设计优化与试验[J/OL].农业机械学报,2016,47(5):106-114. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20160515&journal_id=jcsam.DOI:10.6041/j.issn.1000-1298.2016.05.015.

LÜ Jinqing, SHANG Qinqin, YANG Ying, et al. Design optimization and experiment on potato haulm cutter[J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(5): 106-114. (in Chinese)

2 ZHANG H, FRITTS J E, GOLDMAN S A. Image segmentation evaluation: a survey of unsupervised methods[J]. Computer Vision & Image Understanding, 2008, 110(2): 260-280.

3 陈丽,王兰英.概率神经网络在玉米叶部病害识别中的应用[J].农机化研究,2011,33(6):145-148.

CHEN Li, WANG Lanying. Research on application of probability neural network in maize leaf disease identification[J]. Journal of Agricultural Mechanization Research, 2011, 33(6): 145-148. (in Chinese)

4 霍迎秋,唐晶磊,尹秀珍,等.基于压缩感知理论的苹果病害识别方法[J/OL].农业机械学报,2013,44(10):227-232. http:∥www.j-csam.org/jcsam/ch/reader/ view_abstract.aspx?flag=1&file_no=20131036&journal_id=jcsam. DOI:10.6041/j.issn.1000-1298.2013.10.036.

HUO Yingqiu, TANG Jinglei, YIN Xiuzhen, et al. Apple disease recognition based on compressive sensing[J/OL].Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(10): 227-232. (in Chinese)

5 田凯,张连宽,熊美东,等.基于叶片病斑特征的茄子褐纹病识别方法[J]. 农业工程学报,2016,32(增刊1):184-189.

TIAN Kai, ZHANG Liankuan, XIONG Meidong, et al. Recognition of phomopsis vexans in solanum melongena based on leaf disease spot features[J].Transactions of the CSAE, 2016, 32(Supp.1): 184-189. (in Chinese)

6 梁琨,杜莹莹,卢伟,等.基于高光谱成像技术的小麦籽粒赤霉病识别[J/OL].农业机械学报,2016,47(2):309-315. http:∥www.j-csam.org/jcsam/ch/reader/ view_abstract.aspx?flag=1&file_no=20160241&journal_id=jcsam. DOI:10.6041/j.issn.1000-1298.2016.02.041.

LIANG Kun, DU Yingying, LU Wei, et al. Identification of fusarium head blight wheat based on hyperspectral imaging technology[J/OL].Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(2): 309-315. (in Chinese)

7 PUJARI J D, YAKKUNDIMATH R, BYADGI A S. Automatic fungal disease detection based on wavelet feature extraction and PCA analysis in commercial crops[J]. International Journal of Image Graphics & Signal Processing, 2013, 6(1): 24-31.

8 PECHENIZKIY M, PUURONEN S, TSYMBAL A. The impact of sample reduction on PCA-based feature extraction for supervised learning[C]∥ACM Symposium on Applied Computing, DBLP, 2006: 553-558.

9 GULHANE V A, KOLEKAR M H. Diagnosis of diseases on cotton leaves using principal component analysis classifier[C]∥2014 Annual IEEE India Conference, 2014: 1-5.

10 翟治芬,徐哲,周新群,等.基于朴素贝叶斯分类器的棉花盲椿象危害等级识别[J].农业工程学报,2015,31(1):204-211.

ZHAI Zhifen, XU Zhe, ZHOU Xinqun, et al. Recognition of hazard grade for cotton blind stinkbug based on naive bayesian classifier[J].Transactions of the CSAE, 2015, 31(1): 204-211. (in Chinese)

11 濮永仙.基于病斑特征融合的烟草病害图像检索方法[J].河南农业科学,2015,44(2):71-76.

PU Yongxian. Image searching method of tobacco disease based on disease spot feature fusion[J]. Journal of Henan Agricultural Sciences, 2015, 44(2): 71-76. (in Chinese)

12 CHEN D, CUI D W, WANG C X. Weighted fuzzy C-means clustering based on double coding genetic algorithm[C]∥International Conference on Intelligent Computing, ICIC 2006, Springer Berlin Heidelberg, 2006: 622-633.

13 李超,彭进业,张善文.基于特征融合与局部判别映射的苹果叶部病害识别方法[J].广东农业科学,2016,43(10):134-139.

LI Chao, PENG Jinye, ZHANG Shanwen. Apple leaf disease recognition based on feature fusion and local discriminant projection[J]. Guangdong Agricultural Sciences, 2016, 43(10): 134-139. (in Chinese)

14 LUO Y, ZHANG T, ZHANG Y. A novel fusion method of PCA and LDP for facial expression feature extraction[J]. Optik- International Journal for Light and Electron Optics, 2016, 127(2): 718-721.

15 霍迎秋,秦仁波,邢彩燕,等.基于CUDA的并行K-means聚类图像分割算法优化[J/OL].农业机械学报,2014,45(11):47-53.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20141108&journal_id=jcsam.DOI:10.6041/j.issn.1000-1298.2014.11.008.

HUO Yingqiu, QIN Renbo, XING Caiyan, et al. CUDA-based parallel K-means clustering algorithm[J/OL].Transactions of the Chinese Society for Agricultural Machinery, 2014, 45(11): 47-53. (in Chinese)

16 GOPALAKRISHNAN A, ALMAZROA A, RAAHEMIFAR K, et al. Optic disc segmentation using circular Hough transform and curve fitting[C]∥International Conference on Opto-Electronics and Applied Optics, IEEE, 2015: 1-4.

17 WANG H Y, PAN D L, XIA D S. A fast algorithm for two-dimensional Otsu adaptive threshold algorithm[J]. Journal of Image & Graphics, 2005, 33(9): 968-971.

18 YU X, LIU S, DONG W, et al. Image retrieval method based on fusion of edge features and RGB color component[J]. International Journal of Multimedia & Ubiquitous Engineering, 2014, 9(10): 243-250.

19 CHAKI J, PAREKH R, BHATTACHARYA S. Recognition of whole and deformed plant leaves using statistical shape features and neuro-fuzzy classifier[C]∥International Conference on Recent Trends in Information Systems, IEEE, 2015: 189-194.

20 ANBARJAFARI G, DEMIREL H. Image super resolution based on interpolation of wavelet domain high frequency subbands and the spatial domain input image[J]. ETRI Journal, 2010, 32(3): 390-394.

21 VALLIAMMAL N, GEETHALAKSHMI S N. Efficient feature fusion, selection and classification technique for plant leaf image retrieval system[C]∥International Conference on Computational Science, Engineering and Information Technology, ACM, 2012: 132-137.

22 ABDILLAH A A, SUWARNO. Diagnosis of diabetes using support vector machines with radial basis function kernels[J]. International Journal of Technology, 2016, 7(5): 849-858.

23 JIANG J. BP neural network algorithm optimized by genetic algorithm and its simulation[J]. International Journal of Computer Science Issues, 2013, 10(2): 516-520.

24 CARLIN B P, LOUIS T A. Bayes and empirical Bayes methods for data analysis[J]. Statistics and Computing, 1997, 7(2): 153-154.

猜你喜欢
降维识别率病斑
混动成为降维打击的实力 东风风神皓极
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
核桃叶斑病发生动态及病情扩展进程研究初报
改进自适应分水岭方法分割棉花叶部粘连病斑
一种桑轮纹病病叶发病程度的评价指数
提升高速公路MTC二次抓拍车牌识别率方案研究
高速公路机电日常维护中车牌识别率分析系统的应用