檀香树干受咖啡豹蠹蛾危害区域的分割与分类1)

2017-11-28 07:40陈珠琳王雪峰
东北林业大学学报 2017年11期
关键词:檀香虫害纹理

陈珠琳 王雪峰

(中国林业科学研究院资源信息研究所,北京,100091)

檀香树干受咖啡豹蠹蛾危害区域的分割与分类1)

陈珠琳 王雪峰

(中国林业科学研究院资源信息研究所,北京,100091)

为了实现海南省北部县市檀香受咖啡豹蠹蛾(ZeuzeracoffeaeNietner)虫害的自动识别,使用林内传感器传回的图像信息,提出一种空域与频域相结合的背景去除方法,并提取出虫害区域与健康区域。该方法首先提取出檀香树的前景部分,使用2G-B-R因子去除枝叶及边缘,在L*a*b*系统中选择合适的通道,使用Otus法和形态学运算剔除排泄物区域,并成功分割出虫害和健康区域。通过2种区域的图像在纹理方面表现出的不同,提取筛选出3种受外界因素影响比较小的特征,并在此基础上利用差异扩大法提出了“多纹理特征”的概念。使用Logistic二分类法对提取出的纹理特征及其组合、多纹理特征及其组合、主成分分析后的特征进行分类并分析,结果证明通过扩大差异得到的多纹理特征分类效果要好于单纹理特征,且使用“熵值均值-相关性均值”得到的分类精度最高,并使用系统聚类以及K-means聚类方法验证得到相同的结论,证明了所提方法的科学性。

檀香;图形分割;图像分类;健康诊断;灰度共生矩阵

檀香(SantalumalbumL.)是珍贵树种,其木质均匀细腻,又有独特的芳香,在制香方面历来被奉为珍品。近年来,由于檀香极高的经济价值和药用价值,在华南等地被大量栽植。檀香是一种半寄生常绿乔木[1],而且在气温或者环境不宜等情况下,檀香易受到危害根部的苗立枯病(RhizoctoniasolaniKuhn)、根腐病(PhytophthoracinnamomiRonds)以及危害叶片的叶灰斑病(CercosporasojinaHara)、白粉病(ErysiphegraminisD.)、桑寄生粉蝶(PierisrapaeL.)、金龟子(AliassotumpauperBurmeisten)和危害茎干的咖啡豹蠹蛾(ZeuzeracoffeaeNietner)的危害,其中咖啡豹蠹蛾虫害最为常见,并且破坏性极大,羽化时间不一,给防治带来了很大的困难,严重影响檀香的生长[2]。初孵幼虫在檀香幼嫩枝条上危害,随虫龄的增长,食量加大,幼虫不断转移,蛀蚀粗枝和主干[3]。因此,实时监测檀香健康状态并及时采取相应措施是关系到檀香经营成败的重要手段。目前主要使用的病虫害识别方法效率低,利用计算机视觉技术对病虫害进行识别,具有无损、快速、实时等特点,可以及时采取相应的补救措施,大大提高经济效益[4]。

计算机视觉技术在农业病虫害诊断方面有着广泛的应用[5-9]。在早期的研究中,学者们仅针对单一的特征进行研究,例如颜色特征和纹理特征,结果并不是特别理想。Y. Sasaki et al.[10]利用计算机视觉技术,采用遗传算法,对黄瓜(CucumissativusLinn.)的炭疽病(Colletotrichumfructicola)进行自动诊断和识别,由于没有充分利用病斑的颜色特征和纹理特征,最终对病害的识别效果不理想。Camargoa[11]对采集的RGB病害图像进行了颜色系统转换,在不同颜色系统中提取到了病斑图像的颜色特征,利用局部优化阈值法对病斑进行了分割,虽然精度得到了提高,但毕竟单一特征分类分割能力有限,没有得到太大的突破。

颜色、纹理、形态相结合的提取方法是近年来的研究趋势[12]。张建华等[13]利用径向基支持向量机识别棉花虫害,首先在空域中进行病斑分割,然后分别提取病斑的颜色、形状和纹理特征作为输入向量,得到88.1%的分类正确率。田有文等[14]采用支持向量机进行葡萄病害的识别,提取了纹理、形状和颜色特征,结果表明支持向量机方法比神经网络方法识别性能好。管泽鑫等[15]提取水稻病害图像的形态、纹理、颜色特征参数,提出利用逐步判别分析法分类特征参数并利用贝叶斯判别法进行分类识别,识别率高达97.2%。

虽然通过纹理、颜色图像特征相结合的方法可以提高分类正确率,但大部分研究针对温室种植的植物或大棚种植的作物,并且图像获取方式是由人工获取,失去了图像自动获取判别的意义,在田间试验成功率达不到之前的精度。上述方法不适用于檀香经营过程中的病虫害监测。本研究使用由放置在林内的传感器传回的图像信息,提出一种空域与频域相结合的背景去除方法,并提取出虫害区域与健康区域。根据其在纹理方面表现出的不同,提出并使用了多纹理特征,利用Logistic二分类进行分类,并使用系统聚类与K-means聚类方法验证所提方法的科学性。

1 材料与方法

1.1 研究区域概况与数据获取

试验数据采集于海南省北部县市栽植檀香的不同林内(19°36′~20°3′N、109°12′~111°2′E)。檀香林龄5~12 a,寄主植物包括三角梅(BougainvilleaspectabilisWilld.)、降香黄檀(DalbergiaodoriferaT. Chen)等。咖啡豹蠹蛾幼虫对檀香树干的危害极大,导致树干脱皮以及在心材内蛀成虫道,极大地降低了檀香的实用价值,所以选择对檀香树干虫害区域进行分割研究。原野服务器布设在林中,每台原野服务器由空气温度传感器、空气湿度传感器、土壤温度传感器以及无线局域网模型等组成,从06:00—18:00,每小时获取一次图像,并实时传输到服务器。拍摄时采用定焦镜头并使用大光圈,图像大小为1024像素×768像素。所用算法均在Matlab 2012a软件中实现,软件运行环境是配置为i5-6300HQ 2.30GHz CPU、8G内存、1T硬盘的计算机。

为尽可能减少外界条件变化对分析结果的影响,在研究方法上,选取了对光亮度和位置具有不变性、对描述认为具有尺度不变性的特征量进行分析。以研究区域内获取的60张檀香树干图像作为样本图像数据,设计算法进行图像分割,将健康部分与虫害部分区分开。对每张图像的2个部分各截取2张大小为64像素×64像素的图像样本,共获得研究区域内健康图像与虫害图像各120张。

1.2 图像特征分析与选取

通过对大量图像测试,最终选出能量值、熵值、对比度、相关性4种不受光照、位置和尺度影响的纹理特征作为进一步研究的参数。

(1)能量值。

能量值是灰度共生矩阵元素值的平方和,反映了图像灰度分布均匀程度和纹理粗细度。

(2)熵值。

熵值是图像所具有信息量的度量,纹理信息也属于图像的信息,它表示了图像纹理的非均匀程度或复杂程度。

(3)对比度。

对比度是灰度共生矩阵主对角线附近的对比度矩,它反映了图像的清晰度和纹理沟纹深浅程度。

(4)相关性。

其中:

式中:Pδ(i,j)为灰度共生矩阵的元素;i,j分别为矩阵元素的行元素、列元素;k为图像的灰度级。

相关性度量空间灰度共生矩阵元素在行或列方向上的相似程度,因此,相关性大小反映了图像中局部灰度相关性。

1.3 纹理特征值计算方法

首先对图像作预处理,再将图像压缩到16级后进行灰度共生矩阵特征值的计算。步长选择1,方向为0°、45°、90°和135°,最后求4个方向的均值和方差组成8维特征向量。

1.4 Logistic二分类法

Logistic模型法针对定性的因变量进行分析,常应用于二分类。其回归模型的基本形式为

式中:β0、β1、β2、…、βk为类似于多元线性回归模型中的回归系数。在实际应用的过程中,常常不是直接对P进行回归,而是变形为ln[π/(1-π)]=β0+β1x1+…+βkxk,其中0lt;πlt;1。最后再由π和P的映射关系进行反射得到P的值。

2 结果与分析

2.1 复杂背景下檀香树干图像分割

目前图像分割常利用颜色特征的不同组合,例如2G-R-B、2R-G-B、1.4R-G-B等[16-19]。但这些研究均局限在空域范围内,而频域则揭示了图像在信号方面的不同,同样也可以用于分割。

试验首先使用高斯高通滤波结合Otus法与形态学运算完成檀香树干分割,再通过L*a*b*系统完成虫害区域与健康区域的分割。CIEL*a*b*颜色模型常用来描述人眼可见的所有颜色的最完备的色彩模型,色彩空间比RGB空间大,它是一种均匀的色彩空间,且不受光照变化的影响,适合分析在野外自动获取的图像。从图1a可见,虫害区显示为红色,而a*分量表示洋红色到绿色的范围,有利于上述2部分的分割,所以将该部分统称为虫害区并进行分割。分割出的虫害区域有一部分属于咖啡豹蠹蛾排泄出的粪便,不在文中所研究的分类对象之内,需要将其分割处理。与受损区相比,排泄物区域的亮度偏暗,所以使用L*通道进行上述算法流程将其清除。

a.原图;b.高斯高通滤波后图像;c.形态学处理后二值图;d.初步分割结果;e.檀香树干分割结果;f.虫害区分割结果I;g.虫害区分割结果II。

算法步骤:

(1)对原图进行高斯高通滤波处理(σ=40)(图1b);

(2)对步骤(1)得到的图像进行Otus法分割后,使用disk为5的结构元素分别进行5次膨胀与腐蚀(图1c);

(3)将步骤(2)得到的图像与原图做掩膜,使用超G因子(2G-R-B)和大津法将图中绿色植物去除,得到檀香树干分割结果(图1e);

(4)对步骤(3)得到的图像转换至L*a*b*通道,并对a*通道进行显示,Otus法完成阈值分割后,使用disk为3的结构元素进行3次膨胀和腐蚀运算;

(5)对步骤(4)得到的图像转换至L*通道进行显示,重复步骤(4)中的阈值分割与形态学运算,并与原图进行掩膜,最终分割结果见图1 g。

2.2 纹理特征值比较与确定

2.2.1 纹理特征主成分分析

利用主成分分析方法对各纹理特征的权重做分析,结果表明,1~8号主成分累积贡献率分别为0.598 2、0.753 9、0.850 2、0.910 6、0.958 2、0.989 4、0.999 7、1.000 0。其中,前4个主成分的累计贡献率达到91.06%。由于因子载荷量的绝对值大小代表着变量对结果影响的大小,通过计算各个纹理特征在不同主成分的因子载荷量绝对值之和,得到各纹理特征对结果的影响作用由大到小依次为熵值均值(1.778 2)、相关性均值(1.729 3)、能量均值(1.722 8)、熵值方差(1.692 8)、对比度方差(1.663 2)、能量方差(1.597 6)、对比度均值(1.370 3)和相关性方差(1.237 8)。

2.2.2 单纹理特征

为讨论各个纹理特征对图像的区分情况,将计算出的纹理特征数值用散点图形式表示,观察2种纹理特征值的分布(图2)。由图2可见,图像纹理特征在熵值均值、熵值方差、对比度均值、对比度方差和相关性均值区分度较明显。结合各个纹理特征的因子载荷量与可区分程度,试验选择熵值均值、熵值方差和相关性均值作为研究的纹理特征。

a.能量均值分布;b.能量方差分布;c.熵值均值分布;d.熵值方差分布;e.对比度均值分布;f.对比度方差分布;g.相关性均值分布;h.相关性方差分布。

图2檀香健康树干和虫害树干的不同单纹理特征值分布

2.3 Logistic分类

使用Logistic模型法时,所使用的样本总数为240张,训练样本120张,其中健康图像与虫害图像比例为1∶1,定义其分类类别。其中模型形式为

试验首先验证差异扩大后的多纹理特征与单纹理特征分类效果的差别。

2.3.1 单纹理特征分类

由表1可见,仅使用一种单纹理特征进行分类时,熵值均值的分类效果最佳。但多个单纹理特征参与分类不同程度上提高了分类效果。同时,试验结果说明,并不是参与分类的纹理特征越多越好,熵值均值与相关性均值的组合形式可以提高分类正确率,而熵值方差的加入反而降低分类精度。

2.3.2 多纹理特征分类

在使用相同纹理信息的情况下,多纹理特征的分类精度要高于单纹理特征。利用熵值均值与相关性均值,多纹理特征分类精度提高了2.09%,其他2种情况也分别提高了7.92%与0.84%。这说明利用扩大差异的方法可以有效地提高分类正确率(表1)。

表1 檀香健康/虫害树干图像纹理特征分类精度

2.3.3 主成分分析后的纹理特征数据分类

为了验证所选择纹理特征的科学性以及其他无关纹理特征对分类精度的影响,试验对提取出的主成分分析后的数据进行聚类分析,与最佳单纹理特征、最佳多纹理特征作比较。由于受个别分类效果不理想的纹理特征影响,使用提取出的前4主成分纹理特征进行分类,效果低于其他2种组合。这证明了有必要在分类前对纹理特征进行分析与筛选,既可降低计算量,又可提高分类效果(表2)。

表2 前4主成分与最佳单/多纹理特征分类精度比较

2.3.4 不同分类方法下的精度验证

为了验证文中提出方法的科学性,使用不同的分类方法对筛选前后的数据进行分类,结果见表3。由表3所示,不同分类方法下,使用主成分分析得到的分类精度均低于筛选后得到的精度。同时,扩大差异后的多纹理特征分类效果最好,从而验证了本研究所提方法的科学性。

表3 系统聚类与K-means聚类对提出方法的验证结果

3 结论

本研究对受咖啡豹蠹蛾危害的檀香树干区域进行了分割与分类研究。首先将檀香树干在复杂的背景中分割出来,并进一步进行区域分割。根据健康檀香树干图像与受咖啡豹蠹蛾危害后的树干图像在纹理方面表现出的不同,利用灰度共生矩阵提取8种纹理特征,通过各特征的散点图分布与因子载荷量筛选出3种单纹理特征,并在此基础上利用扩大差异的方法构造出2种多纹理特征,利用Logistic二分类法进行分类,并与使用主成分分析后的数据获取的分类精度比较分析,得到以下结论:

(1)复杂背景下的檀香树干以及区域分割,可以通过高斯滤波结合大津法以及形态学运算得到初始分割结果,运用2G-B-R因子去除残余的绿色植物,得到图像中的树干部分。分别在L*a*b*系统中的a*通道和L*通道使用大津法求得最佳阈值,利用形态学运算将排泄物区域图像剔除,并将虫害区域与健康区域分割开。

(2)使用Logistic二分类时,单纹理特征中使用熵值均值与相关性均值进行分类,精度最高;在使用相同纹理特征数据情况下,通过扩大差异得到的多纹理特征分类效果要好于单纹理特征,且使用“熵值均值-相关性均值”得到的分类精度最高。

(3)使用主成分分析后的数据进行分类均不能达到筛选后的单纹理与多纹理特征分类的效果,这也说明了特征筛选的重要性。

(4)使用系统聚类与K-means聚类方法得到了与Logistic二分类法相同的结论,证明了本文所提方法的科学性。

本研究对海南省东北健康和受到咖啡豹蠹蛾危害的檀香树干的纹理特征变换进行了研究,得到了一些便于计算机自动识别的结论,但是这些结论是否也适用于其他地区,有待于作进一步的分析测试。

[1] 唐黎标.檀香树探秘[J].云南林业,2010(4):49.

[2] 吴智仁.檀香重要害虫咖啡木蠹蛾防治方法[J].福建农业,2012(5):23.

[3] 高泽正,伍有声,董祖林,等.檀香主要害虫的生活习性与防治[J].中药材,2004,27(8):549-551.

[4] 邹修国.基于计算机视觉的农作物病虫害识别研究现状[J].计算机系统应用,2011,20(6):238-242.

[5] YANG C C, PRASHER S O, LANDRY L A, et al. A vegetation localization algorithm for precision farming[J]. Biosystems Engineering,2002,81(2):137-146.

[6] XU G, ZHANG F, SHAH S G, et al. Use of leaf color images to identify nitrogen and potassium deficient tomatoes[J]. Pattern Recognition Letters,2011,32(11):1584-1590.

[7] PÉREZ A J, LPEZ F, BENLLOEH J V, et al. Colour and shape analysis techniques for weed detection in cereal fields[J]. Computers and Electronics in Agriculture,2000,25(3):197-212.

[8] 刘小川,艾矫燕,唐纪良,等.基于自适应模糊阈值的植物黑腐病叶片病斑的分割[J].中国图象图形学报,2009,14(7):1334-1340.

[9] WOEBBECKE D M, MEYER G E, VON BARGEN K, et al. Color indices for weed identification under various soil, residue and lighting conditions[J]. Transactions of the ASAE,1995,38(1):259-269.

[10] SASAKI Y, OKAMOTO T, IMOU K, et al. Automatic diagnosis of plant disease-recognition between health and diseased leaf[J]. Journal of the Japanese Society of Agricultural Machinery,1999,61(2):119-126.

[11] CAMARGO A, SMITH J S. An image-processing based algorithm to automatically identify plant disease visual symptoms[J]. Biosystems Engineering,2009,102(1):9-21.

[12] 汪京京,张武,刘连忠,等.农作物病虫害图像识别技术的研究综述[J].计算机工程与科学,2014,36(7):1363-1370.

[13] 张建华,冀荣华,袁雪,等.基于径向基支持向量机的棉花虫害识别[J].农业机械学报,2011,42(8):178-183.

[14] 田有文,李天来,李成华,等.基于支持向量机的葡萄病害图像识别方法[J].农业工程学报,2007,23(6):175-180.

[15] 管泽鑫,唐健,杨保军,等.基于图像的水稻病害识别方法研究[J].中国水稻科学,2010,24(5):497-502.

[16] 赵进辉,罗锡文,周志艳.基于颜色与形状特征的甘蔗病害图像分割方法[J].农业机械学报,2008,39(3):100-103,133.

[17] BURGOS-ARTIZZU X P, RIBEIRO A, GUIJARRO M, et al. Real-time image processing for crop/weed discrimination in maize fields[J]. Computers and Electronics in Agriculture,2011,75(2):337-346.

[18] AITKENHEAD M J, DALGETTY I A, MULLINS C E, et al. Weed and crop discrimination using image analysis and artificial intelligence methods[J]. Computers and Electronics in Agriculture,2003,39(3):157-171.

[19] 陈佳娟,纪寿文,李娟,等.采用计算机视觉进行棉花虫害程度的自动测定[J].农业工程学报,2001,17(2):157-160.

SegmentationandClassificationofCoffeeLeopardMothAttackedAreainSandalwoodTrunk//

Chen Zhulin, Wang Xuefeng

(Chinese Research Institute of Forestry, Beijing 100091, P. R. China)//

Sandalwood; Image segmentation; Image classification; Health diagnosis; Gray Level Co-occurrence Matrix

1)中央级科研院所基本科研业务费专项项目(CAFYBB2014MA006)。

陈珠琳,女,1994年7月生,中国林业科学研究院资源信息研究所,硕士研究生。E-mail:825511059@qq.com。

王雪峰,中国林业科学研究院资源信息研究所,研究员。E-mail:xuefeng@ifrit.ac.cn。

2017年6月4日。

责任编辑:程 红。

S763.42

Journal of Northeast Forestry University,2017,45(11):94-98,103.

To discuss image understanding about the case of coffee leopard moth pest on sandalwood in north of Hainan, we proposed a classification method by using images obtained in sensors which put in the forest. We used combined spatial and frequency-domain information to segment trunk from complex background, and used 2G-B-R to clear branches, leaves and bright edges in the foreground. After the trunk extraction was completed, we selected the best channel of L*a*b*system and combined the Otus method and mathematical morphology to segment regions successfully. Three kinds of texture features, which were less affected by external factors, were extracted and the concept of multi-texture features is proposed by means of different expansion method. We used the logistic model classification to classify and analyze the extracted texture features and their combinations, multi texture features and their combinations, principal component analysis. The “entropy mean-correlation mean” had the highest classification accuracy, and the same result was obtained by system clustering and the K-means clustering method.

猜你喜欢
檀香虫害纹理
把檀香放在书上
桃树主要虫害及防治方法
基于BM3D的复杂纹理区域图像去噪
不用农药也能治虫害
檀香之爱
使用纹理叠加添加艺术画特效
浅析白三叶的虫害防治
行道树香橼主要虫害及其防治
TEXTURE ON TEXTURE质地上的纹理
蒙药三味檀香胶囊治疗冠心病心绞痛