基于图像处理的苦荞品种判别

2015-03-11 10:06
中国粮油学报 2015年5期
关键词:苦荞图像处理正确率

张 强

(山西师范大学生命科学学院,临汾 041004)

苦荞亦称鞑靼苦荞(F.tartaricum),为蓼科(Polygonaceae)苦荞属(Fagopyrum Gaerth)药食兼用的作物。随着苦荞营养和功能成分研究的深入[1],苦荞的开发利用也得到了迅速的发展,目前中国已是苦荞生产大国,种植面积及产量均居世界第一。

种子的真实性和品种纯度鉴定在种子质量管理、种子生产与营销实践中有重要意义[2]。基于种子数字图像处理的机器视觉检测方法具有无损、高效、快捷和低成本的特点。近年来,国内外学者在小麦[3-7]、玉米[2,8]、花生[9]等大宗作物、经济作物的品种、等级和产地判别中进行了探索和应用。不同农作物的种子特征在识别中作用会有所不同,传统的苦荞种子品种分类鉴别还依赖于肉眼观察为主,而对苦荞种子品种进行图像识别的相关研究还未见报道。为了解决品种混杂、充伪等问题,探寻新的苦荞品种判别方法,对于苦荞品种鉴别、产品质量控制、健全质量管理、保证苦荞产业的持续健康发展具有重要意义。

本试验基于图像处理的研究方法对不同品种的苦荞种子(果实,下同)进行形态特征方面的分类比较,首先使用图像扫描仪获得不同品种苦荞种子的彩色图像,再采用图像处理软件从图像中提取颜色和形态特征的基础数据,然后利用统计软件对这些基础数据进行分析,筛选判别变量,建立有效的判别模型,并对模型进行验证,为苦荞品种分类提供有效鉴定依据。

1 材料与方法

1.1 材料

采用全国8个省区的11个品种苦荞种子作为试验材料,分别为:1威宁苦荞、2九江苦荞、3晋荞2号苦荞、4固原苦荞、5海原苦荞、6通化苦荞、7苦刺荞、8黑丰1号苦荞、9湖南7-2苦荞、10云南苦荞、11黔黑苦荞,均由山西省农科院农产品加工研究所提供。种子过筛去杂,每个品种随机选取40粒种子,共440粒种子。

1.2 方法

1.2.1 种子图像的采集及信息提取

采用EPSON Perfection V700扫描仪获取苦荞种子的数字图像,扫描仪的分辨率设置为600 dpi,背景设置为白色。图像处理与分析在台式电脑(Lenovo,Pentium 4,2.8 GHz)上进行,操作系统为 Windows XP SP3。以图像处理软件Adobe Photoshop CS4作为样本特征参数提取的主要工具。

1.2.2 图像分析方法

通过USB接线将样本的原始图像转入计算机进行处理。为了进一步消减图像在扫描及传输过程中的噪声干扰,利用Adobe Photoshop CS4软件中的调整边缘工具,将调整半径设置为1.00像素,平滑力度设置为3以去除图像边缘的锯齿状干扰,并且利用羽化工具以1.00像素单位平均模糊柔化选取边缘[10],获取更精细的结果。通过边缘的调整,干扰及图像噪声得到消减,较好地保持了图像的边缘。利用快速选择工具,设置选定直径为10 px,间距为25%,对单个种子进行选定,提取单个种子的特征数据。

1.2.3 颜色特征提取

对于颜色识别通常采用红绿蓝(RGB)和HSI颜色分析,使用RGB颜色模式时,自然的色彩与显示器上的色彩是以完全相同的方法创建的,有利于对图像进行客观、准确地分析和研究,因苦荞籽粒主色调为灰白及黑色,并且考虑到Adobe Photoshop CS4软件中颜色数据提取的方便性,采用RGB颜色作为苦荞种子颜色特征的提取通道。利用快速选择工具将籽粒选定后,在直方图里会显示选定区域的RGB各颜色特征均值。

1.2.4 形态特征的提取

利用快速选定工具对每个种子进行选定提取,并记录测量。形态特征如下:

面积=以单个苦荞种子图像所包含的所有像素总数计算。

周长=苦荞种子图像边界像素总和。

长度=苦荞种子纵向图像上距离最长的2个端点之间的像素距离。

宽度=苦荞种子横向图像上垂直于纵轴的最大2个端点之间的像素距离。

长宽比=长度/宽度。圆形度=(周长)2/(4π×面积)。矩形度=面积/外接矩形面积。

1.2.5 其他特征变量的提取

根据苦荞种子的性状特点,将一些较明显的籽粒外观特征也进行了提取,比如腹沟及棱翅的有无。经观察发现,11个样本的苦荞品种均具有腹沟,除苦刺荞具有明显的棱翅分布之外,其他品种均没有明显的棱翅特征。

1.2.6 判别模型的构建与验证

采用SPSS 17.0统计软件进行方差分析和判别分析。方差分析的多重比较采用Duncan法;判别分析,采用Wilks',λ法和逐步法,构建贝叶斯(Bayes)判别函数。聚类分析采用DPS14.10软件进行因子聚类。验证方法采用回判验证和交互验证法。交互验证是近年来逐渐发展起来的一种非常重要的判别效果验证技术,是在建立判别准则时逐一去掉一例,再用建立的判别准则对该例进行判别,交互验证与回判验证相比错分率可能会增加,但结果更真实、客观,是评价判别准则效能的可靠指标[11-12]。

2 结果

2.1 特征变量筛选结果

提取的苦荞种子特征参数为28个。其中9个形态特征包括面积、周长、长度、宽度、矩形度、长宽比、圆度、棱翅和腹沟;颜色特征包括RGB、R、G、B和明度的平均值、标准差、中间值以及灰度的最小值、最大值、平均值、中间值等19个特征指标。方差分析结果显示不同品种间的全部指标均存在显著差异(P<0.05),图1显示的是部分形态特征的多重比较结果,图2显示的是部分颜色特征的多重比较结果(不同字母表示在0.05水平,差异存在统计学意义)。

图1 不同品种苦荞种子的长度、宽度及长宽比

图2 不同品种苦荞种子的R、G、B中间值

11个品种之间28个特征变量均存在显著差异(P<0.05),于是将全部变量纳入进行逐步筛选,根据规则标准F>3.84的纳入,F<2.71的筛除,从中筛选出特征变量,剔除影响不显著变量的干扰。经20步的筛选,获得18个有效特征变量列于表1。

表1 筛选出的特征变量

将这18个变量采用标准化处理,进行因子聚类分析,结果如图3所示,在距离为1处可分为2类,一类为颜色特征变量共13个,另一类为形态特征变量共5个。分别使用筛选出的形态因子和颜色因子进行品种判别分析,5个形态因子的判别正确率为55.7%,交互验证正确率为53.6%;13个颜色因子的判别正确率为76.4%,交互验证正确率为73.4%。

图3 判别变量的聚类结果

苦荞种子的颜色是苦荞的重要特征,基于颜色特征因子的判别正确率为76.4%,亦显示颜色特征是重要的分类特征。颜色特征中的灰度(平均值)为最重要的判别变量,这与Manickavasagan等[13]利用图像处理对加拿大8个小麦品种进行判别时的首要变量有相似之处。颜色特征也较为稳健,对于物体的大小和方向均不敏感,有较强的的鲁棒性。通过人眼得到颜色知觉,这是一种复杂的主观过程,不可避免地受到诸如人的视觉、疲劳程度、个人倾向性、光源等因素的干扰[14]。利用计算机图像分析技术对不同苦荞品种种子的颜色特征和形状特征进行采集、提取,通过图象处理技术与现代统计技术相结合进行分析建模判别,相比传统肉眼识别而言,精确量化、客观准确有效。

基于形态特征因子的判别正确率为55.7%,表明长度、宽度、长宽比、矩形度和垂直投影的面积5个形态特征在品种分类中亦发挥着比较重要的作用。虽然研究显示不同品种形态特征上存在较明显的可区分差异,但这种形态特征差异的显著性仅通过肉眼判别是比较困难的,通过数字图像处理和统计学分析有效克服了这个困难,可以利用这些特征对种子的形状进行较为精确的区分判断。在有效特征的筛选中,腹沟及棱翅2个变量未被加入有效特征中,但这2个特征对于其他品种的区分可能仍具有一定意义。

颜色和形状为多基因遗传特征,受环境因素影响较小,可视为品种的属性特征[15]。颜色特征与形态特征结合使用,能有效提高判别的正确率。本研究方法对品种的判别正确率达到了96.8%,交互验证的正确率达到了94.7%。判别效果一般用误判率来衡量,并要求误判率小于10%或20%才有应用价值[16]。因此根据苦荞的数字图像特点建立的Bayes模型,具有一定的应用价值。另外,研究采用的图像处理软件和统计分析软件普及性高,易于掌握和使用。

2.2 判别结果

使用筛选出的18个形态因子和颜色因子一起进行Bayes判别分析,得到判别函数为:

式中:y1,y2,…,y11,为对应的品种 1,2,…,11的Bayes判别函数,将未知品种特征变量分别代入函数式,哪个函数值大,则应归入相应的品种类别。

表2 判别分析结果

表2结果表明,对11个品种的回判验证(根据判别准则将原样本逐一代入,评价判别效果),正确率为96.8%。其中威宁苦荞、苦刺荞、云南苦荞的回判正确率都达到了100%,固原、海原、通化、黑丰1号及黔黑苦荞的回判正确率达到了97.5%,晋荞2号、九江苦荞的回判正确率分别为95%和92.5%,仅湖南7-2苦荞回判正确率较低,为87.5%。对11个品种的交互验证(即在建立判别准则时逐一去掉一例,再用建立的判别准则对该例进行判别),正确率为 94.7%。

影响苦荞品种判别的因素可能与品种内种子的一致性差有关。苦荞是总状花序,花期长,成熟时间极不一致,因为苦荞的最适宜的收获时间为全株2/3籽粒成熟,过早收获,大部分籽粒尚未成熟,过迟收获,籽粒将大量脱落,影响产量[17]。另外,品种数目越多,在籽粒形态诸特征上的交叠现象就越严重,可区分性变差,也影响到识别效果[8]。今后选择成熟度尽可能一致的籽粒,探索适宜种子样品数量规模、尝试引入新的特征因子,如纹理特征等,优化分类方法和模型,可能有助于提高判别的正确率。本研究使用了11个苦荞品种,而通常某一区域的主要栽培品种不会很多,建立针对某一地域几个主要品种的,基于数字图像处理的判别模型,将使得应用数字图像技术进行苦荞品种判别具有更广泛的应用价值。

3 结论

对来自8个省区的11个品种苦荞种子,通过扫描仪获取其彩色数字图像,并从中提取了颜色和形态2类共28个变量进行统计分析,发现苦荞种子不同品种间的颜色特征和形状特征存在着显著差异。通过逐步法筛选从中获得18个变量,作为苦荞种子品种识别的重要指标,经R型聚类分析可聚成2类:13个颜色变量聚为一类;5个形态变量聚为一类。13个颜色类变量的判别正确率为74.6%,5个形态类变量的判别正确率为53.6%,颜色类变量在苦荞品种预测中发挥着主要作用。

将颜色类变量和形态类变量相结合,获得的Bayes判别模型回判正确率为96.8%,交互验证判别正确率为94.7%。表明利用图像分析系统和现代统计方法,能有效地对苦荞种子的颜色与形态特征进行精确量化提取和快速分析,比肉眼识别更具优势,可为苦荞品种分类鉴别和质量控制提供一种客观性,准确性、有效性的方法。

[1]周小理,李宗杰,周一鸣.荞麦治疗糖尿病化学成分的研究进展[J].中国粮油学报,2011,26(5):119-121

[2]杨锦忠,郝建平,杜天庆,等.基于种子图像处理的大数目玉米品种形态识别[J].作物学报.2008,34(6):1069-1073

[3]Shouche SP,Rastogi R,Bhagwat SG,et al.Shape analysis of grains of Indian wheat varieties[J].Computers and Electronics in Agriculture,2001,33(1):55 -76

[4]何胜美,李仲来,何中虎.基于图像识别的小麦品种分类研究[J].中国农业科学.2005,38(9):1869-1875

[5]Zapotoczny P.Discrimination of wheat grain varieties using image analysis and neural networks.Part I.Single kernel texture[J].Journal of Cereal Science,2011,54:60 -68

[6]Pourreza A,Pourreza H,Abbaspour-Fard M H,et al.I-dentification of nine Iranian wheat seed varieties by textural analysis with image processing[J].Computers and Electronics in Agriculture,2012,83:102 -108

[7]Delwiche SR,Yang I C,Graybosch R A.Multiple view image analysis of freefalling U.S.wheat grains for damage assessment[J].Computers and Electronics in Agriculture,2013,98:62-73

[8]郝建平,杨锦忠,杜天庆,等.基于图像处理的玉米品种的种子形态分析及其分类研究[J].中国农业科学,2008,41(4):994-1002

[9]韩仲志,赵友刚.基于外观特征识别的花生品质与品种检测方法[J].中国粮油学报,2009,24(5):123-126

[10]程轶波.Photoshop图像处理技巧[J].中国科技信息,2009,(1):328-354

[11]黄晓韵,曹波,杨跃.基于 SAS的多元统计方法实现芯片数据挖掘[J].生物信息学,2010,8(2):147-149

[12]刘娟,崔树起,吕曼,等.基于非参数交互证实判别分析法建社区脑膜炎诊断模型[J].数理医药学杂志,2010:23(1):8-10

[13]Manickavasagan A,Sathya G,Jayas D S,et al.Wheat class identification using monochrome images[J].Journal of Cereal Science,2008,47(3):518-527

[14]刘光蓉,管庶安,周红.基于图象处理技术的大米色泽检测[J].粮食和饲料,2006(1):8-9

[15]Wiwart M,Suchowilska E,Lajszner W,et al.Identification of hybrids of spelt and wheat and their parental forms using shape and color descriptors[J].Computers and Electronics in Agriculture,2012,83:68-76

[16]孙振球.医学统计学(第三版)[M].北京:人民卫生出版社,2010

[17]赵钢,陕方.中国苦荞[M].北京:科学出版社,2009.

猜你喜欢
苦荞图像处理正确率
海战场侦察图像处理技术图谱及应用展望
个性化护理干预对提高住院患者留取痰标本正确率的影响
人工智能辅助冠状动脉CTA图像处理和诊断的研究进展
科学家揭示苦荞起源传播驯化路径
苦荞
门诊分诊服务态度与正确率对护患关系的影响
基于ARM嵌入式的关于图像处理的交通信号灯识别
机器学习在图像处理中的应用
苦荞花
生意