基于颜色与缺陷检测的椪柑分级算法*

2018-12-24 06:18曾芳艳冯午阳张书真宋海龙
关键词:色泽像素点分量

曾 磊,曾芳艳,冯午阳,张书真,宋海龙

(吉首大学信息科学与工程学院,湖南 吉首 416000)

目前,椪柑主要依靠果农或冷机械进行手工分级,存在速度慢、精度低和人为影响因素多等缺点,因此椪柑自动分级得到了广泛关注.国内外专家对水果的自动分级处理提出了一些有效的算法,如李国进等[1]针对芒果的外观品质提出了一种基于芒果面积、等效椭圆长短轴之比、H分量均值和缺陷面积所占百分比的多特征参数分级方法;王树文等[2]通过提取缺陷等3个特征进行了番茄损伤自动检测与分类;以哈密瓜、枸杞、红枣等为对象的无损检测与分级算法也获得了广泛研究[3-5].笔者以湘西椪柑为研究对象,根据四川省出台的《柑橘等级规格》标准[6],拟设计一种基于颜色与缺陷检测的椪柑分级算法,为椪柑分级提供科学依据.

1 算法流程

本设计中椪柑分级算法主要由图像预处理、特征提取和决策树判定3个基本模块构成.图像预处理包括椪柑目标区域的分割;特征提取涉及色泽、缺陷面积等特征参数的提取;决策树判定是采用决策树对色泽和缺陷面积2个特征参数进行融合及分级判定.整个算法的流程如图1所示.

图1 算法流程Fig. 1 Flowchart of the Proposed Algorithm

2 椪柑自动分级模型

2.1 图像的预处理

分级系统对图像中椪柑的外部特征进行识别检测.为了辨识和分析目标,需要提取椪柑目标区域,以便进一步分级.在工业化的椪柑分级过程中,系统传送装置构成图像的背景,在背景与椪柑图像的交界处灰度值有较大突变,因此笔者考虑采用阈值分割法对椪柑目标区域进行提取.

(1)阈值分割.阈值分割是一种对原图像的像素集合进行划分的方法,将原图像视作拥有不同灰度级范围的2类区域的组合,即椪柑区域与背景的组合.分割前,首先将彩色椪柑图像转换为灰度图像.设椪柑灰度图像的像素点为p(x,y),其中(x,y)表示像素点坐标.根据灰度直方图得到椪柑区域的灰度范围[Kmin,Kmax],进而将图像分割为2个区域.定义分割后的图像为

(1)

(1)式中通常取b0=1,b1=0.多张椪柑图像的平均灰度直方图如图2所示.

从图2可以看出,有2个相距较远的峰值区域,第1个峰值区域对应椪柑区域,第2个峰值区域对应背景区域,明确的目标区域灰度范围为[108,221].根据(1)式对椪柑灰度图像进行阈值分割,分割后的图像中椪柑区域为白色,背景区域为黑色(图3).

图2 多张椪柑图像的平均灰度直方图Fig. 2 Average Gray Histogram of Ponkan Images

图3 阈值分割前后对比Fig. 3 Contrast Diagrams Before and After Threshold Segmentation

(2)填充孔洞.阈值分割后得到的椪柑图像其表面可能存在孔洞,这对后续的椪柑彩色图像区域的提取造成影响.形态学的闭运算能较好地处理连通区域中的孔洞问题,图像t通过结构元素b进行闭运算,该操作可以表示为

t·b=(t⊕b)⊖b.

(2)

图4 孔洞填充后的图像Fig. 4 Result Diagram After Filling Holes

(2)式表明,图像t先由b进行膨胀,再由b进行腐蚀.图像经闭运算可以去除较小的暗色细节,达到填充孔洞的目的.图3中目标椪柑区域的黑色像素点为孔洞,孔洞填充后的图像如图4所示.

(3)彩色图像中椪柑目标区域的提取.原图像经过阈值分割和孔洞填充后,实际上已获得椪柑目标区域.后续的特征参数提取是在颜色空间中完成,因此需要提取原彩色图像中的椪柑目标区域.具体处理如下:将已获得的二值图像与原椪柑彩色图像的R,G,B分量分别进行与运算,再合成运算后的3幅图像,即可得到椪柑彩色图像的目标区域.椪柑彩色图像的目标区域提取过程如图5所示.

图5 椪柑彩色图像的目标区域提取过程Fig. 5 AND Operation Diagrams of Color Component and Diagram of the Extracted Target Region

2.2 特征提取

椪柑的主要外观特征有果形、颜色和表面缺陷等,影响椪柑品质的因素包括表面缺陷面积大、果皮颜色青涩和果皮颜色分布不均等.基于此,笔者采用色泽和缺陷面积2个特征作为椪柑分级的依据.

2.2.1 色泽参数 果皮表面颜色与内在品质和成熟度有着密切的关系,色泽特征的提取将在RGB颜色空间中进行.RGB空间是最常见的一种颜色空间,根据三基色原理,在RGB颜色空间,任意的颜色都可以用R,G,B三基色分量按照不同比例混合而成.由三基色原理可知:蓝色分量为0时,等量的红色分量和绿色分量合成黄色;当红色分量大于绿色分量时,接近黄橙色.在实际的检测中发现,椪柑目标区域的蓝色分量不为0,特等品椪柑图像中的椪柑区域,其蓝色分量都小于某一个固定小值,且对椪柑颜色的影响很小.因此,在色泽参数提取过程中可以不考虑蓝色分量的影响.本研究中色泽参数直接体现在椪柑区域黄色像素的占比上,像素是否判为黄色是色泽特征提取的关键.根据上述分析,像素是否判为黄色与像素中红色分量的取值有关,为此笔者提出如下的色泽参数提取方法:

Setp 1 设图像中椪柑目标区域的绿色像素数目Gt=0,黄色像素数目Yt=0;令任意某个像素的坐标为(x,y),判定像素是否为黄色的经验阈值为I.

Step 2 分别提取目标区域像素点的R分量r(x,y)、G分量g(x,y)、B分量b(x,y).

Step 3 若r(x,y)>I,则执行下一步;否则,判定该像素点为绿色像素,Gt加1.

Step 4 比较r(x,y)和g(x,y)的大小.若r(x,y)>g(x,y),则判定该像素点为黄色像素,Yt加1,否则,该像素点为绿色像素,Gt加1.

Step 5 遍历椪柑目标区域所有的像素点,统计该区域中黄色像素的总数目Yt,绿色像素的总数目Gt.

Step 6 计算Yt/(Yt+Gt),得到椪柑区域的黄色像素占比,即椪柑区域的色泽参数.

图6 椪柑缺陷标记前后的对比图像Fig. 6 Contrast Diagrams Before and After Marking

2.2.2 缺陷面积参数 受自然环境、采摘、运输和存储等因素的影响,椪柑的表皮不可避免地存在一些缺陷,如刺伤、裂果、虫孔、腐烂和干疤等,椪柑缺陷面积的大小是椪柑分级的重要依据.由于好表皮的颜色都为黄橙色,而缺陷处表皮的颜色普遍偏灰黑色(颜色更暗,与黄橙色的区别比较明显),因此本算法将从果皮表面颜色来判断是否为缺陷,然后以缺陷面积的大小确定椪柑的品级.从色泽参数提取过程可知,R,G分量的合成颜色对椪柑黄色影响最大,故对目标区域的各像素用R,G分量来判断是否为缺陷像素.分析不同等级椪柑图像的R,G分量,最终将116和66分别作为R,G分量的阈值.当椪柑区域中某个像素点的R,G分量都小于其阈值时,将该像素点标记为缺陷像素,并在实验中遍历椪柑目标区域像素点以统计缺陷像素点的总数目.

为了计算缺陷面积,采集椪柑图像时,在处于同一距离、同一水平高度的位置设置一参照物,参照物图像同样进入采集摄像系统.在包含参照物的图像中统计参照物像素点个数,由此可知每个像素点的实际物理值,即椪柑缺陷面积.缺陷标记前后的对比图像如图6所示.

2.3 决策树判定模型

图7 决策树判定模型Fig. 7 Decision Tree Model

根据四川省出台的《柑橘等级规格》标准,笔者将关于色泽和缺陷的描述转换为椪柑分级中色泽参数和缺陷面积参数的量化指标,并根据这些指标来构造决策树判定模型,对椪柑样本进行分级判定.决策树判定模型如图7所示,其中C表示目标区域黄色像素占比,S表示目标区域缺陷面积大小(单位mm2).

3 结果与讨论

在主频1.8 GHz,内存4 GB,处理器型号AMD A8-7100Radeon R5的计算机上,以湘西椪柑为实验对象,利用MATLAB R2014a仿真软件进行仿真实验.根据四川省出台的《柑橘等级规格》标准,将椪柑分为3个等级.从不同等级中各选取20个椪柑作为测试样本,分别利用基于色泽的分级算法、基于缺陷面积的分级算法和新算法对椪柑测试样本进行自动分级,实验结果列于表1.

表1 不同算法的椪柑分级结果比较Tabel 1 Comparison of Ponkan Grading Results by Different Algorithms

由表1可知:采用基于单一特征的2种分级算法对一等品和二等品椪柑进行分级时,误判率较大;采用新算法进行椪柑分级时,分级结果的正确率总体较高,二等品的准确率高达100%.在基于色泽参数进行分级时,造成一等品和二等品被误判为特等品的主要原因是有些缺陷面积的颜色接近于正常黄色.在基于缺陷面积分级时,椪柑分级正确率较低,这表明单独采用缺陷面积进行分级处理并不适应于实际应用场景.虽然基于新算法的椪柑分级正确率高,但是因为难以实现椪柑表面照明的绝对均匀,所以椪柑边缘可能会被误判为缺陷区域.有些缺陷区域(如干疤等)因R,G分量满足色泽参数的条件而被误判为黄色,这导致黄色像素占比增加,从而会将一些一等品椪柑判定为特等品.这些原因均降低了分级的正确率.

4 结语

针对湘西椪柑人工分级存在速度慢、精度低、人为影响因素多、自动化程度低等不足,提出了基于多特征融合的椪柑自动分级算法.该算法在椪柑图像预处理的基础上,引入色泽和缺陷面积2个特征参数,使用决策树对椪柑进行分级.实验结果表明,与基于单一特征的椪柑分级结果相比,所提算法利用特征之间的互补实现了更高性能的分级.光照不均对分级的鲁棒性影响较大,如果能进行光照补偿预处理,椪柑的分级正确率就有望进一步提升.

猜你喜欢
色泽像素点分量
人生的色泽
西装新色
基于局部相似性的特征匹配筛选算法
T-501色泽分析方法的建立
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
基于5×5邻域像素点相关性的划痕修复算法
论《哈姆雷特》中良心的分量
基于canvas的前端数据加密
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割