尿沉渣有形成分优化分割技术研究及应用

2017-04-13 01:34刘玉成张颖超
软件导刊 2017年3期
关键词:尿沉渣颜色空间

刘玉成,张颖超

(1.南京财经大学 国家级实验教学中心,江苏 南京 210003;2.南京信息工程大学 信息与控制学院,江苏 南京 210044)

尿沉渣有形成分优化分割技术研究及应用

刘玉成1,张颖超2

(1.南京财经大学 国家级实验教学中心,江苏 南京 210003;2.南京信息工程大学 信息与控制学院,江苏 南京 210044)

由于现有尿沉渣处理技术存在不足,加上尿沉渣空间环境中细胞图像中聚堆、粘连等类似融合特点和采集过程中受光源等环境的影响,细胞彩色图像的采集经常会发生彩色偏移问题,再加上图像背景本身的复杂性,使得对尿沉渣中有形成分的分割和处理非常困难。为改变传统细胞图像分割和处理方法的不足,提出一种改进型的色度学的图像处理方法,使得分割和处理结果更理想,性能更稳定。其核心系统采用白平衡算法,针对因外部光线所造成的误差进行校正,从而解决了由光照引起的图像彩色偏移等问题,然后利用改进型RGB向量空间分割法对过程图像进行处理,最后在复杂的背景中将尿沉渣有形成分分割出来,进而得到理想的实验结果,满足医学研究中检测分类的要求。

色度学;马氏距离;特征提取;向量空间法

0 引言

随着计算机图像处理(Image Processing)与分析技术的发展,其在医学临床诊断(Clinical Diagnosis)和治疗等领域的应用逐渐深入。医学尿沉渣有形成分分割方法的研究日臻完善,且在整个信息化图像分析(Image Analysis)领域[1]中占据重要地位,这在医学研究(Medical Research)和临床诊断方面,尤其是在缺乏医学专家对细胞图像参与分割和临床诊断的情况下,极为重要。由于众多复杂的有形成分,加上尿沉渣有形成分自身因素,有时会出现多个重叠小区,它们相互作用和影响以聚合成某些较大的融合区(Fusion Zone),被称为图形处理聚堆(Poly Heap)现象;另外,在尿沉渣细胞彩色图像中,也有一些小区会出现重叠现象,为了不影响尿沉渣有形成分各元素的计算和参数测量,最有效的方法就是成功地将尿沉渣有形成分各元素(Unit)从重叠区域一一分割。

根据这些特点,以传统形态学为特征向量的分类器已经满足不了这种复杂情况下的有形成分检测。针对这一情况,本文将这些对应图像从色度学(Colorimetry)的角度进行分析考量,目的是能够根据统一标准的灰度值(Grayscale Value)将尿沉渣有形成分从复杂的空间环境中准确分割出来,这就需要从R、G、B三色空间整体分布入手,精确定位和采集整体图片中各个不同区域的R、G、B空间的颜色值(Color Values),寻找它们的R、G、B分布差异。依据上述创新型的分割理论,本文创造性地提出改进型(Modified)的色度学分割方法对细胞图像进行分割处理,最终得到了理想的实验效果。

1 采集分析系统与核心算法

1.1 模型与原理

本文尿沉渣有效图像的采集应用了国内外先进的DJ 8300自动细胞有形成分的采集分析系统,针对其采集模块的特征采集和机器学习的特点,采用了符合其特点模式的全监督训练模式的模型,其流程如图1所示。由于采集的细胞图像中存在聚堆、粘连等问题,以及采集过程中受光源等环境的影响,图像的采集经常会发生彩色偏移,加上图像空间信息背景的复杂性,使得对尿沉渣中有形成分的分割和处理较为困难。

因此,在尿沉渣图像信息采集系统中,本文应用Matlab7.0作为图像预处理的辅助平台,从R、G、B三色空间整体分布入手,设定统一标准的灰度值(Grayscale Value),精确定位和采集整体图片中各个不同区域的R、G、B空间的颜色值(Color Values),在此基础上采用一种改进型色度学的图像处理方法,使得分割和处理的结果更理想、性能更稳定,从而很好地解决了这一问题。其中核心的分割和处理原理就是下文所架构的改进型白平衡算法。

图1 DJ8300采集分析系统模型流程

1.2 白平衡及其算法

白平衡是一个用来调节图片色彩特性(Color Characteristics)的一种算法,它广泛应用于现代摄像、图像处理(Image Processing)、照相系统(Camera System)等领域。它与色彩科学(Color Science)知识解释相通,白色是指反射到人眼中的光线由于蓝、绿、红3种色光比例相同且具有一定的亮度所形成的视觉反应。赤、橙、黄、绿、青、蓝、紫7种色光混合组成白色光,而这红、绿、蓝三原色按不同比例混合也能形成七色光,当三原色在一种光线中的比例相同时,它被习惯地称为消色,其所反射的光都是消色,情况包括:黑、白、灰、金和银等。一般情况下,白色亮度被视作是不含有色彩。

人眼的固有模式看白色或其它物体颜色与对象本身、色温的光源、物体的反射或透射特性、人的视觉传感器(Vision Sensor),以及许多其它因素有关。当光线照射消色差颜色的物体时,物体反射光的颜色与入射光,也即红灯与红白色物体的颜色相同,同时照射到消色(Achromatic)物体时,如有两个或更多的彩色光,对象的颜色是加深效果,如红色和绿色同时照射到白色的对象上,则对象显示黄色。当彩色物体上照射彩色光时,对象会是减色效应(Hypochromic Effect);如黄色物体照射品红光时,它就呈现红色,黄色物体照射蓝色光时,它就呈现绿色,黄色物体照射青色光时,它就呈现灰色或黑色。

从物理意义上来看,当某种特定有色光线照射到普通物体时,则该特定光线的颜色就会产生,产生的过程一般需要一定的时间,之后就会感觉在人眼的视觉系统(Visual System)中呈现出来,其效果是使得被照物体呈现出某种特定的颜色。换言之,物体的反射特性和物体光线的颜色共同决定了被人眼观测到的颜色;人眼可分辨的光变化所对应的原始颜色,因为人眼具有独特的适应性,但是有时却无法匹配可变化的色温;例如,人在钨丝灯下持续很长时间,你会觉得视觉上没有感觉,如果把钨丝灯突然改变成荧光灯的模式,你就会觉得原本白纸的颜色偏红,不过这仅是一种感觉,人们一般只能持续一段时间。而相机不如人眼的适应性那么强,所以如果相机色彩调整与场景中的照明色温(Color Temperature)一致时,它将发生偏色现象。

为此,本文通过研究,采用了一种白平衡算法来修正这种色彩偏差的现象。具体分类如下:

(1)灰度法。灰度法(Grayscale Method)由Buchsbaum在20世纪80年代首先在图形图像处理应用领域创建,其概念的外延非常宽泛,在不同的应用方向,人们对其理解也不尽相同,因而灰色世界方法(Gray World Method)的概念时常可见。其具体算法中“灰色”的值为一个常数的必要条件需满足:①相关图片要达到应用要求的色彩范围(Color Range);②在已知、经典(Classic Source)光源下三原色颜色空间通道为均值的情况下才成立,通常其值为一个已知常数。光源信息在未知光源情况下,其信息量化数值的计算方式是通过其三原色颜色空间均值和已知灰色值(直方图)统计计算得到。

“灰色”值(直方图)的选定弹性较大,方法、版本很多,历经多次修正。起初,Buchsbaum有过多种设想,包括取每个通道MAX值的1/2到采用以图片数据库(Picture Database)为基础的相关统计值等,都被先后作为“灰色”值。在这些众多版本中,用对角变换矩阵的方法来解决复原问题是比较标准合理的方法,简言之,每个像素为R、G、B的值由相应的光转换因子(Conversion Factor)相乘,该系数因子通常是一个常数。其假设的图片中有足够多的色彩空间、计算简便且非常有效是灰度法最大的优点。在许多情况下,彩色图像的处理相对简单,但有时灰度方式不仅不能改善画面质量,还会使得画面质量严重失真。

(2)色相关法。色相关法在系统识别模型中的一个重要作用是特征提取,其过程是产生特征矩阵,方法为离散化色彩空间(Color Space),目的是给特征参数降低维度,便于数值运算,从而改进了透视色彩法的不足。

1985年,Finlayson提出将预先计算一个矩阵作为色相关法(Color Correlation Method)的基本思想,其相关度用光源与特定图像色彩无关的对应矩阵表示。不同的训练光源与该矩阵的每一行一一对应起来,色彩值用矩阵的列来表达,离散化染色空间(r,g)产生一一对应的色彩值。该方法的有效性不受行和列顺序及排列位置影响。

为此,本文将矩阵数组如A(I,J)的概念描述为:若处于光源I下采集的图像产生J的颜色值,数学表达式为A(I,J)。两种定义矩阵元素A(I,J)的具体方法为:①A (I,J)取值为0或1;取0表示色彩J不可能出现在光源I之下,取1表示色彩J可能出现在光源I之下;②A(I,J)取值为0~1的任何一个值,代表色彩I出现在光源J之下的概率。

计算相关矩阵后取其值,然后使用类似方法对对象图像的颜色空间进行离散化(Discretization),得到一个相关向量后,再用矩阵乘法得出与已知源的相关性,根据与每个图像所对应未知源的相互关联性,选择最大相关的或几种已知、未知特征源中的一个来估计得到未知光源的特性。

(3)神经网络法。神经网络法[2-3]是白平衡算法的一种,处理视角比较独特是其特征之一。这种方法的主要过程首先是离散化染色(Color Space)空间(r,g),实质就是给特征参数降低维度(Dimensions),便于数值运算,然后对接相应的神经网络结构方法。本文针对该识别系统的特点,所提出的神经网络(Neural Networks)白平衡算法使用了3层结构网络,输入层有12个节点,第一个隐藏层有M个节点,第二个隐藏层有N个节点,输出层有6个节点;输入层代表离散化的染色空间(r,g),每一个节点的输入可取0或1,表示某个色彩值(ri,gi)是否在图像中出现,输出层表征了光源特性;上层为下层数值的加权之和。通过输入不同的图片,训练神经网络的不同权值,从而获得满意的结果。

一般而言,结晶图像在采集过程中经常会遇到R、G、B空间颜色值失真的情况。本文采用白平衡算法,目的是去除色度(Chroma)对图像采集的干扰,将产生颜色偏差的图片恢复到经典光源照射下的标准色彩(Standard Color)。所谓的经典光源(Classic Source)就是自然光下的细胞图像。结晶图像在采集过程中遇到R、G、B空间颜色值失真情况下的偏色图像与经典光源之下的自然光图像,如图2 (a)、(b)所示。

图2 偏色图像

2 颜色特征提取

采集系统在进行去光照的白平衡算法处理后,对细胞图像进行颜色特征(Color Feature)提取,细胞颜色是反映细胞种类的重要指标之一。本文根据该系统中的颜色特点,采用RGB向量空间[4]颜色模型的方法来对细胞颜色进行分析和研究。系统对每种成分均提取它们的R (RED)、G(GREEN)、B(BLUE)3个颜色特征值,这3个特征值是各种成分所有像素点的R、G、B的平均值。这对后续细胞成分的分割起到了重要作用,尤其是在后期的训练和识别过程中,其作为神经网络的重要特征参数,直接助力了细胞成分的精确识别。

3 色度学对图像成分的初步分割

3.1 细胞彩色图像色度学分割

其概念[5]的标准定义可结合分割过程中的要求、规则和功能等来理解,具体分割过程为:

(1)将一幅彩色图像依据彩色图像特有的色彩规则(Color Rules)分割成多个不同的区域。这些多个区域元素的整体数量、成型规则(Forming Rule)等都必须符合色度学的分割特定要求,比如区域的特殊性意义,所谓特殊性,主要是指符合识别系统模型中前期的色度学分割所必需的局部图片特性;再如,特定区域的一致性要求,该一致性是指局部独立的区域之间相互不重叠,从而符合前期的色度学分割。

(2)依据色度学分割完成之后的训练和学习要求特点,前瞻性地选取符合具体细化分割的颜色组合(Color Combinations)。需要说明的是,单个颜色参数在模型之间可以相互转化,但是具体颜色组合而成的对应功能是很难相互替代的,这也是上述过程中前瞻性地选取恰当颜色组合的原因之一。针对各种细胞有形成分的分割,选择一个适合于系统特点的色彩特征集(Feature Set),这对于后期的训练与识别非常有用。根据图像处理和模式识别对目标图像的特点要求,彩色图像能相比灰度图像(Grayscale Image)在不同的环节有着不同的作用和特点,其重要性也不尽相同,单从信息量来看,前者的标准量就要远大于后者。因此,前者在医学领域(Medical Field)的普遍应用也更多地被采纳。当然,两者之间的相互转化也不难实现。

本文采集的是尿沉渣彩色图像,根据不同的颜色空间特征参数进行区分和分割[6]。在分析各成分及数据时可以发现,各种细胞和有形成分在R、G、B的3个颜色空间都有交叉区,并且对于不同的图像,由于尿沉渣的各种有形成分在不同环境光照下采集的颜色空间(Color Space)所对应的参数标准不一致,导致其不易简单分割。因此,从这个角度而言,采用单一的色度学颜色空间(Color Space)来分割尿沉渣细胞和复杂的有形成分十分不易且效果不佳;并且,源于众多复杂的有形成分,加上尿沉渣有形成分自身原因,有时会出现多个重叠小区(Overlapping Cells),它们相互作用和影响以聚合成某些较大的融合区(Fusion Zone),被称为图形处理聚堆(Poly Heap)现象;此外,在尿沉渣有形成分彩色图像中,也有一些小区会出现重叠现象,为了不影响尿沉渣有形成分各元素的计算和参数测量,最有效的方法就是成功地将尿沉渣有形成分各元素(Unit)从重叠区域一一分割,而单用传统的方法来处理和分割来自各种尿沉渣有效成分对应的图像将会变得相当困难。

根据上述情况和特点,本文创造性地提出从改进型色度学分割的角度来考虑细胞有形成分的处理,分析不同区域在R、G、B三色向量空间的颜色值(Color Values),以获得各种细胞和复杂成分在R、G、B三色向量空间中的分布概况,查找分析它们其中的R、G、B分布差异;并应用专业仿真软件Matlab7.0,针对在DJ8300超级分析仪中采集的各种尿沉渣有形成分的图像检测(Detect)颜色的像素值(Pixel Values)。根据上述理论,可以提出以下色度学分割准则[8-9](Colorimetry Guidelines),以分类处理各种尿沉渣有形成分的图像。Matlab仿真处理过程如下:

(1)正向扫描整幅图像,将每个像素的R分量减去B分量,根据其差值将像素分为两大类:(R-B)>=M类和(R-B)<-M类。

(2)在(R-B)>=M类中,凡是(R-B)>=M的像素令其保留原先的颜色值,而(R-B)

(3)在(R-B)<-M类中,凡是(R-B)<-M的像素令其保留原先的颜色值,而(R-B)>=-M的像素则令其为黑色,这样得出的图像除去了一般细胞,突显指定细胞区。(M为不同的自然数)

根据Matlab7.0仿真处理结果,采用色度分割准则(Chroma Guidelines)处理尿沉渣有形成分图像取得了一定的分割效果,它能在没有医学专家的参与下,自动粗略地分割文中DJ8300超级分析仪采集的尿沉渣中的有形成分,且可以在系统平台上采集原始的尿沉渣彩色图像中提取出新的图像。从仿真实验的数据中可发现如下图像问题:①粗分割的细胞图像受噪声影响较大,各种因素产生的干扰较多;②尿沉渣有形成分图像不清晰,主要原因通常是染色因素导致的颜色值不一致;③尿沉渣有形成分中聚堆现象的干扰,导致识别部分有形成分的准确率下降;④细胞粘连造成细胞核识别率降低;⑤在尿沉渣的白细胞图像中,存在少量类似上皮细胞成分和少许其它杂质区域等问题。 为了使图像更清晰,视觉效果更好,要对提取出来的细胞图像进行平滑滤波(Smoothing)处理,从而达到更好的分割效果。

3.2 RGB向量空间中的图像分割

本系统将一张完整的含有各种有形成分的尿沉渣图像分割成若干个局部区域。使用R、G、B彩色向量进行彩色区域分割的方法很简单也很实用,它是一种十分重要的改进型应用方法,其标准的分割方法和原始模型源自于冈萨雷斯先生的数字图像处理技术,目前已发展得非常成熟和稳定,并在相关领域被大力推广。本文旨在R、G、B图像中分割一个特定的彩色细胞或尿沉渣有形成分,给定一组指定的彩色(或彩色范围)描述的彩色样本点[10-11],系统可根据这一彩色样本点所对应的一组R、G、B颜色空间向量值,来获得一个“平均”的颜色(Average Color)估计,它是文中期望被分割的某种颜色有形成分,通常可以让这种平均色用R、G、B颜色空间向量的列向量m来定义。

依据本系统所构建的改进型色度学分割方法模型中的理念,其具体分割的目的是对尿沉渣图像中的每一个R、G、B像素进行分类,使其在指定的范围内有一种颜色或没有颜色,为顺利达成这一目的,系统设定了一个相似性度量,最简单的度量之一是欧几里得距离,令z表示RGB空间的任意点,若z和m之间的距离小于指定的阈值T,则可以说z相似于m。m和z之间的欧几里得距离[12-13]由下式给出:

(1)

其中,‖·‖是参数的范数,下标R、G和B表示向量m和z的RGB分量。D(z,m)≤T的点的轨迹是一个半径为T的实心球体,如图3(a)所示。由定义可知,包含在球体内部或表面的点满足特定的彩色准则,而球体外边的点则不满足。在图像中对这两组点编码,如黑的和白的,产生一幅二值分割图像。前述方程的一个有用归纳是距离:

(2)

其中,C表示要分割的彩色样值表示的协方差矩阵。该距离成为Mahalanobis距离,D(z,m)≤T的点的轨迹描述了一个实心三维椭圆体[14],如图3(b)所示,其重要属性是其主轴取在最大的数据扩展方向上。当C等于单位矩阵I时,Mahalanobis距离约简为欧几里得距离。除了数据包含在椭球体内而不是包含在圆球体内之外,分割与前段描述过的相同。

图3 RGB向量空间聚合数据的两种方法

在上述采用的类似实心球体轨迹法和实心三维椭圆体法的模型下,系统函数COLORSEG可在Matlab 7.0仿真软件的环境下实现对尿沉渣有形成分的有效分割,具体函数实现的程序代码如下:

S=Colorseg;

%调用Matlab语言中的分割实现函数,模拟实心球体轨迹法和实心三维椭圆体法来实现尿沉渣有形成分的分割;% method表示方法,f表示RGB图像,T 表示阀值,parameters表示参数。

在Matlab7.0仿真软件的分割函数中method(方法)的选择一般可以有两种:第一种为“euclidean”,第二种为“mahalanobis”。f是分割的RGB尿沉渣有形成分图像,T 是前边描述过的阈值。若选择“euclidean”,则输入参数是m,若选择“mahalanobis”,则输入参数是m和C。parameters(参数)m是RGB向量空间中Mahalanobis距离或者欧几里得距离运算过程中所需向量之一,其选择形式一般也可以有两种:第一种为:“行”,第二种为:“列”,两者的选择项可根据不同的距离计算对应的自由选定。而parameters(参数)C在RGB向量空间中Mahalanobis距离或者欧几里得距离运算过程中一般为三行三列的协方差矩阵(Covariance matrix)。

与此同时,分割函数COLORSEG所对应的输出值用S来表示,它一般表示为与尿沉渣中采集的源图像所对应的灰度图像。按照Matlab软件中图像处理算法对于灰度图像的处理规则,当T=0时,对应部分的区域作为背景图像被系统保存;而当T=1时,对应部分的区域作为目标图像就被系统从源图像(Source image)中分割出来。被分割的二值化图像区域在Matlab软件图像处理的数值计算界面能非常直观地得到显示,整个图像中显示出来的不同区域分别用0和1来表示。

通过上述方法,该系统有效地将各种细胞成分从背景图像中分割了出来,这在该系统的实验结果与研究数据中得到了充分说明,分割效果非常理想。

4 实验结果与结论

本文通过仿真实验,将其与传统分割方法的准确率数据对比可见,改进后的尿沉渣细胞彩色图像的色度学分割方法对尿沉渣细胞及其它有形成分的分割准确率均得到了明显提高[15],这在实验的数据结果中可以得到充分验证。具体结果如表1所示。

表1 尿沉渣成分实验结果 单位(%)

针对尿沉渣有形成分图像的特点,考虑到其采集过程中受光照影响,本文采用改进型R、G、B向量空间的细胞彩色图像的色度学分割法,不但解决了医学细胞图像因光线差异引起的误差,达到了图像色度学分割在医学领域的应用要求,而且能够在受光照影响的情况下更准确地分割各种尿沉渣中的有形成份,从而有效地对它们进行医学分类。

[1] 刘玉成.基于色度学和形态学相结合的图像处理与识别技术研究[D].南京:南京信息工程大学,2009.

[2] 严世珺.数字图像白平衡处理算法研究与改进[D].上海:上海交通大学,2007.

[3] 李阳.自动白平衡算法的改进与实现[D].西安:西安电子科技大学,2010.

[4] RAFAEL C,GONZALEZ RICHARD E,WOODS STEVEN L EDDINS.数字图像处理(Matlab)[M].北京:电子工业出版社,2005.

[5] MIEHAEL BRADY.Computational approaehes to image understandin[J].ACM Computing Surveys,2012,14(1):3-71.

[6] 胡小锋,赵辉.图像处理与识别实用案例精选[M].北京:人民邮电出版社,2004.

[7] 杨榕.基于图像处理技术的浮生物自动分类研究[J].计算机仿真,2006(5):167-170.

[8] 罗军辉,冯平.MATLAB7.0在图像处理中的应用[M].北京:机械工业出版社,2005.

[9] 傅蓉.细胞重叠与融合性图像的分离与分割技术研究[D].广州:第一军医大学,2007.

[10] 冈萨雷斯.数字图像处理[M].北京:电子工业出版社,2005.

[11] 张波.基于数字图像技术的岩石边坡失稳灾害监测预报的开发研究[D].郑州:郑州大学,2007.

[12] 陈志国,须文波.机器视觉智能机器人无损检测系统[J].计算机工程与应用,2009(14):12-14.

[13] 田锐,郭艳玲.基于机器视觉的葡萄自动识别技术[J].东北林业大学学报,2008(11):95-97.

[14] 韩媞.森林防火系统中图像识别算法的研究[D].哈尔滨:哈尔滨工业大学,2008.

[15] FUNT B,BERNARD K,MARTIN L.Is machine colour constancy good enough[C].Proceedings of the 5th European Conference on Computer,Vision.Freiburg,2014:445-459.

(责任编辑:孙 娟)

江苏省“六大人才高峰”项目(2106-A-027);江苏省高校自然科学基金项目(12016KJD520122)

刘玉成(1980-),男,江苏镇江人,硕士,南京财经大学国家级实验教学中心实验师,研究方向为计算机应用;张颖超(1960-),男,江苏徐州人,南京信息工程大学信息与控制学院教授、博士生导师,研究方向为系统控制和仿真、网络控制技术。

10.11907/rjdk.162393

TP319

A

1672-7800(2017)003-0110-05

猜你喜欢
尿沉渣颜色空间
尿常规与尿沉渣对尿液检验的影响及分析
创享空间
用全自动尿沉渣分析仪进行尿沉渣检验的作用分析
特殊颜色的水
UF-1000i尿沉渣分析仪与尿干化学检测对尿路感染诊断价值的研究
全自动尿沉渣分析仪UF-1000i的性能评价及临床应用
QQ空间那点事