基于改进的SLIC超像素分割算法

2023-03-01 08:05许晓东张雷焦小雪廉桂城
电子制作 2023年2期
关键词:像素点像素聚类

许晓东,张雷,焦小雪,廉桂城

(河北工程大学 数理科学与工程学院,河北邯郸, 056038)

0 引言

图像分割作为数字图像处理的关键组成部分,其目的是将图像中感兴趣的部分提取出来。发展至今已有很多分割算法被提出和广泛应用。例如在模式识别、人工智能、医学影像、深度估计[1]等领域,可以利用图像分割技术对既定的目标进行定位及跟踪。

按照技术路线的不同可将图像分割技术分为:基于阈值、聚类、图论以及深度学习等。其中基于阈值分割算法的原理一般为:通过设置一个门限阈值对图像进行二分类,将大于该阈值的像素置1否则置0。其目的是,为了识别和提取图像中感兴趣的部分。但对于大多情况下,仅用该方法是无法找到一个适合全局的分割阈值。

对于基于聚类的分割算法,其本质是利用了样本之间的相似度。通过设置的相似度函数将性质相似的样本或对象聚合为一类,从而实现分割的目的。常用的聚类分割算法有K-means[2]、FCM[3]等。

本文所提的改进的SLIC算法属于聚类分割算法。但该算法在执行之前需要手动设置预分割超像素的个数,自适应性较差。因此本文提出了相应改进的SLIC超像素分割算法。具体改进在于,能够自适应地设置预分割超像素的块数以及优化了最终分割的效果。

1 基于改进的SLIC图像分割算法

■1.1 SLIC超像素分割算法

超像素的概念最早是由Ren等人[4]提出的,具体指的是那些位置相邻且颜色、纹理等特征相似的像素点组成的区域块。超像素分割作为常用的图像分割算法,通常用来提取图片中的有用信息。

SLIC作为一种应用广泛的超像素分割算法,其原理是通过定义一个距离度量公式将性质相似的像素聚合为一类来实现图像的分割。具体的SLIC距离度量公式是通过约束像素点之间的CIELAB颜色空间距离和坐标空间距离[5]来实现像素的聚类。之所以在SLIC算法中选择LAB颜色空间代替RGB颜色空间是因为LAB颜色空间是用数字化的方式来模拟人类的视觉感应,更加符合人类的真实生理感官。

此外,SLIC超像素分割算法作为一种基于K-means的新聚类算法,继承了K-means聚类算法的优点,即算法框架清晰以及部署快捷。然而不同于K-means的是,SLIC在聚类操作过程中对聚类中心周围2S x 2S范围内的像素点进行聚类。而K-means则是在整个图像的全局范围内对像素点进行聚类。因此SLIC的聚类算法相较于K-means聚类收敛速度更快。算法的具体流程如下:

(1)对于一幅有N个像素的图片,首先根据需求预设分割的超像素块数K,则每个超像素块的大小约为N/K,且相邻超像素块的种子点之间的距离

(2)由上述可知,在图像上均匀分布K个初始聚类中心Cii= 1,2,3...K,且聚类中心用五维向量表示为Ci=[Li,ai,bi,xi,yi],其中Li、ai、bi分别为聚类中心对应的CIELAB色彩分量,xi,yi为聚类中心的横纵坐标。

(3)为防止初始聚类中心Ci位于图片的边界,需要将初始聚类中心移至其3x3邻域内梯度最小的位置处。

(4)对图片上的每个像素设置一个初始的标签L(n)=-1以及设置一个初始的距离d(n)=∞(n∈N)。

(5)每个像素的搜索范围与其对应最近的聚类中心相关联,具体限制为计算聚类中心与其2S x 2S邻域内像素之间的距离nD。如果nD

其中Ln、an、bn分别为聚类中心在2S x 2S邻域内的像素点对应的CIELAB色彩分量,xn,yn为邻域内像素点的横纵坐标。dlab表示的是聚类中心与其邻域像素之间的CIELAB颜色空间距离,dxy则表示的是聚类中心与其邻域像素之间的空间坐标距离。最终用nD来表示两像素间的相似度,且nD的值越大就越表明两像素之间越相似。m是该距离公式的紧凑因子。

(6)完成一次迭代后,更新聚类中心CK。通过计算标签值一致的像素的横纵坐标的均值,将计算的均值作为对应聚类中心的新横纵坐标。

(7)重复步骤5和步骤6并计算误差E,其中误差E为前后两次迭代得到的两个聚类中心之间的距离,直至误差小于设定的阈值停止迭代。然而在实际操作中,一般选择重复步骤5和步骤6十次左右,得到的最终分割结果就很好了。

关于SLIC超像素分割算法需要设定两个参数,分别是预分割超像素块数K和紧凑因子m。然而对于分割块数K来说并不是越大越好。K值越大则表明图像分割得越细致即产生过割行为,且每个分割区域的形状也越来越规则。因此为了使SLIC算法的分割结果能够拥有良好的边界,这就需要通过大量的实验来设定合理的预分割超像素块数K和紧凑因子m。其中由相关文献[6]可知,紧凑因子m一般设定在1~40之间。如图1给出的是SLIC超像素分割算法,在不同取值K下的分割效果图。

图1 不同K值下的超像素分割图

■1.2 SLIC分割算法的改进与优化

由于原始的SLIC超像素分割算法在执行之前,需要手动预设分割的超像素块数,这可能会引发图像的过分割或欠分割等问题。因此本小节利用待分割图像的HSV颜色空间在全局上的非均匀量化来间接地表示待分割图像的复杂度,并用其一维向量对应直方图得到的均值来表示预分割超像素的块数,从而达到自适应设置超像素块数的目的[7]。

具体操作如下:首先对待割图像的颜色空间进行转换,将RGB颜色空间转换为HSV颜色空间。这样做的目的是HSV颜色空间相较于RGB颜色空间更接近人眼对色彩的敏感度,因此更适合参与后续的算法处理。具体两种颜色空间之间的转换公式如下所示:

其中CMax表示RGB颜色空间中的最大值,CMin则表示为RGB颜色空间中的最小值。

随后对HSV的三个颜色分量分别进行非等间隔量化,其中将H量化为16级,S量化为4级、V量化为4级。这样量化的目的是,在HSV颜色空间中,图像的色彩信息仅仅与H分量和S分量有关而与V分量无关,因此H量化的更加细致。随后将量化后的三个色彩分量合并为一个一维的向量L,具体如下所示:

式(3)~(7)中SQ和VQ分别表示为分量S与分量V的量化级数。此外由式(3)~(7)可知,H的权重等于16,S的权重为4,V的权重为1。这样分配权重的方式符合上述HSV颜色空间非等间隔量化的目的。

由公式(7)得到的一维向量L求其对应的直方图。随后统计直方图中的特征并按照增序进行排序,并求排序后直方图的平均值。选择直方图中大于平均值的那个最小特征作为图像的预分割超像素个数K。

■1.3 梯度阈值处理

为了进一步优化超像素分割图像的结果,提出利用图像的梯度信息对分割结果做进一步处理。考虑到在一般图像中可能会存在噪声以及其他干扰并最终影响分割的结果。为了消除干扰以及噪声带来的影响,首先对待割图像进行边缘检测以获得图像的边缘信息,同时利用阈值分割技术获取待割图像的阈值门限,并最终将该阈值应用在SLIC超像素分割图像上。

此外常用的边缘检测算子有Sobel、Laplacian、Canny等。本小节使用的边缘检测算子是应用广泛的sobel算子。图2显示的是经过水平方向和垂直方向Sobel算子滤波并归一化处理的图像。

图2 Recycle图像边缘信息示意图

本小节选择的阈值分割是基于自适应阈值分割而来,首先对每个SLIC超像素分割区域进行了特征的统计,并在每个分割区域中计算相应的均值与方差。由均值和方差确定分割区域的阈值。这样的做的目的是可以针对不同的分割区域选取不同的阈值,因此能够得到更多的边缘细节。但使用该方法的计算量会很大且复杂度也较高。因此本小节选择对目标图像的梯度图进行均值和方差的计算。然后由公式(8)计算对应梯度图的阈值[8],并最终将该阈值应用在SLIC超像素分割图像上。

在公式(8)中,G表示的是目标图像的梯度图、avg表示的是均值、var表示则是方差、n为设定的权重。对于权重n来说并不是越大越好,具体本小节将n设置为4就能获得较好的结果[8]。

2 实验结果分析

本小节我们将所提的改进的SLIC超像素分割算法用于实际图像的分割并进行了相应的验证与分析。具体选取图3中的图片来进行分割测试,并将本章所提改进算法的分割结果与原始的SLIC分割算法进行对比。如图3给出了SLIC分割算法及其改进算法的分割效果图。

图3 超像素分割模板图

从图中可以看出,原始的SLIC分割算法虽也能够较好地分割出目标图像的轮廓与边界但仍存在一定的过割行为,即分割结果中相似的区域被分开了。并且由图3(b)的第二幅图中能够看出,桌子附近的地板上存在大量的孤立分割区域。造成这样的原因可能是,该区域相邻像素之间的相似度较为接近从而导致分割算法的距离公式不能够很好地发挥作用,即在进行超像素分割时像素点的归类发生了误判。

此外由图3(c)可知,相较于原始的SLIC分割算法,本章所提的改进算法在保障分割质量的前提下,能够大幅减少图像中超像素的过割行为并仅保留目标图像的边界区域。

3 总结

针对SLIC算法需要设置预分割超像素个数的问题,本文提出了一种改进的SLIC图像分割算法。首先对原始的SLIC分割算法进行了分析并提出了相应的改进思路。随后利用HSV颜色空间在全局上的非均匀量化来间接地表示待分割图像的复杂度,并通过进一步的计算来获取预分割超像素的块数。之后为了获得更加完整的分割目标轮廓信息,又提出了利用图像的梯度信息对SLIC分割结果做进一步的优化处理。

最后将本文所提改进的SLIC超像素分割算法用于实际的图像分割并进行了相应的验证与分析。由实验可知,本文所提算法相较于原始的SLIC分割算法,在分割结果上确实有明显的进步。

猜你喜欢
像素点像素聚类
像素前线之“幻影”2000
基于局部相似性的特征匹配筛选算法
基于K-means聚类的车-地无线通信场强研究
“像素”仙人掌
基于5×5邻域像素点相关性的划痕修复算法
基于canvas的前端数据加密
ÉVOLUTIONDIGAE Style de vie tactile
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现