聚类法阈值分割专题教学探讨

2019-06-01 10:06缪奇航熊莎莎李新宇严裕崔文超
电脑知识与技术 2019年12期
关键词:聚类算法

缪奇航 熊莎莎 李新宇 严裕 崔文超

摘要:数字图像处理在研究生教学中存在着许多难点,尤其是聚类法阈值分割部分,算法多,公式复杂且理论性强,学生难以理解。聚类分割算法主要包括了最大类间方差法、迭代法、二维最大类间方差法、最小误差法四种方法。对聚类法的理论知识进行研究,用无监督法进行结果评估,结合MATLAB进行教学实验,既能帮助学生深度学习理论知识,也能提高学生的编程及分析能力,从而提高研究生的学术能力。

关键词:MATLAB;阈值分割;聚类算法;无监督法

中图分类号:TN911 文献标识码:A

文章编号:1009-3044(2019)12-0126-04

Discussion on Thematic Teaching of Threshold Segmentation by Clustering Method

MIAO Qi-hang, XIONG Sha-sha, LI Xin-yu, YAN Yu,CUI Wen-chao

(College of Computer and Information Technology, China Three Gorges University, Yichang 443000, China)

Abstract: There are many difficulties in the teaching of digital image processing in graduate students, especially in the threshold segmentation part of clustering method, which has many algorithms, complex formulas and strong theory, and it is difficult for students to understand. Cluster segmentation algorithm mainly includes four methods: maximum inter-class variance method, iteration method, two-dimensional maximum inter-class variance method and minimum error method. Studying the theoretical knowledge of clustering method, evaluating the results with unsupervised method and teaching experiment with MATLAB can not only help students to learn theoretical knowledge in depth, but also improve students'ability of programming and analysis, so as to improve the academic ability of graduate students.

Key words: MATLAB; Threshold segmentation; clustering algorithm; unsupervised methods

1 引言

數字图像处理作为国内各高校计算机类和电子信息类专业的拓展课程,同时也作为信息与通信工程类研究生精品课程,具有重要意义。其中阈值分割部分在生活、实践以及科技发展方面起着十分重要的作用。在工业制造方面,可用于电路微型部件以及重工业机械产品的质量检测;在医学方面,可用于分割CT图像以及核磁共振图像,便于医生对病理部位进行更加准确的分析;在国防建设中,用于军事领域的一些仪器精度检测。

聚类法的特点是运算简便、计算效率高。本文利用MATLAB建立阈值分割系统,实现四种不同算法对图像的阈值分割处理,且对分割图像进行无监督型评价,根据评估参数对四种分割算法进行探讨,从而综合得出几种聚类分割算法的优劣及特性。实现理论与实践相结合,使枯燥的理论知识形象化,使聚类法分割专题的教学过程更加形象、具体,从而提高教学质量。

2 聚类法图像分割原理

在聚类法中,确定分割阈值是对灰度图像分割的关键所在,计算出阈值后,将其与灰度图像各像素点灰度值对比,然后把像素点按灰度范围分成背景区域和目标区域,实现聚类法分割。

定义一幅图像为[fx,y],大小为[X×Y],聚类分割算法的核心都是先遍历图像所有像素的灰度值,然后计算得出最佳阈值,假设最佳阈值是T,再对图像进行处理,处理后的灰度图像定义为[gx,y]:

[gx,y={ab f(x,y)>Tf(x,y)≤T ] (1)

聚类算法分割后的图像只有a和b两种灰度,因此这种图像被称为二值化图像。

3 聚类分割算法

3.1最大类间方差法

最大类间方差法也称作Otsu算法,此算法是在图像灰度级直方图基础上使用最小二乘法推导而来。Otsu法是利用最佳阈值将图像的灰度级分成两类,使两类之间的方差取得最大值,方差越大背景区域和对象区域差距越明显,分割效果也越好。

设图像灰度级为L,灰度级为i的像素点有[ni]个,其中i的值在0到L-1之间,图像总像素数是:

[N=i=0L-1ni] (2)

灰度级为i的像素出现概率如下:

[pi=niN] (3)

在Otsu法中,存在一个阈值T,将像素分为背景区和对象区。对象区像素灰度级范围是[0,T-1],背景区的像素灰度级范围是[T,L-1]。

图像平均灰度级:

[μ=i=0L-1ipi] (4)

设对象区像素所占面积比为[ω0],则像素平均灰度为:

[μ0=μ0Tω0] (5)

设背景区像素所占面积比为[ω1],则像素平均灰度为:

[μ1=μ1Tω1] (6)

则类间方差表达式为:

[σ2T=ω0μ0-μ2+ω1μ1-μ2] (7)

计算出在[σ2T]取最大值时的T值,即最佳选择阈值,利用MATLAB中的函数graythresh ()可直接求得最佳阈值T。

3.2迭代式阈值选择法

迭代式阈值选择法简称迭代法,基本思想是先设置一个阈值估计值,然后再根据算法不断改进估计值,直到改进值满足算法要求为止。

迭代法步骤如下:

(1)给图像设置一个初始阈值[T0];

(2)利用阈值[Tk]将图像分成背景区和对象区,将对象区域记为[A1],将背景区记为[A2],再利用公式(8)和公式(9)计算两个区域的均值分别为[μ1]和[μ2],记图像灰度级为L,灰度级为k的像素出现次数为[pk],计算公式如下:

[μ1=k=0Tkkpkk=0Tkpk] (8)

[μ2=k=TkL-1kpkk=TkL-1pk] (9)

(3)利用公式(10)计算最新阈值[Tk+1]:

[Tk+1=12μ1+μ2] (10)

(4)重复第二步、第三步,假设精度为[δ],直到精度满足式(11)即可:

[Tk+1-Tk<δ] (11)

最后得最佳阈值为[Tk+1]。

3.3二维最大类间方差法

二维最大类间方差法也称为二维Otsu法,是一种改进的Otsu法。Otsu算法只考虑到像素的灰度级分布,而二维Otsu法不仅考虑到像素灰度级分布,也考虑到邻域像素的平均灰度级分布,因此得到的阈值是二维矢量,最佳阈值是在一个二维测度准则下确定最大值时得到的。

二维Otsu法内容如下:

(1)设图像[Ix,y]的灰度级为L,则该灰度图像邻域平均灰度也为L;

(2)设像素点[x,y]的灰度值为[fx,y],以像素点[x,y]为中心的[K×K]像素点集合的平均灰度值为[gx,y]。令[fx,y=i],[gx,y=j],然后形成一个二元组[i,j],设[i,j]出现次数为[fij],图像像素点总数为N,则可求得该二元组所对应概率密度为[pij=fijN], 其中i和j取值均为1到L;

(3)任意选取一个阈值向量[s,t],所选的阈值向量将该图像的二维直方图分成4个区,B、C表示图像的对象和背景像素点,A、D表示噪声点。

(4)设B、C两区所对应概率分别是[ω1],[ω2]:

[ω1=i=0sj=0tpij] (12)

[ω2=i=s+1L-1j=t+1L-1pij] (13)

B、C区均值矢量分别是[μ1],[μ2]:

[μ1=μ1i,μ1jT=i=0sj=0tipijω1,i=0sj=0tjpijω1T] (14)

[μ2=μ2i,μ2jT=i=s+1L-1j=t+1L-1ipijω2,i=s+1L-1j=t+1L-1jpijω2T] (15)

則整幅图像均值矢量是[μT]:

[μT=μTi,μTjT=i=s+1L-1j=t+1L-1ipij,i=s+1L-1j=t+1L-1jpijT] (16)

3.4最小误差法

Kittler和Illingworth在文章Minimum Error Thresholding提出了一种基于灰度图像直方图的分割方案,图像由背景区和对象区组成,由于两区域均符合混合高斯分布,依据算法思想以及分割效果,此算法被称为最小误差法。

首先,计算对象、背景的均值[μiT]和方差[σ2iT],公式如下所示:

[PiT=g=abhg] (17)

[μiT=g=abhggPiT] (18)

[σ2iT=g=abg-μiT2hgPiT] (19)

最小误差法对象函数由最小分类误差计算得出,对象函数如下:

[JT=1+2P1Tlogσ1T+P2Tlogσ2T-2P1TlogP1T+P2TlogP2T] (20)

由于对象函数[JT]取值最小时的T值是最佳阈值,则阈值选取原则为:

[Jτ=minTJT] (21)

4 聚类法的MATLAB实现及评估

在聚类法阈值分割专题教学中,为了更加客观地对阈值分割结果进行较为客观、准确地分析,教师在教学中一般采取定性分析和定量分析。定性分析就是通过编写程序都得到图像分割结果;定量分析就是通过评价标准对分割图像进行计算,再依据计算结果进行研究探讨。

4.1定性分析

为验证聚类法分割的有效性,此处以添加高密度高斯噪声、低密度高斯噪声为例,利用MATLAB软件编写程序,对加噪图像进行实验,实现四种聚类分割算法分割效果图,分别如图1、图2所示。

4.2定量分析

在深度教学中对聚类法分割结果的定量分析分为两种情况,无监督型和有监督型参数评估,本文采用无监督型评价标准对分割后图像的质量进行分析,评估参数为区域间熵、组合对比度Zeb。

4.2.1区域间熵

区域间熵可以对分割图像质量进行有效评估。区域熵是对某一区域内均匀性的度量,但其具有偶然性,因此用区域间熵来弥补这种偶然性,从而得到更客观的结论,其表达式为:

[HlI=-j=1NSjSIlogSjSI] (22)

式中,N为图像区域个数,[Sl]为所有像素数,[Sj]为j区域像素数,区域间熵值越大图像分割质量越高。

4.2.2组合对比度Zeb

组合对比度是区域内对比度比区域间对比度,值越小分割质量越好,其表达式为:

[Z=1SjS∈Rjmax|Cxs-Cxt|,t∈Ws?Rj1NbRjS∈nRjmax|Cxs-Cxt|,t∈Ws,t?Rj] (23)

式中,定义[Rj]是区域j的像素集,[Ws]是像素s的领域像素,[Cxs]是像素s的值,[NbRj]是区域j的边界长度,[nRj]是区域j边界元素。

4.2.3教学实验结果探讨

现进行教学实验,用MATLAB软件进行仿真得到添加高密度噪声、低密度噪声时区域间熵、组合对比度Zeb的结果分别如表1、表2所示。

对比添加不同的高斯噪声后分割图像,以及评估参数值分析可知:给图像添加高密度高斯噪声时,二维Otsu法的区域间熵值最大,组合对比度值最小,因此其具有最佳的分割效果;最小误差法的区域间熵值最小,组合对比度值最大,因此分割效果最差;而Otsu法和迭代法分割效果基本上相差无异,分割效果良好。给图像添加低密度高斯噪声时,Otsu法、迭代法和二维Otsu法各参数指标相差不大,分割效果都良好;最小误差法相对添加高密度噪声时,对图像分割效果有很大改善。

在阈值分割专题教学探讨中,为检验四种聚类算法分别所适用的图像,利用MATLAB对不同类型图像进行分割,得出结论为:Otsu法和迭代法侧重于考虑图像的灰度级信息,适用于背景区域和目标区域面积相差较小的图像;而二维Otsu还考虑到了邻域平均灰度级的分布,阈值分割效果更完善;最小误差法适用于小噪声图像分割,不适于大噪声图像分割。

综上所述,在对任意图像分割选择聚类算法的优先顺序为:二维Otsu法、迭代法、Otsu法、最小误差法。

以上教学实验结果证明,在阈值分割的教学探讨中,教师以及学生需要大量的教学仿真实验,从而得到最为客观准确的结论。

5 结束语

本文以MATLAB为基础进行聚类法阈值分割专题探讨,聚类法知识体系庞大,结合MATLAB的库函数能快速实现图像分割。且在专题探讨中也能发现一些问题,比如定量评估某算法分割效果时,不能仅以一种评价标准进行评估,而要综合多种评价标准进行对比分析,得到最为客观的结论。这样更有利于科研领域的进步,从而提高学生的学术质量。

参考文献:

[1]燕红文,邓雪峰.OTSU算法在图像分割中的应用研究[J].农业开发与装备,2018(11):103+108.

[2]宋斌. 基于平均中值离差的二维最小误差分割算法研究[D].湘潭大学,2015.

[3]赵泉华,贾淑涵,高郡,高歆.结合隶属度空间约束的模糊聚类图像分割[J/OL].测绘科学:1-9[2019-03-03].

[4]周佳丽. 声呐图像的灰度统计特征及其在OTSU和FCM分割中的应用[D].内蒙古大学,2018.

[5]Jiasheng Hao, Yi Shen, Hongbing Xu, Jianxiao Zou. A region entropy based objective evaluation method for image segmentation[P]. Instrumentation and Measurement Technology Conference, 2009. I2MTC '09. IEEE,2009.

[6]Ebenezer R.H.P.Isaac,Susan Elias, Srinivasan Rajagopalan, K.S.Easwarakumar. Template-Based Gait Authentication Through Bayesian Thresholding[J].IEEE/CAA Journal of Automatica Sinica,2019,6(01):209-219.

【通聯编辑:王力】

猜你喜欢
聚类算法
一种基于词嵌入与密度峰值策略的大数据文本聚类算法
基于K?均值与AGNES聚类算法的校园网行为分析系统研究
基于弹性分布数据集的海量空间数据密度聚类