浅析K-Means聚类算法在刑事图像处理中的运用

2020-05-22 05:40
科技传播 2020年7期
关键词:指纹图质心图像处理

近年来,先进的刑事图像处理技术给公安机关的侦查工作带来极为显著的成效。运用刑事图像处理技术,能够为侦查过程中所涉及的刑事照相、图像增强、图像复原、图像测量等工作提供更加科学的技术支持和更为严谨的法律保证。其中,K-Means均值聚类算法在刑事图像分析中有着较广泛的运用。

1 K-Means 聚类算法的简介

聚类分析是分类学中的一个分支,但两者之间存在着本质的区别。就目标而言,聚类算法处理数据的分类目标是未知的,而分类是按照预先设定的类别标准进行数据处理。聚类算法作为一种重要的数据分析方法[1],基于层次、划分、密度、网格、模型等可分为不同的聚类算法,在实际使用中根据不同的数据量、数据类型、数据维度等应用于不同的领域。K-Means 聚类算法由Steinhaus 于1955 年首次提出,自它被提出后的60 多年中,K-Means算法一直是聚类算法中运用范围最广、使用频率最高的算法,这主要得益于其简易的算法、快速收敛的特性和处理大量数据的性能,但K-Means 聚类算法主要有两点局限性,一是只能适用于连续型数据,二是很难处理高纬度数据。因此本文选择K-Means聚类算法对包含背景干扰因素的图像进行细节分析,便于后期图像分割。

K-Means 聚类算法在n 个数据中随机选取k 个数据作为质心(k 为目标生成的族数,k ≤n),运用欧几里得距离、余弦相似度等比较剩余数据与质心之间的几何相似度,并划分到k 个族。在新划分的族内通过算法计算新的质心,再次根据几何相似度划分族,不断重复上述过程,直到重新计算后的质心趋于稳定,即达到收敛条件为止。K 值的选取与初始质心的位置会直接影响聚类效果,为了直观评价聚类效果,可以依据畸变程度。畸变程度就是质心与族内数据几何位置距离的平方和:

其中,Ai为第i 族,pi为Ai的质心。当k 值确定,随着算法的运行,pi趋向于稳定,平方和数值即代表当前k 值所对应的畸变程度。平方和越小,表明畸变程度越低,族中的数据点越紧凑,聚类的效果就越好。同理,如果畸变程度的值越大,就表示类中的各个数据点越是分散。K-Means 聚类算法中各个族之间相互独立,因此算法具有很强的独立性,计算的结果也比较稳定,在刑事图像处理中能够对模糊或者有干扰的图片进行分析处理,对案件需要的特征进行细节分析。

2 K-Means 聚类算法在刑事图像处理中的运用

2.1 K-Means 聚类算法在图像分割中的意义

图像分割是分离前景目标与背景的一种处理方法,是图像处理中的重要环节,分割的结果是后续图像分析的基础。图像分割根据分割方法的不同分为多种,其中阈值分割是灰度图像处理中较为常用的方法。阈值分割法可以用函数表示:

其中,f(i,j)表示(i,j)位置的像素强度值,t 为阈值参数。当图像某位置的像素强度值高于或者等于阈值t,则标记为1,反之则标记为0,以此实现图像的分割。由此可见,阈值参数t 是阈值分割法中的核心要素,对于最终效果起着决定性作用。但在实际图像分割中,阈值参数很难确定。而 K-Means 聚类算法可以聚类分析图像,使得同族尽可能相似,不同族间显现差别,从而简化图像,加大前景目标与背景的差异性。因此,利用K-Means聚类算法对图像进行预处理,为后续图像分割提供阈值参数。

2.2 K-Means 聚类算法图像处理方法

运用K-Means 聚类算法时,首先要确定元素k的值。k 是算法中十分重要的元素,必须优先找到最佳聚类数。计算最佳聚类数的方法主要有两种,一种是轮廓系数法,由于k 值往往不会太大,实际操作中可以从2 开始选取k 值,然后利用MATLAB对图片中K 族中的向量计算轮廓系数S。对于某一族中的向量p 来说:

其中,a(p)=avg(p 向量与本族的其他向量的相似度),b(p)=min(b 向量与其他族中所有向量的平均相似度),S ∈[-1,1]。将图片的轮廓系数进行制图,通过轮廓系数的正负值的对比和轮廓边界的变化的陡峭度来判定最佳的K 值选取。轮廓系数大于0,即内聚度高,聚类效果较好。如果轮廓系数变化的陡峭程度较大,即图像出现错误且不易收敛,聚类效果较差。但轮廓系数法所确定的k 值不一定是最佳聚类数,这时应当利用SSE 进行辅助判断,也就是“肘方法”。运用肘方法时,令k 从2开始取值,依次计算每个k 值所对应的SSE,并绘制k 与SSE 的变化曲线,计算曲线在每一点处的曲率,曲率最大的点即为最佳聚类数。确定k 值后,把图像中的各个像素用相应的特征向量表示,选取图像中族的一个均值的向量,通过图像的迭代处理,将微观特征划分为不同区域,再将迭代结果进行逐个重组,进行另一次聚类,从而达到收敛的效果。

2.3 K-Means 聚类算法在图像分割中的应用

目前,以审判为中心的诉讼制度改革不断推进[2],对案件相关证据的科学性提出了更高的要求。在刑事活动中,带有重要证据的一些图片或者录像可能存在着背景及其光线或者其他的一些干扰因素,极大地削弱了图片的证据能力和证明力,从而导致图片无法作为定案的根据和庭审中的关键性证据。目前的指纹图像通常以灰度图像呈现,灰度图像仅有一个通道信息,通常有2 的8 次方,也就是256 个灰度级(以8 位深度图像为例),范围介于0 到255。因此,阈值分割法对灰度图像有很好的处理效果。这里运用指纹图像的分割处理作为实例,探究K-Means 聚类算法在图像处理中的应用。现有的指纹识别是将刑事现场的指纹图像与数据库中的指纹图像进行特征点比对,而比对的关键在于手指表面特定性和稳定性较强的乳突花纹细节特征,例如小勾、小眼、小桥、小点等。因此,在刑事图像处理中,细节特征的保留就显得尤为重要。

以一张带有干扰因素的指纹图片K-Means 聚类算法处理为例。图1 为一张带有背景干扰的原始指纹图片,部分乳突花纹的细节特征在背景的干扰下很难识别。针对这一类图片,利用K-Means 聚类算法对图片进行细节处理,达到排除干扰因素的效果。首先利用2.2 节中轮廓系数法和肘方法确定出最佳聚类数k,再根据随机生成的k 个初始质心,利用相似性把图片像素分成k 个族,将指纹特征点分配到最近的族中,再将每一族中的特征点取均值,作为新的k 个质心,进行新一轮的分族,不断迭代处理,直到质心的位置趋于稳定为止。此时,同族中相似性较大,而不同族之间差异性较大。通过这样的处理算法,可以在保留了指纹乳突花纹的细节特征的同时,弱化了背景,加大了乳突纹线与背景的差异性。最后从结果中选取最大的灰度值,即乳突纹线位置的灰度值作为阈值进行图像分割,除去灰度值小于阈值的背景,得到纯指纹图像,如图2。

图1 原始指纹图

图2 处理后的纯指纹图

3 结语

现代图像处理技术更新换代异常迅速,随着大数据和云计算时代的到来,在公安刑技方面的重要性愈来愈强,为公安工作提供了可靠的技术支撑。同时以审判为中心的诉讼制度改革将对刑事图像处理技术提出更加严格的要求,K-Means 聚类算法在具体的刑事图像处理中也将针对自身的局限性不断优化和完善。

猜你喜欢
指纹图质心图像处理
重型半挂汽车质量与质心位置估计
基于GNSS测量的天宫二号质心确定
基于图像处理的机器人精确抓取的设计与实现
机器学习在图像处理中的应用
指纹图像传感器技术与后续发展研究
沉香GC-MS指纹图谱分析
基于模板检测法的指纹图像的细节特征提取
基于图像处理的定位器坡度计算
一种海洋测高卫星质心在轨估计算法
Photo Shop通道在图像处理中的应用