三特征Contourlet纹理图像检索算法

2015-08-09 02:02陈新武马文娟范春凤
关键词:检索系统子带特征向量

陈新武,刘 真,马文娟,薛 静,范春凤

(信阳师范学院 物理电子工程学院, 河南 信阳 464000)

0 引言

人类认识自然界的基本方式是通过声音和图像来获取经验并逐步丰富自己的知识,不断增强对未知领域和事物的细分能力.在人类的认知过程中,图像信息占了总信息量的80%以上,图像信息主要包括被认知对象的形状、颜色、纹理等底层特征,其中纹理特征是信息量最为丰富的特征.

然而,由于个体生活经历的限制,每个人的一生所能识别和认知的领域十分有限.大量的知识和资料储存在各种数据库中以备查阅,来满足人们对于某一问题的更高认知.当今的数据库也逐渐被各种图像数据库丰富和扩展,但是人们查阅资料的基本方式是基于文本的查询方式,这种查询方式不能精确地描述被查询对象的颜色、形状、结构、纹理等细节特征.为了解决这个问题,研究人员提出了基于内容的检索系统(Content-Based Image Retrieval System, CBIR)[1-3].该研究领域已有众多的研究成果,主要有几何结构方法、基于模型的方法、统计学方法和基于滤波器的方法等4种方法.其中,统计学方法采用类似于灰度共生矩阵、局部二元模式(Local Binary Patterns, LBP)[4-5]与高阶自相关等方法,该类方法已经成功应用于多种应用场合,不足之处在于刻画图像内容不够有力.相比较而言,基于滤波器的方法由于具有较好的时频分解能力而表现更为出色.该类方法又可以分为空间滤波器、频率滤波器和时频滤波器等3种类型.前面两种方法由于尺度固定而表现欠佳.本文将使用时频滤波器方法,这种方法也被称为多尺度分析(Multi-Scale Analysis,MRA)方法.

在MRA方法中,最著名的就是基于小波的纹理检索算法[6-7].但是,由于小波变换具有较低的方向分辨率,不能准确地抽取数字图像中的方向信息,因而对于纹理这样的结构数据不能更准确地刻画.在小波变换的启发下,许多新型的变换相继出场,包括:Fanlet、Bandelet、Ridgelet、Curvelet、Beamlet、Contourlet等.其中Contourlet由于易于实现和方向信息丰富而备受关注[8],但是由于该变换存在有混叠现象,因而不断有新的改进变换出现[9-10],Contourlet-2.3就是在冗余度和消除混叠两个方面折衷设计的典型代表.本文将使用Contourlet和Contourlet-2.3两种变换来构造纹理图像检索系统.另一方面,CBIR系统在对纹理图像进行变换之后,对于每个子带中的数据,需要进行特征抽取,形成特征向量.在过去的30多年中,典型的做法就是选取变换域子带空间中的能量(或者系数绝对值均值)和标准偏差作为特征,进一步将它们级联形成特征向量[11].为了进一步提高检索率,本文将对标准偏差进行改造,提出一种新型的纹理描述算子,并将该算子与已有的能量算子和峰度算子[12]相结合,构造新型的特征向量.

1 实现方法

1.1 特征的提取

基于MRA方法的纹理图像检索系统的典型结构如图1所示.

图1基于MRA方法的纹理图像检索原理

Fig.1TextureimageretrievalprinciplebasedonMRA

在图1中,MRA有许多种,本文选取contourlet和contourlet-2.3两种变换,并推荐使用后者.在进行纹理图像检索之前,需要将纹理图像数据库中的每一幅图像进行contourlet或者contourlet-2.3变换,得到若干子带,每个子带中的数据构成一个矩阵.该矩阵可以看作一组实验数据结果.

从统计学的角度看,如果要描述一组实验结果的特征,最常用的就是均值和标准偏差.但是,对于图像而言,由于多尺度分析方法采用滤波器的方法,而滤波器由于对称性会使得相同的图像内容表现出大小相同而符号相反的系数.因此,对于变换域空间子带中的数据,经常对其绝对值求均值,或者对于系数求平方再取均值,用来刻画纹理的特征.在之前的文献中,学者们大都直接采用这种方法而并没有给出这种处理方法的原因.本文采用绝对值均值作为能量特征,这种特征的定义如式(1)所示.

(1)

式中:s表示contourlet变换的尺度索引,k表示方向子带编号索引,M和N分别表示子带系数的行数和列数,m和n分别表示系数的行号和列号.Ws,k(m,n)表示在contourlet或者contourlet-2.3变换域上,第s尺度k方向子带内第m行第n列的变换系数.将这种特征编号为F1.

对于数字图像而言,真正的意义不体现在每个像素点的亮度值的大小,而在于亮度相对值的大小.在变换域空间子带中,子带系数的标准偏差仅仅反映了每个子带内系数的分散程度,而并未考虑到子带之间的相互关系.鉴于此,本文构造一种新的特征描述算子,用于刻画纹理变化的分散程度.在纹理检索系统中,常规采用的标准偏差的定义如式(2)所示,本文构造的新算子如式(3)所示.将这两种特征分别编号为F2和F3.其中式(2)中的μs,k表示子带系数的均值.

F2(s,k),=σ(s,k)=

(2)

(3)

为了更准确地刻画纹理图像的特征,增加文献[12]中提出的峰度算子作为特征量.该算子的定义如式(4)所示.

F4(s,k)=

(4)

1.2 特征向量的构造

本算法中特征向量的构造方法是将每个子带的F1、F3和F4连接在一起,从而构成一个向量,这个向量就称为特征向量,其定义式如式(5)所示.

(5)

1.3 相似度函数

相似度函数用于计算特征向量之间的距离.到目前为止,至少有10种以上距离测度函数.已有相关学者对这些距离函数的有效性进行了比较分析,认为Canberra距离是比较有效的一种[13].本文就采用这种距离作为相似度函数,该函数的定义如式(6)所示.

(6)

式(6)中:d(x,y)表示向量x,y之间的距离,D表示两个向量的维度(两个向量必须具有相同的维度),xi,yi分别表示向量x和y的第i个分量.

2 实验结果与讨论

2.1 实验对象

实验对象来自Brodatz纹理图像数据库[14].在该数据库中,共有109幅图像,每幅纹理图像的大小为640×640像素,由于纹理具有一定的重复性和相似性,将每一幅图像分割为160×160像素的小图像,这样可以得到1744幅实验图像,从同一幅图像分割出的图像属于同一类.图2给出了来自该测试集的24幅图像.

图2 实验对象中的24幅纹理图像

2.2 实验方法

本文所采用的基本算法框图与文献[12]基本相同,不同之处在于采用了不同的特征向量.此处仅强调值得注意的关键点.

在contourlet-2.3变换中,直接采用具有较好纹理刻画能力的“pkva”滤波器.分解结构参数采用形如[l1,l2,l3,l4]的向量.在这个向量表达式中,从左至右依次表示每个尺度(从细到粗)上方向滤波器的级数.在基本contourlet变换中,方向滤波器和LP滤波器都采用“pkva”滤波器.检索率的定义如式(7)所示.

(7)

其中:p∈{16,20,30,40,50,60,70,80,90,100} ;R(p)表示当检索出的结果图像为p幅时,1744幅图像的平均检索率,q=1744.

纹理检索系统检索率结果如表1和表2所示.其中表1给出的是contourlet纹理图像检索算法与已有算法的比较,表2则给出了在contourlet-2.3框架下的检索率比较结果.在表1和表2中,D1=[4 4 3 3],D2=[4 3 3 2],D3=[3 3 2 2],D4=[3 2 2],D5=[4 3 3],OLD表示目前典型算法,NEW表示本文提出的算法.

从两张表格可以看出,无论采用哪一种分解结构参数,本文提出纹理检索系统的检索率都比现有的纹理检索系统检索率高.随着目标相似图像数N值的增大,这种优势逐渐变小,这个结果是明显的,对于本文所采用的数据库,当N=1744时,任何检索系统的检索率都将达到100%.值得指出,虽然本文给出的结果是采用“pkva”滤波器给出的,我们有大量的实验结果表明,对于其他的滤波器,该结论一样成立.比较表1和表2还可以发现,contourlet-2.3比contourlet有较高的检索率.

2.3 值得注意的问题

分析表1和表2可以发现,分解结构参数的选取对于检索率是有一定的影响,但这种影响不是非常明显,一般在1%以内.鉴于算法的速度问题,建议每个尺度选择4~8个方向子带.

表1 Contourlet检索算法与目前典型算法的检索率

表2 Contourlet-2.3检索算法与目前典型算法的检索率

3 结论

本文提出了一种新型的纹理图像特征描述算子,并在该算子的基础上,构造出新型结构的特征向量,进而提高了纹理图像检索系统的检索率.这种做法,不仅适用于本文给出的两种轮廓波变换检索系统,对于其他多种轮廓波变换纹理检索系统,存在类似的结果.因此具有一定的普遍适用性.下一步将针对变换和相似度函数展开研究,希望能够进一步提高多尺度检索系统的检索率.

猜你喜欢
检索系统子带特征向量
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
一种基于奇偶判断WPT的多音干扰抑制方法*
子带编码在图像压缩编码中的应用
收录《信号处理》的检索系统及数据库
收录《信号处理》的检索系统及数据库
本刊被以下检索系统及数据库收录
本刊被以下检索系统及数据库收录
一类特殊矩阵特征向量的求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用