基于Fisher判别分析的加权估计纹理分析

2015-02-27 08:21从继成张韧志黄淮学院河南驻马店463000
实验室研究与探索 2015年2期
关键词:识别率权值人脸

从继成, 张韧志(黄淮学院,河南 驻马店 463000)



基于Fisher判别分析的加权估计纹理分析

从继成, 张韧志
(黄淮学院,河南 驻马店 463000)

传统的纹理分析方法仅以每个脸部区域的相对贡献来标记全局相似度。针对这种以局部表示全局而导致不能很好地进行特征提取的问题,提出了基于Fisher判别分析的加权估计纹理分析方法。首先使用局部二值模式或者局部相位量化对图像进行纹理编码,然后将其划分成各个大小相等且不重叠的局部小块,从相似空间中提取出最具识别力的坐标轴,利用Fisher线性判别分析方法对其进行纹理分析,通过权值优化给出了最佳解决方案。最后,在FERET和FEI两大通用人脸数据库上的实验验证了所提方法的有效性。实验结果表明,相比其他文献中提出的纹理方法,所提方法取得了更好的识别性能。

人脸识别; Fisher判别分析; 加权估计; 纹理编码

0 引 言

由于人脸识别技术具有低干扰性和高精确性[1],在很多场合下的应用都高于其他生物识别方法,包括一些大范围的应用,比如护照、驾驶执照鉴别、海关检查等[2]。随着人脸识别技术的发展,基于纹理分析的方法得到了越来越多的应用。研究表明,纹理分析方法的应用能够超过其他人脸识别方法主要是因为其对正面照脸部表情的细节变化进行了处理[3]。纹理特征提取是成功进行图像纹理描述、分类与分割的关键环节,纹理特征的提取直接影响后续处理的质量。提取的纹理特征维数不大、鉴别能力强、稳健性好,且提取过程计算量小。在过去的20多年间,很多纹理特征提取的方法被发展。这些纹理特征可以被大致分为基于统计特征、基于模板卷积特征、基于频域特征和基于模型特征这4类[4-7]。

杨关等曾提出在纹理分析中构建高斯图模型(Gaussian Graphical Models, GGM)[8],根据纹理特征的局部马尔可夫性和高斯变量的条件回归之间的关系,将复杂的模型选择转变为较为简单的变量选择,应用惩罚正则化技巧同步选择邻域和估计参数,实验显示了基于高斯图模型的纹理特征对纹理分析的有效性。但是,复杂的计算开销使其在应用中受到了限制。结合纹理编码,文献[9]中提出了一种基于统一权值的纹理分析(Texture Analysis based on Union Weighting, UWTA)方法,采用一组实验步骤获得一个基于识别率的权值的固定形式,意识到了这些权值并不是最佳的,但是通过比较统一的权值,可以提高识别的能力。从那以后,大多数基于纹理的人脸自动识别的方法(Automatic Face Recognition, AFR)[10]都开始使用固定权值来进行人脸识别。文献[11]中提出运用最小二乘法得出齐次非线性方程组,一定程度上提高了基于纹理编码的人脸识别率,并且通过实验表明,运用最小二乘法要比使用固定权值方法要好。然而,最小二乘法涉及到一个相当复杂的方程组,而且还要计算出大量样本图像的每一个被估计的权值。

根据上述分析,传统的纹理分析方法仅以每个脸部区域的相对贡献来标记全局相似度,针对这种以局部表示全局而导致不能很好地进行特征提取的问题,本文提出了基于Fisher判别分析(Fisher Discriminative Analysis, FDA)[12]的加权估计纹理分析 (Weighting Estimation for Texture Analysis, WETA) 方法,采用Fisher线性判别分析方法对相似空间中最具识别力的坐标轴进行纹理分析,通过权值优化给出最佳解决方案。与最小二乘法相比,该方法中每个权值需要训练样本的数量更少,运算更高效,最后的实验对两组纹理编码进行了详细的分析,验证了所提方法的有效性。

1 纹理编码

1.1 基于局部二值模式(LBP)的纹理编码

利用LBP[13-14]来进行脸部描述,是通过分配给x=(x,y)坐标的每个像素一个编码后计算出来的,在半径R的范围内,中心像素强度与离中心m等距像素强度之间的差别,决定如何分配编码。如图1所示,根据像素强度正负值之间的差别,分配二进制“0”和“1”。当采样点不符合中心像素时使用双线内插法。LBP纹理编码以一种无序而又固定的二进制串联方式组成,用“0”和“1”表示m等距内的像素强度。图2包括了4张LBP的影像样本,从中可以看出,像素强度与每个像素的LBP编码之间的关系。

图1 LBP图像编码中不同m和R值的周边像素

图2 FERET、FEI中的样图及相应的LBP、LPQ表示法

1.2 基于局部相位量化的纹理编码

应用中,局部相位量化(Local Phase Quantization, LPQ)[15-16]方法要比LBP更好,因为LBQ图像更模糊,均匀亮度变化更大。与LBP相似,LPQ通过计算x=(x,y)坐标的每个像素编码,用编码代表以x为中心的M×M邻域内(Nx)的像素。

在4个低频区的Nx中观察傅里叶变换Fx(u),u=(u,v)中的实值,虚值实现相位量化,图1中所示的白色圆圈。在这里产生了8位二进制数,“0”和“1”的选择取决于每个值是正还是负。这些二进制数随意而又固定地串联成了一个8位二进制数,以此描绘Nx中的纹理,图像中所有的像素都利用这种方法得出相应的LPQ图像表示。

此方法包括一个简单的过程:在量化步骤前解除傅里叶系数的关联,最大限度地保存纹理代码的信息。

2 加权估计纹理分析

2.1 人脸匹配

假设人脸数据库中包含很多两眼清晰的图像,而且图像中眼睛的像素坐标也相同,数据库中用Sir表示第i个对象的第r个图像。识别过程中纹理图像将被划分成大小相等且不重叠的从1~B的区域,其中,第b块区域纹理编码的直方图统计中,b=1,2,…,B。

第b块区域中,bHir和bHjt这2个直方图的差别在于图像Sir和图像Sjt用不同的距离函数bdirjt(bHir,bHjt)计算,文中简述为bdirjt。

利用计算直方图间距的线性组合来测量脸部的全局相异度,从而推断出两张人脸是否来自同一个人,式中,系数wb为权值,表示第b块区域与最终识别一致的相对相关性。

(1)

2.2 方法提出

dirjt=[1dirjt,2dirjt,…,Bdirjt]

Dirjt=dirjtwT

(2)

因此,全局相异度测量的方法是利用系数向量w来定义相同空间内一个方向的距离向量dirjt。假定最佳加权与相同空间的方向相符合,那么就可以尽可能地把相同对象的配对图像从不同对象的配对图像中分离出来。

假定这两种类型图像对的协方差矩阵是相等的,则可以直接使用Fisher判别方法来找出最佳加权,给出的式如下:

(3)

通过式(3)快速地计算权值是非常重要的,一般情况下,它并不遵循从左到右的脸部对称性。然而,通过二等分系数的量值去估计,则可以用来执行权值对称,降低问题的复杂程度。假设区域b、(b+B)/2甚至B与对称的脸部区域相符合,则可以令bw=b+B/2w使得权值对称,如此,式(1)就可以改写为

(4)

所提方法的主要步骤如下:

(1) 利用LBP或LPQ对人脸图像进行纹理编码;

(2) 将纹理图像划分成B个大小相等且不重叠的区域;

(3) 利用Fisher判别分析方法估算出权值系数wb,b=1,2,…,B;

(4) 利用式w=b+B/2w对称权值;

(5) 利用直方图间距的线性组合进行全局相异度测量,并完成识别。

3 实验与分析

实验使用了FERET及FEI 2个通用人脸数据库。FERET数据库包含了820个对象的1 640张正面照,fa和fb分组里的每个对象拥有两张图像,图像在脸部表情上略有不同。第二个数据库通过FEI构建而成,选取了50个人的每人两张照片,分别为自然的及面带微笑的正面照。图3所示为实验过程中所使用的2个数据库的图像样本。

FERETFEI

图3 人脸数据库示例

3.1 参数设置

实验中,图像均被转换为80×64像素分辨率,右侧和左侧眼睛的像素坐标值分别为(20,14)和(20,51)。采用统一的LBP变量图像,图像含有8个采样点(m=8),半径长为2个像素点(R=2)。计算每个7×7的像素邻域(M=7),且在频率值a=1/7时执行相位量化,通过计算大小为8×8像素中超过10×8个非重叠区域,得到2个数据库的直方图。

所有实验的单体均被随机分散开来,一半用来训练,另一半用来测试。通过选取一张实验图像来测量比率,这张图像应该通过脸部匹配在参与实验的所有图像中被鉴别出来。在所有的实验图像中持续重复这个步骤之后,计算出相应的平均识别率。设置每个数据库与纹理编码平均运行5次以上,每次运行1个训练和测试中随机分配的个体。

3.2 权值估计

值得注意的是,定义判别轴的向量经常会产生一些负面的影响,这些负面影响可能是不合理的,因为在脸部区域识别过程中习惯将权值看得过为重要。然而,所提方法向量w是一个投影方向,如此,w中负值体现了识别过程中相关脸部区域直方图间距的差异。

表1列出了数据库与编码技术组合后得到的4种不同的结果。为了易于观察,所有的数值都被进位,使得所有的权向量量级相等,再四舍五入为整数值。尽管有明显的差异,但从表1中可以清晰地看到,4个权值存在一定的共同结构。为了测量这些结果的一致性,需要计算表1中每一组加权之间的相关性,计算的结果如表2所示。由表2可见,同在一个数据库中,加权之间的相关性是比较高的,而在不同的纹理编码方法中估算出的权值可能都差不多,但改变数据库,纹理编码带来的差异是不可忽略的。由此可见,每个固定的模板都不可能应用在所有的数据库中,而只能在特定的数据库中进行计算。

3.3 加权变量对识别率的影响

实验主要是估测加权变量对识别率的影响。前面估算了每一个加权,这里利用数据库与编码的所有组合加权(共16种)为测试图像计算出了识别率。经过大量实验,图4列出了各种组合加权取得的最好的5个识别率,其中,小图中每个标题显示了编码与数据库的组合。

表1 LBP、LPQ与FERET、FEI的4种不同组合编码

表2 不同数据库与编码技术的加权估计关联性

从图4可以发现,在相同的人脸数据库上使用相同的纹理编码可以获得最好的表现效果。不管是训练还是测试,LBP与LPQ两种编码技术在同一数据库互相转换,对实验效果的影响都很小。与此相反,当加权在一个数据库中估算而又在另一个数据库上实验时,表现效果明显下降。这一结果完全与上一节中提出的加权关联性分析相符合。

(a) LBP编码在FERET上

(b) LPQ编码在FERET上

(c) LBP编码在FEI上

(d) LPQ编码在FEI上

图4 不同数据库和编码技术配置得出的识别率

3.4 比较与分析

针对人脸识别的性能,实验比较所提方法与其他文献中的方法,包括高斯图模型(GGM)[8]、基于统一权值的纹理分析方法(UWTA)[9]及基于最小二乘法(Least Squares)[11],分别在FERET和FEI数据库中用LBP和LPQ纹理编码对识别率进行了测试,各个比较方法的参数设置均与各自的文献相同,实验结果取各方法的最优的10个识别率(升序排列),详细结果如图5所示。

(a) LBP编码与FERET组合

(b) LPQ编码与FERET组合

(c) LBP编码与FEI组合

(d) LPQ编码与FEI组合

图5 各个方法在不同的组合上得出的最优识别率比较

从图5可以看出,在各种组合情况下,所提的基于加权估计纹理分析的FLDA方法的识别率均为最高,在LPQ与FERET组合上的最高识别率高达96%,为4种组合中的最低,在LPQ编码与FEI人脸数据组合上的识别率甚至接近100%,当然,在此组合下,最小二乘法的识别率也接近100%,但是,在其他3种组合上,所提方法的识别率均明显超过了最小二乘法。比高斯图模型方法、基于统一权值的纹理分析方法,更是超出了很多,所提方法的优越性由此可见。

4 结 语

本文提出了基于Fisher判别分析的加权估计纹理分析方法来估算最佳面部区域的权值,并且在FERET及FEI两大人脸数据库上进行了实验。利用两种不同的纹理编码技术,通过对本文方法与文献中其他的加权方法进行比较,表明了本文方法在识别性能方面的优越性。所有的实验都假设权值是对称的,符合左脸到右脸的对称性。这种假设利用二等分系数的数目去估算权值,简化了问题。结果表明,在一个给定的应用中,所提方法能够捕捉到人脸图像中可能出现的分类的不对称性,例如,非对称的视差发光格栅。

对LBP及LPQ进行纹理编码后,进行纹理图像划分、权值推断、权值对称,明显提高了人脸识别率,但同时也增加了额外的开销,所以,如何在提高识别率的前提下,提高算法的效率,将是进一步研究的重点。

[1] 孙吉贵, 刘 杰, 赵连宇. 聚类算法研究 [J]. 软件学报, 2008, 19(1): 48-61.

[2] 乔立山, 陈松灿, 王 敏. 基于相关向量机的图像阈值技术 [J]. 计算机研究与发展, 2010, 47(8): 1329-1337.

[3] Kolda T G, Bader B W. Tensor decompositions and applications [J]. SIAM Review, 2009, 51(3):455-500.

[4] 王佳奕, 葛玉荣. 基于Contourlet及支持向量机的纹理识别方法 [J]. 计算机应用, 2013, 33(3): 677-679.

[5] Zhao Q, Zhang D, Zhang L,etal. High resolution partial fingerprint alignment using pore-valley descriptors [J]. Pattern Recognition, 2010, 43(3): 1050-1061.

[6] Zhao Q, Zhang D, Zhang L,etal. Adaptive fingerprint pore modeling and extraction [J]. Pattern Recognition, 2010, 43(8): 2833-2844.

[7] Su Y, Shan S, Chen X,etal. Adaptive Generic Learning for Face Recognition from a Single Sample per Person[C]//In IEEE International Conference on Computer Vision and Pattern Recognition, 2010: 2699-2706.

[8] Hu H. Orthogonal Neighborhood Preserving Discriminant Analysis for Face Recognition [J]. Pattern Recognition, 2008, 41(6):2045-2054.

[9] 杨 关, 冯国灿, 陈伟福, 等. 纹理分析中的图模型 [J]. 中国图像图形学报, 2011, 16(10): 1818-1825.

[10] Xie Z, Liu G, Fang Z. Face Recognition Based on Combination of Human Perception and Local Binary Pattern [J]. Lecture Notes in Computer Science, 2012, 72(2): 365-373.

[11] Connolly J F, Granger E, Sabourin R. An adaptive classification system for video-based face recognition[J]. Information Sciences, 2012, 192(1): 50-70.

[12] 文乔龙, 万遂人, 徐 双. Fisher准则和正则化水平集方法分割噪声图像 [J]. 计算机研究与发展, 2012, 49(6): 1339-1347.

[14] Zhang Z, Wang J, Zha H. Adaptive Manifold Learning [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(1): 131-137.

[15] Hafiz F, Shafie A A, Mustafah Y M. Face Recognition From Single Sample Per Person by Learning of Generic Discriminant Vectors [J]. Procedia Engineering, 2012, 45: 465-472.

[16] Lowe D. Distinctive image features from scale-invariant key points [J]. Int J Comput Vis, 2004, 60(1): 91-110.

Weighting Estimation for Texture Analysis Based onFisher Discriminative Analysis

CONGJi-cheng,ZHANGRen-zhi
(Huanghuai University, Zhumadian 463000, China)

Traditional texture analysis methods mark global similarity only by related attribution of each face area. For the issue that global information is represented by local information which causes bad feature extracting, weighting estimation for texture analysis (WETA) based on Fisher discriminative analysis (FDA) is proposed. Firstly, face images are divided into some non-overlapping local patches with same sizes after texture coding by using local binary patterns (LBP) or local phase quantization (LPQ). The solution is given by the most discriminative axis within a similarity space using Fisher discriminative analysis and weight optimization after extracting coordinate axes with the most discrimination. Finally, the efficiency of proposed method is verified by experiments conducted on the FERET and on the FEI face databases. The experiments indicate that the proposed method brings a better recognition performance in comparison to other weighting methods proposed in the literature.

face recognition; Fisher discriminative analysis; weighting estimation; texture coding

2014-04-03

河南省教育厅科学技术研究重点项目(13A520786)

从继成(1979-),男,河南驻马店人,实验师,现主要从事计算机应用研究。Tel.:13938365075;E-mail:congjicheng@sohu.com

张韧志(1980-),男,河南驻马店人,讲师,现主要从事计算机网络和数据库研究。

Tel.:13507640981;E-mail:13507640981@163.com

TP 311

A

1006-7167(2015)02-0024-05

猜你喜欢
识别率权值人脸
一种融合时间权值和用户行为序列的电影推荐模型
有特点的人脸
一起学画人脸
CONTENTS
基于类图像处理与向量化的大数据脚本攻击智能检测
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
三国漫——人脸解锁
提升高速公路MTC二次抓拍车牌识别率方案研究
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究