高攀,赵恒斌,米珍美,钱宇珊,郭理
(石河子大学信息科学与技术学院,新疆 石河子832003)
由于人脸识别系统的输入端通常是在不同的条件下获取的图像,因此人脸识别系统最重要的工作是处理多种变化下的人脸图像,如姿态、照明、表情、伪装、面部毛发、眼镜和背景等。受控条件下人脸识别技术已经取得了一定的研究进展,如主成分分 析(Principal Component Analysis,PCA)[1-3],独立成分分析(Independent Component Algorithm,ICA)[4-6],线性判别分析(Linear Discriminant Analysis,LDA)[7-9]等方法都是常见方法,然而在照明和姿态变化条件下识别人脸图像仍然存在识别率较低的问题[10-12]。研究人员利用Gabor 滤波器组(Gabor Filter Bank,GFB) 作为预处理方法为识别工作提取更多的识别特征[13],但使用GFB 本身会导致某些子带域的重叠和丢失[14]。而方向滤波器组(Directional Filter Bank,DFB)则可以保留所有图像信息的连续子带域,因此DFB 比GBF 在发现周围的眼睛、鼻子和嘴等功能上要更有效[15],本文将采用DFB 预处理方法以提高PCA、ICA 和LDA 的识别率。
方向滤波器组(DFB)是一个有共同的输入或输出的方向滤波器集,由一个分析滤波器组和一个合成滤波组构成。DFB 的分析滤波组将原始图像分割成2n个定向传递的子带图像(n是DBF 的阶),合成滤波器组则是将子带图像合成为一个图像。一个DFB 结构图可以表示为一棵二叉树,在每个阶段结束时分裂如图1所示,这样每次分裂,其分辨率就减少了一半。
在DFB 的分析部分中,原始图像分割成2 个方向子带图像,然后每个子带图像再分割成两个方向子带图像,以此类推,直至第n层,这样就得到了2n个方向上的子带图像,每个输出都作为下一层的输入。分析部分是由采样器D 与分析滤波器H0和H1构成。图2所示为8 级DFB 的各子带频率分区图。
图1 DFB 结构Fig.1 DFB structure
图2 8 级DFB 频率分区图Fig.2 The frequency partition map for an eight-band DFB
合成滤波器组进行与分析阶段相反的工作,即各方向子带图像合并成一个重构图像。由于本文的目标只是从各个方向图像提取识别特征,所以本文只关心分析部分。
DFB 最突出的特点之一是它可以仅由一个原型滤波器实现。通过使用幺模矩阵,滤波器的设计过程可以减少到只需要一个原型滤波器H0(ω)。如果幺模矩阵的频率从Ri0(ω)改变为H0(ω),如图3所示,则如图4所示的系统a 和b 是完全相同的,因此,H0(ω)可以取代其余的4 个过滤器Ri0(ω)。
图3 DFB 五通带Fig.3 Five passbands for DFB
图4 DFB 中两个相同的结构Fig.4 Two identical structures in a DFB
梅花采样采用梅花2×2 重采样矩阵,其条目值为±1,行列式为2。有8 个梅花重采样矩阵,最常用的采样矩阵是,简单地说,一个梅花采样对应一个旋转采样。图5显示了原始的Lena 图像和其通过Q1 所对应的梅花采样图像。
图5 Lena 图像(a)及其通过Q1 的梅花采样图像(b)Fig.5 The Lena image(a) and its quincunx downsampled ima ge by Q1(b)
一个4 级DFB 由2 个二级DFB 构成,如图5所示,形成在一个树状结构。经过调制器,组成频率成分转移,导致类钻石的形状,然后,通过H0(ω)和H1(ω)2 个钻石过滤器,4 个频率区域中的每一个都被过滤,最后进行梅花采样。通过在第1 个2 级DFB 末端级联另一个2 级DFB,获得了一个4 级定向分解。
2n级DFB 是根据2 级DFB 到4 级的DFB 的 原理,如果要扩展到8 级就可以在第3 层以级联方式实现,以此类推,在第n层可可以完成2n个扩展。随着如图2(a)所示的定向频率输入,一个8 级DFB生成了8 个子带的输出如图2(b)所示。
图6 2 级DFB 结构Fig.6 A two-band DFB structure
通过应用所有方向的滤波器得到方向图像,实验结果表明(如图8所示)使用2 级DFB 可以取得了较好效果,在DFB 预处理结束时得到4 个方向图像,这些方向图像可以被视为原始图像在4 个方向上的分解。通过创建方向图像,就把原始图像中的噪声分为散在4 个不同的方向上,从而噪声能量降低到原来的四分之一。
为了证明所提出的方法的效率,本文使用Yale人脸数据库[1]和FERET 数据库[11]2 个不同的数据库进行了相同的实验测试。
Yale 数据库(如图7所示)收集了15 个不同个体的165 张图像,每个个体有11 张在光照条件下和表情变化下的不同图像,不同的表情有高兴、悲伤、困乏等,不同的光照条件有左、中、右。数据库中每个个体的11 张图像里面,有3 张是随机选择作为校准数据,其余的8 张作为输入数据。
图7 Yale 人脸数据库中的样本Fig.7 Some samples from Yale face database
首先,通过数据库中每个人脸图像的DFB 生成方向图像,实验结果(图8)显示:获得的最好结果是2 级DFB 或4 级DFB 分解,但当滤波器组的阶数不断增加时,其执行时间也要快速递增,所以选择2级DFB 分解。因此,本文分析中获取每个人脸图像的4 个方向图像,如图9所示,数据库中一个原始人脸图像和通过DFB 产生的4 个方向图像。
图8 不同级DFB 的识别率Fig.8 Recognition rates for different orders of the DFB
图9 2 级DFB 所产生的图像Fig.9 Directional images generated by DFB
为了评估所提出方法的效率,实验先单独使用PCA、ICA 和LDA 这3 种常用的人脸识别算法,然后再使用带DFB 预处理的3 种方法,并进行实验结果比较。
在这个实验中,原始人脸数据库是用来提取特征的,使用传统的PCA 特征脸算法,计算数据中所有人脸的识别率,对DFB 预处理后得到新的数据库使用相同的PCA 算法,数据库中所有人脸图像在不同表情和照明条件下的实验结果如表1所示。
表1 DFB-PCA 方法和PCA 算法实验结果的比较Tab.1 Experiment results for the DFB-PCA method and comparison with the PCA algorithm
从表1可以看出:
(1)PCA 单独处理的识别精度较低,特别是人脸在照明条件变化的条件下识别精度更差,只有13%,但是使用DFB 之后,识别率已经提高了超过150%。
(2)所有人脸识别精度都提高了50%左右。
从图10可知数据库的大小会影响到系统的识别精度。首先从Yale 数据库中随机选择了30 个人脸图像作为测试图像,然后参考图像的数量每次增加1个,与Gabor 滤波器组预处理方法所得结果比较,结果表明DFB 明显优于GFB 这种预处理方法。
图10 基于PCA 算法的识别率Fig.10 Recognition rate of PCA-based algorithms
本实验的目的和PCA 一样,但使用的是ICA 算法代替特征脸算法,所得到的结果如表2所示。
表2 DFB-ICA 方法和ICA 算法实验结果的比较Tab.2 Experiment results for the DFB-ICA method and comparison with the ICA algorithm
针对数据库大小对识别精度的影响,比较结果如图11所示。表2显示使用ICA 和DFB-ICA 这两种方法明显优于PCA。此外,也可以看出DFB 能够进一步改进ICA,特别是在面部变化较大的情况下(如光源、眼镜等)。但是对困乏和眨眼这类变化很小的面部特征,DFB 预处理效率不高,DFB 预处理不能有效捕捉任何额外的识别特征,因此DFB 预处理不适合这类人脸图像。ICA-DFB 方法得到80.83%的整体识别率和12.78%的整体改善。
与上述实验一样,使用相同的步骤,所获得的结果如表3所示,与GFB 方法比较的实验结果如图12所示,结果显示:
(1)使用LDA 和带DFB 预处理的2 种方法明显优于PCA。
(2)DFB 可以进一步提高LDA,特别是当图像发生明显的变化时。DFB-LDA 整体的识别率为94.21%,整体提高了8.91%。
(3)LDA 方法可以很容易地捕捉到均匀、缓慢变化的面部特征,如正常、困乏和左光源。
表3 DFB-LDA 方法和LDA 算法实验结果的比较Tab.3 Experiment results for the DFB-LDA method and comparison with the LDA algorithm
图12 基于LDA 算法的识别率Fig.12 Recognition rate of LDA-based algorithms
对FERET 人脸数据库(图13)[2]进行上述3 个相同的实验。首先,从FERET 数据库中构建样本数据库和测试数据库,然后分别把单独和带DFB 预处理的PCA、LDA 和ICA 算法应用于大小分别为50,100,200 和300 的数据库,最后计算所有测试的平均识别率。
表4是上述实验结果。在这个实验中,由图13可以看出,数据库中人脸图像有了较大的变化,例如头部发生旋转和面部变大,从表4可以看出,即使是使用了一个具有不同条件的更大的数据库,DFB 依然改进了识别效果,总体而言,3 种算法的识别率都提了高超过13%。
图13 FERET 人脸数据库中的样本Fig.13 Some image samples from FERET database
表4 FERET 数据库产生的实验结果Tab.4 Experiment results for the different methods with the FERET database
本文提出使用带方向滤波器组预处理的人脸识别方法,利用滤波器组对人脸图像进行变换,用分解得到的子带能量构造特征矢量,以此来表示图像的特征信息,由于DFB 的子带图像重建出高频信号加上原低频信号得到预处理结果,达到抑制噪声,增强特征目的,提高了PCA、ICA 和LDA 三种现有的人脸识别算法的识别率。实验结果表明,在表情和光照条件变化下,DFB 方法能够产生鲁棒性,同时该方法可以将图像的数量增加到2n,而为分类阶段提供更多的识别能力,因此对于人脸样本图像的数量不多的情况下具有较好的效果,针对Yale 和FERET 数据库DFB 方法效果非常明显。所提出的方法已被证明明显改进了识别效率,其中PCA 算法改进 为:Yale=49.99%,FERET=17.36%;ICA 算 法 改 进为:Yale=12.78%,FERET=19.80%;LDA 算法改进为:Yale= 8.91%,FERET=13.17%,特别是LDA 算法结合DFB 预处理技术更是获得了94.21%的识别率。