基于小波分析和主成分分析的人脸识别

2023-04-19 06:38吴冠朋
智能计算机与应用 2023年3期
关键词:小波人脸识别人脸

吴冠朋

(山东省立第三医院, 济南 250031)

0 引 言

人 脸 识 别[1-3]作 为 模 式 识 别 ( Pattern Recognition)领域中的一种重要应用,广泛应用于安防、门禁等各个系统中,无论是从安全、或是到虚拟现实系统的实现,都对行业发展起到了积极推动作用。 人脸识别要求无论在何种光照和姿势下,都要能迅速、精确地辨识、并区分人的面部,而智能算法则在其中发挥着至关重要的作用。

本文中,会涉及到基于数学转换的特征提取—小波分析。 人脸识别系统要能处理由于光照、姿势和脸部有其他东西的变化。 特征提取作为人脸识别成功的基础,提取的特征必须足够健壮,能够在光照、姿势、失真变化下区分类型。 研究中,采用小波分解将图片分解成近似部分和详细部分不同的尺度标准,得到每张脸图像的近似值。

本文主要进行了小波分析、主成分分析以及RBF 神经网络对人脸识别的应用研究。 第2 部分重点说明了小波分析的原理。 第3 部分为PCA 的基本原理与步骤,以及在人脸识别中的应用。 第4 部分探讨分析了RBF 神经网络的原理。 第5 部分为分类实验结果及分析。

1 小波分析

小波(wavelet)[4-7]可看作是一种用于多层次分解函数的数学工具。 图像信号经过小波变换后可以用小波系数来描述,小波系数体现原图像信息性质。图像信息的局部特征可以通过处理小波系数而改变。 研究中,对人脸进行小波分析的主要目的是降维和图像滤波。 从而降低计算复杂度并滤掉人脸的情感变化因素及眼镜、发型等不必要细节对算法产生影响。 本文采用Haar 小波作为小波基函数对人脸样本进行小波分解。 此处需用到的数学公式为:

其中,I(x,y) 表示待处理图像。

对图像进行小波多尺度分解,其实质就是把采集到的信号分成2 个信号,即高频部分和低频部分,而低频部分通常包含了图像的主要信息,高频部分则与噪音及扰动联系在一起。 根据分析的需要,可以继续对所得到的低频部分进行分解,如此又得到了更低频部分的信号和频率相对较高部分的信号。对人脸图像进行小波分析的步骤具体如下:

步骤1人脸图像的小波分解。 选择Haar 小波和小波分解的层数N(这里N=3),逐次计算各层的分解。

步骤2抽取第N层的低频,舍弃高频部分。考虑到一幅图像的最主要的表现就是低频部分,所以去掉图像的高频部分、只保留低频部分。

二维小波可使用相同尺度张量积方法由一维小波推广得到,并在图像处理中得到了广泛应用。 图1 为二维信号小波的分解过程。 在图像处理中,通常使用如下与二维小波变换等价的滤波器运算,这里给出平方可和的二维离散人脸信{xm,n},并令Co,m,n =αm,n,m,n |z。 则二维图像的小波分解递推公式为:

图1 二维信号小波分解Fig. 1 Wavelet decomposition of two-dimensional signal

由此得到,h(n)= <φ,φ >,g(n)= <ψ,ψ >。在进行小波分解时,是依照小波基进行入手,并区分出细节成分与近似成分,同时,根据所处理图像的性质以及标准来进行展开。 因此,常用于去除噪声、图像压缩处理等方面。 小波分解示意如图2 所示。

图2 1、2 级小波分解Fig. 2 1,2 wavelet decomposition

这里,LH将原始图像的垂直边缘部分保留下来,HH将原始图像的斜边缘部分保留下来,LL将原始图像的低频成分保留下来,HL将将原始图像的水平边缘部分保留下来。 然而,研究可知,人脸属于非刚体的模型斜边缘子带的稳定性最差,究其原因是由侧脸姿势、表情以及无用噪声产生的影响。 因此,如果想要有效刻画人脸的姿态及表情,在小波变换中就要选择合适的低频子带,这样就能得到具有较好稳定性的特征。

2 主成分分析

主成 分[8]分 析(Principal component analysis,PCA)是指将多个变量通过线性变换得到的新的映射。 减少原始数据,尽可能建立少的新的变量。 新变量两两不相关。 这些新的变量则会保持原始数据的原有信息。

样本观测数据矩阵为:

步骤1对原始数据进行标准化处理。 推得的数学公式可表示为:

步骤2计算样本相关系数矩阵R。 推得的数学公式可表示为:

为方便,原始数据标准化后仍用X表示,则经标准化后数据的相关系数为:

步骤3用雅克比方法求取相关系数矩阵R的特征值(λ1,λ2,…,λp) 和相应的特征向量ai=(ai1,ai2,…,aip),i=1,2,…,p。

步骤4选择重要的主成分,并写出主成分表达式。

主成分分析可以得到p个主成分,但是,由于各个主成分的方差是递减的,包含的信息量也是递减的,所以实际分析时,一般不是选取p个主成分,而是根据各个主成分累计贡献率的大小选取前k个主成分,这里贡献率就是指某个主成分的方差占全部方差的比重,实际也就是某个特征值占全部特征值合计的比重。 即:

贡献率越大,说明该主成分所包含的原始变量的信息越强。 主成分个数k的选取,主要根据主成分的累积贡献率来决定,即一般要求累计贡献率达到85%以上,这样才能保证综合变量能包括原始变量的绝大多数信息。

步骤5计算主成分得分。 根据标准化的原始数据,按照各个样品,分别代入主成分表达式,就可以得到各主成分下的各个样品的新数据,也就是主成分得分。 此处可用如下公式进行描述:

步骤6依据主成分得分的数据,进行下一步统计分析。

3 RBF 神经网络的结构和原理

径向基(Radial Basis Function ,RBF)[9-11]神经网络是一种典型的局部逼近人工神经网络,可任意逼近非线性函数。 RBF 神经网络的拓扑结构是3 层前馈网络,其结构如图3 所示。 依次是:输入层、隐含层、输出层。其中,输入层由输入节点组成的,输入节点的个数与输入向量x的维数m相等。 第二层是隐含层,隐含层节点与训练数据点的个数相等。隐含层节点与输入层输入节点相连,输入层到隐含层之间属于非线性变换。 在信号输入时,输入层节点先输入至隐含层。 隐含层节点最常用高斯函数作为核函数,对输入数据进行空间映射变换。 图3 中,i=1,2,…,m,这里m表示隐含层单元的个数,x表示输入向量。 输出层有若干个线性单元组成,每个线性单元与隐含层节点相连,隐含层到输出层实现了线性转换。"线性"是隐含层输出节点线性加权和,即网络的最终输出。 假设求和函数是输出层的作用函数,则有以下输出公式:

图3 RBF 神经网络结构图Fig. 3 Structure of RBF neural network

其中,n=1,2,…,n,n是输出层节点数,wik是径向基函数神经网络隐含层的输出权值。

4 实验结果及分析

本文从ORL 人脸数据库中选取5 人,每人10张、共50 张人脸图像。 试验中,将人脸图片分为训练集和测试集两组,这里选取了前5 个人的总共25 张图片来做仿真实验。 其中,25 幅用于训练P_train,25幅用于测试P_test,人脸图像如图4 所示。

图4 ORL 人脸图像Fig. 4 ORL face image

在主成分分析中,前15 维的主分量所包含的信息比例如图5 所示。 由图5 可知,前15 维的主分量所包含的信息比率可达90%以上,因此选择15 维主分量较为合适。

图5 主分量分析图Fig. 5 Principal component analysis diagram

做出5 张测试图片的第一、第二主成分的散点图,散点图的位置关系表明测试图片存在的某种关系,如图6 所示。 通过实验,分别选取不同小波的分解次数以及RBF 网络不同的扩散速率组成实验的准确度,详见表1。 由表1 可知,最高的识别率在100.00%。 因此研究中,选取小波分解次数在3 次,spread扩散速率为2 或者3。

图6 主成分散点图Fig. 6 Principal component scatter diagram

表1 实验准确结果Tab. 1 Accurate results of the experiment %

通过实验的对比,在采用5 张人脸图片进行训练、5 张人脸图片进行测试时,当小波分解次数为3,RBF 神经网络的速率spread为2 或者为3 的时候,识别率最高。 使用主分量降维,特征提取后,大大降低了图像的维度。 实验表明,当仅仅提取前15 维度时识别率就可达到90%以上。 由于ORL 人脸数据量过少等原因,识别率会存在误差风险,下一步准备将人脸图像替换为真实人脸图像,并应用于实际环境中。

5 结束语

在安防、门禁等各个系统中进行人脸识别,是目前受到广泛关注的热点研究课题之一。 本文主要进行了小波分析、主成分分析以及RBF 神经网络对人脸识别的应用研究,并在小波变换基础上,结合主成分分析进行了人脸图像识别。 实验结果表明,当仅仅提取前15 维度时识别率就可达到90%以上。 由于ORL 人脸数据量过少等原因,识别率会存在误差风险,下一步准备将人脸图像替换为真实人脸图像,并结合院内门禁系统,与厂家联合开发,继而应用于环境中。

猜你喜欢
小波人脸识别人脸
人脸识别 等
有特点的人脸
构造Daubechies小波的一些注记
揭开人脸识别的神秘面纱
基于MATLAB的小波降噪研究
三国漫——人脸解锁
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
基于类独立核稀疏表示的鲁棒人脸识别
马面部与人脸相似度惊人
长得象人脸的十种动物