考虑局部邻域多流形度量的单训练样本人脸识别*

2022-08-26 09:39毛明扬

计算机与数字工程 2022年7期

毛明扬

（广州华商学院数据科学学院广州 511300）

1 引言

在日常生活中，所看到的图像大多为高维图像，如果直接对其进行识别，过程繁杂，识别结果也存在不精准的情况，为此常利用数据降维解决不精准的问题。数据降维就是在特定的空间内，通过某种算法规则使高维数据转换为低维流形结构。通常使用的降维算法有监督式降维的算法和非监督式降维算法两种。监督式的算法通常可以对数据进行最大化的聚类处理，而非监督的算法则可以在数据降维时将损失值降到最小。但是，面对高维数据的高度非线性和高相关属性，单训练样本人脸识别在此情况下容易发生识别干扰因素过多的情况，为此相关研究受到了重视。

文献［1］提出基于深度学习和约束稀疏表达的人脸识别算法，完成对人脸的识别过程；文献［2］提出基于改进卷积神经网络与集成学习的人脸识别算法，确保算法整体具有较强的可移植性；然后，引入集成学习策略，对所有人脸图像进行个体学习器的学习；文献［3］提出一种结合内变化基和乘性协同表示分类的人脸识别算法，利用基稀疏字典构建减小训练样本间的差异，实现人脸智能识别；文献［4］提出基于结构化局部约束低秩表示的人脸识别，通过线性分类器对测试样本分类，采用结构化局部约束低秩实现人脸识别。虽然上面的算法取得一定进展，但是影响因素较多，容易出现过度拟合现象。

本文在上述研究的基础上，考虑局部邻域多流形度量的情况下，提出单训练样本人脸识别算法。本文所研究的创新点是提出局部邻域多流形度量。局部邻域多流形度量在一定程度上可以很好地将高维特征转换为便于识别的低维流形结构。同时，对于护照、身份证等特殊场合下的查验方式单训练样本，识别效果更佳；在局部权重矩阵的理论指导下，找出人脸图像内部的最佳投影区域，减小重构数据点和原始数据点之间的误差，实现单训练样本人脸识别。

2 单训练样本人脸图像特征提取

2.1 人脸图像预处理

在获取到的人脸图像中，通常因为光线问题、遮挡物原因或者图像拍摄角度等因素的干扰，使得图像中含有较多的噪声和杂质。若直接再提取特征，则可能存在误差，导致提取结果不准确影响最终人脸识别的结果。针对此问题，本文首先考虑局部邻域多流形度量，局部邻域多流形度量可以将高维特征转换为便于识别的低维流形结构，并求得相应的关系。选择Contourlet变换算法对人脸图像的进行预处理，该算法具有较好的去噪效果，将该算法引入到原始图像中，去除掉多余的噪声和杂质，然后对其进行图像重构。Contourlet 变换算法由拉普拉斯塔式分解结构和方向滤波器结构组成，具体内容如图1所示。

图1 Contourlet变换算法原理

在Contourlet 变换算法原理的基础上，经过变换处理，得到的人脸图像如图2所示。

图2 人脸图像预处理效果

在图2 中，图（a）是未经过处理的原始图像，图2（b）是经过Contourlet 变换后的图像。根据图2 所示内容，经过处理后的图像，预处理效果有了明显的提升，具有较好的效果。

2.2 人脸图像分块

为了有效提取到图像的特征，需要将其划分为多个相等或不相等的子块图像，这主要取决于具体的人脸图像。将人脸图像的长和宽看作是定值，在互不重叠的原则上对其进行划分，得到人脸图像分块。

2.3 人脸图像特征提取

随机选取一幅人脸图像，在这幅图像中提取代表的是流形内部和外部近邻，利用多流形判将对人脸图像特征的提取转换为最优化问题。

3 局部邻域多流形度量下的单训练样本人脸图像识别

3.1 多流形距离度量矩阵

对于多流形距离度量矩阵的构建，通过仿射包来实现。如果非空子集内包含了多条穿越该子集的线段，那么就可以认为非空子集是一个仿射子集。非空子集维度与仿射空间内的维度始终保持在一种平行的状态下。将所得的仿射子集进行汇总整合，即可得到仿射包。

通过预处理后，人脸原始图像结构转换处理成为了一个非线性的低维流形结构，为了对每个流形结构内的特征实现准确抓取，建立了多个局部模型，此模型并非单一的模型，其优势是在一定程度上提高识别率。目前所有的多模型算法都是将低维流形结构划分为若干个子集，其中每个子集代表了对应的线性空间，由此可以在一定程度上增加平均识别率。由于线性空间内部无法实现结构的紧密联系，因此，本文提出利用仿射包来表示流形结构。假设当前已知人脸数据集的类别标签，形成一个子集，那么即可得到个人脸数据子集。利用谱聚类算法，计算得到仿射包，以此类推，得到其他流形的仿射包。在仿射包的作用下，剔除掉了线性空间内的冗余信息［6～7］，可以使子集在紧密的状态下存在。

3.2 误差度量矩阵构建

构建误差度量矩阵，假设wij为将第j个数据点在重构第i个数据点时所做的贡献权值，为了得到wij的具体值，设定每个数据点在进行重构时，只允许通过它的近邻点k来确定。

在权值矩阵L={l1,l2,…,lk} 中，处于同一行中的所有元素相加等于1，即：

重构的数据集与原始数据集之间差异较小，流形结构的内部距离保持不变。那么重构后的数据集［8］用式（2）表示为

式中，X表示重构系数。

3.3 单训练样本人脸识别算法实现

在人脸图像数据集内，根据误差度量矩阵来构建零空间，然后再对没有进行预处理的图像进行特征人脸的选取［9］，将所得特征脸结果代入到训练集汇总，即可针对单训练样本问题得到解决。

计算求得人脸图像的特征脸数据集，与之相对应的时间序列目标函数为［10～11］

式（3）中，Ei表示时间特征向量，将λ值的前d个特征整合在一起，得到特征向量［12～13］λ1＞λ2＞…＞λd。E′=(E′1,E′2,…,E′d)表示Ei的投影矩阵。在低维流形空间内进行人脸图像的映射［14～15］，保障减少识别时间的基础上，确保重要特征不会变形、消失。

4 仿真实验与性能分析

4.1 数据来源

实验中所使用到的人脸图像数据均来自于FDDB（Face Detection Data Set and Benchmark）数据集和MALF（Multi-Attribute Labelled Faces）数据集。FDDB 数据集中的图像来自38 个人，在64 种不同环境下所拍摄，分为5 个子集。MALF 数据集中的图像来自65 个人，每个人在光线、遮挡完全不同的环境下均拍摄了21张图像，共同组成了MALF数据集。在此次实验中，从FDDB 数据集中选取了具有代表性的23 张样本图像，具体如图3 所示，其中测试集和训练集的数量分别为10和13，从MALF数据集中选取了12 张样本图像，具体如图4 所示，训练集和测试集的数量分别为8和4。

图3 FDDB数据集23张人脸图像

图4 MALF数据集12张人脸图像

4.2 算法性能测试

首先为了验证近邻点k值的变化对人脸图像识别结果是否产生影响，针对FDDB 和MALF 数据集，利用单一变量原则选取不同的k值，确定这两个数据集在最优识别率下k的具体值。结果如图5所示。

图5 两个数据集随k 值变化情况

通过观察图5（a）和图5（b）可知，识别率取决于k值的变化。在FDDB 数据集中，当k值为40时，识别率为最优，而在MALF 数据集中，当k值为70时，识别率为最优。

根据图5 得到的结果，结合划分的训练集和测试集，利用文献［1］基于深度学习和约束稀疏表达的人脸识别算法和文献［2］基于改进卷积神经网络与集成学习的人脸识别算法验证在不同数据集下识别结果，如表1所示。

表1 在不同数据集下不同算法人脸识别结果

通过观察表1 可知，本文算法平均识别率高达97%，而深度学习网络识别算法和改进卷积神经网络识别算法的平均识别率仅仅为85%和88%。其原因是由于本文算法在对人脸图像识别前对数据进行预处理，有效去除了冗余信息。

为了更加深入验证所设计算法的效果和有效性，对三种算法进行人脸识别所需要的时间进行仿真实验，结果如图6所示。

图6 三种算法在不同数据集下人脸识别时间

由图6 可知，通过三种算法在不同数据集下人脸识别时间差异较大，本文算法在数据集相同的前提下，人脸识别所用的时间最少，而其他两种算法的时间较长。这是由于本文算法将原始人脸图像从高维数据形式转换为了低维流形数据，再对其进行预处理，一定程度上有利于提高处理效率。

5 结语

针对单训练样本中人脸图像识别，在识别过程中存在着大量的干扰因素问题，提出了一种有效的人脸识别算法。预处理人脸图像中的噪声等影响因素，确保后续人脸识别效果更加精准。实现线性空间内结构的紧密联系，在此基础上可取得理想的识别结果。实验得出如下结论：本算法具有较高的识别率，可以有效去除冗余信息，减少识别时间，增加识别效率。对于人脸识别仍在不断发展中，未来可以针对多训练样本进行更加深入的研究。为人脸识别发展提供更多的参考。