主成分分析在模式识别领域中的研究进展

2023-10-26 12:00王文杰石竞琛姜念祖林帅男
白城师范学院学报 2023年5期
关键词:降维协方差人脸识别

王文杰,石竞琛,姜念祖,林帅男,赵 瑞

(吉林师范大学数学与计算机学院,吉林 四平 136000)

0 引言

随着信息技术的不断发展,数据生成的速度和规模都呈现出指数增长态势,这使得数据的类型趋于多样化,数据结构趋于复杂化,这种现象被称为维数灾难,并且这种现象已经影响到了诸多领域,如人脸识别、图像压缩、图像去噪等.如何通过数据降维来减轻维数灾难、减少高维空间中其他不相关的属性已成为学者们主要的研究方向.

维数灾难[1-3]带来的问题主要表现在以下几个方面:一是随着数据维数的增加,高维空间样本点的分布将会更加稀疏,从而导致过拟合的问题;二是维数增多使样本远离中心点,导致边缘样本密集过高,无法拟合;三是随着维数的升高,在高维度空间中距离度量逐渐失去了度量差异性的能力;四是高维数据影响问题处理的效率和准确性,增加数据预处理的难度;五是高维数据的运算与存储对计算机的要求较高,目前计算机仍不能完全满足其要求;六是对高维数据处理的方法较少,处理难度较大,增加了计算难度.

上述问题给高维数据分析与处理带来了较大的困难,严重制约了数据挖掘算法的高效性,而维数约简技术是解决这一难题的有力工具,它主要包括特征选择技术和特征提取技术两大类.特征选择是从数据集中去除不相关和冗余的信息以获得最优的特征子集[4].由于特征选择通常会采用搜索算法,所以特征选择中最优特征子集的搜索速度和精度存在一定的问题.而特征提取是利用现有的特征参数组成一个低维的特征空间,将原始特征包含的有用信息映射成少量的特征,忽略冗余和不相关的信息[5].所以特征提取可以很好地避免信息冗余、数据维数过高等问题.目前,研究者们已经提出了多种有关特征提取的降维方法,基于线性的特征提取方法有主成分分析和线性判别分析(LDA),而基于非线性特征提取方法主要包括局部线性嵌入(LLE)、等距离映射(Lsomap)、扩散映射(Diffusion Map)、多维尺度变换(MDS)、局部切空间排列(LTSA)、核主成分分析(KPCA)等.多种特征提取技术中最常用的算法无疑是PCA,由于其具有降维精度高、信息损失量小、应用范围广等特点而得到广泛应用.本文综述了近五年主成分分析算法在人脸识别、图像压缩和图像去噪等模式识别领域中的最新研究进展,分析了其技术特色和应用范围.

1 主成分分析

主成分分析[6-9]是20 世纪初引入用于探索多元数据分析中最流行的方法之一,并随着时间的推移逐渐走向成熟,它的主要思想是将n维特征映射到k维上(k<n),而这k维特征是在原有的基础上重新构造出来的,我们也称这k维特征为主成分.

1.1 主成分分析方法的求解步骤

PCA 具体的求解步骤如图1所示.PCA 降维的过程是通过计算样本集的协方差矩阵,得到协方差矩阵的特征值和特征向量,选择其中特征值最大的k个特征所对应的特征向量组成特征向量矩阵,将原有的样本数据转化到新的空间中,从而实现对数据特征的降维.它的目标是通过某种线性投影,将高维的数据映射到低维的空间中,并期望在所投影的维度上数据的方差最大,以便使用较少的数据维度,同时保留住较多的原数据点的特性.

图1 PCA算法求解步骤

1.2 主成分分析方法的特点

PCA 算法的主要优点表现在:PCA 是无监督学习,完全没有参数的限制,在计算过程中不需要人为地设定参数;PCA 技术可以对数据进行降维,从而达到简化模型的效果,同时最大程度地保持了原有数据的信息;PCA 降维后的主成分之间相互正交,可抵消原始数据成分间的相互影响;PCA 算法计算方法简单,在计算机上便于实现.

PCA算法的主要缺点表现在:虽然用户掌握了一些关于观测对象的数据的特征,但却无法通过参数化等方法对处理过程进行干预,使用PCA 算法可能得不到预期的效果,效率也不高;贡献率小的主成分可能含有对样本有重大影响的重要信息,但在使用PCA 算法时往往会忽略贡献率小的主成分;特征值矩阵的正交向量空间是否唯一有待讨论.

2 主成分分析在模式识别中的应用

模式是对客观事物的一种抽象化的概括和定理化的描述,而模式识别则是在某些观测基础上把待识别模式划分到各自的模式中.模式识别可以和很多人工智能技术和算法相结合,其中主成分分析在模式识别领域中主要应用于人脸识别、图像压缩和图像去噪等方面.

2.1 人脸识别

2.1.1 人脸识别简介

人脸识别[10-12]的研究起始于20 世纪60 年代,在过去的几十年内,人脸识别一直是一个十分活跃的研究领域.近几年,人脸识别技术的研究更是取得了巨大的进展,获得了计算机视觉、机器学习和人工智能等多个领域的研究关注.目前,人脸识别技术已经在社会上得到了广泛的应用,具体来说,人机交互、身份验证、安全监测、刑事案件侦破和金融行业等都应用到了人脸识别技术.广义的人脸识别包括人脸检测、身份识别和图像预处理等.目前,PCA在人脸识别中的应用已经逐渐成熟,具体流程如图2所示.

图2 PCA在人脸识别中应用流程

2.1.2 PCA在人脸识别中的应用

在将PCA应用于人脸识别的过程中,一般都是直接应用PCA技术对人脸图像进行降维[13-17].具体方法就是先将数据集中的每一个人脸图像转化为一个向量V,以此对训练集T进行更新,得到T={V1,V2,V3,…,VN},之后再计算平均脸向量,用原始的人脸图像向量减去平均脸向量后计算出协方差矩阵,得到降维后的面部特征向量,最终获得降维后的人脸图像数据.

与直接应用PCA 技术不同,一些研究者对PCA 算法进行了改进.2018 年,Seghouane 等[18]提出的新方法是在进行PCA 降维时用单位矩阵代替一维协方差矩阵,这样完美地解决了行作为潜在的随机向量的问题.他们在Yale-B data 数据集上的实验验证了新提出的方法的性能.2019年Rathika等[19]和2020年Zhang 等[20]在应用PCA 时都首先对原始的图像数据进行均值归一化,即从数据的每个值中减去平均维度值,每个维度的平均值为零.然后再求出平均脸向量,用原始的人脸图像向量减去平均脸向量,计算出协方差矩阵,最后利用它们得到降维后的人脸图像数据.2019 年,Xue 等[21]提出了一种新的RPCA 模型,新模型用于补全原始PCA方法降维时主成分大量损坏或缺失的情况.相比于PCA,新提出的RPCA 考虑了边的信息,即使存在缺失值也可以很好地完成人脸识别的任务.2021年,Arora等[22]提出了一种可以区分人脸不同情绪的自动面部情绪识别方法.该方法利用PCA 技术将面部特征提取为一组特定的特征描述,称为特征脸.该方法处理的过程是先将图像的每个矩阵与对应的图像向量i进行归一化,在除去共同的面部特征后,用求出的矩阵的协方差来评估面部表情的特征向量,从而实现降维的目的.

另外,还有一些研究者将PCA 算法与已有的模型和算法相结合实现人脸识别.2020 年,Alahmadi等[23]提出了一种将神经网络和PCA 完美结合的人脸识别方法.其中,PCA 用于学习卷积层的滤波器组,通过无监督学习的方式计算出人脸数据的L个特征映射的值,再将这些特征映射与L个滤波器进行卷积,最终得到降维后的人脸图像数据.2022 年,Yadav 等[24]提出了一种新的PCA-SVM 模型.PCA-ANN[25]和PCA-SVM 是最近出现的两种功能强大的人脸分析技术,相比于PCA-ANN,PCA-SVM 的优点是在人脸检测中需要的参数更少,识别精度更高.但PCA-SVM 在光线差、头发长或物体遮挡面部的情况下,对人脸的检测是无效和低效的.新提出的PCA-SVM 模型不仅保留了原模型的优点,还解决了原模型存在的问题,增强了识别的精度.同年,Dutta 等[26]提出了一种将PCA、ICA 和神经网络相结合的用于3D 人脸识别的新方法.与文献[23]不同,Dutta等使用PCA 和ICA 滤波器融合而成的新滤波器组,而新的滤波器是通过WPCA和WICA的数据级融合产生的.

2.1.3 2D-PCA在人脸识别中的应用

2018 年,Gao 等[27]提出了一种高效的2D-PCA 人脸识别方法,该方法使用2D-PCANet,解决了PCA方法在PCANet中存在的不足.PCANet在使用PCA作为滤波器组时必须将二维矩阵变为一维向量,这样才能计算协方差矩阵,但2D-PCANet 在计算协方差矩阵时不需要进行向量转换,大大地提高了计算效率.2019年,Xu等[28]提出了一种新的动态双向二维主成分分析D(2D)2PCA 方法,与传统的2D-PCA 方法不同,该方法不仅考虑变量之间的相关性,还考虑变量之间的自相关性.D(2D)2PCA 方法构造一种增广时间序列矩阵来有效提取变量之间的动态关系,准确描述水下物体的动态行为.2020年,Wang等[29]提出了一种基于Frobenius 范数的高效鲁棒方法F-2D-QPCA.该方法的目标是找到投影矩阵,使投影数据基于F 范数的方差最大,并且该方法比2D-PCA 方法和F-2D-PCA 方法具有更强的鲁棒性和更高的识别精度.

2.2 图像压缩

2.2.1 图像压缩简介

随着计算机在现代社会中的应用不断增加,大量的图片数据需要被持续传输,这使得将其存储在有限的内存中或通过有限的互联网带宽进行传输变得越来越困难.因此,需要对图像压缩技术进行更加深入的研究来应对这些挑战.同时,这种研究也响应了网络上高速传输数据的要求[30-31].图像压缩是指用尽可能少的数据量表示原数据量,其基本原理是去除其中冗余的数据[32].在所有图像压缩技术中,基于PCA的特征降维方法已经相对成熟,获得了一定的成果,被广泛应用到各个领域.

2.2.2 PCA在图像压缩中的应用

2018 年,Licciardi 等[33]提出了使用NLPCA 变换方法来降低高光谱图像数据的光谱维数.与PCA 相比,NLPCA 方法能够在更低维的空间中以更少的特征表示相同的信息内容.NLPCA 方法首先训练AANN 进行身份映射,将获得的主成分(NLPCs)作为输入数据再重新输入到解码层,得到重构的原始数据.最后使用4 个数据集对新提出的NLPCA 方法进行测试.同年6 月,Báscones 等[34]也提出了一种新的图像压缩方法用于高光谱图像的压缩.该方法首先使用矢量量化和主成分分析(PCA)对图像进行光谱分解,然后将JPEG2000应用于利用空间相关性进行压缩的主成分.2020年,Thayammal等[35]同样提出了一种新的高光谱图像的压缩方法,该方法利用PCA 方法时先将相似像素分组在一起,然后将原始数据中的每个向量投影到约简空间中,并将约简数据浸入到原始空间,这样就得到PCA 方法降维后的图像.2021 年,Xue 等[36]提出一种改进的PCA 算法用于人脸图像数据的压缩.传统的PCA方法在对人脸图像进行压缩时,由于样本数据量过小的问题,很难得到准确的协方差矩阵,而改进后的PCA 算法可以根据投影向量的协方差轨迹来描述投影样本的离散程度,得到准确的协方差矩阵,从而更好地实现对人脸图像数据进行压缩.2022 年,Park 等[37]提出了一种将PCA 应用于多分辨率特征图像的压缩方法.该方法主要是利用PCA 变换来消除多分辨率特征图像映射通道中冗余的数据.利用VCC 编码器和DeepCABAC网络对特征向量进行压缩,最后再经过PCA逆变换重构图像.2023年,Doorsamy等[38]将PCA用在了医学图像压缩方面,研究如何用PCA 进行X 射线图像分类、压缩和预处理.该方法在利用PCA 前先将X射线图像的颜色成分分成三个分量,然后再利用PCA方法对这些图像进行降维,用得到的方差稀释比例PVE来决定整体图像中每个主成分所包含的数据方差,从而实现对X 射线图像的压缩.

2.3 图像去噪

2.3.1 图像去噪简介

图像去噪[39-41]是指减少数字图像中噪声的过程,目前数字图像采集设备已广泛应用于医学、天文学、生物学、国防工业等诸多领域.在恶劣的天气、光照等条件下采集的图像日渐增多,再加上各种采集设备固有的物理限制,导致图像在采集过程中容易出现一些随机噪声,给后续的文本检测、图像分割、图像压缩等图像处理环节造成不可估计的影响.而所谓的噪声可以理解为一种阻碍图像观测和信息提取过程的基本信号失真,抑制图像噪声是图像分析和处理的基础,因此,利用图像去噪技术去除噪声,从失真图像中恢复原图像是非常必要的.

2.3.2 PCA在图像去噪中的应用

Zhao 等[42]和Singh 等[43]提出基于渐进式主成分分析的图像去噪方法,其中文献[42]于2018 年提出了基于聚类的渐进主成分阈值分析,该方法使用渐进式PCA 阈值分割技术对训练图像的聚类矩阵进行降噪,并用PCA 变换域进一步去除低秩矩阵的剩余噪声.不同于文献[42],文献[43]于2022 年10 月提出了一种新的渐进式PCA 方法.该方法主要分为两个阶段,在第一阶段将给定的图像划分为大小相等或大小不等的分区,创建图像的不重叠子分区,第二阶段将PCA逐步应用于第一阶段生成的子集.

与文献[42]和文献[43]不同,一些研究者是将PCA 方法和其他方法相结合来进行图像降噪.2018年,天津电子实验室的Zhao 等[44]用PCA 方法对高噪声图像进行降维处理,然后将降维后的图像用于SGK 字典学习.2019年,Routray 等[45]提出一种将PCA 算法和Patch Groups(PGs)相结合的图像去噪算法.这种去噪方法主要包括三个阶段,即分组阶段、字典学习阶段和基于PCA 的去噪阶段.在去噪阶段,该方法将学习到的PGs 转换为PCA 域,去除噪声成分时,只保留了最重要的主成分.2021 年,Berrimi 等[46]提出一种针对退化人脸图像序列去噪算法.该方法利用PCA 变换实现自适应空间滤波,根据利用PCA算法降维后的特征向量来保留噪声的强度和计算阈值,并将经过时间滤波的图像分解为两个子图像,从而实现图像去噪.同年,Jing 等[47]提出一种将LPG 和PCA 相结合的图像去噪方法.这种方法首先将LPG-PCA方法的输出用引导滤波器进行滤波,然后用PCA方法对SAR(Synthetic Aperture Radar)图像进行降维.2022 年,Lu 等[48]提出一种将PCA 和残差网络的优点相结合的光学图像去噪方法.该方法利用PCA对图像噪声进行分析,进而建立估计噪声水平与真实噪声水平之间的精确映射.映射有助于选择合适的残差神经网络模型进行图像处理,最大限度地保留图像信息,减少噪声的影响.

还有研究者提出了将PCA应用在高光谱图像的去噪上.2018年,Cao等[49]就利用PCA方法对高光谱图像进行了去噪,并提出了一种新的RPCA 模型.该模型将噪声建模和HSI 建模相结合,用于混合噪声去除.最后再利用PCA 方法求出的协方差矩阵来恢复降噪后的图像数据.2022 年,Wu 等[50]提出一种新的基于PCA 的高光谱图像去噪模型——PCA-Tensordecomp,该模型首先利用主成分分析对HSI 信号进行降维处理,得到主复合成分,然后进行低秩CP分解,对含有大量噪声的第一主成分和其余次要成分进行降噪.最后利用逆PCA对降噪后的HSI进行恢复,达到综合降噪的效果.

3 总结与展望

伴随着大数据时代的来临,数据处理和分析显得日益重要,如何从高维数据中提取出有用的信息成为当前研究的主要方向,原始的降维方法得到了新的应用.PCA方法可以用于揭示变量和样本之间的关系,它在模式识别领域主要应用于人脸识别、图像压缩和图像去噪.但PCA方法也存在一定的缺陷,PCA主要应用于线性降维,使用PCA进行线性降维后样本间的非线性数据有可能会丢失.PCA方法降维后的主成分都是原始变量的线性组合,这就导致PCA 方法不能很好地估计降维后隐变量的数目.为了解决PCA方法潜在的问题,使其具有更强的可用性,一些新的PCA方法开始出现.如:KPCA,SPCA,Dual-PCA,HSIC-PCA 等.在应用方面,PCA 方法也逐渐开始与统计学方法和神经网络相结合应用于医学、生物学等,使得各个领域的研究都有了突破性的进展.未来PCA 方法还会给研究者在处理各类问题上提供更多新的思路和方法,产生更多的研究成果.

猜你喜欢
降维协方差人脸识别
混动成为降维打击的实力 东风风神皓极
人脸识别 等
揭开人脸识别的神秘面纱
降维打击
多元线性模型中回归系数矩阵的可估函数和协方差阵的同时Bayes估计及优良性
二维随机变量边缘分布函数的教学探索
不确定系统改进的鲁棒协方差交叉融合稳态Kalman预报器
基于类独立核稀疏表示的鲁棒人脸识别
抛物化Navier-Stokes方程的降维仿真模型
基于特征联合和偏最小二乘降维的手势识别