基于门控多尺度匹配网络的小样本SAR目标识别

2022-10-29 08:25张新禹刘永祥

系统工程与电子技术 2022年11期

刘旗, 张新禹, 刘永祥

(国防科技大学电子科学学院, 湖南长沙 410073)

0 引言

合成孔径雷达(synthetic aperture radar, SAR)系统通过对被测目标发射电磁波,得到被测目标的散射点回波,进而对被测目标的雷达回波进行相干处理,得到目标的高分辨率图像。与红外和光学成像系统相比,由于雷达电磁波的穿透性,使得SAR系统相较于红外和光学系统而言具有在极端条件下工作、不受天气等自然条件的影响的优势。而且,SAR系统便于搭载,在军用和民用领域都发挥了重要的作用。例如,地形测绘、海洋观测以及自动目标识别(automatic target recognition, ATR)。

SAR图像能够反映目标散射点的距离向和横向信息,因此基于SAR图像的雷达自ATR(radar ATR, RATR)技术一直是近年雷达目标识别领域的研究热点。常见的目标识别方法大致由3部分构成,分别是数据预处理、提取特征和设计分类器。传统的SAR目标识别方法通过人类手工提取或设计特征,并根据特征设计合适的分类器来实现对SAR图像的自动识别。传统SAR图像目标识别方法虽然在一定程度上取得了一些成果,但是上述方法需要人类进行手工提取或者设计特征,需要花费大量的人力、物力和财力,而且特征的表征能力成为了上述方法性能提升的瓶颈。因此,近年来,研究者们为了得到更具表征能力的特征做了大量的工作,但是低级的视觉特征和高级的语义表示之间的语义鸿沟使得传统的SAR图像目标识别方法往往不能取得令人满意的结果。

近年来,深度学习方法发展迅速,在很多领域都表现出一定的先进性。在SAR目标识别领域,深度学习方法因其良好的泛化能力和较强的类内表征能力被研究者们广泛应用到SAR图像的识别任务中,并取得了一定成果。文献[24]的作者提出了一种复数卷积神经网络(complex-valued convolutional neural network, CVCNN),该方法能够同时利用目标的幅度和相位信息进行目标识别。文献[25]提出了一种斑点噪声鲁棒的SAR图像目标识别方法,该方法设计了一种双阶段组合卷积神经网络来对地面目标的SAR图像进行识别。在该方法中,SAR图像目标在第一阶段会经过基于卷积神经网络实现的去斑点噪声子网络的处理,从而去除SAR图像中的斑点噪声,然后去除噪声的SAR图像在第二个阶段会经过基于卷积神经网络设计的识别子网络的处理,从而实现对地面目标的鲁棒识别。文献[26]提出了一种基于卷积神经网络的特征融合SAR目标识别方法,该方法可以大致分为3个部分,分别是特征提取模块、特征融合模块和识别模块。在该方法中,作者提出了一种可以保留不同特征之间空间关系的特征融合方法,在一定程度上提高了目标识别的准确率。上述基于深度学习的SAR目标识别方法,在一定程度上实现了自动提取特征的功能,与传统SAR目标识别方法相比避免了繁琐的人工提取特征的过程,并在识别性能上具有一定的提升。然而,上述基于深度学习的方法需要大量的标注数据进行训练,一旦训练数据不足,上述方法往往会产生严重的过拟合现象,导致其泛化能力下降,识别性能降低。

实际上,小样本问题在SAR目标识别领域普遍存在。SAR目标识别领域的小样本问题是指在只有少量SAR训练样本的条件下,要求模型利用获取的少量SAR训练样本快速地学习并且表现出较强的泛化性能。由于以下几个方面的原因,导致了SAR目标识别领域产生了小样本问题:① 在军事领域,尤其是非合作目标,能够探测得到的SAR图像很少,而且在特殊情况下,往往要求模型在获取少量样本的条件下就能够对被测目标做出准确的识别。② SAR图像的标注工作需要一定的先验知识作为基础,这造成了标注工作的缓慢以及需要花费更多的财力。因此,提升小样本条件下SAR目标识别模型的泛化能力、提高目标识别准确率具有重要意义。

在光学图像识别领域,小样本问题很早就受到了诸多研究者的持续关注,发展到现在,光学图像识别领域的研究者们已经提出了一系列能有效解决小样本条件下模型泛化能力下降、识别准确率低问题的方法。文献[32]提出了一种模型无关的元学习方法(model-agnostic meta-learning, MAML),在该方法中,作者设计了特定的模型结构,并且使得模型的参数经过文章中介绍的训练方法训练以后,模型在面对新的学习任务时,只需要少量的学习样本并且少次优化迭代就可以表现出较好的泛化性能。文献[33]提出了一种新的基于长短时记忆神经单元的元学习器(meta long short-term memory, Meta-LSTM),具体而言,作者利用长短时记忆网络的长时间状态转移矩阵的更新公式代替传统的基于梯度下降的优化方式,经过大量学习任务的训练,元学习器可以在少量样本的条件下优化学习器,使得学习器在小样本条件下能够表现出较好的性能。文献[34]提出了匹配网络的模型,匹配网络能够形成没有标签的待测目标样本与带有标签的训练样本之间的映射,避免了模型在适应新类型目标时的微调过程。

近年来,在SAR图像目标识别领域,也有一部分研究者针对如何提高小样本条件下SAR图像目标的识别率以及识别模型的泛化能力,提出了一些小样本条件下的SAR图像目标识别方法。文献[35]提出了一种基于度量学习的小样本SAR目标识别方法,结合小样本学习的训练方式,在一定程度上降低了训练所需的样本数。文献[36]提出了一种基于自注意力机制和多尺度特征融合的SAR图像目标识别方法,虽然该方法在一定程度上降低了SAR图像目标识别时需要的训练数据量,但是该方法在MSTAR数据集上目标识别准确率达到90%以上需要至少50%的训练数据,获取这50%数据量仍然存在一定难度。文献[37]基于高速公路单元提出了一种卷积高速公路网络架构,用于训练数据有限情况下对SAR图像目标进行准确识别,该方法在MSTAR数据集上识别准确率达到90%以上，但需要的训练数据量降低到了30%左右,然而获取这30%数据量仍然存在一定难度,而且该方法在识别率达到90%以上以后,增加训练数据量对提升识别准确率效果不如未达到90%以前明显。文献[38]提出了一种基于小样本学习的SAR图像目标识别方法,该方法利用2D Gabor滤波器对图像进行增强,利用卷积自编码器提取特征并识别,该方法在MSTAR数据集上只用了10%的训练数据进行训练就可以实现对SAR图像目标的有效识别,但是该方法的识别准确率不高,很难满足人们的识别需求。

受上述光学图像识别领域解决小样本问题的方法的启发,针对目前现存的SAR图像目标识别模型在小样本条件下存在的模型泛化能力差、识别准确率低的问题,本文提出了一种小样本SAR图像目标识别方法,叫做基于权重门控多尺度特征融合匹配网络SAR目标识别方法。具体而言,所提方法引入了多尺度特征提取模块,用以提取匹配网络不同卷积层的多尺度特征,门控单元根据不同识别任务对不同卷积层的特征设置不同的权重,从而实现根据特定任务以不同卷积层的特征为主导进行SAR图像目标识别的效果,最终提升模型的泛化能力以及目标识别准确率。

1 基于权重门控多尺度特征融合匹配网络的SAR目标小样本识别方法

1.1 问题定义和阐述

在本文中,匹配网络中的卷积网络、多尺度特征提取网络和权重门控单元都是由深度神经网络实现的。然而,在小样本条件下,由于训练数据的不足,经常会导致深度神经网络模型出现过拟合现象,导致模型泛化能力下降,识别准确率低。因此,采用由文献[33]和文献[35]启发得到的episode训练策略,对所设计的网络模型进行训练。episode训练策略是元学习领域经常采用的训练方法。具体而言,episode训练策略需要两种类型的数据集,分别是元训练集和元测试集。和中由很多episode数据集构成,每一个episode数据集都是从目标数据集中采样得到的“类样本”的任务,“类样本”是指分别从类不同目标的数据集中采样,每种目标取个样本。每一个episode由两部分构成,分别是支撑集和质询集。支撑集中包含了类目标的样本,每类目标具有个样本,质询集包含了与支撑集相同类别的类目标的样本,其中质询集中的样本没有在支撑集中出现过。元训练集中的支撑集和质询集记为和,元测试集中的支撑集和质询集记为和。

本文设计的方法之所以能够适用小样本条件下对SAR图像目标的识别,可以大致总结为以下几个原因。首先,采用的episode训练策略遵循了一个简单的机器学习原则,即训练和测试条件必须匹配。具体而言,在训练时,只将每类目标的几个样本输入网络进行训练,就像在测试时,只能得到新任务每类目标的几个样本一样,这就能够使网络进行快速学习,满足小样本学习的要求。其次,匹配网络成功将参数模型和非参数模型进行结合,同时利用了参数模型提取的特征表征能力强和非参数模型不需要训练、没有灾难性遗忘的优点,降低了训练需要的数据量,并使其具有能够从少量训练样本中提取出表征能力强的特征从而快速泛化到新样本上的能力,有利于小样本条件下提取SAR图像目标的特征并应用到新样本的准确识别上。再次,匹配网络具有一定的记忆功能,能够记住支撑集中每类目标的特征,通过将质询集中样本的特征与支撑集中每类样本的特征进行匹配,完成对质询集样本的识别,匹配网络的这种记忆功能和匹配识别方法,在一定程度上降低了训练所需的样本数。最后,在匹配网络的基础上,加入了多尺度特征提取模块和权重门控单元。多尺度特征提取模块能够提取出匹配网络不同卷积层的特征,权重门控单元能够根据不同的识别任务对不同卷积层的特征赋予不同的权重值,从而达到根据不同识别任务选择不同特征进行识别的目的,有利于小样本条件下针对不同的识别任务,快速提取适合且表征能力强的特征,有助于提高小样本条件下对SAR图像目标的识别准确率。

1.2 权重门控多尺度特征融合匹配网络

图1为门控多尺度匹配网络的网络结构示意图。提出的权重门控多尺度特征融合匹配网络旨在根据特定的识别任务,提取对当前识别任务最有帮助的特征,匹配网络根据提取出的特征对不同目标做出识别,从而达到提升模型泛化能力、提高模型识别准确率的目的。

图1 门控多尺度匹配网络的网络结构示意图Fig.1 Schematic diagram of the network structure of gated multiscals matching network

输入的图像会首先经过4层卷积神经网络进行特征提取,不同层的卷积特征代表着目标不同深度的特征而且具有不同的感受野,不同层的卷积特征会经过特征压缩模块和感兴趣区域(region of interest, RoI)模块进行处理,特征压缩模块通过1×1卷积运算减少了特征图的大小,提高了运算效率,降低了对计算资源的需求,RoI池化将不同层的卷积特征由不同的空间形状变为相同的空间形状以便于后续处理。权重门控单元对多尺度RoI池化特征图进行权重分配,对有利于当前识别任务的特征图赋予更高的权重,对不利于当前任务目标识别或冗余的特征图赋予更低的权重。最后,不同层的特征通过拼接融合到一起,参与到最终的识别任务中。用于测试的图像样本的融合特征会与用于训练的每类目标的样本特征进行余弦相似度比较,最终预测出测试样本的类别。

1.3 匹配网络

(1)

(2)

式中：,表示嵌入函数,在本文中,=,由卷积神经网络实现,用以提取特征；表示两个向量之间的余弦相似度,表示为

(3)

式中：,表示维向量；,表示向量中的元素。

匹配网络的结构示意图如图1(a)所示,如上文描述,=表示嵌入函数,用以提取特征,由4个相同的卷积模块构成,每个卷积模块由一个3×3的卷积层、一个批归一化层,一个修正线性单元(rectified linear unit, ReLU)非线性激活函数层和一个2×2的最大池化层构成。

1.4 多尺度特征提取网络

多尺度特征提取网络可以大致分为两部分,分别是特征压缩模块和RoI池化模块。设计特征压缩模块的目的在于其能够压缩匹配网络各个卷积层得到的卷积图,从而达到减少数据量、提高识别速度的作用。RoI池化模块的设计初衷在于其能够提取对SAR目标识别感兴趣的特征,并将不同卷积层提取出的特征的形状进行统一,便于后续处理,而且RoI池化模块能够进一步减少数据量,提高运算效率。图2展示了多尺度特征提取网络的结构及操作流程。

图2 多尺度特征提取网络结构及运算流程Fig.2 Structure and operation flow of multiscale feature extraction network

(4)

式中：*表示卷积操作；表示特征压缩模块第个压缩因子。图2展示了式(4)表示的1×1卷积运算过程。1×1卷积运算通过对不同通道的数据进行加权求和实现跨通道的信息交互,实现在不改变特征图二维形状大小(,)的前提下对其进行降维操作,减少了网络的参数,降低了网络优化的复杂度。同时,1×1卷积层后接的ReLU激活函数可以增加网络的非线性特性,提高网络的表征能力。1×1卷积操作跨通道的信息交互、减少网络的参数量、提高网络的表征能力等优点都有利于提高小样本条件下SAR图像目标识别的准确率和网络模型的泛化能力。

1.5 权重门控单元

权重门控单元能够根据不同的SAR目标识别任务对不同尺度的RoI池化特征图学习到不同的权重大小,从而实现根据不同的SAR目标识别任务提取不同的目标特征,以该特征为主要信息完成SAR目标识别任务。权重门控单元的结构很简单,包括1×1卷积层,2个全连接层和Sigmoid激活函数,权重门控单元的网络结构示意图如图3所示。

图3 权重门控单元的网络结构Fig.3 Network structure of weight gated unit

权重门控单元∈××的定义式如下所示:

(5)

式中：,分别表示第二个和第一个全连接层的权重；是卷积层的权重；,表示激活函数,分别是Sigmoid和ReLU。

权重门控单元通过与RoI池化特征图做元素对应位置相乘实现对多尺度特征设置不同的权重。上述过程表示为

(6)

权重门控单元本质上是一种注意力机制,与文献[40]中提出的注意力机制有所不同,文献[40]中提出的注意力机制是基于通道级的注意力机制,主要负责将不同通道的特征图赋予不同的权重大小,而权重门控单元是一种基于空间结构级,经过权重门控单元处理后的特征图,会将特征图中对识别比较重要的空间位置的特征赋予更大的权重,通过对重要位置的特征赋予更大的权重使得网络学习到的特征更加具有代表性,表征能力更强,可以在一定程度上减少训练所需的样本数量。

2 实验结果与分析

为了验证本文所提方法的有效性,本节介绍了所提方法在公开SAR图像数据集上的实验结果,包括数据集介绍和实验的具体实施细节。为了更直观地体现所提方法的优越性,将所提方法与3种目前光学图像识别领域表现良好的小样本学习方法进行了对比,3种方法分别是:MAML、Meta-LSTM、Matching Net。同时,将所提方法与两种小样本SAR目标识别方法进行了对比。而且,本文尝试了两种不同的度量函数,进行了小样本条件下的SAR图像目标识别实验。最后,对原始的数据集加入不同分贝的噪声,分别验证了所提方法在-10 dB,-5 dB,0 dB,5 dB和10 dB的噪声条件下,对小样本目标的识别效果。所有的实验都是在带有一块NVIDIA GeForce GTX 1650显卡的笔记本上基于Pytorch库进行的。

2.1 数据集介绍

实验所采用的数据集是由美国空军研究室提供的运动和静止目标获取与识别(moving and stationary target acquisition and recognition， MSTAR)数据集。该数据集中包含了10类前苏联军事车辆目标的SAR图像,被很多研究者广泛应用在SAR目标识别中。

MSTAR数据集中的10类军事车辆目标分别是:ZSU234,ZIL131,T72,T62,D7,BTR70,BTR60,BRDM2,BMP2,2S1。每张SAR图像在距离向和方位向的分辨率是0.3 m,大小为128×128,通常是在0°～360°方位角下,每隔1°～2°获取到的一次SAR目标切片图像。图4展示了10类军事车辆目标的光学图像(第一行)和相应的SAR图像(第三行)。

图4 MSTAR数据集10类雷达目标的光学图像和相应的SAR图像Fig.4 Optical images and the corresponding SAR images of 10 types of radar target in MSTAR dataset

2.2 具体实施

实验选取了俯仰角为17°的数据集作为元训练集,俯仰角为15°的数据集作为元测试集。元训练集中的支撑集和质询集是从元训练集中通过“类样本”的方式产生的。具体而言,首先从10类军事车辆目标中随机选取类,然后从这类的0°～180°方位角样本中每一类随机选出个样本,组成支撑集,再从这类的181°～360°方位角的样本中每类随机挑选出一部分样本组成,经过一次“类样本”过程,得到的支撑集和质询集组成元训练集的一个episode,然后重复进行“类样本”过程次,就得到个episode,这m个episode用来对所提方法进行训练。同样地,对元测试集进行相同的操作,用以验证所提方法。值得一提的是,文中的取值为5,分别在取1,2,5和10的条件下进行了小样本SAR目标识别实验。在取1,2,5和10的条件下,的取值分别是100,50,20,10。数据集的设置形式如图5所示。这样划分支撑集和质询集的目的是验证所提方法的泛化性能,探究利用一部分方位角的SAR图像对学习器进行训练,学习器能否将这种识别能力泛化到对另一部分方位角的SAR图像的识别中。实际上,很难得到目标全方位(0°～360°)的SAR图像,尤其是针对非合作目标甚至是对方目标。因此,对于小样本条件下识别模型的泛化能力,其中一种表现形式可以是利用方位角范围尽可能小的SAR图像进行训练,得到的模型能够对方位角范围尽可能大的SAR图像进行有效识别。极端情况下,如果只利用一个角度的SAR图像进行训练得到的模型,能够实现对360°的SAR图像的有效识别,那么可以认为该模型具有较强的泛化能力。本文中利用0°～180°范围的SAR图像作为支撑集进行训练,而利用180°～360°范围的SAR图像作为质询集进行测试的目的就是为了验证所提模型对不同方位角SAR图像识别的泛化性能。

图5 数据集的设置形式Fig.5 Dataset setting of the proposed method

对于匹配网络中卷积神经网络特征提取模块,采用经典的4个卷积模块构成,具体而言,每个卷积模块包含一个3×3的卷积层、一个ReLU、一个批归一化层和一个2×2的池化层。多尺度特征提取模块由一个1×1的卷积层和一个RoI池化模块构成。1×1卷积层用于减少数据量,RoI池化模块由一层9×9的池化层构成,用于改变特征图的空间形状。权重门控单元由一个1×1卷积层、一个全连接层和一个Sigmoid激活函数层构成。

2.3 与其他小样本识别方法进行对比

为了验证所提方法的有效性,通过设置实验,将所提方法与3种经典的小样本学习方法进行了对比。值得一提的是,3种经典的小样本学习方法在光学图像领域小样本条件下都表现出了良好的识别性能,3种方法分别是:MAML,Meta-LSTM和Matching Net。为了能够更好地反映3种方法在SAR图像目标识别中的表现,没有对上述方法的网络结构进行改动。

在“5类1样本”“5类2样本”“5类5样本”和“5类10样本”的条件下,分别利用所提方法和上述3种方法,对SAR图像目标进行了识别实验。值得一提的是,“类样本”表示对类目标进行识别,每次训练每类目标只提供个样本。在本节中,设计了针对5类雷达目标在小样本条件下的识别实验,具体而言,首先将MSTAR数据集划分成了元训练集和元测试集,将MSTAR数据集中俯仰角为17°的数据作为了元训练集,将俯仰角为15°的数据作为了元测试集。然后,利用“类样本”方法将元训练集和元测试集划分成了若干支撑集和质询集。在本文中，恒等于5,有4种不同的取值,分别是1,2,5和10。下面以=5,=10为例简单介绍一下支撑集和质询集的划分过程。首先,从MSTAR数据集10类不同雷达目标中随机选取5类目标,然后从选出的这5类雷达目标中每类目标0°～180°的方位角样本中随机挑选10个样本,选出的这×=5×10=50个样本构成元训练集的一个支撑集；在这之后,从选出的这5类雷达目标180°～360°的方位角样本中随机挑选一部分样本数据构成与支撑集相对应的质询集,重复上述过程,就可以得到多对支撑集和质询集用以对模型进行训练。而对元测试集进行上述相同的操作,就可以将元测试集划分成若干支撑集和质询集的形式,用来对模型的性能进行测试验证。

表1给出了在“5类1样本”“5类2样本”“5类5样本”和“5类10样本”的条件下,训练迭代100次,所提方法和上述3种方法达到的最高识别准确率。如表1所示,尽管在光学图像领域,上述3种方法表现出了一定的先进性,但是针对小样本条件下SAR图像的目标识别任务,上述方法性能普通,识别准确率还有提升的空间。所提方法在提到的4种小样本条件下均实现了最高的识别准确率。尤其是在“5类1样本”和“5类2样本”条件下,所提方法较其他方法识别准确率提高接近10%,这表明多尺度特征提取网络提取的不同尺度的特征蕴含了SAR图像目标的不同信息,通过将蕴含不同信息的特征融合在一起进行融合识别,有利于小样本条件下提升SAR图像目标的识别准确率。为了更加直观地展示网络训练过程中的细节信息,图6给出了4种小样本条件下,所提方法和上述3种小样本学习方法训练迭代100次的识别准确率变化曲线,其中图6(a)～图6(d)分别展示了“5类1样本”“5类2样本”“5类5样本”和“5类10样本”条件下训练迭代100次的识别准确率变化曲线。

表1 小样本条件下所提方法与其他小样本学习方法识别准确率的结果比较Table 1 Comparison results of recognition accuracy of the proposed method and other few-shot learning methods in few-shot conditions

图6 不同小样本条件下所提方法与其他3种小样本学习方法的识别准确率曲线对比图Fig.6 Recognition accuracy curve comparison chart of the proposed method and other three few-shot learning methods in different few-shot conditions

观察图6可知,相比于其他3种方法,所提方法在4种小样本条件下均表现出了最好的识别结果,尤其是在“5类1样本”和“5类2样本”的条件下,所提方法的识别准确率较其他3种方法有较大的提高。观察图6不难发现,所提方法和其他3种小样本学习方法的识别准确率曲线均存在不同程度的震荡,一种可能的原因是,在实验中,每次训练都会重新从MSTAR 10类不同雷达目标中随机选择5类不同的雷达目标进行识别,增加了识别目标的不确定性,导致了4种方法的识别准确率都出现了不同程度的震荡。但是,所提方法识别准确率曲线局部震荡的程度要明显小于其他3种小样本学习方法识别准确率局部震荡的程度。通过分析所提方法和其他3种方法的网络结构,造成上述现象的原因可能是所提方法中的权重门控单元赋予了多尺度特征提取网络提取出的不同尺度特征不同的权重大小,从而实现了根据具体的识别任务选择出最具代表性的目标特征,从而以该层特征为主导完成目标识别任务。正是因为权重门控单元的这种特性,使得所提方法在每次训练迭代时都会根据重新选择的5类不同雷达目标决定不同尺度特征的权重大小,从而实现根据具体的识别任务选出最适合当前任务的目标特征,进而以该层特征为主导完成识别任务,提升了模型的稳定性和泛化性能。

2.4 与其他小样本SAR目标识别方法进行对比

为验证所提方法的有效性,设置实验将两种小样本SAR图像目标识别方法进行了对比,两种方法分别是基于度量学习的小样本SAR目标识别和基于小样本学习的SAR目标识别,为了更好地体现对比方法的实际效果,没有对对比方法中的网络结构做任何调整。在“5类1样本”“5类2样本”“5类-5样本”和“5类10样本”4种不同小样本条件下,分别利用所提方法和上述两种小样本SAR目标识别方法对SAR图像目标进行了识别实验,实验环境包括支撑集和质询集的划分方式都与第2.3小节相同。

表2给出了在“5类1样本”“5类2样本”“5类5样本”和“5类10样本”4种不同的小样本条件下,训练迭代100次,所提方法与上述两种小样本SAR目标识别方法达到的最高识别准确率。如表2所示,所提方法在上述4种小样本条件下均实现了最高的识别准确率,尤其是在“5类1样本”和“5类2样本”的条件下,所提方法比两种小样本SAR目标识别方法识别准确率高10%以上；在“5类5样本”的条件下,所提方法比文献[38]中的方法识别准确率高10%以上；在“5类10样本”的条件下,所提方法比文献[35]中的方法识别准确率高10%以上。可能的原因是，所提方法中的匹配网络结构同时利用了参数模型能够提取表征能力强的特征和非参数模型不需要训练、没有灾难性遗忘的优点,在一定程度上减少了所需的训练样本数,以及多尺度特征提取模块能够提取不同层特征,权重门控单元能够根据不同识别任务选择不同特征进行识别的特点,有利于提高小样本条件下对SAR图像目标的识别准确率。

表2 小样本条件下所提方法与其他小样本SAR目标识别方法识别准确率的结果比较Table 2 Comparison results of recognition accuracy of the proposed method and other few-shot SAR target recognition methods in few-shot conditions

2.5 不同度量函数对实验结果的影响

第2.3节的实验将所提方法与其他3种小样本学习方法进行了对比,通过对比实验结果,不难发现所提方法在“5类1样本”“5类2样本”“5类5样本”和“5类10样本”4种小样本条件下,无论是在识别准确率方面还是在性能稳定性方面,所提方法都取得了最好的结果。

对所提方法中的度量函数进行了进一步的探讨实验。在所提方法中,采用了余弦相似度度量函数来匹配质询集中的样本特征与支撑集中每种类型雷达目标的特征之间的相似度。第2.3节的实验结果表明,采用余弦相似度度量函数取得了较好的结果,本节利用欧式距离替换了原有的余弦相似度度量函数,采用欧式距离来匹配质询集中的样本特征与支撑集中每种类型雷达目标特征之间的相似度。实验结果如表3所示,其中“采用余弦相似度”指的是所提方法采用余弦相似度来度量质询集中样本特征与支撑集中每种类型雷达目标特征之间的相似度,而“采用欧式距离”是指所提方法采用欧式距离来度量质询集中样本的特征与支撑集中每种类型雷达目标特征之间的相似度。为了更好地体现不同度量函数对实验结果带来的影响,上述两种方法除了度量函数不同之外,其余实验环境、网络结构及网络参数等实验条件均保持一致。

表3 小样本条件下所提方法采用不同度量函数识别准确率的结果比较Table 3 Comparison of the recognition accuracy results of the proposed method using different metric functions

表3展示了所提方法分别在采用余弦相似度作为度量函数和采用欧式距离作为度量函数的情况下,训练迭代100次过程中,采用两种不同度量函数的方法分别在“5类1样本”“5类2样本”“5类5样本”和“5类10样本”4种小样本条件下取得的最高识别准确率。通过观察表3可以发现,虽然在上述4种小样本条件下采用余弦相似度的最高识别准确率要高于采用欧氏距离的最高识别准确率,但是两者的差距始终在2%以内。因此,采用余弦相似度和采用欧式距离作为所提方法的度量函数,对最终识别结果准确率影响不是很大,不能凭借识别准确率来判断两种方法的优劣。

为了更加直观地展现在采用两种不同度量函数的条件下,所提方法训练迭代过程中的细节信息,图7展示了在“5类1样本”“5类2样本”“5类5样本”和“5类10样本”4种小样本条件下,所提方法分别采用余弦相似度和欧氏距离作为度量函数时,在训练迭代100次过程中对元测试集质询集中待测目标的识别准确率变化曲线,其中图7(a)～图7(d)分别展示了在“5类1样本”“5类2样本”“5类5样本”和“5类10样本”条件下的识别准确率变化曲线。

图7 所提方法分别采用余弦相似度和欧氏距离作为度量函数的识别准确率变化曲线Fig.7 Recognition accuracy variation curves of the proposed method using cosine similarity and Euclidean distance as the metric function respectively

通过观察图7不难发现,所提方法在分别采用余弦相似度和欧式距离作为度量函数时,识别准确率变化曲线比较相近。而且,由于权重门控单元能够通过对多尺度特征提取模块提取出的不同尺度的特征赋予不同大小的权重,从而实现根据具体识别任务选择出最具代表的目标特征,以该层特征为主导完成目标识别任务的效果,因此在分别采用余弦相似度和欧式距离作为度量函数时,所提方法的识别性能都表现出了较好的稳定性。

2.6 鲁棒性能验证

作者进行了加有噪声的SAR图像目标识别实验来验证所提方法在噪声环境下的鲁棒性。本文分别将信噪比(signal to noise ratio, SNR)为-10 dB, -5 dB, -0 dB, 5 dB和10 dB的高斯白噪声加到了原始的MSTAR数据集中,并分别在“5类1样本”“5类2样本”“5类5样本”和“5类10样本”4种小样本条件下进行了SAR图像目标识别实验,实验结果展示在表4中。

表4 所提方法对加有噪声的SAR图像的识别结果Table 4 Recognition results of the proposed method for SAR images with added noise

3 结论

本文提出了一种新的小样本条件下针对SAR目标进行识别的方法,叫做基于门控多尺度匹配网络的小样本SAR目标识别方法。在本方法中,通过引入多尺度特征提取模块,用以提取匹配网络不同卷积层的多尺度特征,门控单元根据不同识别任务对不同卷积层的特征设置不同的权重,从而实现根据具体的识别任务选出最适合当前任务的目标特征,进而以该特征为主导完成识别任务。利用MSTAR数据集对所提方法进行了实验验证,通过与3种光学图像目标识别领域表现良好的小样本学习方法和两种小样本SAR目标识别方法的比较,所提方法表现出了令人满意的结果,在识别准确率和识别稳定性方面都要优于其他方法。在此基础上,尝试了利用两种不同度量函数作为所提方法中用来度量质询集中样本特征与支撑集中每类目标特征的相似度的探索性实验。最后,分别在4种小样本条件下和5种噪声条件下,验证了所提方法的噪声鲁棒性,实验结果表明本文方法在上述条件下具有良好的鲁棒性。