基于融合Attention机制的残差神经网络雷达干扰感知方法

2022-09-19 01:17彬,健,
电光与控制 2022年9期
关键词:干扰信号残差雷达

郎 彬, 宫 健, 陈 赓

(空军工程大学,西安 710000)

0 引言

雷达作为电子战中目标侦察、作战支援的重要装备,其应对复杂电磁环境的能力是战争胜利的重要保障。为保证雷达系统的生存和效能,作为雷达智能化抗干扰体系核心的雷达干扰感知技术[1]需要随着电磁环境和干扰技术的变化而不断发展,因此,雷达干扰感知研究具有重要的军事价值和意义。

根据干扰作用机理的不同,干扰可分为压制性干扰、欺骗性干扰[2]以及复合干扰。对各类干扰的感知需提取有区分度的特征,传统识别研究在多信号域中人工设计或发现有效的特征。文献[3]在时频域上建模分析合成孔径雷达回波与欺骗干扰的差异,利用直方图匹配距离对特征进行增强,有效地识别出虚假目标;文献[4]将频域上的多尺度相像系数作为区分各干扰信号的本质特征,使用改进的支持向量机(Support Vector Machines,SVM)模型针对3类干扰实现了87.5%的识别准确率;文献[5]针对箔条干扰识别问题,引入极化散射参数研究箔条云的散射特性,将极化散射参数作为SVM识别箔条干扰的特征向量;文献[6]基于熵理论,提取干扰信号的信息熵、范数熵与指数熵用于有源干扰区分。这些依赖人工设计的方式除存在特征区分度随干扰技术发展逐渐下降的不足之外,还面临对于抽象的关键特征难以提取的问题。近年来,深度学习以自动学习输入数据特征的能力被广泛应用于图像、文本、语音识别等领域。有学者用其对雷达干扰进行感知识别并表现出良好的性能。文献[7]采用经典的AlexNet神经网络对5类单一的雷达干扰进行感知识别,实现了较高的准确率,但其并未考虑复合干扰场景;文献[8]对干扰信号做时频变换后输入卷积神经网络(CNN),能够适应各种干扰及其参数,但网络结构相对简单,限制了模型的特征提取能力;文献[9]将原始雷达干扰信号与时频变换后的数据作为3个子网络的输入,通过融合各网络提取的特征实现了简单雷达干扰信号的分类。尽管深度学习可自动感知干扰数据,但仍存在如下不足:第一,普通的神经网络深度有限,限制了特征提取能力,网络加深会出现网络退化问题;第二,神经网络自动提取到的输入数据特征,其中存在大量的冗余特征甚至负面特征;第三,神经网络的训练需要大量的训练数据支撑,雷达干扰信号往往来自非合作辐射源,样本获取与标准难度较高,小样本条件下的训练问题难以避免。

本文针对上述不足做出改进,提出一种基于融合Attention机制的残差神经网络的雷达干扰感知识别方法,并采用迁移学习进行模型训练。利用跳跃式连接的残差(Residual)结构[10]改善网络退化问题,引入Attention机制实现通道注意力,将注意力集中于最具区分度的特征通道上。最后,基于迁移学习(Transfer Learning,TL)[11]进行模型训练,将其他领域数据训练出的模型参数[12]迁移至雷达干扰识别任务中,在提升模型性能与鲁棒性的基础上,增强了模型应对小样本训练的能力。

1 构建干扰信号数据集

1.1 干扰信号生成

依据压制和欺骗类型干扰的数学模型[2]生成典型干扰信号的数据集,信号主要仿真参数设置如表1所示,其中,JNR取值范围为-2~16 dB,间隔2 dB。

表1 干扰信号仿真参数设置Table 1 Setting of jamming signal simulation parameters

仿真9种信号,除正常回波(Echo)外,设置8种雷达干扰信号,分别为噪声调幅干扰(Noise AM Jamming,AMJ)、噪声调频干扰(Noise FM Jamming,FMJ)及射频噪声干扰(Radio Frequency Noise Jamming,RFNJ)3种压制性干扰;距离欺骗干扰(Range Deception Jamming,RDJ)与速度欺骗干扰(Velocity Deception Jamming,VDJ)2种欺骗类干扰[2];距离欺骗干扰分别与3种压制性干扰并用的复合干扰(RDJ+AMJ,RDJ+FMJ,RDJ+RFNJ)。

每种干扰信号生成425组样本,为研究训练样本数量对模型性能的影响,将训练样本数量分为125和300。测试数据在-2~16 dB之间,间隔2 dB,生成100组样本。数据集共计12 825组样本。设Pjam为干扰信号功率,Pnoise为添加到干扰信号中的噪声功率,JNR定义为

(1)

1.2 干扰信号预处理

首先,利用短时傅里叶变换(Short-Time Fourier Transform,STFT)对生成的干扰信号做时频分析,得到反映瞬时频率随时间变化的时频分布图像。对于干扰信号j(t),窗函数g(t)的共轭g*(t),STFT算式为

(2)

式中:τ为t的微分,τ在t范围内移动;j(t)为干扰信号;j(τ)为τ时刻的干扰信号;g(t)为窗函数;g(τ-t)为以t=τ为中心的窗函数。对于给定时间t,TSTFT(t,f)是t时间段内的时频分布。

为加快训练速度,需要在保留时频图像特征信息的前提下做进一步预处理,首先将图像尺寸压缩至224×224像素大小,随后做灰度化处理,相较于三通道RGB图像,将单通道图像作为模型输入时,可节省计算时间,进一步加快模型训练收敛速度及识别速度。随机选取雷达回波与各类干扰信号的时频分布图像如图1所示。

图1 雷达回波与各类干扰信号的时频分布图像Fig.1 Time-frequency distribution images of radar echo and various jamming signals

2 基于Attention机制的残差神经网络雷达干扰识别

2.1 Attention机制与残差模块

注意力机制广义上指将处理资源重点分配于信息量最大的部分,如人类视觉系统在面对现实场景时,往往聚焦在某些重点区域,忽视非重点信息[13-14]。基于Attention机制实现通道注意力,通过映射加权和学习参数赋予各通道(Channel)不同权重,使模型自动学习到不同Channel的重要程度,加强重要特征的影响。

残差模块结构如图2所示。

图2 残差模块结构Fig.2 Structure of residual module

对于残差模块输入x通过主干F(x)实现残差映射(Residual Mapping),通过右侧支路的短路连接(Shortcut Connection)实现恒等映射(Identity Mapping)。图中,两层权重Weight Layer用W1,W2表示,ReLU激活函数用σ表示,经两层权重Weight Layer映射后的残差映射结果为

F(x)=W2σ(W1x)

(3)

与短路连接传入的x求和得到输出y,完整的映射过程为

H(x)=F(x)+x。

(4)

残差模块的学习目标是学习残差映射F(x)中的各项权值参数,寻找输出减输入,即H(x)-x。通过残差映射学习到输入x的新特征,可获得更好的性能,即使残差F(x)为0没有学习到任何新特征,由于恒等映射的存在,在堆叠加深网络过程中网络性能也不会发生退化。

2.2 基于Attention机制改进的残差模块

为增强关键特征通道,削弱冗余和负面特征的影响,以SE模块(Squeeze-and-Excitation Module)实现通道注意力[15]的原理改进残差层,SE模块结构如图3所示。

图3 SE模块结构Fig.3 Structure of SE module

图中:SE模块输入X尺寸为C1×H×W,C1,H,W分别为Channel数、高度和宽度;X经标准的卷积操作Ftr映射为特征图U,U的Channel数变为C2;Fsq与Fex分别表示SE模块中的Squeeze和Excitation操作,Squeeze将U中每个Channel的特征图做全局平均池化(Global Average Pooling,GAP)运算,GAP表达式为

(5)

式中:zc为第c个Channel特征图的全局特征;uc为第c个Channel的特征图。经Squeeze后,U变为1×1×C1的全局特征向量。随后,通过Excitation操作重新标定该向量,Excitation的实现是利用多层全连接层自动学习调整,利用Sigmod激活函数得到向量和为1的通道权重向量。最后,将该向量乘以U得到最终的输出特征图,此时,各通道特征图已区分每个Channel的重要程度,从而实现通道注意力。

基于以上SE模块的实现原理,在残差层中融合通道注意力成为新的层结构,再堆叠为完整的网络结构。图4所示为残差层与融合Attention机制后的残差层,其中,FC1,FC2代表2组全连接层。

图4 残差层与融合Attention机制后的残差层Fig.4 Residual layer and the residual layer afterfusion with Attention mechanism

残差层中的Wight Layer设置为卷积核大小为3×3的卷积层,SE模块参照图3结构,经过GAP,Squeeze,Excitation操作后得到通道权重向量,该向量与两层Weight Layer映射输出相乘后再与恒等映射相加得到最终输出。将该融合Attention机制后的残差模块命名为SE-Res Block。

2.3 SE-ResNet网络模型

融合Attention机制后的残差网络SE-ResNet完整架构如图5所示。全网络堆叠了16组SE-Res Block,将16组SE-Res Block分为4部分,分别为Layer1,Layer2,Layer3,Layer4,各自具有3,4,6,3组SE-Res Block,Channel数随着Layer的增加,分别为64,128,256,512。

图5 融合Attention机制的残差网络整体模型Fig.5 The overall model of residual network fused with Attention mechanism

本网络模型主要参数如表2所示。

表2 网络模型主要参数Table 2 Main parameters of the network model

针对小样本训练数据问题,在网络模型权重初始化阶段应用迁移学习,载入已有的ResNet34在ImageNet数据集上训练后的权重,由于本文对RseNet34嵌入SE模块,使得模型结构发生变化,因此在导入权重时需跳过不匹配的操作层。利用其他领域的数据,提取有用的先验知识再将其迁移到雷达干扰识别任务中,使模型获得更好的初始化权重参数,提高小样本训练条件下的识别精度。

3 实验与分析

3.1 实验过程

实验硬件环境为Intel®Xeon®Gold 6246 CPU,NVI-DIA Quadro GV100显卡;软件平台为Python3.6,Pytorch 1.8.1,CUDA 11.1。评价指标为网络总体准确率(Overall Accuracy,OA)与Kappa系数[16],OA可直接反映分类正确的比例。Kappa系数给予模型偏向性评价,偏向性越强的Kappa值越低,定义如下

KKappa=(po-pe)/(1-pe)

(6)

pe=(t1×p1+t2×p2+…+tm×pm)/(n×n)

(7)

式中:po即为OA;样本共有s类,每一类真实样本数分别为t1,t2,…,ts,识别出的每一类样本数分别为p1,p2,…,ps。在两种训练样本数量条件下,设置5种对比实验,分别为SVM,RF,未融合Attention机制但使用迁移学习的ResNet34,Attention机制与迁移学习都未使用的ResNet34以及未使用迁移学习下的本文模型。

3.2 实验结果分析

各模型在两种训练样本数量下的OA值如图6所示,小样本训练下的4种深度学习方法在不同JNR下的OA和Kappa值分别如表3、表4所示。

表3 小样本训练下的4类神经网络在不同JNR下的OA值Table 3 OA of four types of neural networks trained with small samples under different JNR %

表4 小样本训练下的4类神经网络在不同JNR下的Kappa值Table 4 Kappa of four types of neural networks trained with small samples under different JNR

图6 训练样本数分别为100和300时不同JNR下的OA值Fig.6 OA under different JNR when the number of training samples is 100 and 300

由图6可知,训练样本数为100时,JNR低至0 dB时OA也能保持在90%以上,表明在低JNR的条件下,迁移学习下的SE-ResNet有着较好的识别能力,并明显优于对比方法。绘制JNR分别为0 dB与4 dB时的混淆矩阵如图7所示。

图7 JNR分别为0 dB与4 dB时的混淆矩阵Fig.7 Confusion matrix when JNR is 0 dB and 4 dB

由图6可知,小样本训练对OA影响明显,但4种深度学习方法都优于SVM,RF传统机器学习方法。表3、表4表明,迁移学习下的SE-ResNet在不同JNR下的OA值与一致性均优于其他模型,尤其低JNR、小样本时,SE-ResNet识别准确率保持最优。Attention机制对OA值提升明显,SE-ResNet相比ResNet提升3%~7%。迁移学习在小样本训练时对模型OA值提升明显,对于本文模型,迁移学习将小样本训练的OA值最高提升5.4%。可见,本文模型不仅能够对典型雷达干扰实现不同JNR下的有效识别,而且在小样本训练条件下同样具备较好的识别效果。

分析图7中0 dB与4 dB时的混淆矩阵可知,干扰误判主要发生在RFNJ以及RFNJ+RDJ中,其他干扰可以实现接近或达到100%识别率。干扰误判主要因素是在低JNR下,RFNJ淹没在噪声背景,在时频分析中难以体现RFNJ的时频特征,使得无干扰的雷达回波与RFNJ、RFNJ+RDJ与RDJ难以区分。

4 结论

本文为实现雷达干扰信号在低干噪比、小样本训练条件下的精确与稳定识别,提出融合Attention机制的残差神经网络,并基于迁移学习训练的感知识别模型,与传统机器学习方法和未经改造过的神经网络模型进行典型干扰信号的感知识别实验。实验结果表明,即使在低JNR、小样本训练条件下,本文模型仍实现了鲁棒性更强且更加精确的雷达干扰感知效果,有助于实现智能化、自动化的雷达干扰感知,为抗干扰手段提供有效引导。

猜你喜欢
干扰信号残差雷达
基于小波域滤波的电子通信信道恶意干扰信号分离方法
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
基于DJS的射频噪声干扰信号产生方法及其特性分析
基于残差学习的自适应无人机目标跟踪算法
基于粒子群算法的光纤通信干扰信号定位方法
基于深度卷积的残差三生网络研究与应用
DLD-100C型雷达测试方法和应用
雷达
基于空时二维随机辐射场的弹载雷达前视成像