基于数据增强与集成学习的小样本识别技术

2022-08-10 04:57王满喜陆科宇王佳保林云
移动通信 2022年7期
关键词:识别率切片电磁

王满喜,陆科宇,王佳保,林云

(1.电子信息系统复杂电磁环境效应国家重点实验室,河南 洛阳 471003;2.哈尔滨工程大学信息与通信工程学院,黑龙江 哈尔滨 150001)

0 引言

未来复杂电磁环境下的信息化战争是多军种联合作战,各种武器平台互联、互通,构成了陆、海、空、天、网、电一体化作战体系[1]。在复杂电磁环境下进行电磁个体识别是实现电磁频谱管控的重要步骤,对未知威胁的用频个体进行有效识别对提升复杂电磁频谱环境下的实时感知能力具有关键的意义。而在实际工作场景中,电磁信号经常只能获得少量有标签样本的数据,因此如何在小样本环境下提高识别率成为了需要解决的难题。

面对复杂的电磁环境,各种设备依赖于电磁环境空间,因此深度学习也被用于处理物理层通信[2]。现代化信息战中,电磁环境变得更加复杂,会对无线电的使用产生严重干扰,限制装备的使用和作战效能[3]。传统的技术手段已经难以对电磁个体进行快速有效识别,而近几年出现的深度学习方法[4],是一种快速发展、有前景的新型技术,在电磁信号识别领域得到了有效的应用[5]。其中基于深度学习的电磁个体识别技术主要有实数网络、复数网络、多模态融合以及注意力机制等技术[6]。

小样本学习在近年来受到了广泛的关注,被用于解决信号识别时样本数不足导致模型识别率低的问题[7]。在小样本信号识别中,数据增强是一种提升效果的方法,已经应用在图像、文本和语音处理等方面,但是对时间序列尤其是电磁信号的数据增强方法研究较少[8]。数据增强是深度学习模型在时间序列数据上应用的关键。其中时序变换是时间序列数据最直接的数据增强方法,大多数对原始输入数据进行处理,通过引入高斯噪声或更复杂的噪声模式来提高模型的鲁棒性[9]。对时间序列在频域的转换,可以利用频域中振幅和相位谱的扰动来增强卷积网络对时序异常数据的识别能力[10],实验证明该方法相较于原始序列有显著提高。

深度学习生成对抗网络(GAN,Generative Adversarial Networks)作为一种生成模型,可以有效地生成合成样本,应用于小样本识别的训练。在GAN 中,需要为时间序列数据建立良好的通用生成模型。通过一种辅助分类器生成对抗网络的智能编程数据增强方法,对等势星球图在统计图域的特征进行数据增强,可以实现信号调制识别性能的提升[11]。利用循环生成对抗网络的方法生成真实合成数据,还可以针对时间序列分类不平衡问题生成平衡的数据集[12]。研究人员还发现基于GAN 架构生成的合成时间序列数据,可能更接近测试数据。此外提出了一个在不同领域生成真实时间序列数据的自然框架,在嵌入式空间进行对抗和联合性训练,具有监督和非监督性损失[13]。

基于模型的时间序列增强方法通常会用统计模型对时间序列进行建模。通过一种称为混合高斯树的简化版统计模型,对少数类时间序列数据进行建模,可以解决分类不平衡的问题,与不利用点间的过采样相比有很大优势[14]。此外使用局部和全局趋势(LGT,Local and Global Trend)的统计方法来计算参数和预测路径样本,可以提高模型识别性能[15]。使用混合自回归模型来模拟时间序列的集合,根据条件分布生成新的时间序列,同样可以达到数据增强的效果[16]。

本文将针对电磁信号识别中的小样本问题,在现有的识别方法的基础上,分别使用切片处理、时间序列增强和对抗训练增强这三种方法,在小样本数据集上进行测试,并通过对不同数据增强场景下模型的集成学习,极大地提高信号的识别效果,同时对不同算法的性能进行探讨。

1 实验数据集的建立

1.1 数据采集系统

信号采集系统广播式自动相关监视(ADS-B,Automatic Dependent Surveillance-Broadcast)遵循国际民航组织协议[17],系统的工作框架如图1 所示。其中A 和B 飞机收到来自卫星导航发送的飞机位置消息后,与其自身的其他相关信息进行结合,比如飞机的速度、状态、意图等,由两架飞机ADS-B 发送子系统的消息生成模块生成合法的信号后,再通过消息发射模块周期性地广播出去,然后被地面工作站接收。

图1 ADS-B系统工作框架

采用基于通用处理器的软件无线电SM200B 接收设备采集信号,该设备的结构可以为开发提供很高的灵活性和简便性,使用标准接口如以太网、通用串行总线等能够对数字基带或者低中频的采样数据进行处理,同时利用多核对数据进行处理以提高吞吐量。其结构包括天线、数模转换模块、缓冲模块和常用处理器。这种架构十分灵活,能够使用个人处理器进行算法的开发和测试。

1.2 数据采集与预处理

(1)数据集预处理

本文采集数据时自动联合参数设置部分、信号解码部分以及信道估计出的信号信息,进行消息组装,并结合信号检测部分的信号位置,提取出原始信号,完成自动标注过程。

1)利用统计学中的相关原理分别对I 路和Q 路两路信号的二、四阶统计量进行计算;

2)在同相和正交分量各自的二、四阶统计特征的基础上,得到对应的信号功率因子和噪声功率因子,计算得到对应的信噪比;

3)根据同向和正交两种分量的信噪比得到整体基带通信信号的平均信噪比;

4)在上述工作的基础上计算得到信号的参数化或非参数化功率谱;

5)在x-dB 的基础上或根据其他方法对信号传输时的带宽进行估计;

6)分别将信号的最低和最高截止频率设置为fmin和fmax,对载波频率偏移进行估计。

(2)实验数据采集

实验数据通过第1.1 节所述数据采集系统进行采集,并通过接收设备进行存储。

电磁数据采集:图2 展示了进行信号采集中的数据采集环境。采集地点选择在航空器飞行航线上,避开架空导线等各种干扰源,降低到达采集点的反射杂波。采集到信号后将数据传输到控制台并进行存储。

图2 电磁数据采集环境

2 基于时间和对抗序列的数据增强

2.1 切片预处理

通过窗口滑动将每个小样本数据集中的信号处理成序列长度相等的切片,并且使用原有信号的标签对设备进行标记[18]。对数据进行切片的流程如图3 所示,Mk是第k个序列的长度,L为对应子帧的序列长度,当设置窗口滑动步长为1 时,第k帧传输共生成Mk-L+1 个子帧切片。

图3 切片处理示意图

为了提高模型的训练速度并降低训练数据特征的冗余,不需要将所有子帧的切片都输入至网络进行训练,因此在本文中,均匀地随机选择一部分切片作为识别模型的输入样本,每个传输k最终得到的实际切片数由式(1)得出:

其中,λ为超参数,控制最终的实际切片数,其物理意义为在[1,L]区间内每个训练样本出现的次数的期望值,选择合适的期望值可以降低模型过拟合的风险并节约计算成本。

2.2 时间序列数据增强

(1)频率偏移数据增强

接收设备与发射设备之间的相对运动或信号发生反射的现象,会对信号传输产生影响,即多普勒效应[19]。在模型进行训练时对数据加入频偏,可以提高鲁棒性。信号从发射端X 处产生并且向Y 处运动,接收设备在s的位置接收到电磁信号,则信号传输的长度存在路径差:

式中,Δt表示发射端从X 处运动到Y 处的时间;θ代表X、Y 发射与信号接收位置产生的夹角。实际采集情况中,接收设备一般距离发射端20 km 以上,因此可以假设在两处有相同的θ,从而可以计算出接收电磁信号的相位变化Δφ:

采集数据过程中飞机速度相对过快,接收数据会受到多普勒效应的干扰[20],偏移频率是数据的重要特征,进行频偏变换需要傅里叶变换。

(2)信道损伤数据增强

在地空信号的传输过程中易受如山体、大雾等的环境干扰而造成信号的反射、衍射和绕射[21],从而导致衰落,本文利用该特性对数据进行增强。

接收端信号可以表示为:

其中α代表信号衰减;f0代表频率偏移;θ0代表相位偏移;ω(t) 代表均值为零的复高斯加性白噪声;s(t) 为信道传输信号,其分布服从:

在地与空通信中传输链路一直保持“通视”效果,即存在信号直射路径,但因为传输的多普勒效应和多径效应的影响,使接收得到的信号包含多径分量,而且信号的包络服从莱斯分布。

2.3 对抗样本数据增强

对抗样本攻击指通过对数据集样本引入扰动,使其产生具有高置信度的错误输出[22]。对于学习系统M(·) 和正常的输入a,如果有另一个样本是几乎与a相同,但被系统错误地分类为,可以称其为对抗样本。本文利用对抗样本对模型进行训练以提升模型的泛化能力及鲁棒性。

分类器对输入a及其扰动版本做出不同的响应是不合理的,即。为了实现有效的分类器设计,只要,分类器就应该将a和分类为同一类。假设激活函数是线性的,那么对的分类器的输入为:

3 基于集成学习的信号分类

3.1 集成学习算法原理

本算法主要包括小样本信号预处理、网络识别和投票集成几个部分。在数据输入分类器之前,将采集得到的原始小样本数据进行处理,然后使用不同网络提取出信号特征进行投票,利用集成学习算法进行信号识别的流程如图4 所示。

图4 集成学习算法流程

集成学习包含以下三种常用方法:1)直接平均法,这种集成方法具有高效性,预测结果为不同网络产生的分类置信度的平均;2)加权平均法,在直接平均的基础上引入权重进而调节不同网络分类置信度的重要性,从而提高识别率;3)投票法,常见的方法,其中使用最多的是多数表决法,投票之前分别将网络得到的分类置信度转变为预测类别[24],将最高分类置信度相应的类别作为该网络的输出对结果进行预测。

3.2 卷积神经网络

卷积神经网络具有较强的识别数据特征的能力,进而获得更具拟合性的模型,是在监督下学习的分类模型[25],可以进行局部连接、权值共享和下采样的操作。卷积神经网络一般由输入层、卷积层、池化层、全连接层及输出层构成。分类识别中常用的卷积神经网络的结构如图5 所示:

图5 卷积神经网络结构

卷积层包含多个滤波器,以对输入信号的特征进行学习[26],不同尺寸的卷积核提取得到的特征包含不同信息,而且权值的共享可以减少模型的复杂度并提高鲁棒性[27]。除Alexnet 外,本文引入了ResNet[28]、VGG 和Inception[29]进行信号识别。

4 实验及分析

本文设计并构建了小样本下的电磁信号识别任务,并在不同的数据增强方法和基于集成学习的小样本电磁信号识别方法下进行对比验证。

4.1 实验设置

实验所采用的数据为数据采集系统得到的ADS-B 信号数据集,信号长度为4 800。分别对数据进行切片处理和数据增强获得数据集,将增强后的数据集与原始数据集进行混合训练,设置80% 数据为训练集,20% 数据用于测试,然后使用4 种卷积神经网络进行训练与测试。在基于集成学习的小样本识别中,对4 种模型进行集成学习。

本文中神经网络训练均基于Windows 10 操作系统上的Keras 与Tensorflow 深度学习框架构建,CPU 处理器为i7 -11370,GPU 使用NVIDIAGeForce 3060。

4.2 基于数据增强的识别性能分析

(1)切片处理后性能分析

为了对比不同样本数目下切片处理对信号识别结果的影响,分别在类别样本数目N为5、10、15、20 的情况下进行切片处理,通过这种方式对样本数目进行扩增。切片处理后,在得到的数据集上分别对4 种神经网络模型进行测试。在该实验中,每个数据集包含20 个类别,对样本切片时设置单帧长度为4 799,即将数据扩增一倍。

从图6 中的结果可以看出,经过切片处理的信号识别效果与未经处理的效果相差很大,基于切片处理的小样本识别准确率有了大幅度的提高。在单个类别样本数目为5时,识别率最高的VGG13 仅为35%,残差网络的识别率为10%,这表明在小样本下,模型的分类识别能力面对很大考验。但是经过切片处理后,4 种模型的识别率均有了大幅提高,其中网络的识别率最高达到了92.5%。

随着样本的数目越多,不同的网络的识别率会随之上升,这表明样本数目的大小对模型的识别能力有着较大的影响。在样本数目较小时,网络缺少足够的特征来提高鲁棒性;当样本数目提高到20 时,4 种模型的识别率均超过了90%。实验结果证明了切片处理的有效性,在接下来的实验中设置每个类别样本数均为20。但是该方法得到的数据并不包含新的特征,没有对模型进行新的训练。且切片处理在模型的实际部署应用中存在约束,无法对信号进行实时的识别。且在识别前首先对信号进行切片处理,这样会占用大量的时间和资源,因此本文接下来对时序增强方法进行研究。

(2)时序增强方法性能分析

为了通过增加样本特征的方式提高小样本识别率,需验证时序增强方式在信号样本较少时能否提高模型的性能。选用频偏增强和损伤增强两种信号增强方法对样本特征进行扩增,样本类别与每类样本数目均为20,训练得到的结果如表1 所示,对不同网络结构和增强方式的识别效果进行研究。在训练时为保障训练的一致性和公平性,将学习率等超参数保持一致。设置频偏增强的载波频率偏移为4 kHz,莱斯多径信道损伤的时延τ为0.1 个符号时间,增强后的数据与原始数据等比例混合训练。从结果中可以看出,两种数据增强方式均可以在一定程度上提高识别准确率。对于不同的模型,数据增强的效果相差较大。网络VGG13 的识别率提高到了90.6%,而残差网络的识别率仅提高到了68.75%,这与网络结构的不同有关。

图6 切片下不同模型性能对比

表1 小样本在时序增强时的性能比较

从结果中可以看出,网络的结构对时序数据增强的效果有着较大的影响。传统的卷积神经网络有较多的参数,在面对小样本时,识别率较高且具有较高的鲁棒性。经时序数据增强后,识别率得到了大幅提升。而对于残差网络,主要由残差块组成且参数较少,在面对新的特征时,因其鲁棒性不强,所以无法对新的样本进行有效识别。

(3)对抗训练增强方法性能分析

为了验证对抗训练增强方法对于小样本信号识别是否有作用,选用4 种对抗样本方法生成对抗性样本数据。采用上述实验中的原始数据集,首先对测试集数据进行对抗样本攻击,并将不同模型在不同攻击方式下的识别效果展示在图7。从图中可以看出,不同的攻击方式均会造成网络识别率的下降,且随着样本扰动程度的增加,对识别性能的损伤越严重,同时模型的结构对攻击的效果有着一定的影响。这表明接下来可以利用对抗样本攻击对模型进行训练,使其具备对精心设计的扰动的识别能力,提高模型在进行小样本识别时的鲁棒性。

图7 对抗样本攻击下模型性能对比

经过上述研究,为了得到不同网络结构和对抗攻击训练方法对识别的提高效果,将不同网络在样本扰动为0.01 的情况下产生的训练集对抗样本与原始数据进行混合训练。从表2 可以看出,对抗训练增强可以提高网络小样本识别性能。

表2 小样本在对抗增强时的性能比较

4.3 基于集成学习的识别方法性能分析

为了研究集成学习在小样本下的识别性能,从模型角度对识别性能进行分析,对上文中使用到的数据集和模型进行集成训练。首先在不同的信噪比下进行分析,然后在不同数据增强方法下进行集成学习,验证本文提出的方法。

(1)集成学习算法性能分析

对网络在没有数据增强下的识别效果进行研究,并将结果呈现在图8 中:

图8 集成学习与非集成模型性能对比

从结果可以看出,集成学习和单一模型的识别性能随着信噪比的增加而逐步提高,在低信噪比下均无法取得很高的识别效果。在信噪比为-5 dB 时,集成学习的识别率超过了其余模型,并且在20 dB 信噪比下达到了71.3%的识别准确率,其分类结果的混淆矩阵如图9 所示,这表明集成学习对小样本识别有效,可以为接下来数据增强下集成学习提供参考。

图9 集成学习,SNR=20 dB

从结果可以看出,集成学习并未对小样本的识别准确率带来大幅的提升,这并不表明集成学习不适用于小样本识别场景,而是因为其中一些模型在小样本下的原始识别率无法达到很好的效果,导致进行集成学习后无法产生正面的效果。

(2)数据增强下集成学习性能分析

数据增强下,4 种模型均能取得较高的识别准确率,因此考虑在数据增强下对模型进行集成学习训练,研究是否能通过数据维度与模型维度对小样本识别率的提升产生积极的影响。测试在对抗训练增强和时序数据增强下进行,并将结果展示在图10 中:

图10 数据增强下集成性能对比

从结果可以看出,本文提出的基于数据增强和集成学习的小样本识别方法取得了很好的效果,在BIM 对抗训练下的识别率最高可以达到96.5%,其分类结果的混淆矩阵如图11 所示:

图11 BIM对抗训练下集成学习

从结果中还可以看出,基于时序增强和集成学习的小样本识别方法并没有提高识别准确率,这同样是因为在时序增强下,有些模型的识别性能不强从而对其他模型的识别产生了负面的影响。

5 结束语

小样本电磁信号识别在民用和军用领域具有重要的战略意义。随着通信领域和电磁空间领域相关技术的不断发展,只有通过领先的电磁信号识别技术才能定位对方的电台、飞机等设备,在未来的复杂电磁环境中掌握主动权。在设备的实际工作中,建立一个高质量标注数据集是很难实现的工作。为了利用少量的有标签数据训练得到具有泛化能力的模型,本文提出了基于数据增强和集成学习的小样本识别方法。通过数据增强的方式,扩展信号样本的特征,使模型能够获得较多的特征来提高泛化能力,同时从模型角度来探讨如何提高小样本识别率。

对于小样本识别中存在的样本和特征不足问题,本文分别从切片处理、时序增强和对抗训练增强等角度对其进行了探讨。从结果发现,该3 种方法均能有效提高小样本信号识别率,其中时序增强对模型的提升效果不同,而对抗训练增强能对模型识别性能普遍产生正向效果。最后在数据增强下利用集成学习进行识别,识别率最高达到了96.5%,证明了该方法的有效性,在后续工作中,可以从特征维度研究如何提高小样本识别效果。

猜你喜欢
识别率切片电磁
基于类图像处理与向量化的大数据脚本攻击智能检测
三维多孔电磁复合支架构建与理化表征
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
掌握基础知识 不惧电磁偏转
基于SDN与NFV的网络切片架构
高速公路机电日常维护中车牌识别率分析系统的应用
肾穿刺组织冷冻切片技术的改进方法
冰冻切片、快速石蜡切片在中枢神经系统肿瘤诊断中的应用价值比较
电磁换向阀应用探讨