基于卷积神经网络的自动调制识别方法

2023-02-23 03:31郝立鑫崔永俊
电子设计工程 2023年4期
关键词:时频信噪比频谱

郝立鑫,崔永俊

(中北大学仪器科学与动态测试教育部重点实验室,山西太原 030051)

信号进行调制之后,在无线信道中可以进行更加稳定高效地传输,而接收到信号之后,解调信号的前提条件就是确定信号的调制方式。调制识别[1]方法基本分为三类,第一类是早期的人工识别,现已经基本被淘汰;第二类是基于决策理论[2]的最大似然法识别,该种方法运用概率学等相关数学知识进行信号识别,该方法较为复杂;第三类是基于特征提取的统计模式识别,根据信号的不同特征进行识别。

调制信号识别技术在不断发展,文献[3]中将卷积双向长短期神经网络应用于信号识别领域,没有先验信息干扰时提高了识别性能,文献[4]中将高阶统计量与决策树相结合,以此进行信号识别,模型鲁棒性较强,文献[5]中将时频特征信号特征作识别信号,信号的时频分析更能反应信号在时间与频率上的变化,且具有普适性。

近年来,深度学习在众多领域都取得了不错的进展,其中卷积神经网络[6]可以自动化地提取特征,在分类问题上有着卓越的性能,该文将其与调制信号识别相结合,并在模型的结构上做出了一定的改进,将信号的频谱图作为信号识别的重要特征。文中进行设计并实验,证明了该文方法在普适性与准确率上均优于现有方法,在信号识别领域有一定意义。

1 信号频谱表示

简单的通信系统如图1 所示。其中s(t)表示要从发射机发送到接收器的传输符号,调制函数F将s(t)转换为发送信号,信号经过h(t)到达接收机。y(t)为接收机接收到的信号,且表达式如下所示:

图1 通信系统

式中,s(t)、h(t)、n(t)分别表示传输符号、脉冲响应和加性高斯白噪声,F是对信号进行调制的函数。该文的主要工作就是识别F的调制类型。

调制信号的调制类型不同,时频变化也不同,因此可以将信号的时频变化作为判断调制类型的依据。频谱图可以表示丰富的信号时频,所以将频谱图作为观察信号时频变化的视觉表示。信号转换为频谱图[7]的方式,该文选用的是STFT(短时离散傅里叶变换),将y(t)表示成采样频率fs的离散时间信号y(n),通过STFT 对其进行加窗变为频域,即:

式中,m和k分别表示时间框架跟频率单元指数,w(n)表示窗口函数,L和K分别表示帧长度和移帧,频谱图Y=|Y(m,k)|2,其中,每个像素对应于频率和时间点。

2 数据预处理

该文采用了RadioML2016.10a 数据集[8],该数据集中有八种数字调制方式[9],分别是CPFSK,GFSK,PAM4,16QAM,64QAM,BPSK,QPSK,8PSK;有三种模拟调制方式,分别是WBFM,AM-SSB,AM-DSB;共有11 种信号调制方式,每种调制方式都有20 000 个调制信号,共有220 000 个调制信号。调制信号共有20种信噪比,分别是-20 dB、-18 dB、…、16 dB、18 dB。每一种信噪比都有1 000 个调制信号。将一维信号转换为二维频谱图,需要使用低通滤波器对信号进行降噪[10]处理,然后通过Matlab 2018b 中的spectrogram函数将调制信号转换为频谱图,图片大小设置为100×100×3。

所有调制信号在相同的调制类型不同的信噪比下按照7∶1∶2 的比例划分为a 组、b 组、c 组,所有的a组数据组合起来作为训练数据集,同理,b 组、c 组分别作为验证数据集和测试数据集。

3 模型设计

3.1 卷积神经网络架构

卷积神经网络[11-12]的结构及参数如图2 所示。

图2 卷积神经网络

CNN(Convolutional Neural Networks)中有四层卷积层、三层池化层。卷积核尺寸为3×3,卷积工作过程如图3 所示。

图3 卷积核工作过程

卷积层的二维卷积计算公式如式(3)所示:

式中,⋆代表二维互相关算子,N代表batch size,即每次输入图片集合的大小,C代表图片的通道,H与W分别代表图片的高与宽。经过卷积之后,图片的输出尺寸如公式(4)、(5)所示:

式中,padding 代表对输入图片四边边缘的填充,kernel 代表卷积核的大小,stride 代表卷积的步长。

在卷积层之后引入了一层注意机制,以便更快、更好地进行模型分类,注意机制之后是池化层,池化层的主要作用是简化特征,在一定尺寸的滤波器内取特征向量的最大值或者平均值,池化层中选择的是最大池化,取值过程如图4 所示。

图4 最大池化取值过程

使用SoftMax 函数进行分类[13]。模型训练时的优化器采用Adam 优化器,网络层的激活函数均采用ReLU 激活函数,函数公式如公式(6)所示:

3.2 注意机制

模型中引入注意机制[14],可以赋予模型分类过程中重要特征更高的权重,以此实现更快、更好地进行分类。综合了Senet、CBAM、AA-Net 等注意力模型,该文选择将CBAM[15](Convolutional Block Attention Module)添加到CNN 网络中,CBAM 的结构示意图如图5 所示。

图5 CBAM结构示意图

其中,通道注意力模块的结构如图6 所示。

图6 通道注意力模块

将大小为C×W×H的特征图F并行进行最大池化与平均池化,大小变为C×1×1,经过一个共享MLP(Multi-Layer Perception),对输出的特征进行加和,最后经过一个Sigmoid[16]激活函数得到M1,M1与F相乘得到大小为C×W×H的F1,计算公式如下:

式中,⊙表示矩阵元素积,将对应元素进行点乘。空间注意力模块结构如图7 所示。

图7 空间注意力模块

对F1分别进行两种池化操作,然后将得到的张量组合在一起再进行卷积,最后经过一个Sigmoid 激活函数得到M2,M2与F相乘得到大小为C×W×H的F2。用新的特征图F2代替原先的特征图进入模型中的下一层网络。

3.3 模型训练测试流程

模型的训练测试流程如图8 所示,用训练数据集训练CNN,如果训练结果理想,保存模型;如果不理想,则调整参数或者模型结构,然后重新训练直到理想为止,保存模型。最后输入测试数据集,记录结果,完成测试。

图8 模型训练测试流程

4 实 验

4.1 实验设计

该文设计了三个实验进行对比,以便更好地评估该文模型的性能:

1)将信号的IQ 两路采样信息直接作为模型的输入,识别模型为没有注意机制的卷积神经网络,为了更好地进行对比实验,识别模型的其余结构与参数均与该文所提出的一样,设该识别模型为CNN1;

2)将信号转换而来的频谱图作为模型的输入,识别模型的结构与1)中相同,设该识别模型为CNN2;

3)将信号转换而来的频谱图作为模型的输入,识别模型为该文提出的模型,设该模型为CNN3。

所有实验都使用相同的数据集,模型都基于TensorFlow 框架进行搭建,所有实验都在Nvidia RTX 2060 GPU 中实现,在训练趋于稳定时结束训练并进行验证与测试。

根据控制变量法对CNN1 与CNN2 的识别结果进行对比,可以得到信号的频谱图作为输入时对识别模型性能的影响。

将CNN2 与CNN3 的识别结果进行对比,可以得到增加注意机制对识别模型的影响。

4.2 实验结果

根据实验设置进行实验,得到三种情况下的识别结果,由于篇幅有限,该文只给出部分数据,如表1所示。

表1 准确率识别结果

将实验得到的准确率结果绘制为曲线图,将三种实验结果都画到一张曲线图中,并用不同的曲线进行标注,有利于进行对比观察,实验结果如图9所示。

图9 实验结果

从图9 中可以看出,在信噪比为-16~-6 dB 时CNN2 的准确率相较于CNN1 提高了0%~3%,在信噪比为0~18 dB 时CNN2 的准确率相较于CNN1 提高了0%~20%,因此,将信号转换为频谱图更有利于模型的识别。在信噪比为-10~14 dB 时,CNN3 的准确率相较于CNN2 的提高了0%~10%,在0 dB 时,CNN2的准确率相较于CNN1 提高的最多,提高了10%。其在低信噪比情况下准确率没有明显差别,这是因为当信号失真比较严重时,降噪算法改善信噪比的能力有限。因此CNN3 的性能优越于CNN2。

因CNN1 与CNN2 在结构上没有差别,所以不作比较。CNN2 与CNN3 均在训练30 轮左右区域稳定,训练准确率如图10 所示。在训练时间上,CNN2 每轮训练时间为105 min,CNN3每轮训练时间为122 min,训练时间如表2 所示。

图10 训练准确率

表2 训练时间

CNN3 的训练效率相比于CNN2 降低了16%,CNN3 训练所需时间更多是因为CNN3 中引入了注意力机制,在结构上更为复杂。总体来说,训练效率在可接受范围之内。

5 结论

该文提出了一种基于CNN 的自动调制识别模型,并在CNN 中加入了CBAM,该模型与现有方法相比,在信噪比为-10~14 dB时,准确率提高了0%~10%,且在0 dB 时,准确率提高最多,训练效率降低了16%,但总体在可接受范围之内,由实验可知,该文提出模型优于现有方法。

猜你喜欢
时频信噪比频谱
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
一种用于深空探测的Chirp变换频谱分析仪设计与实现
基于深度学习的无人机数据链信噪比估计算法
基于稀疏时频分解的空中目标微动特征分析
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
频谱大师谈“频谱音乐”——法国作曲家缪哈伊访谈记
遥感卫星动力学频谱规划
保持信噪比的相位分解反褶积方法研究
基于时频分析的逆合成孔径雷达成像技术
双线性时频分布交叉项提取及损伤识别应用