基于数据增强的侵彻引信准确层识别神经网络方法

2022-03-21 11:37房安琪
探测与控制学报 2022年1期
关键词:插值噪声神经网络

房安琪,李 蓉

(西安机电信息技术研究所,陕西 西安 710065)

0 引言

现代战争中,大规模杀伤武器库、地下指挥中心、多层建筑物、导弹发射井、飞机掩体等高价值目标的防护能力大幅增强,建筑物内部结构变化多样[1],作为打击这类硬目标的侵彻弹药动能也在不断提高,在高速侵彻多层硬目标时,侵彻弹内部的加速度传感器获取的过载中叠加了大量高频振荡信号,导致层与层之间彼此粘连,计层算法准确率下降甚至失效[2]。如何对多层粘连过载信号实现准确计层一直是国内外研究的热点,目前的层识别研究主要集中在信号处理方面。如基于幅值识别的计层方法,该算法简单易实现,但对高速侵彻和复杂结构多层目标及宽速度范围的适应性不足。利用小波变换提取过载信号的小波系数[3],匹配滤波提取过载信号的包络等方法相较于幅值识别算法进一步提高了计层的准确性,但需要计算多个中间过程,且在一定程度上依赖先验参数,需针对不同战斗部、不同靶板、不同工况设置不同阈值。文献[4]采用时频分析法研究弹体主轴方向加速度信号的Choi-Williams能量分布特征,提出以侵彻过程加速度信号的能量分布为依据的层识别方法。文献[5]利用短时傅里叶变换对过载信号进行处理,通过分析频率成分及梯度提取完成层识别。这两种方法对复杂信号的识别能力较为精准,但均为事后分析非实时处理,难以应用到硬件电路。

本文针对此问题,提出基于数据增强的侵彻引信准确层识别神经网络方法。与信号处理方法不同的是,深度学习具备自己获取知识的能力,即从原始数据中提取模式识别的能力,能够自主分析决策,解决涉及现实世界知识的问题。将神经网络引入目标层识别算法,通过对侵彻多层粘连过载信号进行学习与训练,自主认知战斗部侵彻多层硬目标的过程,自适应调整模型参数,可以有效提升层识别算法的准确性,使引信获得精确计层起爆控制能力。

1 数据增强

大量研究和实验表明,神经网络在拥有足量数据的情况下具有极其强大的非线性映射能力,但当数据量较少时,识别效果不理想,因此获取大量数据是神经网络工作的关键。然而由于侵彻试验成本高昂,无法收集足够多的过载信号来训练神经网络模型,而利用数据增强方法对已有样本进行处理,可以显著缓解训练数据缺乏的问题。

本文将抗高过载电子数据传感记录器置入战斗部,通过侵彻多层试验方法获取战斗部侵彻多层硬目标的加速度信号,采用线性抽取与插值、添加自适应噪声的方式将实测小样本数据进行扩展。

1.1 线性抽取与插值

线性抽取与插值是丰富离散数据的有效方法,也是神经网络数据增强的常用手段。过载信号作为随机振动信号无法使用确定性的插值函数来拟合曲线,因此本文采取连续均匀插值法,计算相邻两点的均值进行数据填充,实现对实测过载信号的等倍数压缩和扩展,例如将6 000点的数据插值为12 000点或者将6 000点的数据抽取为3 000点,将每条实测信号扩展为原数量的两倍,实测信号与经过抽取和插值后的样本对比如图1所示。

图1 实测信号与经过抽取和插值后的样本对比Fig.1 Samples of the measured overload signal after extraction and interpolation

从图1可以看出过载数据在抽取和插值前后没有显著变化,在时域内保持了波形的一致性,信号功率随频率的变化趋势相同,具有相似的频谱特征,在扩展样本的同时增加了数据多样性。

1.2 添加自适应噪声

文献[6]发现神经网络非常容易受到对抗样本的攻击,对抗样本是指对原样本产生一些人眼可能无法察觉的微小扰动,分类器却会输出完全不同的预测结果,甚至以高置信度错误分类。为提高神经网络正确处理对抗样本的能力,最近的一些工作在模型训练阶段向输入的数据集中添加随机噪声[7],实现网络正则化,从而增强模型的鲁棒性;然而这些方法所添加的噪声均服从同一分布,具有相同的均值和标准差,没有考虑到神经网络对不同数据的敏感度不同。因此,本文使用添加自适应噪声的数据集训练神经网络,首先对每个过载信号样本进行功率谱分析,在功率集中的地方添加较多噪声,有效降低模型对序列变化的敏感性,提高神经网络对抗扰动的能力,在敏感性较小即功率分散的地方添加较少噪声,提高模型的识别精度。

图2显示了过载信号与添加普通随机噪声和自适应噪声的不同。其中(a)为普通随机噪声,(b)为该随机噪声的功率谱估计,(c)为根据过载信号不同敏感度产生的自适应噪声,(d)为该自适应噪声的功率谱估计,(e)为原始过载信号,(f)为该原始信号的功率谱估计,(g)为将普通随机噪声添加到过载信号的样本,(h)为添加随机噪声的功率谱估计,(i)为将自适应噪声添加到过载信号的样本,(j)为添加自适应噪声的功率谱估计。

图2 原始信号与添加普通随机噪声和自适应噪声对比Fig.2 Comparison of the original signal with the addition of random noise and adaptive noise

从图2可以看出,原始信号的中心频率分布在1 kHz左右,其他谐波主要分布在(1.5, 2.5)kHz区间内,而添加随机噪声的信号中心频率变为1 kHz和2 kHz两个波峰,其他谐波分布区间变为(2.2, 10)kHz区间内,完全丧失了原始信号的频谱特征,而添加自适应噪声的信号中心频率依然分布在1 kHz左右,其他谐波也分布在(1.5, 2.5) kHz区间内,在提高网络对抗能力的前提下仍然保留了原始信号的特征,因此本文采用的自适应噪声能够更好地增强神经网络的抗干扰能力,与此同时将每条实测信号扩展为原数量的5倍,实现数据扩充。

2 基于数据增强的侵彻引信准确层识别神经网络方法

神经网络是由具有适应性简单单元组成的广泛并行互连网络,它的组织能够模拟生物神经系统对真实世界物体作出的交互反应。神经网络最基本的组成成分是神经元模型,如图3所示,即上述的“简单单元”[8]。

图3 神经元模型Fig.3 Neuron model

神经元接收来自其他神经元传递的输入信号x1,x2,…,xi,…,xn,这些输入信号通过带权重的连接w1,w2,…,wi,…,wn进行传递,然后将其与神经元阈值θ比较,通过激活函数处理产生输出y:

(1)

其中,Relu函数是目前最常用的激活函数之一[9],表达式如下:

f(x)=max(0,x)

(2)

由式(2)可以看出,神经元在输入负值的情况下不被激活,这意味着同一时间内只有部分神经元被激活,这种单侧抑制的性质使神经网络变得稀疏,极大提高了模型的计算效率。

将神经元的每个结点都与下一层所有结点相连就得到了神经网络的全连接层,如图4所示。

图4 全连接层Fig.4 Fully connected layer

2.1 数据集

在深度学习中,数据集一般分为独立的三部分:训练集、验证集、测试集,其中训练集用于学习样本数据,学习完毕后验证集对模型进行准确率评估,测试集作为模型在学习与训练过程中从未出现的数据,用于检验模型的泛化能力,也就是模型在全新数据上的识别能力。

本文从实测侵彻多层过载信号库中抽取试验数据187条,通过分析剔除不完整数据后用于建模的实测数据为162条,实验室仿真数据412条,采用数据增强生成的数据1 031条,总数据集为1 605条,其中1 120条作为训练集,485作为验证集。

模型的输入是经过归一化后的序列数据,标签为人工标记的层识别信号,具体而言,通过分析每条过载信号的包络同时结合侵彻试验信息在侵彻体穿出靶板至穿入下一层靶板的间隔内标记一个幅值为200的识别信号,其余时刻幅值均为0,如图5所示。

图5 训练集中的样本数据Fig.5 Data from training set

2.2 超参数选取

超参数是神经网络训练开始前人为设置的参数,而非模型经过训练习得的参数。通常情况下需要对超参数进行不断调试与优化,确定一组最优值以提高网络的学习的能力和效率。超参数包括学习速率、优化器、网络深度、隐藏单元数、Epoch等。

学习速率被认为是最重要的超参数,它决定了参数每次更新的幅度,如果学习速率太小,会使收敛过慢;如果学习速率太大,则会导致损失函数振荡甚至使梯度下降法越过最低点进而发散。

通过选取不同学习速率,对比各学习速率的识别准确率后使用指数衰减式学习速率,曲线变化如图6所示。初始学习速率α0=10-7,衰减步长T=1.0,衰减速率β=0.98,即:

(3)

图6 指数衰减学习速率曲线Fig.6 Exponential decay learning rate curve

神经网络学习的目标是寻找合适的参数使损失函数尽可能小,解决这个问题的过程称为最优化,解决这个问题使用的算法叫做优化器,一个好的优化器总能够快速可靠地找到最小值,而不会陷入局部极小值、鞍点或高原区域。本文采用Adam优化器,它同时兼顾了Momentum优化器和RMSProp优化器的优点,使用跟踪梯度平方和的方式在不同方向调整梯度,实践效果非常好,是深度学习的常用选择。

深度学习另一个重要的概念是Epoch,每学习一遍数据集,就称为1个Epoch。神经网络只运行一个Epoch是远远不够的,而运行过多Epoch又会导致模型陷入过拟合问题,也就是模型只能在训练数据中达到满意效果而无法适应新数据。经过不同的尝试后,Epoch=2 000时模型的学习效果最好。

2.3 层识别神经网络模型

针对侵彻多层粘连过载信号特征建立神经网络模型,网络深度共六层,第一层是Flatten层,将输入一维化;第二层到第五层为全连接(Dense)层,使用Relu函数激活,用于拟合层识别信号;最后一层为300个神经元的Dense层,即每300个点输出一次预测结果,完整的层识别神经网络模型如图7所示。

图7 层识别神经网络模型Fig.7 Layer recognition neural network model

2.4 识别实时性

假设神经网络的可训练参数为M,那么完成线下训练后由Dense层构成的模型进行层识别需要运行的乘法指令为M个,加法指令为M-1个。本文构建的层识别模型参数数量如图8所示,可训练参数为148 652,因此运行的乘法指令为148 652个,加法指令为148 651个。若选用STM32F7系列芯片每次预测时间约为2.1 ms,能够满足层识别的实时性要求。

图8 层识别神经网络的参数量Fig.8 The number of parameters for layer recognition neural network

3 仿真验证

在Anaconda科学计算平台使用TensorFlow 2.0深度学习框架进行层识别神经网络的训练与验证,选用MSE均方误差作为损失函数评估模型的识别效果,其变化曲线如图9所示,经过2 000个Epoch后,训练集的损失约在18.452 2~19.058 3,验证集的损失可达3以下,其中由幅值带来的误差占总损失的98.4%,而幅值误差对计层准确度不产生影响,因此层识别误差仅有1.6%。

图9 训练集和验证集的损失函数Fig.9 Loss function of training set and validation set

使用多组未曾在学习与训练过程中出现的靶场实测过载信号组成测试集,模型输出的层识别信号符合标签信息,可以实现精确计层,其中一组复杂粘连过载层识别模型预测结果如图10所示。

图10 层识别神经网络模型的预测结果Fig.10 Prediction results of layer recognition neural network model

4 结论

本文提出基于数据增强的侵彻引信准确层识别神经网络方法,该方法针对粘连过载特征构建全连接神经网络模型,通过对过载信号进行抽取、插值及添加自适应噪声将实测小样本数据扩展为较大样本,实现数据增强,层识别神经网络模型使用数据增强后的数据集进行学习与训练,自主认知战斗部侵彻多层硬目标的过程,自适应调整模型参数。仿真验证结果表明,该方法不依赖先验参数,能够对不同靶板、不同战斗部、不同工况下的侵彻多层过载信号实现准确计层。

猜你喜欢
插值噪声神经网络
基于神经网络的船舶电力系统故障诊断方法
“白噪声”助眠,是科学还是忽悠?
滑动式Lagrange与Chebyshev插值方法对BDS精密星历内插及其精度分析
滑动式广义延拓插值法在GLONASS钟差插值中的应用
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
基于声类比的仿生圆柱壳流噪声特性研究
不同空间特征下插值精度及变化规律研究
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
要减少暴露在噪声中吗?