文仕强,田 斌,梁 冰,葛友铖
(武汉工程大学 电气信息学院,武汉430205)
工频磁场具有频率低、波长长、分布广泛等特征[1],世界各国输变电网络均能在空中和海域产生分布均匀、强度稳定的可探测工频磁场,工频磁场探测技术可对低噪声、低热辐射、高消磁的重要目标进行探测[2],可作为传统探测技术的有效补充探测手段,工频磁场探测与反探测技术在目标探测、空中电磁污染探测等领域逐渐成为国内外研究热点[3]。
近年来,国内外多个课题组开始研发具有集成电路功能的高精度感应式磁传感器,能利用集成电路高效快捷处理原始数据,使之转化为多特征时间序列信号[4]。
目前,对地面及空中目标活动的探测与识别是当前工频磁场探测的热点之一[5]。主流方式是基于时间序列的特征提取,主要分为三类:提取时域特征、提取频域特征、提取时频域特征[6]。而时间序列异常检测(ADD)方法则包括集成学习、深度学习、浅层神经网络、小波变换、K 近邻算法等方法[7-8]。从上述方法在磁异常方向的应用效果来看,对磁异常信号的探测精度仍难以达到较高水平,具有较高的漏报与误报率。
为解决上述问题,本文通过复杂观测环境下的工频磁场探测信号进行统计分析,提取数据进行时域特征,提出结合CNN、LSTM 与Attention 机制结合的新型预测模型,导入不同类型目标信号以及复杂背景下无目标背景信号训练模型,同时在测试集中加入了未经训练目标扰动数据,将不同目标模型预测信号与测试数据比对,获取差值并进行加权平滑,设置滑动窗口对时间序列数据进行检测,结合CNN、LSTM 与Attention 机制的新型预测模型可在较大范围(20 m 内)有较高精度。
本文中所提出的工频磁场探测系统示意图如图1所示。三轴感应式磁传感器从环境中采集原始时间连续信号f(t),再将其转化成时间序列数据{fn},最后对{fn}进行目标扰动信号探测。首先对{fn}的时域信号做特征工程提取,即根据多维度磁异常数据的时间序列信号不同维度相关性、不同状态下工频磁信号差异等特征,提取各状态下工频磁场时域信号序列},再将二者分别输入至CNN、LSTM 与Attention 机制结合的新型预测模型训练,生成网络模型作为异常检测器,用来检测工频磁场扰动信号。
图1 模型结构图Fig.1 Model structure
复杂条件下的磁场信号是连续时间信号f(t),传感器以时间间隔Δt=2 ms 进行采样得到离散信号f(n·Δt)≡f_n(n=1、2、3、…、N-1),其中N为信号长度。
工频磁场数据背景场信号不稳定,为分离出扰动信号与背景场信号,本文采用欧几里得距离法分离出异常信号与背景信号,通过取同轴近邻两个位置数据为x,y,每次检测共取6 组数据分别来自X、Y、Z轴,所以在数据中取得两近邻点下标为x_x、y_x、x_y、y_y、x_z、y_z,其欧几里得距离可表示为
式中:i=x、y、z,分别表示3 个维度数据。
为避免单个数据异常造成误判,本文将设置一个阈值,仅当临近簇的异常数据点大于阈值,才定义为异常信号。
本文将CNN、LSTM 两种网络和Attention 注意力机制融合在一起合成一种新的神经网络,用于各种序列连续识别任务。对于磁场信号建模能力来说,CNN 擅长减小频域变化[8];GRU 可以提供长时记忆,在时域上有着广泛应用[9];Attention 机制能有效聚焦关键特征,所以将三者联合进行特征提取,用聚类方法进行异常检测,可以获得比单独网络更好的性能[10]。
本文所采用模型结构如图2所示,先使用一维conv 层提取特征以提供良好的学习效果[11],再通过LSTM 层与Attention 机制良好的时间序列特性,集中于重点特征训练,从而达到良好训练效果[12]。
图2 CNN、LSTM 与Attention 机制结合的神经网络结构Fig.2 Neural network combining CNN,LSTM and Attention mechanism
实验地点位于武汉市某生活区,环境相对复杂,车流量较多,能模拟真实场景。实验50 Hz 背景场信号如图3所示。由图3 可知,实地背景场情况与工频磁场信号理论情况类似,三轴幅值基本稳定在0.2~1.4 nT 左右,且基本呈现正弦信号图像。
图3 三轴传感器50 Hz 磁场幅度随时间变化图Fig.3 Variation of 50 Hz magnetic field amplitude of triaxial sensor with time
传感器系统采集连续时间序列信号,其中包括有目标、背景场信号,使用Matlab 绘制图形如图4所示,结合图3 可看出,总体信号由背景信号与目标信号叠加形成。
图4 扰动信号实测图Fig.4 Measured disturbance signal
对原始信号做傅里叶变换后提取出50 Hz 特征图,并提取50 Hz 信号特征,如图5所示。显然,X、Y、Z轴数据分别聚焦于0.2~0.39 nT、0.17~0.32 nT、1.18~1.75 nT 之间,利用Attention 机制很容易将注意力权重集中于重点段区域。
图5 X、Y、Z 幅值分布图Fig.5 X,Y and Z amplitude distribution
本组实验中神经网络的输入分别是原始数据50 Hz 傅里叶变换之后的时间序列数据。样本被分为20%的训练集和80%的测试集。为使模型具有更强的泛化能力,本实验将不同距离、不同车速随机输入模型。网络训练样本总数为349151,测试样本总数为846580。将训练样本每10 个点(1 s)作为一个滑动窗输入至网络中训练,得到的损失函数与测试准确率如图6所示。
图6 CNN+LSTM+Attention 网络X 轴拟合图像Fig.6 Fitting image to X-axis of CNN,LSTM,Attention network
图7 中可见该方案获得了较好的损失值,能很好地捕捉不同车辆出现的时间,同时将其与其他单一模型对比。
图7 多轮断点续训后损失值Fig.7 Loss values after multiple rounds of breakpoint training
表1 显示该模型比其他单一模型具备更好的拟合能力,能更准确地判断目标的出现。
表1 CNN-LSTM-Attention 模型与其他单一模型预测结果对比Tab.1 Comparison of the prediction results of the first mock exam model with the CNN-LSTM-Attention model
在深度学习拟合获得良好效果之后,由于扰动样本不足,采用结合了阈值法和欧几里得距离法的算法对84 组目标信号进行分类(有目标和无目标),分类结果如表2所示。
表2 实际分类准确率Tab.2 Actual classification accuracy
时间序列在复杂环境下的磁场探测中变得非常重要。现有的大多数方法计算复杂度高或预测精度低。为此,本文提出了一种新的深度学习框架(CNN、LSTM 与Attention 机制结合的神经网络)对多元时间序列进行分类。该模型从每个通道的单变量时间序列中自动学习特征,并在最后一层将所有通道的信息结合起来作为特征表示。将传统的MLP 连接起来进行分类。最后,基于实测自制数据集上评估了模型。实验结果表明,该模型在实测过程中有较低的拟合误差和较高的分类准确率。这为进一步对复杂环境下的磁场异常信号检测研究提供了基础。