基于CNN和BiLSTM的地震检测漏报优化算法

2023-02-27 10:35张文浩
智能计算机与应用 2023年2期
关键词:卷积准确率噪声

张文浩, 尹 玲

(上海工程技术大学 电子电气工程学院, 上海 201620)

0 引 言

为了最大程度上减轻地震带来的灾害,各国政府越来越关注地震预警相关系统的研究与建设工作,许多国家都相继建设GPS观测网并投入使用,为地震预警工作提供了大量的观测资料[1]。地震预警技术作为目前国际上公认的能够减轻地震灾害的有效手段之一,可有效减少地震带来的人员伤亡及财产损失[2]。因此研究准确地震检测算法对抗震减灾、地震定位等研究有重要意义。

自长时窗平均/短时窗平均(STA/LTA)被提出以后,在此基础上衍生了很多改进方法,谭玉阳等[3]针对微震事件,根据噪声振幅、偏振等差异提出SLPEA算法,根据信噪比的不同构建不同检测函数来对地震波形进行提取;刘晓明等[4]引入权重因子K构建特征函数,使用全局最大的确定p波初至时刻;张小红等[5]使用S变换对近震台站的高频GPS信号进行p波拾取,与强震仪数据相对比得到较吻合的结果。随着深度学习技术的发展,越来越多的研究人员将深度学习用于地震检测中,Ross等[6]利用卷积神经网络来检测地震相位,可在低信噪比的情况下进行拾取;Perol等[7]搭建神经网络,利用单一波形对地震进行分类,输出0为噪声,1-6对应6个区域的地震;李建等[8]搭建多任务卷积神经网络,输入为台站三分量数据,实现对震相的检测和到时的估计;刘佳楠等[9]使用全卷积神经网络区分初至波和背景噪声,在高噪声的环境下取得较好结果;Dokht等[10]使用深度卷积网络提取地震信号和噪声信号的一般性特征,使用不同频域的地震波作为输入,完成对地震事件的检测。

目前基于深度学习的到震检测研究较少,最常用的方法仍是利用能量特征差异进行检测工作。该方法主要用于高信噪比的数据,对于信噪比较低、能量较弱的GPS数据易出现漏报。本文提出一种融合区域特征的CNN-BiLSTM分类模型,降低到震检测过程中的漏报率,并与融合区域特征的预测模型及单独的CNN、BiLSTM模型对比来验证本文方法的有效性。

1 数据预处理

在训练神经网络时,数据预处理工作至关重要,预处理的效果将直接影响模型的训练效果,影响网络是否收敛[11]。因此本文在数据预处理时对其进行数据清洗、归一化操作,并探究小波降噪对实验的影响。

1.1 数据来源

本文使用的高频GPS时间序列数据来自新西兰GEONET地震信息网,收集2008~2018年间新西兰北岛地区最小4级到最大8.8级共214个历史地震事件中多个监测台站记录的高频GPS数据,数据频率为1 Hz。每个监测台站有X、Y、Z3个方向的观测数据,以3个台站3个方向上的高频GPS时间序列为一个样本,最后得到训练集6 124条样本,测试集679条样本。

1.2 缺失值处理

首先对高频GPS数据进行处理,根据解算质量对台站数据进行筛选,只有少量的数据出现缺失值,为保证数据的完整性及预测结果的准确性,补全缺失值,常用的缺失值处理方法有平均值填充、特殊值填充、数据补差。本文使用平均值补差方法,用周围数据均值进行填充。

1.3 数据归一化

在深度学习训练过程中需要让数据在尺度上具有一致性,归一化可提高模型优化算法的收敛速度。本文使用Min-Max归一化对每个分量进行计算,归一化公式如式(1)所示:

(1)

其中,Ai为数据每个分量的值;Amax为每条数据分量中的最大值;Amin每条数据分量中的最小值。

1.4 小波降噪处理

由于高频GPS观测数据会受到多路效应及接收机噪声干扰,噪声基底较大,可能会对序列分析造成一定干扰,需要进行降噪处理。使用小波阈值降噪对高频GPS数据进行处理,使用信噪比(Signal Noise Ratio, SNR)、偏差(BIAS)、均方根误差(Root Mean Square Error, RMSE)作为评价指标探究不同小波基、分解层数对降噪效果的影响。SNR为信噪比,该指标反应降噪后的数据中真实信号及噪声信号的比重,SNR的值越高说明信号中的噪声越少,计算公式(2);BIAS表示未降噪信号与降噪后信号的偏离程度,理想情况下为0,计算公式(3);RMSE用来表示原始信号与降噪后信号两个时间序列的离散程度,RMSE的值越小说明降噪后信号的离散程度越小,降噪效果越好,公式(4)所示:

SNR=10*log10(psignal/pnoise)

(2)

(3)

(4)

小波阈值降噪的关键是对小波基、分解层数及阈值进行选择,使用Symlet小波基处理高频GPS时间序列,尝试使用不同的小波基(sym2-sym7)并固定其他变量来比较评价指标的优劣,根据实验经验将小波分解层数设置为3,阈值函数使用平滑阈值函数,得到的评价指标参数见表1。由表1可知,使用sym6作为小波基进行降噪,得到的SNR最高、RMSE最小、BIAS的结果也较为理想,说明使用sym6作为小波基对序列进行降噪能最大程度上减少时间序列中的噪声并保持序列的相对稳定。

表1 不同小波基对应的评价指标

在确定小波基后,需要确定分解层数,尝试1~4层分解进行去噪,得到的各项指标见表2。由表2可知,使用1层分解的效果最好,得到了的较低RMSE及较高的SNR,BIAS的偏离程度只比分解成2层略差。因此小波基选用sym6,分解层数为1层时有较好的降噪效果。

表2 不同分解层数对应的评价指标

2 基于CNN-BiLSTM神经网络的地震分类模型

2.1 LSTM网络原理

长短期记忆(Long short-term memory, LSTM)神经网络是一种特殊的循环神经网络,不同于单只包含单一结构的神经网络,LSTM`使用4种不同的门结构,主要为了解决在长序列训练时出现的梯度消失和梯度爆炸问题,LSTM单元结构如图1所示。

图1 LSTM单元结构

LSTM通过输入门、遗忘门、输出门结构让时间序列中的信息有选择性的通过。遗忘门要决定从上一个状态中舍弃哪些信息,输入为前时刻的输出ht-1和当前的输入xt输入到σ函数,σ函数公式(5):

(5)

遗忘门输出ft的计算公式如公式(6)所示:

ft=σ(Wf*[ht-1,xt]+bf)

(6)

其中,Wf为遗忘门的权重,bf为偏置项。

输入门决定让多少信息进入到细胞状态中,可以利用当前时刻的输入xt和上一时刻的输出ht-1通过σ函数决定更新的信息ii,公式(7):

(7)

其中,Wi为输入门权重,bi为偏置项。

用xt和ht-1通过tanh层得到临时细胞状态C't,公式(8):

(8)

其中,Wc为细胞单元权重,bc为偏置项。

(9)

输出门决定了从细胞状态中输出哪些信息到下一神经元,将当前时刻的输入xt和上一时刻的输出ht-1通过σ函数来确定输出信息Ot,公式(10):

Ot=σ(Wo*[ht-1,xt]+bo)

(10)

其中,Wo为输出门权重,bo为偏置项。

将输入门的结果经过tanh函数,最后将两者相乘得到LSTM单元的输出ht,公式(11):

ht=Ot*tanh(Ct)

(11)

2.2 CNN-BiLSTM网络结构

LSTM模型解决了循环神经网络中存在的循环依赖问题,但是该网络只使用了单向的过去信息,而没有使用未来的信息。为了更好地学习GPS时间序列的变化趋势及局部特征,本文使用双向长短时记忆网络(Bi-Directional Long Short Term Memory,Bi-LSTM),同时学习时间序列的过去及未来相关的信息。首先使用卷积神经网络(Convolutional Neural Network,CNN)提取时间序列中的短时小尺度特征信息,再送入Bi-LSTM网络提取长时序信号的关联信息。卷积网络使用深度为1的2D卷积,shape为(1,64,(3,9)),卷积核个数为64,卷积核大小为3,为了防止过拟合的发生加入dropout层,在网络的随机区域进行稀疏性限制,最后利用全连接和sigmoid实现噪声-事件的二分类,融合区域特征的CNN-BiLSTM分类模型框架如图2所示。

图2 融合区域特征的CNN-BiLSTM分类模型框架

CNN-BiLSTM的地震检测算法过程示意图如图3所示。整个流程可分为数据预处理部分及神经网络处理部分。数据预处理部分将原始波形中的地震片段进行分割组成数据集,再对数据使用小波阈值方法进行降噪及数据的归一化操作;神经网络由输入层、CNN层、Bi-LSTM层、及输出层组成。输入为长度38 s的时间序列片段,其中含30 s的到震前序列及8 s的震后序列,特征维度为3个台站的三分量数据;使用卷积提取维度间短期的相关特征;双向循环神经网络叠加了正向和反向的LSTM层,并将输入的正向数据输入正向LSTM层,计算从1到t时刻值,输入的反向数据输入反向LSTM层,计算从t到1时刻的值,并把正向LSTM及反向LSTM层相应时刻的隐藏层状态连接;再将双向LSTM输出的向量进行全连接,经过sigmoid运算后输出分类结果。

图3 融合区域特征的CNN-LSTM分类模型计算过程示意图

2.3 模型评估

使用准确率、精确率、召回率作为评价指标对训练模型进行评估,精确率越高说明模型对地震事件的误检率越低,召回率越高说明模型的漏检率越低,准确率、精确率、召回率公式分别如式(12)~式(14)所示:

(12)

(13)

(14)

其中,Tp为正样本被正确预测的样本数量;Fp为负样本错误预测为正样本的数量;TN为负样本正确预测为负样本的数量;FN为正样本错误预测为负样本的数量。

使用新西兰地区高频GPS数据对模型进行训练,并探究数据降噪、学习率、网络层数及dropout值等参数对结果的影响,分别使用经过降噪及未经过降噪的数据训练网络,未经降噪处理时得到的模型准确率为92.3,%,降噪后准确率提升为95.22%。对dropout参数进行调优,依次调整dropout值为0.2、0.3、0.4、0.5进行训练,实验结果显示当dropout的值取0.3时准确率较高;使用多个不同的学习率对模型进行训练,不同学习率下损失函数的变化如图4所示,当学习率为0.000 3时收敛速度较慢,当选择学习率0.000 8时可以较快收敛且损失函数值较低,当学习率为0.001 5时,虽然能够较快收敛,但是不够稳定存在一定的震荡现象。

图4 不同学习率下的loss曲线

不同的卷积网络层数进行试验,试验结果见表4,采用一层的卷积神经网络得到的准确率、召回率及精确率较低,使用两层的卷积神经网络比3层卷积的检验结果较高,且较深的网络会增加模型训练所需的时间,综合考虑模型的精度和训练所需要的时间,本文最终选取两层的卷积神经网络结构。

表4 不同卷积层数的检测结果

训练时使用ADAM作为优化器,使用交叉熵作为损失函数来优化参数,经过对学习率、网络层数、dropout等参数进行调优后,模型在训练集上的准确率达到了97.03%,此时学习率、网络层数、batch size、dropout的值分别为0.000 8、2、64、0.3。

3 实验结果及对比分析

为验证模型的实际检验能力,本文选取训练的最优模型对新西兰北岛地区台站记录的地震波形数据及无震噪声数据进行检测。该模型训练了200个epoch后,在训练集上精确率为97.03%、召回率为96.48%、准确率为97.51%。使用该模型对由316个地震波形和363个噪声波形组成的测试集进行测试,得到测试集上的准确率为91.45%、召回率为90.5%、精确率为91.08%。

单独使用CNN分类器、Bi-LSTM分类器及融合区域特征的预测方法对316个地震波形和363个无震噪声波形组成的测试集做对比实验,不同模型的检出结果对比见表5。由表5可知,本文提出的分类模型与预测模型相比提高了5.69%的召回率,降低了漏检率,同时其他指标也比预测模型及单独的Bi-LSTM及CNN模型有所提高。

表5 不同模型的检出结果对比

4 结束语

本文提出一种融合区域特征的CNN-BiLSTM分类模型来降低地震检测的漏报率。首先,在预处理过程中使用小波阈值方法对高频GPS数据去噪;其次,训练并调优CNN-BiLSTM模型进行地震检测,通过与融合区域特征的预测模型、单Bi-LSTM模型及单CNN模型进行对比实验。实验结果表明,本文提出的分类模型相比融合区域特征的预测模型对召回率有较大提高,能有效降低漏报率,并且检测的准确率等指标要比单独的CNN、BiLSTM模型要高,提升了模型的可靠性。

猜你喜欢
卷积准确率噪声
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
噪声可退化且依赖于状态和分布的平均场博弈
从滤波器理解卷积
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法
控制噪声有妙法
一种基于白噪声响应的随机载荷谱识别方法