基于Inception-GRU 模型的泄洪建筑物结构安全状态智能识别

2022-12-20 10:34陈浩东庞博慧
人民黄河 2022年12期
关键词:卷积准确率神经网络

刘 昉,陈浩东,梁 超,庞博慧

(1.天津大学水利工程仿真与安全国家重点实验室,天津 300354;2.华能澜沧江水电股份有限公司,云南 昆明 650214)

1 引 言

近年来一系列300 m 高坝大库相继建设完成,这些工程身处高山峡谷之中,在巨大的水头落差作用下,泄洪建筑物内的高速水流可达50 m/s,内部结构极易发生破坏。 内部结构破坏后若继续承受水流的冲击荷载,会引发严重的安全事故,如美国胡佛拱坝泄洪洞内发生的空蚀破坏,最终导致了超过5 000 m3的混凝土及岩体破坏。 因此,为保障水利枢纽的泄洪安全,有效识别泄洪建筑物的结构安全状态十分必要。 杨弘等[1]、练继建[2]研究指出泄洪建筑物的结构安全状态与结构振动位移相关,并提出通过振动信号判断结构安全状态的理论,但缺少具体的计算方法,实际使用中存在较大困难。 传统的识别方法通常需要通过先验知识,人工选择判断指标,因此人的因素决定了方法的优劣,存在明显的局限性。

随着深度学习的发展,智能识别在各个领域逐渐得到广泛应用。 深度神经网络能够通过多次非线性变化,自适应地从数据中提取特征。 智能识别就是运用这种特征提取能力,在大量的已识别数据中自主学习最佳的识别特征,进而识别目标数据的所属类别。 黎阳羊等[3]提出了一维卷积神经网络和长短期记忆网络相结合的混合模型,能够通过齿轮箱振动信号有效识别齿轮箱故障类型。 李大柱等[4]结合车辆车轮振动信号的特征,提出了基于多尺度时频图与卷积网络的车轮故障智能诊断方法,准确率高达97%。 周谦等[5]将力和振动信号转化为二维频谱图,输入VGG13卷积神经网络,成功实现了对生产刀具磨损状态的监测。 然而,这些识别方法是针对单点振动数据提出的,泄洪建筑物结构安全状态识别的输入信号却是多测点振动数据,因此方法和数据之间不能很好地匹配。 本文以Inception 模块为主体结构,结合门控循环单元(GRU)和高效通道注意力(ECA)机制,提出了一种Inception-GRU 深度神经网络模型,其能够通过多测点泄洪振动数据,对泄洪建筑物的结构安全状态进行智能识别,并通过实测振动数据进行测试,验证该模型的识别效果。

2 相关理论简介

2.1 Inception 模块

卷积神经网络(CNN)是针对图像任务提出的神经网络结构,在许多领域得到了广泛应用,通过卷积核在特征图上的滑移操作,能够逐层提取深层特征。 增大网络的深度和宽度是提高网络性能的主要方式,但会导致过拟合和网络难以训练的问题[6]。 Inception 模块是解决这些问题的有效方法(基本结构见图1),它对同一层特征图使用不同尺寸的卷积核进行特征提取,然后通过1×1 卷积核进行通道降维,最后对通道拼接汇总提取特征信息[7]。 基于 Inception 模块的结构,使得在扩展网络宽度的同时,参数量保持相对不变。

图1 Inception 模块基本结构

批标准化(BN)一般在卷积层和激活函数之间使用,它在通道维度上对数据进行归一化处理,能够有效地解决梯度消失问题,减少过拟合现象,提高训练速度[8]。 批标准化公式如下:

式中:μB为训练批次的平均值为训练批次的方差;m为训练批次单通道的数据量分别为标准化前、标准化后、缩放平移后特征图上的第i个数据;γ、β分别为空间缩放、空间平移的控制因子;ε为保证方差为0 时计算可正常进行的常数。

2.2 门控循环单元(GRU)

循环神经网络(RNN)是针对时序信号提出的神经网络结构,能够存储和分享不同时刻的信息,并共享权重因子,进而学习不同时刻输入间的隐藏信息,被广泛应用于自然语言处理(NLP)领域。 GRU 是基于RNN 的一种优化模型(单元内部结构见图2),解决了传统循环网络反向传播过程中出现的梯度消失问题,能自适应地学习不同时间尺度间的依赖关系[9]。

图2 GRU 单元内部结构

GRU 单元使用重置门和更新门控制单元的信息流动,重置门用于控制记忆信息的保留程度,更新门用于控制输入信息和记忆信息的结合程度。 GRU 单元结构相对简单,参数量约为长短期记忆神经网络(LSTM)的3/4,性能表现基本相当,适用于构建较大的网络模型。 GRU 单元内信息更新公式如下:

式中:zt、rt分别为更新门、遗忘门;σ为 Sigmoid 函数;为Hadamard 乘法;xt为当前时刻的输入为当前时刻 GRU 单元内的隐藏信息;ht-1、ht分别为t-1 时刻、t时刻 GRU 单元内的记忆信息;Wxu、Wxr、Wxh、Whu、Whr、Whh为权重矩阵;bu、br、bh为偏置矩阵。

2.3 高效通道注意力(ECA)

通道注意力机制能够计算特征的重要程度,赋予特征不同权重,进而提升网络对主要特征的敏感程度。ECA 机制是一种超轻量注意力模块(内部结构见图3),避免了SENet 中的通道降维操作及可能带来的负面影响,能以较小的参数量获取网络性能的显著提升[10]。

图3 ECA 内部结构示意

ECA 机制首先对输入的特征图进行全局平均池化(GAP),然后对得到的向量进行快速一维卷积,在使用sigmoid 函数激活后获取通道的权重,最后将通道权重和输入特征图相乘就能得到具有通道注意力的特征图。 一维卷积尺寸k决定着跨通道信息交互的覆盖范围,可以通过下式进行计算:

式中:C为特征图的通道数;|·|odd为距离“·”最近的偶数;γ、b分别为 2、1。

3 模型构建

3.1 模型结构

Inception-GRU 模型的结构如图4 所示,大致分为3 部分,分别为 CNN 模块、Inception 模块、GRU 模块。模型的输入为三维特征矩阵,尺寸为4 × 8 × 10,首先通过2 个二维卷积层组成的CNN 模块初步提取浅层特征,然后通过Inception A、Inception B、Inception C 3 个子模块逐步提取深层特征,接着再以时序的方式输入GRU 模块,汇总子时间段内的切片信息,最后通过Softmax 激活函数输出识别结果。

图4 Inception-GRU 模型结构示意

InceptionA、Inception B、Inception C 是 Inception基本结构进行卷积核分解后得到的3 种优化结构(内部结构见图5),它们在保持感受野不变的情况下,提升了网络的非线性表达能力[11-12]。 3 种优化结构分别适用于不同尺寸和通道数的特征图,Inception A、Inception B结构在网络前期表现较好,Inception C 结构则适用于网络后期。

图5 Inception 优化结构示意

Inception-GRU 模型的具体参数见表1。 Inception结构由左至右为分支1、分支2、分支3、分支4,表1 中相关参数为对应分支的卷积核数量和池化类型。

表1 Inception-GRU 模型结构参数

3.2 数据预处理和数据增强

模型识别的输入信号为泄洪建筑物受水流脉动影响的振动信号,该信号的时域、频域统计量对结构变化敏感,具有良好的表征能力。 因此,对于原始的振动信号,进行数据预处理时,选取7 个时域统计量和3 个优势频率形成特征矩阵作为模型的输入。

数据增强是指通过增加数据的多样性,来增强模型的泛化能力,以在测试集和实际应用中取得更好的表现。 本试验通过在固定时长内随机抓取振动片段的方式,增加单条数据的随机性,实现对振动信号的数据增强操作。

4 模型测试及评价

4.1 试验数据

本试验采用某水电站的8 个测点振动数据来测试模型的性能,振动数据共5 704 条,标签类别为正常状态、异常状态A、异常状态B 和传感器故障4 类,每一类各1 426 条数据。 在数据预处理和数据增强后,数据以三维特征矩阵的形式输入模型(见图6)。

图6 数据输入模型示意

为进一步验证模型的识别能力,应对异常状态和传感器故障类别的数据进行矩阵随机行变换,从而增强数据的随机性和模型的泛化能力。 试验中训练集、验证集、测试集的数据比例为8 ∶1 ∶1,用随机分层抽样的方式进行划分,以确保样本集之间数据分布的均匀和相似。

4.2 设置训练参数及评价指标

模型训练时使用SGDM 优化器,动量因子为0.9,使用L2 正则化选项;学习速率为0.01,使用余弦退火算法进行衰减;批数据量为128,训练次数为100 次,损失函数使用交叉熵损失函数。 在模型评价时,选用准确率作为主要评价指标,以精准度、召回率和F1 分数作为辅助评价指标。

4.3 测试结果和模型评价

为更好地评估模型的性能,同时引入其他模型作为对照,分别为Inception 模型、CNN-GRU 模型和 Inception-LSTM 模型,模型训练过程和测试结果分别见图7、表2。 从图7 中可以看出,在100 次更新优化中,4 个模型都能完成训练,达到相对最优状态。 从表2可以看出,本文提出的Inception-GRU 模型识别效果最佳,在测试集上的准确率可达97.15%,能够通过多测点振动数据高效地识别泄洪建筑物的结构安全状态;Inception-LSTM 模型识别效果略差,准确率为95.12%,基本能够完成识别任务;相比之下CNN-GRU 模型和Inception 模型效果较差,但准确率也超过了90%。 4个模型结构依次从简单到复杂,模型参数逐渐增加,分类的准确率在90%~98%范围内波动,说明对于泄洪振动数据来说,时域、频域统计量能够较好地代表原信号,转换过程中信息丢失较少,适合作为模型输入进行识别,能简化模型结构,减少参数量,加快训练和识别速度。

图7 模型训练过程

表2 模型测试结果 %

此外,具有循环神经网络结构的CNN-GRU 模型、Inception-GRU 模型和Inception-LSTM 模型对时序信息敏感、收敛更快,准确率较Inception 模型均有所提升。 而Inception 模型没有进行数据增强,对于特征的提取能力较差,延后约20 次训练才达到最优状态,同时识别表现也最差。 CNN-GRU 模型和Inception-GRU模型准确率相差5.69 个百分点的原因在于卷积部分的性能差异,能够看出对于规模较小的矩阵来说,Inception 模块的分支卷积结构能够更加有效地进行深层特征提取。 Inception-LSTM 模型的参数量较Inception-GRU 模型更多,但进行训练的数据量较少,导致其在训练过程中出现了过拟合的现象,尽管理论性能更好,实际准确率却低了2.03 个百分点。 在未来数据量更多的情况下,可考虑使用Inception-LSTM 模型,以期获得更好的识别效果。

图8 为Inception-GRU 模型在识别测试集数据后绘制的混淆矩阵,主对角线为正确识别的样本数量,其余位置为错误识别的样本数量,可以看出Inception-GRU 模型对4 类数据都能有效识别。 传感器故障类别的数据与其他3 个类别的数据相比特征更加明显,在本次试验中能够全部正确识别,而正常状态、异常状态的数据均存在错误识别的情况。

图8 Inception-GRU 模型混淆矩阵

为研究模型提取特征的性能,将CNN 模块、Inception 模块和GRU 模块的输出分别取出,使用t-SNE 算法[13]将多维特征降维到二维,绘图实现可视化,如图9 所示。 从图9 可以看出,CNN 模块提取了浅层特征,基本能够判断传感器故障类别,但此时在高维空间内其他3 类数据的特征向量仍十分混乱,无法有效区分;Inception 模块进一步提取深层特征,正常状态和异常状态的数据点在高维空间中逐渐分离,但仍有少许交叉,此时已能够基本识别;GRU 模块较好地处理了Inception 模块输入的时序信号,进一步优化了提取特征,使4 类数据进一步分离。 总的来说,Inception-GRU模型提取的特征逐渐变强,混乱的输入数据在高维数据空间内逐渐分离,最终达到距离较远、区分度较高的空间位置,实现了对泄洪建筑物结构安全状态的有效识别。

图9 模块输出特征t-SNE 可视化

5 结 论

鉴于识别泄洪建筑物结构安全状态的必要性和传统识别方法的局限性,提出一种Inception-GRU 深度神经网络模型,智能化地实现泄洪建筑物结构安全状态的识别,进而确保水利枢纽泄洪过程中的运行安全。主要结论如下。

(1)提出的Inception-GRU 混合网络模型,经测试以97.15 %的准确率高效地识别泄洪建筑物的结构安全状态。 该模型比 Inception 模型、CNN-GRU 模型、Inception-LSTM 模型识别效果更好,原因在于Inception结构对小尺寸输入的特征提取能力更强,而门控循环单元(GRU)在较好地处理时序信息的同时没有产生过拟合现象。

(2)对于泄洪振动信号来说,提取时域、频域统计量作为模型的输入,能较好地保持原始振动数据的信息完整,在减少参数量的同时,具有较高的准确率;使用随机抓取振动片段进行时序堆叠的数据增强方法,模型能够获取更多信息,识别能力得到显著增强。

猜你喜欢
卷积准确率神经网络
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
卷积神经网络的分析与设计
神经网络抑制无线通信干扰探究
从滤波器理解卷积
基于神经网络的中小学生情感分析
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法