基于声发射和GAN-CNN的铝合金管道法兰连接松动泄漏检测*

2023-09-20 06:49王新夏广远
应用声学 2023年5期
关键词:时域法兰分类

王新 夏广远

(1 内蒙古农业大学职业技术学院 包头 014109)

(2 内蒙古科技大学机械工程学院 包头 014010)

0 引言

法兰连接管道作为输气装置被广泛应用于各种运输场合。目前,一个严重的问题是管道系统运行中存在泄漏,这不仅降低了整个管道输送的效率,而且对整个管道工作环境中的人员安全构成威胁。众所周知,这种管道系统的泄漏容易发生法兰连接处,且法兰连接处的泄漏通常是螺纹松动或垫圈异位、破损引起的。因此,泄漏的早期对于分布广泛的法兰管道系统的生命周期维护和管理具有重要意义[1-2]。

随着信息技术的发展,基于声发射(Acoustic emission,AE)技术数据驱动的管道泄漏检测已成为研究热点[3]。通过自动提取管道泄漏AE 信号中隐含的泄漏信息,智能识别管道的泄漏状态。机器学习[4]是数据驱动管道泄漏检测的主要方法,已采用一些方法来解决管道连接方式失效引起的泄漏问题。Wang等[5]开展了基于多类支持向量机(Multi-class support vector machine,MCSVM)的一对多(One-vs-all,OVA)泄漏率识别算法研究,实现了探空火箭推进系统管路螺纹连接处的管道小泄漏检测。Li等[6]通过构建人工神经网络分类器开展了基于AE 和模式识别的供水管道承插接头失效泄漏检测研究。Ye等[7]利用SVM 学习和相关向量机(Relevance vector machine,RVM)模式识别算法实现了管道阀门泄漏检测识别。徐光[8]基于AE技术,开展了基于SVM 的法兰连接失效导致的配气管道泄漏的实验研究。然而,以上机器学习方法无法直接生成原始数据的鉴别特征,其在管道泄漏检测中的有效应用通常需要与信号特征提取过程相结合。而特征提取和选择是一项耗竭的工作[9]。

随着机器学习技术的迅速发展,深度学习已经成为克服上述缺点的有效途径。深度学习可以自动学习原始数据的抽象表示特征[10-11],有效避免人为特征提取与选择的繁琐工作。其中卷积神经网络(Convolutional neural network,CNN)[12]作为最有效的分布式学习系统之一,已在诸多领域广泛应用。高留刚等[13]开展了基于CNN生成虚拟平扫CT图像研究,通过应用CNN 提高了图像识别分辨精度。徐卫鹏等[14]开展了基于CNN 的轴承故障诊断研究,通过验证,CNN 模型通过直接读取振动信号时域数据可以很好地实现对采煤机截割系统轴承故障诊断。然而,应用CNN数据驱动深度学习方法处理工程问题,需要依托大量的有效的样本数据才能实现模型的鲁棒性训练。在管道泄漏领域,常见的检测技术是AE无损检测。然而,若想在短时间获取海量、真实的泄漏数据是一项具有挑战的任务。因此,如何通过获取的小样本数据,达到训练CNN 的目的,实现对法兰管道泄漏识别是需要解决的关键问题。

2014 年,Goodfellow等[15]提出了一种智能化的数据生成模型,即生成对抗网络(Generative adversarial network,GAN)极大缓解了数据缺失问题。GAN 通过涉及一对网络的竞争过程获取反向传播信号来实现一种无需大量注释训练数据即可学习深度表示的方法。当前,伴随着GAN相关技术的不断发展,其已得到广泛应用。康旭等[16]面向雷达领域的智能化应用需求,开展了基于GAN 的雷达遥感数据增广方法,该方法有效解决了因雷达数据样本不足导致的人工智能技术在雷达探测领域的应用受限难题。邱根等[17]开展了基于GAN数据扩充的缺陷识别方法研究。实验结果表明,应用GAN 扩充图像数据集有效提升了深度学习在缺陷检测中的能力。

受上述研究启发,本文面向法兰连接管道泄漏应用需求,开展基于AE 和GAN-CNN 的铝合金管道法兰连接松动的泄漏检测研究。一方面,通过利用GAN对基于AE技术获取不同泄漏等级的AE泄漏信号进行扩充;另一方面,将生成的样本数据与原始数据设置为不同的训练集,训练CNN 网络,构建智能分类检测模型;最后,设置新的泄漏工况和应用支持小样本数据的SVM 对本文所提方法进行验证与分析。

1 基本原理分析

1.1 GAN

常规的GAN 由两个相互对立的部分组成,分别为生成模型G和判别模型D,如图1 所示。GAN主要思想是使用对抗网络来提高数据的质量。生成模型经过训练从随机噪声向量Z中生成真实的合成数据Sgenerated=G(Z),并试图以假乱真判别模型使得Sgenerated不会被识别为生成样本。判别模型是将生成模型生成的真实训练数据和伪造样本作为输入,然后对其训练以区分生成的样本和真实数据。判别模型输出特定样本对应于可能的概率。判别模型的损失函数L定义为

图1 GAN 架构Fig.1 Typical architecture of GAN

其中,Pdata表示真实数据分布,P(Z)表示噪声向量Z上的先验分布,D(S)表示S来自真实数据而非生成数据的概率,ES~Pdata表示真实数据分布Pdata中S的期望值,EZ~P(Z)表示噪声采样Z的期望值。对于判别器,训练的目的是最大化损失函数,这意味着在正确的样本源下最大似然数。对于生成模型,训练的目的是最小化等式(1)的第二项,以混淆判别模型。因此,GAN的目标可表示为

基于目标函数更新模型参数可以通过随机梯度下降训练GAN 并实现判别模型和生成模型的正确配对。

当前,已基于原始GAN 生成多种变体,如深度卷积生成对抗网络(Deep convolutional generative adversarial network,DCGAN)、Wasserstein 生成对抗网络(Wasserstein generative adversarial network,WGAN)和辅助分类器生成对抗网络(Auxiliary classifier generative adversarial network,ACGAN)。本文采用ACGAN 用于数据扩充研究。与常规GAN 相比,ACGAN 能够生成高质量的数据,同时提供标签信息。

1.2 CNN

CNN是前反馈神经网络,其是人工神经网络的一种特殊结构。与完全连接(Fully connected,FC)神经网络不同,每层特征映射的每个神经元仅与CNN 前一层的一小部分神经元稀疏连接。CNN 有3个主要层:(1) 卷积层;(2) 池化层;(3) FC层。

卷积层应用一定数量的滤波器来获得输入图像的特征映射。假设卷积层数据为X ∈RA×B,其中A和B是输入数据的维数,卷积层输出可计算为

其中,*是卷积算子,Ccn是卷积层的第cn 个特征映射,cn为滤波器的数量,X代表输入数据矩阵,Wcn是当前层第cn 个滤波器的权重矩阵,第cn 个偏差为bcn,激活函数f表示结果,通常是整流线性单元、双曲正切或sigmoid函数。

池化层是降低输入特征维数的下采样层。CNN最常用的最大池化函数中,激活可计算为

其中,Pcn是池化层的输出,S是池块的大小。池化块的所有S将组合在一起作为池化层的输出,这样输出在两个空间维度上都会小S倍。

然后,在几个交替的卷积层和池层之后,有一个完全连接的层,最后,按照FC层计算分类。

本文选择keras 来实现CNN,其中选择一个隐藏层,然后使用softmax 回归作为最后一层,以实现快速计算和精确结果。CNN结构如图2所示。

图2 CNN 结构图Fig.2 The structure diagram of CNN

同时,为了保证搭建的神经网络拥有足够大的感知视野并且能够覆盖所有的特征信息,对各层参数进行了布局,如表1所示。

表1 CNN 结构参数Table 1 CNN structure parameters

2 实验装置

为模拟充气管道系统法兰连接失效引起的泄漏,专门设计了具体实验装置,如图3 所示。选用直径为18 mm、长度分别为250 mm 和950 mm 的铝合金管道段,采用法兰接头连接。盲法兰安装在短管段的每一端。气体通过空气压缩机被泵入管道,管道的内部压力由空气压缩机和压力表控制在5 bar。

图3 法兰连接松动的铝合金管道泄漏检测的实验装置Fig.3 Experimental setup for leak detection of aluminum alloy pipe due to loosening of flange connection

图3(a)中,泄漏由于法兰连接松动而形成。为了解释泄漏现象,实验中使用了气泡泄漏检测方法。为将铝合金管道完全浸没水中并固定,选用了4 个玻璃吸盘,前端2 个吸盘压制管道,后端2 个吸盘交缠直线防止管道浮起。在管道完全浸没水中时,首先,将充满水的量筒放置在泄漏点上方收集从法兰连接处涌出的气泡。然后,根据采集气体与检测时间的比值估算出相应的泄漏率。本文通过改变法兰连接的松紧度(垫圈的破坏情况一致)来标定不同的泄漏率。

图3(b)中,根据标定的不同泄漏率情况,AE传感器被放置在法兰连接接口处。所有测试均以1.0 MHz 的采样率记录AE 信号,每个样本的持续时间为0.1 s。AE 信号由前置放大器(PAC,MISTRAS,2/4/6)以40 dB 放大倍数进行预放大,并由辅助数据处理软件(PAC、AE-Win)驱动的8 通道AE 数据采集卡(PAC、Micro II Express、1MS/s)采集。因此,实验装置用于测量和记录泄漏AE信号。

3 实验分析

3.1 原始AE信号的声学特性

本文中,选用宽频AE 传感器S9208 来捕获实验中的产生的AE 信号,该传感器在0~1 MHz 响应特性几乎相同,有利于捕捉未知泄漏频带。为了全面考察泄漏率对泄漏AE 信号的影响,通过松动法兰螺纹设置泄漏率的小大形成不同的漏源,分别0 mL/s、0.6 mL/s、1.8 mL/s、4 mL/s 四种泄漏工况。其相应的时域和频域图,如图4所示。

图4 不同泄漏等级下,PAC AE 传感器S9208 捕获的泄漏AE 信号的时域波形和频谱Fig.4 Time domain waveform and frequency spectrum of leak AE signals captured by PAC AE S9208 sensor under different leak levels

从泄漏时域图可以看出,不同泄漏率下的感应泄漏AE 信号是时域连续的AE 信号,且随着泄漏率增大时域信号没有明显波动变化。而在频域图中可以发现:频域的局部声能分布较广;一个峰值位于20~50 kHz 范围内,一个位于77~87 kHz范围内;随着泄漏等级的增大,20~50 kHz 频带范围内相应的峰值几乎相同,且频带变化无明显波动;77~87 kHz 频率范围内的峰值略有变化。进一步扩大77~87 kHz 频带区域,如图5 所示,发现77~87 kHz 频带的局部声能随着泄漏率的增大而增大。因此,将该频带定义为管道法兰连接泄漏的特征频带。

图5 不同泄漏等级,特征频带77~87 kHz 的频域分布Fig.5 Frequency domain distribution of characteristic frequency band 77~87 kHz under different leak levels

过程中获取了不同泄漏下的300个单独的样本数据,整个数据集包含1200个样本,分为两部分:训练数据和测试数据。对于每种泄漏等级,有200 个时间序列样本用于训练GAN体系结构并生成样本,100 个样本用于测试构建的CNN 模型,并评估生成样本的质量。

3.2 基于GAN生成数据的声学特性

经过训练,获得了经由GAN 生成的样本数据。4 种泄漏等级下的生成样本数据的时域波形和频谱结果,如图6所示。从图6中可以大致识别真实传感器数据和生成样本之间的相似性。特别是,面向不同泄漏等级,生成样本数据的特征频带仍旧集中在77~87 kHz范围,该部分与真实数据特性相似。

进一步,从时域和频率特性分布角度,引入计算统计指标以评估生成样本的质量。欧氏距离、皮尔逊相关系数、库尔贝克-莱布勒散度被用于评估生成样本与真实训练数据之间的相似性。欧氏距离表示生成的样本与真实数据之间的距离,较小的数字表示更相似。同样,库尔贝克-莱布勒散度表示两个分布之间的差异,因此,数值越大,性能越差。相反,皮尔逊相关系数显示生成的样本与真实样本之间的相关性,超过0.8 的高相关性意味着这些样本之间具有很强的相似性。通过计算得出3 个指标分值分别为0.1201、0.8369、0.1571。

可见,通过这些指标证明了基于GAN 生成的样本数据与真实数据有很好的相似性,进一步将生成的样本数据用于构建管道泄漏分类检测模型开展管道法兰连接泄漏检测。

3.3 实验结果与讨论

为了进一步研究生成样本的质量,针对生成的数据集中执行特定的训练过程。GAN 模型生成4000 个样本,对应于4 种不同的工作条件。然后利用这些生成的样本训练本文构建的CNN 模型,并在对CNN 模型进行充分训练后,将真实传感器采集信号作为测试数据测试训练的模型,以预测管道泄漏等级。过程中,为了研究生成的训练样本数量对模型学习的影响,设置了几种情况来训练测试模型性能。经过训练迭代100 次后,模型的分类精度结果如图7 所示。每种情况的训练数据详细信息如表2所示。

图7 不同训练数据集之间的泄漏检测模型分类性能Fig.7 Classification performance of leak detection model among different training data sets

由表2 和图7 可以看出,规模较大的训练数据在分类精度具有更好的性能;当使用包含真实数据和生成数据的混合数据时,该模型比仅使用生成数据具有更好的性能;且当获取到足够的训练数据,使用生成数据的模型能够实现高精度的分类预测,最终的分类精度可达到100%。这表明生成数据和真实传感器信号之间的具有很高相似性,且数据驱动的CNN可实现对管道泄漏高精度分类检测。

同时,考虑到实际中的工况其实并不存在明显的界限,为验证所提出方法的性能或适用性,选取了不同于前4 种泄漏等级的第5 种泄漏工况,泄漏率为2.5 mL/s,用于测试上述训练模型。理论上,由于在训练时指定了4 种泄漏工况,出现的第5 种泄漏工况将被模型分配至4种工况。相应地,按照本文选取的2.5 mL/s 泄漏率,本文的第5 种泄漏样本会更多划分至第3种和第4种泄漏工况,其中第3种应该居多,或者全部分配至第3 种。本文选取了不同数据样本训练的CNN模型,测试样本为100,第5种泄漏工况的分类预测结果如表3 所示。由表3 可发现,第5 种泄漏样本更多分至第3种泄漏等级。同时,样本集得越多,分配越明显。因此,本文提出的方法在考虑实际工况无明显界限时,实验结果基本符合理论分析,验证了方法的性能和适用性。

表3 第5 种泄漏工况下,不同训练数据集之间CNN 模型的分类结果Table 3 Classification results of the CNN model among different training data sets under the fifth leak condition

进一步,为了验证数据驱动的CNN 的分类优势,开展了基于SVM 的分类检测模型的构建。在此,选择文献[5]提到的管道泄漏常用的参数作为特征,其中时域特征为标准差、均方根、能量,频域参数为平均频率、特征频带包络面积。同时,考虑到高斯径向基(RBF)核函数(KG)具有相对简单的计算形式、输入参数较少、更强的学习能力[18],选择RBF 作为分类预测核函数。整个训练测试过程,训练集与测试集比例2 : 1,总特征集包含1200 样本,分类结果如表4 所示。此处,F1 表示时域参数特征组合集,F2 表示频域参数特征组合集,F3 表示77~87 kHz 特征频带包络面积特征,F4 表示频域参数和时域参数的组合特征集。

表4 不同特征指标下,基于SVM 模型的分类结果Table 4 Classification results based on SVM under diあerent feature indicators

由表4 可以看出,时域和频域特征的组合能够提升泄漏检测精度,而实际主要优势在于特征频带包络面积的选择。可见,特征的提取和选择对最终的结果影响巨大。对比构建的不同分类测试模型结果发现,通过选择合适的特征指标,SVM 分类精度在某种程度上可以媲美CNN 结果,精度已达到98.75%。但是,该模型的精度需要依靠人为特征提取过程的保证。

4 结论

本文面向铝合金法兰管道泄漏检测需求,提出了基于AE 和GAN-CNN相结合的智能分类检测方法,解决了数据样本不足问题,减少了人为特征提取这一项耗时工作。通过对铝合金管道法兰连接失效泄漏信号进行标定和采集,研究了原始管道泄漏AE 信号的声学特性和GAN 生成数据的特征,进一步,在构建CNN 管道泄漏分类检测模型上,通过不同生成的样本数据训练分类器并用真实数据进行测试验证了生成样本的有效性。最后,与常见的小样本智能方法SVM 比较,证明了GAN-CNN 相结合对实现管道分类检测的优越性。并得出以下结论:

(1) 提出了基于GAN 扩充管道泄漏数据的方法。该方法能够产生令人信服的传感数据,解决了样本数据不足问题,保证了CNN 分类模型构建过程数据的充足。

(2) 提出了基于数据驱动的CNN 分类检测管道泄漏的方法。数据驱动构建的CNN 管道泄漏检测分类模型能够有效地学习特征,对不同泄漏等级和新的泄漏工况都能获得令人信服的检测结果。

(3) 对比常见的小样本智能方法SVM。特征的选择对SVM 泄漏检测模型的影响较大,特征频带包络面积构建的SVM 智能分类模型表现效果最佳,且与其他特征相结合进一步提高分类检测精度,但特征提取过程繁冗。

同时,本文还存在不足之处。首先,文中选择的泄漏等级没有规定泄漏等级范围,训练和测试选取的数据均为同一泄漏值下的泄漏数据,因此,样本数据在达到一定程度,CNN分类会出现100%的结果。若考虑在规定等级范围内获取范围泄漏数据,分类结果的准确性将会降低。其次,实验条件有限,未考虑不同噪声水平下采集样本数据,以验证算法对不同噪声水平的鲁棒性。因此,下一步,将考虑两方面的不足,将其融入相关管道泄漏检测研究。

猜你喜欢
时域法兰分类
分类算一算
法兰通联展览(北京)有限公司
法兰通联展览(北京)有限公司
分类讨论求坐标
基于时域信号的三电平逆变器复合故障诊断
数据分析中的分类讨论
教你一招:数的分类
基于极大似然准则与滚动时域估计的自适应UKF算法
基于时域逆滤波的宽带脉冲声生成技术
法兰连接中的接触分析