基于迁移学习的桥墩结构损伤识别方法*

2021-02-23 10:55刘肖易可夫
公路与汽运 2021年1期
关键词:时频卷积深度

刘肖, 易可夫

(长沙理工大学 汽车与机械工程学院, 湖南 长沙 410114)

为保证桥梁的安全运营,需对桥梁结构进行损伤识别。刘泽佳等提出了基于结构响应向量与支持向量机的桥梁损伤识别方法,该方法引入主成分分析,减少了噪声信号对识别结果的影响;Wu J. Q.等提出了一种结合频域分解和应变模式识别的桥梁结构损伤评估方法,该方法具有良好抗噪性能,在噪声环境下能依靠结构的应变响应识别结构应变参数;郭建等提出了一种使用两个小波分别对实时监测数据进行分解和重构的信号特征表达方式,并定义一个损伤指示系数,通过采集信号确定损伤时刻。现有桥梁损伤识别方法分为桥梁数据采集、特征选择和提取、损伤识别3个阶段,这种人工选择损伤特征的方法存在一定缺陷,其泛化性较弱,不能完整表示结构的损伤信息。深度学习模型能从输入的信息中自动寻找显著特征来训练自身模型,其学习能力比传统机器学习模型更强,识别精度更高。国内外学者展开了一系列基于深度学习的结构损伤识别研究,如王相龙等改进VGG网络的输入层、输出层和FC层神经元个数,解决了基于灰度图的裂纹子块的二分类识别问题;柳厚祥等将深度学习与数字图像处理技术相结合,提出了一种裂缝检测方法,该方法可自动定位裂缝并结合图像局域阈值分割方法提取裂缝。但深度学习模型的隐含层数和参数过多,从零开始训练一个大的神经网络需要大量标签数据和相当大的计算成本和时间成本。而实际损伤识别案例中损伤数据较少,应用少量数据很难训练出有效的深度模型。另外,参数和超参数的调节对模型性能的影响较大。迁移学习(TL)能消除深度学习模型的局限,很大程度上推动了深度模型训练的进程,降低了对数据量的要求。该文使用预训练的深度卷积神经网络(CNN)进行迁移学习,内核使用Resnet50,其训练数据为自然图片,将预训练模型的网络结构、模型参数及超参数转移到目标模型上,目标模型的低层网络的权重直接从预训练模型中获取,高层网络的权重则针对任务进行调整,从而实现对桥墩结构损伤的检测。

1 研究方法

1.1 连续小波变换

连续小波变换是一种有效多分辨率信号处理技术,该方法对时域信号十分敏感,被广泛应用于损伤识别。连续小波变换属于时频成像技术,能将时间-频率信号转化到时频域上。

通过对母小波进行缩放和平移得到所需小波,将信号和小波进行内积运算,称为小波变换。公式如下:

(1)

式中:s为缩放参数,与频率成反比;τ为平移参数。

信号x(t)的连续小波变换由复共轭的卷积求出,公式如下:

W(s,τ)=〈x(t),Ψs,τ〉=

(2)

连续小波变换通过式(2)将原始信号分解成一系列小波系数,再进行卷积运算,信号被投影至二维的时间尺度上,将一维时间序列转换成时频图像。

1.2 迁移学习

使用Resnet50的内核,将预训练模型的卷积网络部分迁移到目标模型上,全连接层和softmax网络针对时频图重新训练,获得新的权重。在迁移学习的过程中,预训练模型低层网络部分的权重值固定,不需进行调整;高层的分类模块的参数不固定,需输入新图片数据进行调整(见图1)。

图1 迁移学习的网络结构示意图

1.2.1 CNN模型

CNN被广泛应用于图像处理。深度CNN能自动从输入图片中学习到多层特征,高层网络的特征比低层的特征更抽象,有利于模型分类和自动学习。CNN的基本结构包括卷积层、线性整流层、池化层和全连接成层。每层卷积由若干个卷积单元组成,卷积单元的参数通过反向传播算法优化得到。卷积的目的是提取输入数据的特征,第一层提取较简单的特征,如边缘和线条角度等,高层所提取的特征更复杂。线性整流层的激活函数使用线性整流。池化层即下采样的目的是减少特征图,将卷积层输出的特征切割成多个区域,取最大值或平均值得出维度较小的新特征。全连接层把局部特征结合变成全局特征,用来计算最后每一类的权重。

1.2.2 Resnet50结构

残差网络是He K. M.等于2015年提出的深度CNN框架,该模型的训练样本为ImageNet数据集,其中图片类别为1 000种,数量为百万级,每张图片的尺寸为224×224。常规的网络堆叠会使深度网络在层数过高时出现梯度消失和训练效果变差的情况,Resnet网络的残差学习模块能解决梯度消失和梯度爆炸问题。Resnet使用全等映射将前一层输出直接传输到后面(见图2),残差学习模块中的期望输出为H(X),将上层输入X作为初始结果,将学习目标由完整的H(X)转换成F(X)=H(X)-X,通过Reformulation将一个问题分解成多个尺度直接的残差问题。该方法能降低参数优化难度,加快模型训练速度,提高训练效果,解决网络退化问题。在Resnet50训练阶段,固定部分的参数在训练时保持不变,将图片数据输入模型中进行训练,经过固定部分的处理,高层网络的特征被提取出来并传递给高层网络。针对这些特征,目标模型训练出高层卷积网络及全连接层的权重,并与固定部分组成完整的损伤识别网络,最后由softmax分类器输出数据结果。

图2 砼塑性损伤识别模型(CDP)的结构

2 基于迁移学习的损伤识别方法

基于深度CNN模型,以经过连续小波变换的一维信号的时频图为输入数据,损伤识别步骤见图2,包括时频成像、预训练模型的微调、模型测试。预训练模型使用深度CNN Resnet50模型,该模型使用残差学习模块加强深度网络的性能,解决其梯度下降和梯度爆炸问题。预训练模型使用自然图片数据集训练得到,其中图片是砼结构损伤数据的时频成像。因此,使用目标模型的输入对源模型全连接层和Softmax的权重重新进行训练。

(1) 时频成像与数据准备。使用加速传感器采集砼的振动信号,通过连续小波变换将一维信号转换成二维时频图作为深度CNN模型的输入,并将图片尺寸调整为224×224,将数据分为训练集和测试集备用。

(2) 预训练模型的微调。将训练集的时频图输入模型,卷积层维持原有权重,对模型的全连接层和Softmax重新进行训练,得到新的权重。图2中固定部分的权值不变,非固定部分的权值经过训练后重新赋值。

(3) 模型测试。将训练好的模型在测试集上进行损伤识别,验证模型的损伤识别精度。

3 试验与仿真

3.1 参数设置

CDP模型中砼材料的密度、杨式模量、泊松比分别为2.4×10-9t/mm3、26 957.85 MPa、0.15,对应的膨胀角、偏心率、fb0/fc0、K和黏度参数的缺省值分别为35°、0.1、1.16、0.667和0.01。

连续小波变换过程提取的一维信号的长度为1 500,使用Morlet(morl)小波基对信号进行分解,信号与小波函数高度相关时,小波的频率等于结构的固有频率。由于砼结构出现损伤时固有频率会发生改变,该小波能检测出结构损伤情况。为验证morl小波在砼结构损伤识别中的有效性,选择Haar小波和Daubechies(dbN)小波进行训练测试。

迁移学习网络中的参数使用试验数据进行优化,经过调整后的学习率、正则化系数、Batch_Size分别为10-6、10-4、32。学习率用来控制模型的学习进度,学习率大则学习速度快,易损失值爆炸和振荡;学习率小,经过一定学习轮数后易出现过拟合和收敛速度变慢的情况。迁移学习中因模型已在原始数据上收敛,设置较小的学习率(<10-4),并在新数据上进行微调。将学习率设置为10-6进行测试,正则化系数分别设置为1、10-1、10-2、10-3、10-4、10-5、10-6、10-7,根据损伤识别精度选择最优正则化系数,测试结果见图3。Batch_Size为模型进行一次训练所选择样本数,其大小影响模型的优化程度和速度及GPU内存使用情况,其值越大,对GPU的显存要求越高。测试机的GPU为16 GB,Batch_Size值为32。

图3 不同正则化系数的测试结果

3.2 仿真

使用ABAQUS和MATLAB进行联合仿真,在有损伤和无损伤的情况下,采集多组砼梁受到振动激励时产生的振动信号。先在ABAQUS中建立仿真模型,再结合MATLAB实现自动更换激励点位置,采集所需信号。使用CDP模型,在有损情况下,通过在结构梁的顶部施加静载荷,使砼梁产生裂缝后卸载静载荷,在梁上表面选择网格的一个节点作为激励点,施加高斯脉冲,在几何模型的侧表面选择信号采集点。无损情况时不施加静载荷。砼梁一端的支撑点固定6个自由度,另一端的支撑点固定垂直方向位移。对应于两种情况分别采集振动响应信号,采样频率为7 500 Hz,采样周期为0.2 s,每次试验采集一组振动信号,每组振动信号为长度1 500的一维频率时间序列。使用MATLAB在每次仿真完成后修改激励点的位置参数,自动进行下一轮仿真。分别使用10种不同网格尺寸进行几何建模,在每种网格尺寸下都进行上述数据采集。仿真砼梁的结构尺寸为(3 000×210×110) mm(见图4)。

图4 仿真砼梁的结构尺寸(单位:mm)

将仿真数据进行连续小波变换,将一维信号转换成二维时频图,作为深度CNN模型的输入来训练模型。数据的训练集和测试集使用两种划分方式:1) 对于所有网格尺寸的仿真数据,分别从有损和无损的数据中提取150组作为训练集、50组作为测试集。训练集中有损数据1 500组、无损数据1 500组,测试集数据中有损数据500组、无损数据500组。2) 选择其中8种网格尺寸数据作为训练集,另外两种网格尺寸数据作为测试集。训练集中有损数据和无损数据各1 600组,测试集的数据各为400组。两种划分方式得到一致的结果,验证了损伤识别框架的有效性。

3.3 试验

试验使用桥墩模型,由砼和钢结构构成,桥墩结构见图5。在桥墩的端面设置加速传感器,在上表面设置激励点,使用锤击激励。桥墩的损伤使用人工对端面进行裂缝制造(见图6)。采样频率为8 kHz,时间间隔为2 s。进行识别的损伤情况为无损伤和270 mm裂缝损伤。两种损伤情况各200个数据,其中300个数据作为训练集,另外100个数据作为测试集。该试验在桥墩端面设置6个信号采集点,在桥墩的上表面设置3个信号激励点,每个激励点收集6种不同采集点的振动响应信号。共采集6×3种振动信号,并对每种信号进行建模测试。每种信号有400组数据,每组数据的数据量不足以建立完整的深度CNN模型,但采用迁移学习可在数据不够充足的情况下建立完整且精度高的深度模型。数据集的情况见表1和表2。

图5 试验结构

图6 试验流程

表1 第一种分类方式

表2 第二种分类方式

在试验数据下对迁移学习框架进行测试,对于每组信号使用连续小波变换将信号转换成为时频图,然后将生成的图片作为输入,按照表1和表2的方式划分测试集和训练集,测试该框架在试验数据下的结果。

3.4 测试结果

3.4.1 仿真数据测试结果

为验证上述损伤识别框架的有效性,使用另外两种损伤识别方法进行比较。第一种为基于支持向量机(SVM)的损伤识别方法,该方法使用相对小波能量的方法提取特征,将信号分解成7种不同频带的信号,每种频带的信号经过转换得出7个特征值,即该频带的能量值。将7个特征值作为输入,训练支持向量机分类模型,最后在测试集上验证模型的精度。第二种为从零训练的卷积神经网络,该网络的权值和参数都需在任务中训练出来,样本需求大,训练时间长。仿真数据测试结果见表3。

由表3可知:迁移学习方法在砼结构损伤仿真数据上的识别精度比从零训练的CNN更高;与SVM相比,迁移学习不需手动寻找特征值,可节省大量人工,提高智能化水平。

表3 识别精度测试结果 %

3.4.2 试验测试结果

为验证损伤识别框架在试验数据上的有效性,将其与其他两种损伤识别方法进行比较。训练集与测试集的分配见表1、表2,对每组数据进行多次测试后取均值,结果见表3。

经过试验数据测试,得到与仿真一致的结果。在建模速度方面,迁移学习比从零训练的深度CNN模型更迅速,且在测试集上的识别精度更高,相对于SVM具有更高的识别精度。

4 结论

基于迁移学习的损伤识别方法在CDP模型的仿真数据与桥墩试验数据下皆具有非常高的识别精度,在识别性能上优于从零训练的卷积神经网络与支持向量机,能准确诊断结构的损伤情况。

猜你喜欢
时频卷积深度
基于3D-Winograd的快速卷积算法设计及FPGA实现
深度理解一元一次方程
从滤波器理解卷积
深度观察
深度观察
深度观察
基于傅里叶域卷积表示的目标跟踪算法
基于时频分析的逆合成孔径雷达成像技术
对采样数据序列进行时频分解法的改进
一种基于卷积神经网络的性别识别方法