基于小样本迁移学习的轴承故障诊断

2022-08-08 02:30王天君
机械管理开发 2022年7期
关键词:源域微调编码器

王天君

(山煤国际能源股份有限公司, 山西 晋中 031100)

引言

风力发电作为清洁能源不仅成本低廉而且容易大规模普及,因此风力发电是最具有竞争力的发电技术[1],保障风电机平稳高效的运行变得越来越重要。然而风电机轴承与低速轴直接相连运行数据稀少且易于损坏,因此小样本迁移学习方法对于风电机轴承的故障研究具有重要意义[2]。

近年来,迁移学习在各个领域中得到广泛应用,将风电机轴承故障诊断与迁移学习型相结合,成为变工况故障诊断研究领域的热点[3-4]。然而风电机等设备面临故障样本稀少,样本不平衡,因此需要通过小样本迁移学习来解决这一问题[5]。

针对故障样本稀少问题,文献[6]提出非平衡小样本轴承对抗诊断,生成大量故障数据,扩充故障样本。文献[7]提出改进粒子群优化算法优化均衡支持向量机的健康预测模型,通过对动态非线性惯性权重对粒子群优化算法的改进有效解决小样本数据不均衡问题;文献[8]提出组合预测模型的小样本轴承故障分类诊断,通过半监督变分自编码器与LightGBM分类模型相结合学习模型,解决小样本性能的不稳定。但以上方法无法获取组自然损坏数据,而人工轴承损伤加工明显,无法直接使用。事实上,目前风电机轴承故障诊断的方法受限于实际工程数据,对于实验室故障模拟生成的数据常常面临诊断率低下的问题,这意味着现有研究与工业应用仍有差距。但人为生成的故障转化为机器自然的故障仍然是解决自然故障样本量少的重要方法之一。我们如果可以利用成本相对较低的人工故障样本替换大量成本较高的自然故障样本,并获得相对较高的准确率,就能够解决电机故障样本稀少,样本不平衡的问题,因此提出了基于小样本迁移学习的轴承故障诊断方法。

1 理论背景

1.1 迁移学习的概述

基于源域和目标域具有不同分布的假设,迁移学习的主要目标是将源域中学到的知识迁移到目标域中。因此,迁移学习方法中如何使源域与目标域之间的特征分布对齐是目前研究的重点。根据要迁移的表达形式不同迁移学习分为样本迁移、特征迁移、模型迁移、关系迁移等方法[9]。将实验室获取的源域数据设为,其中xi是源域中的第i 个样本,Xs是所有源域样本的集合。新采集的数据为目标域是所有目标域样本的集合,xj是目标域第j 个样本。ni、mj为标签的样本总数。迁移学习通过源域模型中的训练,学习目标域中的预测函数,从而得到源域与目标与之间共同特征,实现对目标域的标签进行预测分类[10]。

1.2 小样本迁移学习框架

1.2.1 数据预处理

轴承振动信号数据随着输入长度的增加,神经网络的参数大小会迅速增加,这意味着需要更多的训练数据来匹配模型容量。但过小的输入长度会导致频率分辨率低,不利于有效的故障识别。因此将模型的输入长度统一设置为1 024。在实验过程中,首先将PU 大学轴承数据集中的所有振动信号截断成长度为2 048 的数据。虽然时域中的信号保留了原始信号的所有信息,但普遍认为频域中的信号比时域中的信号对故障更敏感。所以通过快速傅立叶变换(FFT)应用于每个数据,数据的长度减少到原来的1/2。

1.2.2 网络模型

设计了一个一维卷积网络,包括一个特征编码器网络fθ和分类器网络Gk,卷积模型网络结构如图1所示。特征编码器网络由四个一维卷积块和一个一维自适应最大池化层组成,适用于处理一维序列信号。图像处理中经常使用小的卷积核,因为小的卷积核能够更好地捕捉特征的边缘信息,但是在第一个卷积层使用核大小为10 的大卷积核能够更好地提取振动信号的丰富浅层信息表示。因为振动信号数据在时域和频域对整体的相关性都比较敏感,第一层核太小会丢失信号中的有用信息。特征编码器的输出是一个1600 维的特征张量,输出大小为64×25。分类器网络如图1 所示包含一个简单的全连接层和一个softmax。

图1 卷积网络模型

2 迁移学习小样本模型设计

将源域训练特征编码器作为初始化,并使用目标域中的数据微调预训练的特征编码器。在实验过程中,考虑了特征编码器中的四个卷积块对应的四个不同级别的解冻微调。如图2 所示,解冻层数从1 逐渐增加到4。为简单起见,这四个模型表示为Unfrozen m Fine-tuning Net(UmFN)。基于微调的方法的学习过程也可以分为两个阶段。首先,Adam 优化器在源域中学习一个特征编码器,学习率为0.001,统一训练epoch 为200。其次,在目标域中微调一个新的分类器和一些层数固定的特征编码器,学习率为0.01 的SGD 优化器数据被分成小批量,并用50 个epoch 进行训练。最后10 个epoch 的平均准确率被视为这些方法的最终准确率。

图2 微调迁移学习小样本模型

3 实验数据集及结果

3.1 实验数据集

为保实验方法的真实有效性,选取PU 轴承数据集。用于轴承的状态监测和诊断。PU 轴承数据集中的32 个6203 型轴承,包括12 个人为损坏轴承,14 个通过加速寿命测试的自然故障轴承和6 个健康轴承。实际的轴承损坏是在加速寿命试验台中通过预定义的连续载荷产生的;实验中选取了N09_M07_F10 工况下1 个健康轴承K001; 人工损坏轴承KA01、KA03、KA05、KA07、KA08、KI01、KI03、KI07;5 个 自 然 故 障轴承KA04、KB23、KB27、KB24;13 个轴承的详细信息如表1 所示。

表1 轴承信息

3.2 实验结果与分析

通过解冻层数的逐一解冻并设置一个学习率为0.01 的Adam 优化器,用不同工况的小样本数据再次训练,对网络层结构的参数进行微调,使得网络大部分参数不变,让不同工况下的不同层学习到更专业的特征。人工制造故障的8 个轴承迁移到具有自然故障的4 个轴承和一个健康轴承使用不同解冻层数分类的准确率如下页图3 所示

迁移学习分析的目标是解冻微调的目标域模型如何影响少样本数据中的可迁移性,从而改变源域和目标域之间的关系。从下页图3 中可以清晰地得出在训练次数达到40 的时候,分类结果基本趋于稳定,并且随着解冻层数的增加,对网络层结构的参数进行微调时,不同工况迁移的准确率会逐渐下降。从下页图4 中直观的可以看到解冻层数对准确率的影响,解冻一层微调模型参数的准确率为95.2%;解冻二层微调模型参数的准确率为94%;解冻三层微调模型参数的准确率为92.3%;解冻四层微调模型参数的准确率为90.4%。从实验结果可以看出,人工制造故障的轴承迁移到具有自然故障轴承的分类结果都取得不错的效果。可以利用成本相对较低的人工故障样本替换大量成本较高的自然故障样本,并获得相对较高的准确率,能够解决电机故障样本稀少,样本不平衡的问题。这为从实验室数据集中学习模型提供了一种可行的方法,以提高模型现实中的泛化性能。

图3 不同解冻层相互迁移分类结果

图4 不同解冻层相互迁移分类准确率

5 结论

1)特征编码器的四个卷积块解冻层数对目标域数据微调,随着解冻层数的增加,目标域数据微调效果的准确率越来越低。

2)人工模拟的轴承故障数据迁移到自然损伤的轴承故障数据获得较高的准确率,这为从实验室数据集中学习的模型提供了一种可行的方法,证明了小样本迁移学习故障诊断模型对风电机轴承场景应用的可行性。

猜你喜欢
源域微调编码器
融合CNN和Transformer编码器的变声语音鉴别与还原
乐海乐器“微调轴”研发成功
转炉系统常用编码器选型及调试
基于参数字典的多源域自适应学习算法
舞台机械技术与设备系列谈(二)
——编码器
从映射理论视角分析《麦田里的守望者》的成长主题
基于数字信号处理的脉冲编码器
我国的民族优惠政策应往何处去?