基于OC-SVM与DNN相结合的ZPW-2000R轨道电路故障诊断研究

2023-09-21 02:12谢本凯蔡水涌黄春雷禹建丽陈广智王国保
工业工程 2023年4期
关键词:轨道电路区段故障诊断

谢本凯,蔡水涌,黄春雷,禹建丽,陈广智,王国保

(1.郑州航空工业管理学院 管理工程学院,河南 郑州 450046;2.黑龙江瑞兴科技股份有限公司 客户技术服务中心,黑龙江 哈尔滨 150030;3.郑州航空工业管理学院 智能工程学院,河南 郑州 450046)

近年来,我国铁路建设发展迅速,给人们的生活出行带来了极大的便利,也在一定程度上推动了国民经济的发展,因此保证列车安全高效地运行具有十分重要的价值。ZPW-2000系列无绝缘移频轨道电路是列车运行控制系统的基础设备,轨道电路的正常工作是保证列车安全高效运行的关键因素[1]。然而,轨道电路系统构成复杂、工作环境恶劣、故障发生率高且故障类型多,因此轨道电路的故障诊断研究是非常重要的。

轨道电路的故障诊断技术经历了3个阶段,依次为人工诊断、信号处理诊断和人工智能诊断[2]。人工诊断阶段主要凭借工作人员维修经验和维修技术对轨道电路的故障进行判断和维修,其盲目性大、工作效率低、劳动强度大;信号处理诊断阶段主要依靠信号集中监测系统对数据进行采集和分析,其抗干扰能力差、精度低;人工智能诊断阶段是在传统诊断的基础上再结合机器学习的众多算法对轨道电路故障进行诊断,既提高了诊断效率,又提高了诊断精度。目前一些学者在人工智能诊断阶段已取得了一定的成果。Sun等[3]采用多分类支持向量机 (support vector machines,SVM) 的一对一策略,提出了一种针对铁路轨道电路中的关键部位电气绝缘节的故障诊断系统。Ma等[4]提出了一种利用不同数据集训练的二进制支持向量机新决策树方法,进行模拟电路故障诊断。Yuan等[5]针对经典的SVM分类方法精度较低且难以训练大规模数据集的问题,采用一种改进的混合粒子群优化算法对SVM进行优化,并将其应用于模拟电路故障诊断中。林俊亭等[6]提出了一种深度置信网络和海洋捕食者算法优化最小二乘SVM的故障诊断方法,解决了区间无绝缘轨道电路故障类型复杂、诊断精度低等问题。优化后的SVM方法在一定程度上提高了故障诊断精度,但其面对多分类问题时,需要组合多个二类SVM,故障诊断过程较为复杂,且SVM方法对参数和核函数的选择以及缺失数据较为敏感,构建最优结构的SVM模型较为困难。随着大数据收集、存储、处理能力的迅速提升,深度学习等智能优化算法应运而生并被运用在故障诊断中。卢皎等[7]提出了一种基于深度卷积神经网络的ZPW-2000R轨道电路故障诊断模型,解决了ZPW-2000R轨道电路故障智能自诊断问题。田粉霞等[8]针对现有故障诊断中忽略调谐区故障对列车安全影响的问题,建立了基于改进卷积神经网络的无绝缘轨道电路调谐区故障诊断系统。然而,轨道电路系统设备组成结构复杂,仅依靠单一网络模型对系统进行故障诊断存在较大的局限性[9],近年来大部分学者尝试利用多种方法的组合来进一步提高轨道电路故障诊断的精度。宋威等[10]构建了堆叠降噪自编码器与卷积神经网络的集成模型,解决了轴承振动信号特征微弱、难以诊断的问题。张洪亮等[11]提出基于跳跃连续变分自编码器与宽核深度卷积神经网络相结合的小样本故障诊断方法,从而实现更高的故障识别精度。王秋实等[12]以ZPW-2000无绝缘移频轨道电路红光带故障为研究对象,针对其故障的多样性与复杂性,提出了一种基于故障树分析与改进BP神经网络相结合的轨道电路智能故障诊断方法。

综上,运用神经网络或其他机器学习方法能有效地识别轨道电路故障类型,对辅助现场维护人员及时准确地发现故障位置有极大的帮助。但这些方法需要大量的高质量轨道电路故障数据进行算法训练,一旦遇到未知或全新的故障数据,其诊断准确率就会降低,将影响模型在实际场景中的应用。针对上述问题,本文提出一种基于单分类支持向量机(one-class support vector machines,OC-SVM) 与深度神经网络 (deep neural networks,DNN) 相结合的ZPW-2000R轨道电路故障诊断方法。首先对故障数据进行单分类识别,然后对负样本数据进行收集,最后将正样本数据输入到DNN模型中进行故障分类,以期解决未知或全新故障数据的检测和收集问题,从而提高故障诊断准确率。

1 OC-SVM和DNN的基本原理

1.1 OC-SVM的原理

OC-SVM是一种单分类算法,属于无监督学习的方法,不需要人为标记数据集的标签,主要用于奇异点的检测[13]。该算法通过对观测到的高维样本数据进行训练,形成一个最小的超球面,超球面中包含大量的背景数据,而落在超球面外的数据则为奇异点数据,进而实现奇异点的识别。SVM算法在实际应用中会遇到正负数据不平衡的问题,如轨道电路中高质量的故障标签数据难以获取。然而,采用OC-SVM能高效解决负样本数据与正样本数据不平衡的问题,实现不同故障类别的信号数据的收集。

设样本数据 {χ1,χ2,···,χm}∈Xn,m是样本数量。分离超平面的表达式为 ωTϕ(χ)-ρ=0。其中,ϕ (χ)是将样本映射到特征空间的函数,ωT、ρ分别表示特征空间中分离超平面的法向量转置和偏移量。目标是最大化分离超平面与原点之间的距离,则OC-SVM需要求解的优化问题为

式中,ξi是松弛变量,表示允许离群点存在;v是控制离群点数量上限和全部支持向量数量下限的参数。

利用拉格朗日乘子法,可得上述优化问题的对偶问题,即

其中〈,αi是样本〉χi对应的拉格朗日系数;核函数κ(χi,χj)=ϕ(χi),ϕ(χj),代替了特征空间中的内积。

对轨道电路数据进行测试,将其代入式 (3),当结果为+1时,可认为该组数据为正样本;若其结果为-1,则该组数据为负样本。

1.2 DNN的原理

DNN通过学习一种深层非线性网络结构,实现复杂函数的逼近,得到输入数据的分布式表达[14]。

DNN包含前向传播和反向传播两个过程:前向传播算法是利用上一层的输出计算下一层的输出,反向传播是对原始数据的反馈。

DNN的前向传播算法主要进行一系列的线性运算和激活运算。本文是对多种故障数据进行识别,故激活函数的选择如下:隐藏层使用ReLU激活函数,它是目前最常用的激活函数,计算速度较快。函数公式为

输出层使用Softmax激活函数,它常用于多分类问题,将输入映射为概率值。函数公式为

DNN的反向传播算法是使用优化器迭代求损失函数最小值的过程。在进行反向传播之前,需要确定一个损失函数来度量输出数据与真实数据之间的损失。本文选择交叉熵损失作为度量损失的函数,对于每组数据,均期望求得式 (4) 最小值。

其中,yi为目标值,为预测值,m为样本数。

总损失函数的平均值表达式为

其中,m为样本数。

本文使用Adam优化器对权重向量w、偏置向量b进行梯度优化,对于w计算过程如式 (6)~ (10) 所示 (b同理)。

将得到的w、b反馈到前向传播过程,如此循环,直至达到最大迭代次数或满足最小误差要求。

2 实验数据的收集与分析

为了验证所提方法的实验效果,本文采用黑龙江瑞兴科技有限公司采集的ZPW-2000R轨道电路数据集进行实验。该数据具有强耦合、非线性的特征,能够有效地测试轨道电路故障诊断模型。

ZPW-2000R系统的组成结构为发送设备、接收设备、通道设备和轨旁设备,其故障设置结构如图1所示。本文采用控制单一变量法对14种全新的故障类型数据进行收集,将每种故障类型数据分别在5个区段中进行测试。各故障类型明细如表1所示。根据ZPW-2000R轨道电路的结构,选取如表2所示的48个电流电压监测量作为故障数据的特征。

表1 故障类型明细Table 1 List of fault types

表2 本文所使用的具体数据名称Table 2 Name of the specific data used in this paper

图1 ZPW-2000R轨道电路故障设置图Figure 1 Fault setting diagram of a ZPW-2000R track circuit

5个区段分别为1~ 3区段 (区段2为故障区段、区段1为后方区段,区段3为前方区段)、6~ 7区段(区段7为故障区段,区段6为后方区段)、10~ 11区段 (区段11为故障区段,区段10为后方区段)、12~13区段 (区段12为故障区段,区段13为前方区段) 和25区段 (区段25为故障区段)。其中1~ 3区段为中间区段,6~ 7区段和10~ 11区段为接近区段,12~13区段为离去区段,25区段为无岔区段。将各区段的数据按照前方区段、故障区段和后方区段的前后顺序进行数据组合,最后得到2 609组样本数据,如表3所示。其中,代号N表示正常数据。在区段25中,缺失故障6和故障8两种故障数据。

表3 各区段实验数据类型Table 3 Experimental data types for each zone

3 OC-SVM与DNN故障诊断模型

3.1 DNN神经网络结构

DNN模型的参数设置对ZPW-2000R轨道电路的故障诊断效果有重要的影响。为了得到最优的DNN模型结构,本文采用“经验法”和“试错法”来调整DNN模型的各类参数[15]。确定隐藏层节点数借鉴经验公式。式中,h为输入层神经元个数;n为输出层神经元个数;c为[1,10]之间的正整数;S为隐藏层节点数。确定隐藏层层数和迭代次数都通过实验进行,将隐藏层层数设置为1~ 5层,迭代次数设置为100~ 500次。通过对隐藏层节点数、隐藏层层数和迭代次数等相关参数的实验结果分析,进而确定5个区段的DNN模型结构的隐藏层节点数分别为22、20、20、20和15,隐藏层层数均为1层,迭代次数均为500次。

3.2 OC-SVM与DNN算法实现

在ZPW-2000R轨道电路故障诊断中,数据的获取至关重要,但人为地采集整理高质量轨道电路故障数据,不足以达到人工智能故障诊断的要求。本文将OC-SVM和DNN相结合,OC-SVM对实验数据进行负样本检测,对负样本数据实现标签添加并存放在数据库中,以此不断扩大数据库;将正样本数据输入到DNN模型中进行故障诊断。OC-SVM模型的实验过程为:加载数据库,使用MinMaxScaler () 函数对数据集进行归一化;利用itertlools.combinations ()函数获取训练模型中故障类型数量为m时的所有组合方式;将每次组合对应的实验数据作为训练样本,剩余实验数据作为测试样本;根据参考文献[16]和[17]和粒子群算法确定重要参数的选择和设置,其参数设置为nu=0.01,kernel=‘rbf’,gamma=0.01;每次取出一个组合的训练数据,对模型进行训练,并将测试样本加载至训练后的模型中进行预测,直至所有的组合训练完毕求出平均值,以此来降低随机因素对实验结果的影响;得出测试样本准确率的最小值、最大值和平均值。DNN模型的实验过程为:加载数据库;使用to_categorical () 函数将标签列转化为One-hot编码;设置隐藏层节点数,激活函数选择ReLU函数,输出层节点数为故障类型个数,激活函数选择Softmax函数,使用交叉熵损失函数计算损失,以Adam算法作为优化器,迭代次数设置为500次;将正样本数据加载到训练后的模型中进行预测,并记录结果。本文所提出的轨道电路故障诊断模型的整个流程如图2所示。

图2 故障诊断模型流程图Figure 2 Flow chart of the fault diagnosis model

主要流程描述可分为以下4个步骤。

步骤1获取某时刻轨道电路的信号数据,并对数据进行预处理。

步骤2将处理后的数据加载至One-Class SVM模型中进行奇异点检测。

步骤3若检测结果为1,则将该时刻轨道电路的信号数据加载至DNN模型中进行故障分类预测,而后将其存放在数据库中;若检测结果为-1,且连续稳定出现,为其添加标签并存放到数据库中,否则,视其为跳跃数据进行删除。

步骤4将更新后的数据库加载至One-Class SVM模型和DNN模型中再次进行训练,生成新的预测模型。

4 实验与结果分析

为了检验OC-SVM模型的奇异点检测性能,针对ZPW-2000R轨道电路的15种数据类型,设置以下实验:依次选取1~ 15种数据类型作为训练集,为了避免随机性,使用itertlools.combinations () 函数获取训练集为m种数据类型时的所有组合方式1≤m≤15。例如当m=1时,训练集有=15种组合方式,分别对每种组合方式的数据进行训练,剩余数据进行预测,取15种组合方式的平均值作为实验测试结果,并记录15种组合方式中的最小值和最大值,并求得平均值。最终得到训练模型在不同数据类型数量的情况下,OC-SVM模型的预测结果,如图3所示。

图3 各区段测试样本准确率Figure 3 Accuracy of test samples in each zone

图3显示在训练数据类型个数变化的过程中,区段1~ 3、区段10~ 11和区段12~ 13的测试样本的平均准确率均达到100%,区段6~ 7的测试样本的平均准确率保持在98%以上,区段25的测试样本的平均准确率保持在96%以上。由实验结果可知,OCSVM模型能精准地对负样本数据进行检测,准确地识别出负样本数据,进而实现对负样本数据的添加和将正样本数据输入到DNN模型中进行故障类型预测;随着训练集中数据类型个数的变化,预测数据准确率的平均值均较高且并未发生明显的变化,即OC-SVM模型能有效地解决正负样本不均衡问题,实现对负样本数据的收集,成功解决了高质量故障数据难以获取的难题。本文针对负样本数据进行了标签添加并存放在数据库中,实现了对负样本数据的收集,填充了数据库,有助于提高DNN模型的故障诊断准确率。

将数据库加载至最优结构的DNN模型中进行训练,得到各区段训练过程模型的准确率和损失函数的变化曲线,如图4所示。

图4 各区段训练样本准确率和损失值变化曲线Figure 4 Accuracy and loss value change curves of training samples in each zone

实验结果显示随着迭代次数的增加,本文构建的DNN模型在各区段训练过程中准确率逐步上升,约在第100次迭代后达到稳定,准确率稳定在100%;损失值也随着迭代次数的增加逐渐降低并达到稳定,最后降低至0。由图4可知,损失值的减小和诊断准确率的提高呈正相关。为验证训练后模型对ZPW-2000R轨道电路故障数据的预测情况,将正样本加载至训练后的模型中,对模型的准确率进行评估。

为了更好地评估DNN模型的效果,本文引入了精确率、召回率、准确率和F1-score 4个指标对DNN模型进行性能分析[18]。精确率指的是模型正确分类的样本数与测试集的总样本数之比,可评估出模型的总体分类性能。召回率指的是模型识别的目标类样本在总目标类中的比例,它衡量的是诊断模型的召回率。准确率指的是预测正确的结果占总样本的百分比。F1-score是从精确率和召回率中得来的概率值,其反映了模型对故障类型的分类性能。精确率P、召回率R、准确率A和F1-score的计算公式如式 (11)~ (14) 所示。

式中,TP为被模型预测为正的正样本;FP为被模型预测为正的负样本;FN为被模型预测为负的正样本;TN为被模型预测为负的负样本[19]。TP、FP、FN、TN构成了混淆矩阵,进而得到故障类型的预测结果和DNN模型的性能分析如图5和表4所示。

表4 DNN模型在各区段中的评价指标Table 4 Evaluation indicators of DNN model in each zone%

图5 DNN模型在各区段的分类结果Figure 5 Classification results of DNN model in each zone

实验结果表明,对于ZPW-2000R轨道电路的5个区段故障类型,本文构建的DNN模型达到了99.62%的识别率,但也存在一些误判情况:在区段1~ 3中,有1条的故障代号为6的数据,被误判为正常数据;在区段10~ 11中,有1条正常数据,被误判为故障代号为8的故障类型;在区段12~ 13中,有1条故障代号为8的数据,被误判为正常数据。由实验结果可知,有两种故障类型数据被误判为正常数据,分别是衰耗器故障或主接收器故障 (调接入异常) 和衰耗器故障或并接收器故障 (调接入异常);有1条正常数据被误判为衰耗器故障或并接收器故障 (调接入异常)。DNN模型在各区段的测试过程中的准确率依次为99.40%、100.00%、99.37%、99.34%和100%。故使用DNN模型对ZPW-2000R轨道电路的各区段故障类型进行诊断时,准确率较高,具有可行性,且本文构建的DNN模型性能优良,当ZPW-2000R轨道电路发生故障时,运用该模型可快速定位到故障位置,提高故障维修的效率,从而提高列车的安全性能。

由上述实验结果可知,OC-SVM模型的奇异点检测准确地区分了负样本数据与正样本数据,进而实现负样本数据的标签添加,实现了负样本数据的自动收集;将正样本数据输入到DNN模型中进行故障分类;且能在高质量标签缺失的情况下,准确高效地进行奇异点检测。DNN模型对正样本数据进行精准的分类,能准确无误地识别出各区段中的各种故障类型。经过ZPW-2000R轨道电路信号数据的验证,证明了该方法具有可靠性和实用性。

为进一步验证该方法的优越性,本文基于相同的训练集和测试集,选择近几年较为常用且先进的3种故障诊断模型进行对比分析,其网络结构均为最优。3种故障诊断模型和参数设置分别如下。粒子群算法优化支持向量机 (SVM),其中PSO的惯性权重设置为1,加速度系数c1和c2均为2,其优化后的最佳参数为Best γ=35.79,核函数参数为Best σ2=1.87;卷积神经网路 (CNN),优化器设置为Adam,卷积核大小为3×1,采样宽度为2×1,卷积层的激活函数为ReLU,池化层为MaxPooling,输出层的激活函数为Softmax,批处理数目为64;堆叠自编码器(SAE),层数设置为2,第二个隐藏层节点数为30,隐藏层的激活函数为ReLU,优化器为Adam,损失函数为mse,批处理数目为64,采用KL散度正则化,分类器为Softmax。为避免随机性,每种模型进行10次实验,平均诊断准确率如表5所示。

表5 不同方法的诊断结果Table 5 Diagnosis results of different methods

实验结果显示本文方法的诊断准确率分别比SVM、CNN、SAE模型高16.08%、2.4%、6.67%,且标准差和测试时间均小于其他方法,即本文提出的方法具有较高的诊断准确率和稳定性。

5 结论

本文针对ZPW-2000R轨道电路故障诊断中高质量故障数据难以获取以及故障诊断准确率较低等问题,提出了一种基于单分类支持向量机与DNN相结合的故障诊断方法。根据ZPW-2000R轨道电路的结构选择了48个监测量作为DNN模型的特征,对15种数据类型进行识别,并采用OC-SVM算法实现了奇异点检测,进而实现负样本数据的标签添加。选择该模型对ZPW-2000R轨道电路故障数据进行预测,并与SVM、CNN和SAE进行了模型预测对比实验,发现该模型在准确率和预测时间等方面均具有优势。本研究为轨道电路的故障维修提供了可靠的指导,可提高轨道电路维护维修的效率和智能化水平,确保现代化铁路运输的高速、高效和安全可靠;同时,实现了高质量故障数据的获取,为扩充数据库进一步提高故障诊断准确率打下了基础,具有良好的应用前景。但DNN模型的故障诊断仍有少量的误判情况,在后续的研究中将对此进行深入的研究,以达到理想的识别效果。

猜你喜欢
轨道电路区段故障诊断
中老铁路双线区段送电成功
基于HHT及LCS的轨道电路传输变化识别探讨
JXG-50S型相敏轨道电路接收器自动测试台
站内特殊区段电码化设计
站内轨道区段最小长度的探讨
ZPW-2000客专轨道电路掉码故障分析
浅析分路不良区段解锁的特殊操作
25Hz相敏轨道电路的计算和仿真
因果图定性分析法及其在故障诊断中的应用
基于LCD和排列熵的滚动轴承故障诊断