基于SVM的动车组电流互感器可靠性研究

2022-03-15 09:45孟建军赵文涛
计算机仿真 2022年2期
关键词:互感器动车组样本

孟建军,赵文涛

(1.兰州交通大学机电技术研究所,甘肃 兰州 730070;2.甘肃省物流及运输装备信息化工程技术研究中心,甘肃 兰州 730070;3.甘肃省物流与运输装备行业技术中心,甘肃 兰州 730070)

1 引言

电流互感器在动车组上广泛应用于牵引传动系统与继电保护系统中。目前动车组上使用的均为电磁式电流互感器[1],其高可靠性在带给动车组安全稳定运营的同时,也意味着对其进行可靠性研究时会存在难以采集故障数据样本的问题。

随着技术的发展以及对可靠性重视程度的不断提高,各类产品的故障率也随之降低,采集到的故障数据数量少且分布不均匀、不平衡,“大数据,小样本”的情况普遍存在[2]。而传统的基于大样本数据的可靠性研究方法虽已相对成熟,分析结果相对准确,但传统方法并不适用于目前的小样本数据现状,对于小样本数据的产品进行可靠性研究是近年来亟待解决的问题,申桂香等[3]采取极大似然法(MLE)对典型的高可靠性产品数控机床进行二参数Weibull分布参数估算,并与传统可靠性建模方法进行了对比,证实了其对于小样本数据的优越性;张立敏等[4]针对采集到的少量故障数据,结合 Bayes理论与粒子群优化算法PSO进行了威布尔分布模型参数的估算,鉴于Bayes理论中的先验知识存在较大的主观因素,会对估算结果造成一定的影响。综上所述,传统的可靠性分析是一种统计分析,是建立在大样本数据之上的研究方法,若对小样本数据的产品依旧使用传统的可靠性分析方法往往会产生极大的误差,使得计算结果不准确。而虚拟样本生成技术无需先验知识,通过提高小样本故障数据的预测泛化能力以及减少“过拟合”的情况来建立较为精确的故障分布模型[5]。1992年,美国的Tomaso和Thomas Vetter等人[6]首次提出了虚拟样本的概念随后人们将其应用于可靠性领域发现虚拟样本可以有效地对小样本数据进行扩充进而得到精确的模型。故本文提出了一种能够在缺失相关先验知识的前提下,准确地在小样本数据条件下对动车组电流互感器的可靠性与安全性进行评估分析的方法,能够为类似于电流互感器的高可靠性产品的可靠性研究提供更有价值的参考。

本文以动车组电流互感器为研究对象建立相关故障树,并对每一个底事件采集到的小样本故障数据,引入支持向量机(SVM)结合中位秩与johnson算法来进行样本扩充。利用最小二乘法对威布尔分布参数进行估计,结合算例通过蒙特卡洛仿真来对动车组电流互感器进行可靠性研究。

2 动车组电流互感器简介与故障树的建立

2.1 动车组电流互感器简介

目前高速列车上安装有多个电流互感器,均为直通式电流互感器,其中一个用于测量动车组的电流,同时连接到每一个主断路器中;两个用于监测主变压器,其中位于主变压器上段车顶的电流互感器测量牵引单元的线电流,而用于测量牵引单元回流电流的回流电流互感器位于主变压器下端安装在主变压器中。电磁式电流互感器虽然相较于电子式电流互感器有着如误差较大等问题,但其应用范围与可靠性是电子式电流互感器无法比拟的[7],因此目前高速铁路网依然普遍使用电磁式电流互感器。动车组电流互感器作为牵引传动系统与继电保护系统中的核心器件,向来是维修方案与优化设计的重点元件,然而其作为高可靠性产品,能够收集到的故障数据较少、来源复杂、分布不均匀不平衡,是典型的非线性小样本故障数据。

2.2 故障树的建立

动车组电流互感器内部结构可分为铁芯、绕组、分接开关三部分,首先确定电流互感器故障为顶事件,分别对其内部元件的故障机理进行研究,如动车组电流互感器使用的铁芯类型为开口铁芯,长期工作暴露在空气中会导致其发生锈蚀,铁芯质量下降,交合处气隙增大,铁芯磁导率下降进而增大线路误差导致差动保护误动[8];绝缘对于电流互感器而言是极为重要的,无论是铁芯内部、一次与二次绕组内部、铁芯与绕组之间还是外壳与内部结构之间都需要做好绝缘,其损失或破坏会对电流互感器产生极大的影响及安全隐患,最终导致其失效等[9]。根据各元件故障机理,绘制故障树,其中图1为主故障树,图2为主故障树下的三个子故障树。其中图2(c)为B子树的补充子树。

图1 电流互感器主故障树

图2 电流互感器子故障树

3 小样本数据产品的样本扩容与可靠性建模

3.1 小样本数据的获取与扩充

鉴于试验条件以及试验时间的限制,无法保障每一个观测样本都能得到完整的失效数据,或因在观测还未开始选定的观测样本便已经投入使用的左截尾数据,或因某个与实验无关的外在因素影响观测样本还未发生故障便需要更换的删除样品,或因观测时间限制直到观测结束样本都没有失效的右截尾数据[10]。在采集到的小样本数据中总会存在多种截尾数据,目前虽有部分方法如贝叶斯最大似然估计[11]等能够在一定程度上对截尾数据进行分析,但由于接受条件的设定具有较大的主观因素,仍会带来一定的误差影响结果的准确。故本文在原样本数据数量较少的情况下再次剔除截尾故障数据,仅采用少量的完整样本数据进行可靠性研究。

在较为普遍的现实问题中,很少会见到线性的回归问题样本集,因此引入在解决非线性小样本学习的回归问题中非常突出的SVM来实现对样本的扩容。其实在解决非线性的回归问题时,往往希望能够使用线性回归问题的方法来解决,即非线性变换的方式,在SVM中,一般通过将训练样本从原始的维数有限的空间中通过一个非线性映射Φ(x)映射到一个更高维的特征空间中,即可将非线性问题转变为线性问题来构造线性最优超平面。

在SVM的回归问题中首先定义一个训练样本数据集

S={(xi,yi),i=1,2,……,m}

(1)

其中xi∈Rn表示第i个完整失效数据样本,yi∈R表示第i个数据样本的目标值,m是样本的数量。算法的最终目的是为了进行可靠性的研究,故样本数据的目标值采用估计可靠度来代替。利用johnson算法结合中位秩,对于包含有右截尾故障数据以及完整故障数据,定义收集到了n个完整故障数据以及右截尾故障数据,以升序的方式排列编号为1-n记为j;其中包含(n-m)个右截尾数据,完整的失效数据则为m个,同样升序排列编号为1-m记为i;则第i个完整失效样本数据的可靠性估计数据为

(2)

支持向量机的回归问题不同于分类问题,回归问题的目标是将训练集中的所有样本点尽量拟合到一个线性模型中,故需要找到一个能够表示y与x之间依赖关系的函数,而样本中的点与函数之间必然存在一定的距离误差,若采用均方误差表示过于苛刻,故定义一个损失函数err(xi,yi),只要各个样本点的损失不大于常数ε,则认为该样本点没有损失。

(3)

其中f(x)=ωTxi+b=0,ω∈Rn,b∈R为定义的一个超平面,若|yi-f(xi)|≤ε,则认为该超平面是寻找的线性估计模型。

故目标函数可以表示为

(4)

(5)

其中C为引入的松弛因子权重,权重的大小表明了模型对样本误差大小的容忍程度,即C的值越小,过渡带越宽,C的值越大,过渡带越窄。这也使得支持向量机具备更强的泛化性。

而在非线性的回归问题中,非线性映射Φ(x)的加入使得超平面函数变为

f(x)=ωTφ(xi)+b

(6)

相应的目标函数变为

(7)

K(xi,xj)=φ(xi)Tφ(xj)

(8)

核函数的选择主要是基于样本数据的不同而选择不同的参数,比较常用的核函数包括:

用于线性可分情况下的线性核函数

(9)

适用于正交归一化数据的多项式核函数

(10)

广泛用于深度学习以及机器学习中的Simoid核函数

(11)

而本文使用的是局部性较强的高斯核,对于小样本数据以及将其映射到更高维空间的适应性较强,且参数较少计算简便。形式为

(12)

对样本进行回归训练,为保证较高的准确性需要寻得支持向量机的最优参数,在小样本数据的条件下,使用网格法以及交叉验证法对松弛因子权重C以及高斯核函数中的宽度系数R进行搜索寻优。

设置极大的上下界,确保最优参数大概率存在上下界内,令

C∈[Cmin,Cmax],R∈[Rmin,Rmax]

(13)

寻优步长分别为Cs,Rs

对每一组参数(Ci,Ri)进行训练,结合交叉验证法得到各个样本点与最优超平面距离的均方根误差,其中误差最小的一组可以认为是最优参数,若误差相同,为了使得所建的模型泛化能力最大化,选取松弛因子权重较小的一组。

建立代表着故障数据与经验可靠度逻辑关系的函数后便可对少量的数据样本进行扩容,进而对故障发生概率分布参数进行较为准确的估计。

3.2 故障发生概率分布参数的估计

样本扩容后将有效地提高故障分布参数的估算准确性。对于故障发生概率分布,由于威布尔分布能够更准确地描述出在工程系统中常见的“浴盆曲线”失效分布,是目前应用最为广泛的分布函数之一[12],故本文以二参数威布尔分布为例,对经过扩容后的样本数据采用最小二乘法进行参数估计。

二参数威布尔分布的可靠度函数为

(14)

反函数为

(15)

为了更方便直观一些可以定义H(t)=-ln(R(t))使得原式变为

(16)

(17)

将式(2)求得的结果代入式(17)中即可求得参数的估计值。

4 算例分析

4.1 动车组电流互感器各元件故障发生概率分布参数的估计

由于电流互感器在动车组上运行的时间较长,因条件限制难以取得近几年投入使用的新设备运维数据,故认为动车组在大修后使得电流互感器恢复至原始状态。收集某动车段在2016年后凡是进行过二级大修之后近两年的动车组运维数据,共得到60组符合要求的动车运维数据,结合网上信息以及检修师傅的经验判断,舍弃了部分明显不符合常理的故障数据,将故障数据进行整理并根据式(2)计算各个完整失效样本对应的估计可靠度作为训练样本。

因篇幅的限制仅将底事件64外部短路的样本数据及其估计可靠度计算结果用表1展示。

表1 底事件64外部短路样本数据及其估计可靠度

在近两年的运维数据中,在剔除了部分大概率因记录员误操作而记录的数据后,共得到关于底事件64外部短路相关的完整故障数据17次,右截尾故障数据48次。共得到故障数据65次,其中有5次故障是已经发生过该故障并在维修后再次发生,故原始训练样本数目为17。得到支持向量机的训练样本后,进行松弛因子权重C以及高斯核函数中的宽度系数R的参数寻优,在网格搜索法中设定搜索的上下界、步长以及求得的参数结果如表2所示。

表2 底事件64外部短路相关参数计算结果

利用支持向量机对样本数据进行扩容20倍,得到共200个新样本数据,为直观地对样本数据进行显示,将非线性的威布尔二参数通过参数变换将问题转换为线性问题,令

(18)

使得函数变为y=ax+b,原样本数据与扩容后得到的新样本及其估计可靠度如图3所示。

图3 样本点示意图

将扩容后的样本根据式(1)计算其估计可靠度,并带入式(2)中进行威布尔分布参数的估计,结果为α=1.56,β=19357.6

仿照上述过程对所有底事件发生概率分布函数进行参数估计后,结果如表3所示。

表3 所有底事件参数估计值

4.2 方法对比分析

为体现出本文提出的支持向量机扩容后拟合算法的优越性,与传统的最小二乘法[13]进行对比。以上文所举的例子底事件64外部短路为例,计算所得参数的对比结果如表4所示。

表4 不同方法参数结果

而两种方法计算所得的估计可靠度随时间变化的曲线拟合结果如图4所示。

图4 方法对比示意图

通过对比可知基于小样本数据的传统最小二乘法已难以获得准确的参数估计值,且抗野值能力较弱,拟合不足,而本文所提支持向量机方法能够很好的估计参数结果且更符合工程实际,从图6中可以明显看出支持向量机方法能够大大减小野值对曲线拟合结果的影响,具有较高的优越性。

4.3 动车组电流互感器的蒙特卡洛仿真分析

得到了底事件发生概率分布的参数估计值后,采用反函数随机数抽取法来对发生故障的时间进行抽样,本文所设定的二参数威布尔分布的抽取公式为

(19)

其中r为在电脑上产生的[0,1]上均匀分布的随机数。

将动车组电流互感器故障树转化为布尔运算函数

T=x1+x2+x3+x4+x5+……+x70+x71

(20)

其中输入为底事件是否发生,输出为顶事件是否发生。

每次抽样将各个底事件发生的时间作为该函数的输入,将顶事件发生的时间作为输出并进行记录,同时记录引起系统失效的底事件编号。重复以上步骤直到抽样次数达到设定值10000次,将仿真结果进行曲线拟合,结果如图5所示。

图5 电流互感器故障分布函数模拟曲线

得到动车组电流互感器系统故障概率分布函数为

(21)

统计引起系统失效的底事件编号及其出现次数,计算其模式重要度

(22)

其中N1i为底事件i引起系统失效的次数。N2为系统失效总次数。计算结果如表5所示。

表5 底事件重要度

由表5数据可知,底事件编号为1铁芯锈蚀、18铁芯振动、20绕组绝缘老化、41绕组运行劣化、49绕组端部绝缘不良、64分解开关触头外部短路、65过负荷、79负荷不平衡、85分接开关触头压力不足九项底事件重要度相对较高,故可以认为上述事件为动车组电流互感器的薄弱环节,需要在维修保养过程中重点关注。

5 结论

本文以动车组电流互感器为研究对象,建立相关故障树模型,基于其小样本数据,利用支持向量机进行了样本扩容,采用最小二乘法利用扩容后的样本得到了各个底事件发生概率的威布尔分布参数估计值,且通过与传统最小二乘法进行了对比,验证了本文所提方法在小样本数据条件下的优越性。使用蒙特卡洛仿真得到了动车组电流互感器的系统失效概率分布函数以及各个底事件的模式重要度,发现铁芯锈蚀、振动,绕组绝缘老化、运行劣化、端部绝缘不良,分接开关触头外部短路、压力不足等九项问题重要度相对较高,为动车组电流互感器的薄弱环节,为制订相关维修策略提供了有效地参考,为类似于电流互感器的高可靠性小样本数据产品的可靠性研究提供了参考。

猜你喜欢
互感器动车组样本
电子式互感器可靠性检测关键技术及工程应用
电子式互感器可靠性检测关键技术及工程应用
220kV电流互感器故障分析及处理
“95后”动车组女司机的首个春运
“湖南造”首列CJ6动车组上线运营
A Glance of China High Speed Train
随机微分方程的样本Lyapunov二次型估计
“熊猫动车组”获量产资格
基于支持向量机的测厚仪CS值电压漂移故障判定及处理
电子式电流互感器研究