基于多策略ISOA优化SVM的变压器故障诊断研究

2023-03-16 06:51郑业爽李世春鲁玲
智慧电力 2023年2期
关键词:海鸥种群故障诊断

郑业爽,李世春,鲁玲

(1.三峡大学科技学院,湖北宜昌 443002;2.三峡大学电气与新能源学院,湖北宜昌 443002)

0 引言

变压器作为电力系统中的重要设备,如果出现故障将会严重影响电力系统的稳定运行,因此对变压器进行快速准确的故障诊断具有重要的意义[1-3]。

当变压器出现故障时,内部的绝缘油会受热分解,产生氢气和低分子烃类气体,因此采用油中气体溶解分析(Dissolved Gas-in-oil Analysis,DGA)数据对变压器故障进行诊断效果较好[4]。目前基于DGA 的变压器故障诊断主要分为传统方法与人工智能方法[5]。传统方法存在编码不全,过于依赖人工经验的缺陷,无法对变压器故障进行高效准确的诊断[6-7]。因此随着人工智能方法的发展,基于人工智能方法的变压器故障诊断技术也逐渐步入人们的视野,例如神经网络[8]、深度学习[9]、专家系统[10]、支持向量机(Support Vector Machine,SVM)[11-12]等。近年来应用于变压器故障诊断的人工智能主流方法为神经网络与SVM。但神经网络模型复杂性较高,且存在需要较大的样本集、收敛速度慢等缺点,对于样本量少的DGA 数据诊断效果较差[13]。而SVM 凭借泛化性较强,适用于非线性、小样本数据的优势被广泛应用于故障诊断领域[14-16]。但SVM 的分类精度依赖于参数设置,仅凭人工经验无法达到诊断模型性能最大化,因此部分学者通过寻找SVM 的最优参数来构建最优故障诊断模型。文献[17]使用量子行为粒子群对SVM 参数进行寻优以提升故障诊断模型的性能。文献[18]利用合成少数类过采样技术和基于最近邻规则的欠采样方法对变压器故障数据进行采样,使故障诊断模型的分类精度最大化。文献[19]基于类重叠度构造二分类模糊SVM,提出一种基于类重叠特征的变压器分层故障诊断方法,其优点是诊断性能较强。文献[20]采用混合特征法对DGA 数据进行处理,提出采用遗传算法优化SVM的故障诊断模型,其优点是可提升故障诊断的准确率。综合分析文献[17-20]可知,基于SVM 进行故障诊断的模型存在着参数需依靠人为经验设定的缺点,同时传统的元启发式算法也存在易陷入局部寻优的缺陷,从而导致模型诊断精度较低、有效性较差。

综上所述,本文为解决由SVM 参数难以确定而导致的变压器故障诊断精度低及海鸥优化算法(Seagull Optimization Algorithm,SOA)易陷入局部寻优的问题,提出一种多策略改进海鸥优化算法(Improved Seagull Optimization Algorithm,ISOA)优化SVM 的变压器故障诊断方法。该方法的创新之处在于利用非线性惯性权重、Logistic 映射随机性的变异扰动及种群精英化策略对SOA 进行改进,所建立的ISOA-SVM 故障诊断模型较传统方法具有计算精度更高的优点。

1 ISOA优化SVM方法

1.1 SVM原理

SVM 是基于统计理论的一种传统的机器学习方法,其原理是在空间中构造最优超平面,对样本数据进行分类处理。使用核技巧将DGA 数据样本集中的输入向量xi从输n维的输入空间Zn变换到特征空间H,得到特征向量φ(xi)。再将数据升至高维空间,以φ(xi)代替xi构造最优超平面[21-22]。数据分类的决策函数f(x)为:

式中:i为特征量号;ω为法向量;b为分类阈值。

引入松弛变量ξi,构造SVM 针对非线性数据的最大间隔分类器表达式为:

式中:C为惩罚参数;N为每个样本中特征量的集合;yi为分类标记,yi∈{-1,1}。

引入拉格朗日乘子λi,并根据KKT(Karush-Kuhn-Tucker)条件,得到最优ω与b带入式(1),可得最终决策函数f(x)为:

式中:K(xi,xj)为核函数;xj为高斯核函数中心向量;j为核函数中变量号。

K(xi,xj)的表达式为:

式中:σ为核函数参数。

通过分析可以看出,SVM 的最优超平面与惩罚参数C和核函数参数σ有关。本文使用ISOA 对参数C与σ进行寻优,并结合核主成分分析(Kernel Principal Component Analysis,KPCA)对数据进行处理,以达到建立一个快速准确的变压器诊断模型的目的。

1.2 SOA的改进方法

SOA 是 由Gaurav Dhiman 和Vijay Kumar 于2018 年提出的一种新式的元启发算法[23-24]。其基本思想是模拟海鸥种群的迁徙和觅食行为,通过种群间不断迭代更新最优解。本文提出使用SOA 对SVM 的超参数进行寻优,同时针对SOA 初始种群位置较差、容易陷入局部优化的缺陷进行研究。为改善SOA 存在的各种不足,主要针对非线性惯性权重、Logistic 映射随机性的变异扰动及种群精英化3个方面,提出一种多策略的改进方法来全方面提升SOA 的寻优性能。

1.2.1 非线性惯性权重

在SOA 中,参数线性惯性权重A会控制海鸥在给定搜索空间中的运动行为,可以避免海鸥种群在迁徙过程中发生碰撞,影响海鸥种群的全局搜索行为。但A存在无法随着海鸥种群更新而灵活改变的缺陷,因此对其进行改进研究并提出一种非线性惯性权重公式,使A的衰减过程更为平滑。改进后A的表达式为:

式中:t为当前迭代次数;tmax为最大迭代次数。

设tmax=500 次,则改进前后的惯性权重曲线如图1 所示。

图1 惯性权重曲线Fig.1 Curves for inertia weight before and after improvement

由图1 可知,A>1 时,海鸥种群将进行全局搜索;A<1 时,海鸥种群将进行局部搜索。所提非线性惯性权重缩减了海鸥在迭代前中期的全局搜索行为,在迭代中后期A衰减缓慢,SOA 则可进行精细的局部搜索以提升SOA 的寻优性能。

1.2.2 Logistic映射随机性的变异扰动

针对SOA 在迭代过程中容易陷入局部寻优的缺点,提出一种随机变异公式,使海鸥在寻优过程中获得小幅度的扰动。当海鸥种群陷入局部寻优时,该扰动将帮助其跳出局部寻优,当前海鸥位置表达式为:

每一次迭代中R均会随机变换,一般在[-0.5,0.5]之间;变异系数V一般设置为1。同时为了保证随机数生成的遍历性与随机性,提出使用Logistic 混沌映射生成R,Logistic 混沌映射表达式为:

式中:Rt为第t次迭代的扰动系数;Rt-1为第t-1次迭代的扰动系数;μ为控制变量。

为了保证映射得到的Rt始终位于区间[-0.5,0.5]内,μ的取值区间为(0,4],当μ属于(3.569 9,4]之间时Logistic 映射处于混沌状态,本文选择设置μ为4。为证明所提Logistic 映射的有效性,本文利用生成随机数的Rand 函数和Logistic 混沌映射2 种方法迭代3×105次后的混沌序列分布如图2 所示。其中,对生成的所有随机数进行统计,统计范围为[-0.5,-0.4],[-0.4,-0.3],…,[0.4,0.5]共10 个区间。

图2 混沌序列分布Fig.2 Chaotic sequence distribution

由图2 可知,Logistic 映射生成的随机数分别聚集于[-0.5,-0.4]与[0.4,0.5]这2 个区间时,结合式(6)可以看出海鸥种群将进行大变异,可对海鸥种群陷入局部优化的缺陷进行深度改进;Logistic 映射生成的随机数分别聚集于[-0.1,0]与[0,0.1]这2 个区间时,表示海鸥种群几乎没有变异,可保留一部分海鸥种群寻优的优势;分布在其余区间内的随机数则在迭代过程中对海鸥种群进行不同程度上的扰动。由于基于Rand 函数生成的随机数的范围近似相等,无法对海鸥种群进行针对性的变异,因此本文使用Logistic 混沌映射生成扰动系数R。

通过给定变异概率p进行变异判定,若符合p=0.3,则使用变异公式将SOA 原有的位置更新公式进行替换,则当前海鸥位置为:

SOA 通过式(8)进行更新迭代,可以有效帮助陷入局部寻优的海鸥种群快速跳出,在增加算法寻优精度的同时也可以提升其收敛速度。

1.2.3 种群精英化

海鸥种群在每次迭代后会存在几个较差个体,从而影响SOA 的寻优精度和收敛速度,因此本文提出一种种群精英化策略对其进行改进,种群位置表达式为:

式中:M为种群数;m为精英化过程中所选个体组成的集合,一般设为10%M;Hran为范围[1,2,...,m]中的随机整数;index(M)为种群中适应度值排在第M名的个体;index(M-1)为种群中适应度值排在第(M-1)名的个体;index(M-m)为种群中适应度值排在第(M-m)名的个体。

在每一次迭代结束后会选择种群中10%的最差海鸥个体进行精英化,将它们的位置重新更新,以大幅提升海鸥种群的寻优能力。

1.3 ISOA流程

基于ISOA-SVM 的变压器故障诊断流程如图3 所示。该流程包含ISOA 寻优与SVM 故障诊断2 部分。

图3 基于ISOA-SVM的变压器故障诊断流程Fig.3 Fault diagnosis process of transformer based on ISOA-SVM

ISOA 寻优流程具体如下:

1)参数初始化。初始化最大迭代次数、维度、惯性权重及SOA 种群大小等参数的值。

2)种群初始化。通过算法的初始化进程,随机产生海鸥初始种群及个体。计算海鸥个体与种群的初始适应度值。通过对适应度值进行比较,找出最优个体。

3)迁徙行为。SOA 进行迁徙行为时,利用式(5)使用非线性惯性权重替代线性惯性权重A。

4)觅食行为。用随机性变异公式(8)代替传统觅食公式,使海鸥种群进行随机性强且精度更高的觅食行为。

5)种群选择并进行精英化策略。SOA 迭代完成后进行种群选择,将具有最优的种群位置与个体位置作为下一代适应度。使用式(9)精英化迭代后的种群。

6)判断是否满足终止条件。若迭代次数达最大值,算法运行结束,输出寻优结果;否则,转到步骤4。

1.4 ISOA寻优性能测试

为验证所提ISOA 的优越性,选取Ackley 函数与Quartic 函数对粒子群算法(Particle Swarm Optimization,PSO)、SOA 和ISOA 3 种算法的寻优性能进行对比测试。

Ackley 基准测试函数区间为[-32,32],函数的最优解为0,Ackley 基准测试函数表达式为:

式中:F1(x)为Ackley 基准测试函数;xk为测试函数的输入变量;k为求和变量;q为变量总数。

Quartic 基准测试函数区间为[-1.28,1.28],函数的最优解为0,Quartic 基准测试函数表达式为:

式中:F2(x)为Quartic 基准测试函数;Wran为区间[0,1)中的随机数。

假设PSO,SOA,ISOA 3 种算法迭代次数为500次,种群为50 个。对Ackley 和Quartic 2 种函数各取10 次测试结果,适应度变化曲线如图4 所示。

图4 适应度变化曲线Fig.4 Fitness curves

由图4(a)可知,通过适应度值来评定3 种算法寻优过程中个体的优劣程度,ISOA 算法在收敛性和全局寻优性能2 方面较PSO,SOA 都表现更优,在多峰函数中ISOA 可在保证其收敛速度的同时,寻找到比SOA 与PSO 更优的寻优值。由图4(b)可知,ISOA 算法在收敛性和全局寻优性能2 方面较PSO,SOA 依然表现更优,在单峰函数中ISOA 拥有较快的收敛速度且寻优精度也更佳。因为随机变异公式被应用于ISOA 算法,所以ISOA 可以频繁跳出局部寻优,而SOA 与PSO 则易陷入局部寻优且寻优值较低。

综上,与其他2 种优化算法相比,本文所提ISOA 算法无论在收敛性方面还是在全局寻优性能方面,都表现出较好的优化效果。因此,本文使用ISOA 对参数C与σ进行寻优,通过快速准确找到SVM 的最优参数,建立基于SVM 的最优故障诊断模型。

2 基于ISOA-SVM的电力变压器故障诊断

2.1 DGA数据处理

在实际应用中,特征气体往往会携带变压器的故障信息,本文所提变压器故障诊断方法以DGA数据作为特征量进行故障诊断。所使用的DGA 数据是从湖北省某电网公司与文献[25]中获得的500组故障数据。数据存在5 种特征量分别为H2,CH4,C2H6,C2H4及C2H2的含量;6 种故障类型分别为中低温过热(T1)、高温过热(T2)、局部放电(PD)、低能放电(D1)、高能放电(D2)及正常状态(NC)。6 种故障类型编号如表1 所示。

表1 6种故障类型编号Table 1 Numbering for six kinds of fault types

由于DGA 特征量存在偏差与冗余问题,因此使用比值法将DGA 特征量进行扩充。其中,TH 为低分子烃类气体之和(TH=CH4+C2H6+C2H4+C2H2),9种故障特征量分别为CH4/C2H6,CH4/C2H4,CH4/C2H2,C2H6/C2H4,C2H4/C2H2,H2/(TH+H2),C2H6/TH,C2H4/TH,C2H2/TH对应的9 组比值。

为解决因DGA 数据冗杂影响诊断精度的问题,提出适用于非线性数据特征提取的KPCA 方法对DGA 数据进行处理。KPCA 先通过核函数把DGA 数据映射到高维空间,再在高维空间下将其映射到另1 个低维空间以进行特征提取。将数据划分为测试集与训练集,选择其中的330 组数据为训练集,170 组数据为测试集。以帕累托图的形式给出故障特征量主成分贡献率如图5 所示。其中,KPCA 中核宽度选择为8。

图5 故障特征量主成分贡献率Fig.5 Contribution rate of principal component of fault features

由图5 可知,为有效表现故障数据集的故障特征,本文要求故障特征量主成分累计贡献率须达90%。前4 个故障特征量主成分的累计贡献率为90.70%,已达到本文要求的90%,因此选取前4 个故障特征量主成分可有效表现故障数据集的故障特征。本文牺牲贡献率小的故障特征量主成分,将DGA 故障特征量由图5 中的10 维降低到4 维,进而达到提高模型计算效率的效果。

对500 组数据进行故障诊断,训练集与测试集的数据分组如表2 所示,分组比例为2:1。

表2 数据分组Table 2 Data grouping

2.2 故障诊断流程

由图3 可得,基于ISOA-SVM 的变压器故障诊断模型流程为:

1)数据预处理。载入数据,其中训练集为330组,测试集为170 组,对数据进行归一化处理,将所有数据归算到(0,1)之间。

2)KPCA 特征提取。使用KPCA 对DGA 数据进行特征提取,按总贡献率90%的标准对主成分特征量进行提取作为故障数据。

3)基于最优参数建立诊断模型。使用测试完成的优化算法ISOA 对SVM 的参数C与σ进行寻优。

4)故障诊断。SVM 使用最优参数C与σ进行故障诊断。

5)输出诊断结果。输出诊断结果,包括:故障诊断分类情况、测试集准确率、训练集准确率、错分个数情况等。

3 实例分析

本文在MATLAB 仿真平台上使用PSO-SVM,SOA-SVM 以及ISOA-SVM 3 种模型对基于KPCA特征提取后的DGA 数据进行故障诊断,结果如图6所示。

图6 PSO-SVM、SOA-SVM、ISOA-SVM 3种模型故障诊断结果Fig.6 Fault diagnosis results with PSO-SVM,SOASVM and ISAO-SVM

图6 中,蓝色圆圈表示实际故障,红色星号表示故障诊断模型的诊断故障。若圆圈与星号未重合,则表示该次诊断属于错判。

由图6(a)可知,PSO-SVM 模型对于高能放电存在大量错判情况,其中8 个情况错判为低能放电;对于局部放电存在4 个错判;对于低能放电存在6 个错判;对于其余3 种故障类型一共存在7 个错判。对于电故障的诊断效果较差,总准确率为85.29%,模型性能一般。由图6(b)可知,SOA-SVM模型对于低能放电与高能放电均存在6 个错判情况;对于局部放电存在4 个错判;对于中低温过热存在4 个错判;对于高温过热无错判;对于正常状态仅存在1 个错判。总准确率为87.65%,模型性能优于PSO-SVM。由图6(c)可知,使用ISOA 对SVM 的参数进行寻优,从而使故障诊断模型的泛化性能与诊断性能得到提升。对于低能放电存在6个错判;对于高能放电存在3 个错判;对于局部放电存在1 个错判;对于中低温过热存在2 个错判;对于高温过热无错判;对于正常状态存在1 个错判。总准确率为92.35%,模型性能相比较PSOSVM 与SOA-SVM 为最优。

3 种模型故障诊断准确率如表3 所示。

表3 3种模型故障诊断准确率Table 3 Fault diagnosis accuracy of three models %

由表3 可知,为考虑故障诊断模型的有效性,采用三折交叉验证法对3 种故障诊断模型的有效性进行验证,其中ISOA-SVM,PSO-SVM 以及SOA-SVM 的准确率分别为91.96%,83.73%和86.67%,较其总准确率分别减少0.39%,1.56%和0.98%,证明ISOA-SVM 模型的有效性较高。

4 结语

针对SVM 参数难以确定导致变压器故障诊断精度低及SOA 易陷入局部寻优的问题,提出一种多策略改进方法以提升SOA 的寻优精度与收敛速度,并使用基准测试函数对ISOA 的性能进行测试,表明其寻优性能良好。实例分析结果表明,ISOASVM 有效性较强,且具有较高的故障诊断精度。同时也证明ISOA-SVM 具有一定的优越性,在后续研究中可以用来解决更多的分类问题。

猜你喜欢
海鸥种群故障诊断
山西省发现刺五加种群分布
霸道海鸥谁能治
基于包络解调原理的低转速滚动轴承故障诊断
“海鸥”展翅 “美好”起飞
中华蜂种群急剧萎缩的生态人类学探讨
因果图定性分析法及其在故障诊断中的应用
基于LCD和排列熵的滚动轴承故障诊断
高速泵的故障诊断
岗更湖鲤鱼的种群特征
种群增长率与增长速率的区别