基于自适应粒子群优化LSSVM的变压器油中溶解气体浓度预测

2021-06-09 07:03连文莉司刚全
电工电能新技术 2021年5期
关键词:时序粒子变压器

连文莉, 耿 波, 周 舟, 司刚全

(1. 国网陕西省电力公司, 陕西 西安710048;2. 西安交通大学电气工程学院, 陕西 西安 710049)

1 引言

随着我国经济的迅速发展,电力系统不断朝着高电压、大容量的方向发展,保证电力设备的安全运行越来越重要。电力变压器作为电力系统中最关键的设备之一,一旦发生故障会造成大面积的停电及巨额的经济损失[1]。因此迫切需要对变压器的运行状态进行实时在线监测,及时反映该设备的劣化程度,以便采取预防措施,避免停电事故发生。油中溶解气体分析(Dissolved Gas Analysis,DGA)是早期检测油浸式变压器内部潜伏性故障的有效手段[2]。特征气体是油浸式变压器运行过程中自然老化及劣化的产物,其产生过程可大致划分为两个阶段:①在变压器故障早期阶段,特征气体的积累总体较为平稳,常规离线及在线DGA分析不易发现潜在增长趋势;②在故障发生阶段,特征气体含量迅速上升,造成严重的运行事故。因此,分析油中溶解气体历史数据并对未来时刻的值进行合理预测,能够提前判断变压器的状态发展趋势,对指导变压器检修工作和预防事故发生有重要的意义。

目前,油中溶解气体预测方法主要有:REG回归分析法(Regression, REG)、时间序列分析法[3]、灰色预测[4]、组合预测法[5]、最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)[6]等。其中,REG回归法仅仅只能对历史曲线进行大体趋势拟合,不能够给出较为准确的时刻数值;时间序列分析法的参数整定需要大量的数据输入,在样本较少时效果欠佳;灰色预测中,灰关联度的计算和初始值的选取相关,且阈值变量的选取依赖主观经验;组合预测法根据不同权重建立综合预测模型,曲线拟合精度较高,但预测结果缺乏信服度;LSSVM按结构风险最小化准则进行学习,能够较好地解决小样本、非线性等问题,但是其模型的性能过分依赖超参数的选取。

由上可知,优化LSSVM模型的参数能够得到适用于油中溶解气体浓度预测的优异模型。国内外学者也对LSSVM参数模型进行了一定研究:文献[7]利用遗传算法来对LSSVM模型进行参数寻优;文献[8]采用蚁群算法对LSSVM参数进行固定步长搜索;文献[9-12]采用粒子群优化算法对惩罚系数和核参数进行优化。上述方法在参数寻优过程中均有自己的优势,同时也存在一定的问题:遗传算法优化过程中存在不收敛现象;蚁群算法由于其固定搜索模式,可能无法得到全局最优解;粒子群算法容易陷入局部最优。

因此,本文利用自适应粒子群优化算法(Improved Self-adaptive Particle Swarm Optimization, IDPSO)寻找LSSVM参数全局最优值,基于种群的并行搜索策略特点来自适应迭代搜索,避免陷入局部最优和过程不收敛的困境,并将构建的LSSVM模型应用于变压器油色谱参量的预测,实例分析验证了本文方法的有效性。

2 基于LSSVM的变压器油中溶解气体浓度预测

2.1 基于LSSVM的油中溶解气体浓度预测模型

将离线DGA所获取的油中特征气体数据按采集时间依次排列,可构成特征气体时间序列X,具体可表示为X={x1,x2,...,xd},其中d表示时间序列长度。目标是构建模型f(x)对原始时序进行拟合,从而根据已知样本数据对未知样本进行预测。为实现上述目标,首先需构造模型输入矩阵P及相应期望输出矩阵Q。假设嵌入维度为m,则X可进一步表示为:

X={(x1,y1),...,(xd-m,yd-m)}∈(P×Q)d-m

(1)

式中,P为输入矩阵;Q为输出目标。

(2)

考虑运用LSSVM将上述d-m维样本映射到高维空间,即采用非线性变换z=ψ(xi)将d-m维向量映射到l(l>>d-m),在这个高维特征空间中利用f(x)=ηψ(x)+b对其进行线性拟合,最终目标是寻找模型泛化性能与经验风险之间的平衡点,即最小化结构风险[13,14]。

根据结构风险最小化原则,确定线性拟合参数η和b即为计算:

(3)

式中,ηTη为模型的复杂度;C为误差惩罚系数;Remp为误差控制函数。

LSSVM在优化目标中选择损失函数为误差ξi的二范数,优化问题可表示为:

(4)

约束条件:

yi[ηTφ(xi)+b]=1-ξii=1,2,...,d-m

(5)

由于η维数可能趋于无穷,直接求解minJ(ξ,η)较为困难,因此考虑通过拉格朗日变换将该问题转换至其对偶空间,即:

(6)

式中,αi(i=1,2,...,m)为拉格朗日乘子。根据KKT优化条件:

(7)

可得:

(8)

(9)

(10)

定义核函数K(xi,yi)=ψ(xi)·ψ(yi),根据minJ(ξ,η),可将上述问题转化为求解线性方程组:

(11)

运用最小二乘法求解上述方程组得到αi和b,得到LSSVM的预测输出为:

(12)

式中,核函数K可选择满足Mercer条件的任意对称函数。常见的核函数包括线性核函数、多项式核函数、径向基核函数、sigmoid核函数等。本文采用sigmoid核函数,即

K(x,xi)=tanh(v(x·xi)+c)

(13)

选定核函数类型后,LSSVM算法中的ξ、C和σ即为模型最关键的三个参数。参数设置的好坏将直接决定着模型的复杂程度和预测效果,即训练预测模型的关键在于确定所需参数的全局最优值[15-17]。

2.2 基于IDPSO的LSSVM模型参数优化

运用IDPSO求解优化问题时,每个粒子在搜索空间中的位置就代表了一个对应的解,解的优越程度用一个适应度函数衡量。每个粒子都追寻当前处于最有位置的粒子对空间进行搜索,并不断对最优粒子进行更新,逐步向最优解靠近。IDPSO在初始化时首先在空间中随机初始化一群粒子,包括其位置与速度。每个粒子在搜索空间时,反复更新自身搜索过程中发现的最优位置(pbesti)并逐渐向其靠拢,同时也向粒子群历史搜索过程中发现的最优位置(gbest)汇聚。

IDPSO算法采用速度-位置搜索模式,群体中第i个粒子在M维空间的位置与速度分别定义为:

xi=(xi1,xi2,...,xiM),vi=(vi1,vi2,...,viM)。

每次迭代过程中,各粒子根据个体最优位置、全局最优位置以及前一时刻的位置与速度来调整下一时刻对应的状态,迭代公式可表示为:

(14)

xi(t+1)=xi(t)+vi(t)

(15)

式中,xi(t)、vi(t)分别为粒子i在t时刻的位置与速度;r1与r2为[0,1]区间内的随机数;ωi为惯性系数;c1i、c2i为学习因子,计算如下:

(16)

c1i(t)=c1i(t-1)φi(t)-1

(17)

c2i(t)=c2i(t-1)φi(t)

(18)

φi(t)=|(gbest-xl(t-1))/(pbesti-xi(t-1))|

(19)

式中,Kmax为最大迭代次数;ωinitial与ωfinal分别为惯性系数ω的设定初值与终值。

引入适应度函数用于评估当前粒子的优劣,如下:

(20)

式中,yi为目标值;f(xi)为LSSVM输出结果。

IDPSO算法通过引入多样性度量指标从而避免粒子群的早熟收敛问题。具体实现包括以下两个方面:

(1)选取初始种群

初始粒子群的选取是随机的,理想状况下其位置应遍布整个解空间以增加搜索到全局最优解的概率。但是粒子的个数是有限的,解空间又相对较大,如果不能保证有限个粒子均匀分布在整个解空间,就加大了陷于局部最优的可能。

为此,引入平均粒距的概念,定义如下:

(21)

(2)判断早熟收敛

(22)

式中,f为归一化定标因子,取值如下:

(23)

适应度方差反映的是种群中粒子的聚集程度,σ2越小,则种群中粒子的聚集程度越大;反之,则聚集程度越小。当α2<β(β为某一给定的阈值)时,认为算法进入后期搜索阶段,此时种群容易陷入局部最优而出现早熟收敛现象。

3 基于IDPSO优化的LSSVM模型预测方法

本文基于迭代寻优思想,将IDPSO与LSSVM相结合应用于变压器油中溶解气体含量预测,以达到将IDPSO不易陷入局部最优解的良好特性与LSSVM在求解凸二次优化问题速度上的优势相结合的目的,最终实现对变压器溶解气体含量进行准确预测。由于LSSVM的学习精度以及泛化能力很大程度上依赖参数的选择,因此采用IDPSO算法对其参数进行优化。

运用IDPSO算法对LSSVM的参数ξ、C和σ进行优化,每个粒子由三维参数(ξ,C,σ)决定其位置和速度,适应度函数可表示为预测精度均方差值,算法主要步骤如下:

(1)随机初始化一群粒子,设置群体规模M、惯性权重因子的初值ωinitial与终值ωfinal以及最大迭代次数Kmax。由于ξ、C和σ的数量级不同,还需对其进行无量纲化处理。

(2)根据当前位置计算各个粒子的适应值并作比较,将各个粒子当前点设为最优位置,所有粒子中最优者设为种群最优位置。

(3)更新粒子速度和位置,产生新种群X(t)。

(4)计算X(t)各个粒子新位置的适应值,并分别与其历史最优位置和种群的历史最优位置作比较,若更优,则替换,否则,保持不变。

(5)检查是否满足寻优结束条件(达到或小于),若满足则结束寻优,得到最优解,否则,令t=t+1,转步骤(2)。

(6)将IDPSO寻优结果代入LSSVM,对变压器特征参量进行预测。

基于IDPSO优化LSSVM的变压器特征参量预测模型如图1所示。

图1 基于IDPSO优化LSSVM的模型构建流程图Fig.1 Structure of LSSVM optimised by IDPSO

4 实例分析

4.1 数据来源

本部分采用陕西省电力公司提供的辖区内变压器7种常规油中溶解气体(H2, CH4, C2H6, C2H4, C2H2, CO, CO2)时序数据,采样频率为天,采样长度为70~300不等。将原始数据集Xi(i=1,...,7)划分为两部分,将每组时序数据的末尾20个作为测试集Xit,前面剩余部分作为训练集Xiv,具体划分如表1所示。

表1 原始油中溶解气体时序数据及其划分Tab.1 Original time series and division results

4.2 实验设置及算例分析

随后,对于每一组训练集Xiv={x1,x2,...,xn},构造模型的输入训练集样本XivT={(x1,y1),...,(xn-m,yn-m)}∈(P×Q)n-m,其中P为输入矩阵,Q为输出目标,m为嵌入维数。

IDPSO算法中各参数的初始化选取如下:确定粒子个数M为30,最大迭代次数Kmax为300,惯性权重系数ω线性变化范围为[0.4,0.9],加速常数c1和c2分别为1.5和1.7。

随后利用IDPSO对ξ、C和σ进行寻优,其中ξ和σ寻优范围设定为[0.1,10 000],C初值设为0并进行迭代更新。随后利用训练数据对LSSVM预测输出函数进行训练。此后,采用与训练集同样的划分方式对于测试集数据进行处理,并利用构造后的训练集对模型预测性能进行测试。

在基于IDPSO优化的LSSVM预测模型中,嵌入维数m的取值也将影响最终的预测效果。若m过大,则将大幅降低训练集样本的数量,导致模型训练不充分。经测试,当m超过算例所采用样本长度的10%时,预测精度将出现一定程度的下降。相反,若m过小,将导致训练样本长度过短,模型无法提取时序自身的波动信息,同样将降低模型预测的准确度。考虑到现有文献中没有指导该参数取值的依据,本例中通过实验方法确定m的取值。预实验中将m的取值范围限制在2到训练集长度的10%之间,重复上述训练及预测过程,最终确定在所选时序样本下的最优m取值为5。

图2(a)~图2(g)分别展示了7种特征气体的原始时序数据、针对测试集的预测结果,以及寻优过程中粒子最优适应度f的变化情况。实验过程均采用单步预测,即在获取某一时刻时序样本真实值后再对后续时序变化进行预测。图2(a)~图2(g)中,左栏图中“◇”标注的序列表示原始时序,“*”标注的序列表示预测结果。由图2可得,IDPSO -LSSVM能够较准确地跟踪气体含量变化并预测其趋势。除C2H4之外,其余寻优过程在迭代100次左右均可收敛,表明了算法的高效性。

图2 七种气体的预测结果及最优适应度变化曲线Fig.2 Result of prediction and best fitness curves regarding different gases

4.3 同类方法对比分析

为了进一步说明本预测算法的有效性,本节将IDPSO-LSSVM的预测结果与目前普遍使用的油中溶解气体预测方法,即ARIMA与REG回归的预测结果进行对比。

首先,图3(a)~图3(g)展示了三种方法对于7种特征气体的预测结果对比。其中,“●”标注序列为原始时序样本,“★”、“◆”及“■”标注序列分别代表IDPSO-LSSVM、ARIMA及REG回归的预测结果。由对比可见,IDPSO-LSSVM及ARIMA的预测精度明显高于REG回归,对气体时序样本的跟踪效果较好。进一步而言,IDPSO-LSSVM针对大部分时序样本的拟合效果优于ARIMA,该优势针对C2H6预测时尤为明显。

图3 三种方法在不同特征气体预测中的对比Fig.3 Comparison of results given by three methods

为进一步对三种方法预测性能进行定量对比,本节采用以下两个指标作为预测结果评判标准,即平均绝对误差MAE (Mean Absolute Error)与均方根误差RMSE(Root Mean Square Error),计算方式如下:

式中,τ为预测长度,本例中取20。表2展示了IDPSO-LSSVM、ARIMA及REG回归预测算法针对7种特征气体的预测结果评价指标。最后也给出了各方法针对不同气体预测结果的MAE及RMSE均值。

表2 预测结果对比Tab.2 Comparison of prediction results

由表2可见IDPSO-LSSVM针对大部分特征气体含量的预测效果明显优于传统ARIMA及REG算法。在考虑MAE作为主要评价指标时,IDPSO-LSSVM在6类气体时序样本中的预测结果优于常用对比方法。具体而言,IDPSO-LSSVM较ARIMA的MAE及RMSE平均降低了14.67%与10.66%,且显著优于REG回归。

由此可见,本文提出的IDPSO-LSSVM模型具有较强的学习性能,充分利用了IDPSO自适应寻优不易陷入局部最优解的特性,使优化后的LSSVM能更为准确地分析数据的变化规律从而得到更为精确的跟踪预测结果。

5 结论

文中将自适应粒子群与最小二乘支持向量机相结合,利用粒子群算法基于种群的并行搜索策略特点来自适应迭代搜索最优的目标函数值,从而找到LSSVM核函数中的参数ξ、C和σ的最优取值,克服了应用传统支持向量机算法进行预测时凭主观经验选择参数对模型泛化能力和预测性能的影响,也避免了普通粒子群算法容易陷入局部最优解的缺陷。通过对特征气体的预测实例可见,本文所提出算法的模式跟踪与预测性能较好,为后续变压器的状态预测打下了良好的基础。

猜你喜欢
时序粒子变压器
基于Sentinel-2时序NDVI的麦冬识别研究
理想变压器的“三个不变”与“三个变”
基于粒子群优化的桥式起重机模糊PID控制
开关电源中高频变压器的设计
基于粒子群优化极点配置的空燃比输出反馈控制
基于FPGA 的时序信号光纤传输系统
一种毫米波放大器时序直流电源的设计
一种不停电更换变压器的带电作业法
变压器免维护吸湿器的开发与应用
DPBUS时序及其设定方法