基于改进RBF的变压器油色谱在线监测装置配置策略研究

2020-01-14 06:03李文震罗汉武许晓路谷凯凯吴启瑞
计算机应用与软件 2020年1期
关键词:色谱聚类变压器

李文震 罗汉武 许晓路 谷凯凯 吴启瑞

1(国网内蒙古东部电力有限公司 内蒙古 呼和浩特 010020)2(国网电力科学研究院武汉南瑞有限责任公司 湖北 武汉 430074)

0 引 言

近十年来,我国在变电运检领域取得了长足的进步,电网规模不断增长,变电站数量由21 556座增加到39 247座,由于输变电设备数量与变电站数量正相关,可以认为设备规模增长82%,但运维人员仅增长9.8%,结构性缺员问题突出。而传统的人工巡检和带电检测方式也暴露出人力成本和运维成效之间的矛盾。而此类运维模式多针对缺陷后期,无法对故障前期状态进行发掘,严重影响电网安全稳定运行。

变压器作为电力系统最关键的设备,其运行状态关乎整个区域电网安全,对变压器故障及时诊断分析具有重要意义。变压器油色谱在线监测已成为了变压器状态监测的重要发展方向和组成部分。

变压器油色谱在线监测旨在不停电情况下,对变压器进行连续性的自动检测,掌握变压器内部运行状况。特别针对偏远地区、无人值守电站等特殊区域安装实时监测设备,有利于实现变压器监测自动化和智能化。

国网公司对变压器在线监测系统配置做出了规定,强制安装220 kV及以上变压器,110 kV(66 kV)及以下电压等级变压器为选配,实际操作普遍采用基层单位需求上报、网省公司审批的模式,配置方式粗放。为此,研究110 kV(66 kV)及以下变压器油色谱在线监测装置配置策略,对降低变压器故障率,是当前电网系统中急需要解决的一项重要研究课题。

油色谱在线监测装置配置问题是一个经典的组合优化问题,其配置受到很多因素的制约,目前在该领域,国内外已经有大量的研究工作。文献[1]针对观测站选址问题,从地质、工程设计和建设角度出发,设计了一种基于经验和专家决策的选址原则和方法。文献[2]针对变压器油色谱的在线监测问题,提出了一种基于改良三比值法的变压器故障在线监测系统,对在线检测装置从安装、运维、诊断等方面进行了系统研究。文献[3]对输电线路污秽在线监测装置选址问题进行研究,提出了利用层次分析法进行选址。这些相关文献大部分停留在经验模式,专家决策等模式中,其科学性不足,并缺乏全局性、系统性地规划和考量。因此有效地利用历史数据,并使用科学的理论方法对在线装置配置问题进行系统建模,并指导实践显得更为重要。

为了提高在线装置的运行效率和监测准确率,本文以蒙东电网公司为研究对象,分析近年来变压器故障状况,根据易发故障所在区域的相关数据,分析并筛选了影响在线监测装置配置问题的重要影响因子。利用改进RBF神经网络模型对在线监测装置配置问题进行了系统建模,提出了一种基于K-means聚类和遗传算法的RBF神经网络配置模型,为在线监测装置配置提供了理论依据,提高变压器实时监测准确率,进一步保障了电网的安全稳定供电,对我国变电检修工作具有重要的意义[4-6]。

1 影响因子分析及RBF适用性分析

1.1 影响因子分析

变压器油色谱在线监测装置在实际应用过程中受到很多因素制约,影响因素众多,主要分为内部的变压器本体运维和外部的变压器所处环境两大类,如图1所示。

(1) 变压器本体运维状态类包括电压等级、 历史故障次数、运行年限、负载类型和历史缺陷次数。其中:电压等级是表征变压器在电网中重要度最核心指标,电压等级越高,所处位置和安全级别就越高;历史故障次数和历史缺陷次数主要说明变压器故障发生率和缺陷发生率,因维修更换过程中会对变压器进行大面积拆解和试验,后续局部放电和过热可能性提高;运行年限与设备运行工况体现出“浴缸效益”,是重要影响因子;变压器负荷类型直接影响了变压器内部故障风险率,突发急救负载不断挑战安全阈值,需要通过在线监测装置实时监测变压器各项指标。

(2) 变压器所处环境类包括变压器运行位置的重要度、是否存在家族性缺陷、场站环境等。由于变压器运行位置表征所属场站重要度,其对监测装置配置的影响不容忽视。家族性缺陷是同厂家、同批次、同型号等多个维度对比分析,共性明显,需要对有家族缺陷设备进行重点监控;场站环境是表征变电站的所处区位的多雷、大风、极寒、地质灾害等地理环境和贴近工矿企业、居民社区等运行环境,也是造成故障风险的一大因素。

1.2 RBF神经网络适用性分析

变压器油色谱在线监测装置配置是内因和外因等多种因素共同决定的,而其中大部分影响因素具有很多的不确定性和复杂性,它们之间的关系并不是简单的线性关系或者指数关系等,无法用精确的表达式进行描述。而人工神经网络模型通过模拟人的脑神经功能,具有很好的自我学习能力、很强的自适应性、自组织性和泛化能力,能适应复杂不确定的系统和环境,能够更好地描述自变量和因变量之间之中非线性、复杂度高的关系[7-10]。因此,我们考虑使用人工神经网络进行监测装置配置问题的决策。其中,当样本数据较多,输入输出之间关系较为复杂时,BP神经网络容易进入局部收敛且收敛速度较慢。因此本文中,我们选取径向基函数(Radial Basis Function, RBF)神经网络[1]来进行建模,它是由Powell于1985年提出的一种高效前馈式神经网络。它结构简单,易于操作,学习收敛速度快,几乎可以逼近任意的非线性函数,具有强大的泛化能力。使用RBF模型解决变压器在线装置配置问题的适用性主要体现在以下几个方面:

(1) 对于复杂非线性的关系来说,RBF模型可以通过以往数据快速为电网决策人员提供一个配置方案。

(2) RBF模型可以充分利用历史数据,有效地评估不同配置方案的优劣,为电网决策人员提供可靠的技术支撑。

(3) RBF模型可以与其他一些优化方法进行结合,不断地更新和改进自身算法,最终形成一种配置方案评估的工具,提高电网检修能力。

2 基于RBF的装置配置模型

2.1 RBF神经网络

RBF神经网络是一种三层结构的神经网络,包括输入层、隐含层和输出层。其中从输入空间到隐层空间的变换是非线性的,而从隐层空间到输出空间的变换是线性的。其基本思想是用RBF作为隐单元的“基”来构成隐含空间,隐含层对输入空间中的矢量进行变换,将向量从线性不可分的低维度映射到线性可分的高维度。RBF神经网络可以处理一些系统内难以解析的规律,具有良好的泛化能力,且结构简单、易于操作,学习收敛速度快,因此被广泛地应用于非线性函数逼近、信息处理、系统建模、控制和故障诊断等领域[16]。

假设RBF网络输入向量为X=[x1,x2,…,xp]T,则多输入单输出可描述为:

(1)

式中:K是隐含层神经元个数;αk是隐含层到输出层的权值向量;φk是输入层到隐含层的输出,其输出值取决于输入向量与径向基函数中心的距离。在这里基函数选取高斯函数,距离采用欧式范数表示,则:

(2)

式中:ci是第i个隐含层节点高斯函数的中心向量;σi是第i个隐含层节点的标准化常数。

由此可知,RBF神经网络算法设计中需要求解的参数主要包括:隐含层节点数、隐含层节点中径向基函数的中心和方差、隐含层到输出层的权值。RBF神经网络有很多中学习方法,如随机选取中心法、自组织选取中心法、最近邻聚类法、有监督选取中心法、K-means聚类法等。本文中选取利用K-means聚类算法和遗传算法相结合的学习方法对RBF神经网络参数进行不断的优化和修正,有效地保证了网络预测精度,实现了神经网络结构和参数的自校正。

2.2 RBF神经网络结构的建立和分析

在变压器油色谱在线监测装置配置问题中,RBF神经网络结构的建立首先应该确定网络输入自变量X,并输入到神经网络系统中,作为输入层;其次将不同地址评分作为因变量Y,作为网络模型的输出,以此建立二者的非线性关系模型;最终建立网络结构,如图2所示。

图2 RBF神经网络结构图

输入层节点数与在线监测装置配置影响因子有关,本文结合历史记录中的变压器相关监测数据、变压器故障数据、所处环境等数据,对变压器油色谱在线监测装置配置影响因素进行了分析,确定了主要影响因子有:电压等级(x1)、历史故障次数(x2)、运行年限(x3)、变压器运行状态(x4)、变压器最大负载(x5)、历史缺陷次数(x6)、所在运行位置重要度(x7)、是否有家族性缺陷(x8)、场站环境(x9)。选取以上9个影响因子作为神经网络输入层的神经元节点。由于这几类影响因子量纲不同,在网络进行训练前,需要对样本数据进行无量纲归一化的预处理过程。

(3)

(2) 文字类影响因子。油色谱在线装置配置影响因子中还有一些因子只能用文字进行描述,但是这些因子在变压器故障风险中影响颇大,对监测装置配置影响亦不容忽视,例如电压等级、负载类型、变压器运行位置重要性等,对于这一类文字类影响因子采用如表1所示的赋值方法,并进行归一化。

表1 油色谱在线监测装置配置影响因子赋值

将监测装置不同的配置评分作为神经网络结构的输出Y,为了便于比较将评分进行归一化处理,使得不同样本的输出值均在0~1之间。经过数据预处理,确定网络输入和输出,建立基于改进RBF神经网络在线监测装置优化配置模型,通过参数优化学习,找出最终的最优配置策略,并进行结果输出。

2.3 基于RBF模型的建立和分析

变压器油色谱在线监测装置配置问题属于复杂的非线性系统问题,因此我们采用基于K-means聚类和遗传算法的RBF神经网络模型进行装置配置,其优化选址配置流程如图3所示。

图3 基于K-means聚类和遗传算法的RBF装置配置流程

步骤1确定RBF神经网络结构。在训练开始时,进行样本数据输入,并根据2.2节介绍的数据预处理方法进行处理得到RBF神经网络的输入层和输出层。

步骤2优化RBF网络结构参数。遗传算法(Genetic algorithm,GA)是模拟生物进化论中的自然选择和遗传学中的生物进化过程所形成的一种搜索最优解的计算模型,它具有良好的全局优化性能,搜索效率较高。因此我们利用遗传算法对网络结构中隐含层节点数K、中心向量ci和宽度σi进行参数优化。其优化过程包括:

1) 染色体编码。模型采用实数编码,将由隐含层节点数K、中心向量ci和宽度σi组成的集合编码成一个个体,个体基因值用实数来表示。

2) 生成初始种群。目前,比较常用的RBF学习算法有K-means聚类算法,其基本思想是从输入样本数据中选取k个数据作为初始的聚类中心;然后计算所有样本与聚类中心的范式距离,对样本进行分类,重新计算得到新的聚类中心,反复执行上述步骤,直到聚类中心不再变化,得到中心向量ci;接着根据聚类中心之间距离确定宽度σi。该算法简单易实现,因此我们选用随机选取不同的厨师聚类中心并多次利用K-means算法优化得到初始种群个体。

3) 计算种群内个体适应度。适应度函数用来评价种群中每个个体的优劣,个体适应度越大,性能越好。参数优化的最终目的是找到一组最优参数,使得样本的均方误差最小。因此适应度函数如下:

(4)

4) 判断染色体适应度是否满足设定要求。若满足输出最优染色体,即最优RBF网络参数;若不满足,则利用遗传算子对染色体进行选择、交叉和变异。交叉概率Pc和变异概率Pm计算方式如下:

(5)

(6)

式中:fmax是种群中最大适应度;favg是该平均适应度;f′为将要进行交叉的两个个体中较大的适应度;f为将要进行变异的个体适应度;Pc1、Pc2、Pm1、Pm2为固定值。以此产生新种群重复如上遗传步骤,直到满足设定条件,选出最优染色体。

5) 输出最优配置结果。利用最优的网络参数,得到最优的RBF神经网络模型,输出全局最优解。

3 案例分析

为了验证提出的选址模型有效性,本文选取蒙东电网公司近年来12组变压器油色谱在线监测装置配置及其相关数据作为样本数据。其中:由历史记录数据中得到每种配置方案影响因子数据并进行归一化处理后作为模型输入数据;由专家对每种不同的方案按照相同指标进行了评价打分,输出各个方案的总评作为模型的输出数据。最终样本数据如表2所示。

表2 12组历史监测装置配置的样本数据

续表2

模型训练利用的是MATLAB[19]关于神经网络的仿真实验环境,样本数据中前10组用于神经网络的训练,后2组作为测试数据。为了对比算法的效果,本文将传统的BP神经网络与本文所建立的K-means+遗传算法+RBF神经网络模型进行对比研究,实验中所用到的参数有:BP神经网络中训练目标参数为0.000 1,训练次数为5 000; K-means+遗传算法+RBF神经网络模型中参数设置为种群个数为10,遗传算法迭代次数为100,交叉变异概率为Pc1=0.9、Pc2=0.5、Pm1=0.1、Pm1=0.002。

10组数据训练误差结果如图4所示,可以看出,采用BP神经网络模型和改进的RBF神经网络模型对油色谱在线监测装置配置问题进行评分,对同样的样本数据来说,BP神经网络收敛速度较慢,改进的RBF神经网络收敛速度较快,效率更高。

(a) BP训练结果

(b) RBF训练结果图4 不同模型下训练误差变化曲线图

为了进一步说明RBF神经网络比BP神经网络更加适用于小样本数据的训练,我们对10组数据输出真实值和预测值进行了对比分析,结果如图5所示。可以看出,RBF网络更加适合于处理小样本数据,其训练结果要比BP神经网络好。因此当训练样本数据少时,使用本文提出的改进RBF神经网络更加有效。

图5 不同模型下真实值与拟合值对比图

除此之外,我们用训练好的RBF神经网络对剩下的2组测试数据进行总评分预测,将输入数据带入到神经网络输入结构中,最终得到方案11和12的总评分分别为0.431 2和0.759 6。

4 结 语

本文结合蒙东电网特征,包括地区、变压器故障、地理信息等,找出变压器油色谱在线监测配置主要影响因子,研究并提出了一种基于改进RBF神经网络的在线监测装置配置模型。该模型有效地结合K-means聚类和遗传算法对神经网络参数进行了优化,并找到最优参数,来对不同的配置策略进行评分,最终得到最优配置。该模型可以快速并有效地找到变压器油色谱在线监测装置配置方案,提高了故障监测效率,对蒙东电网输电线路的安全稳定运行提供了强有力的支撑和保障。

猜你喜欢
色谱聚类变压器
《色谱》论文中可直接使用的缩略词
一种傅里叶域海量数据高速谱聚类方法
10KV变压器配电安装柜中常见问题分析
高效液相色谱技术在食品检测中的具体应用探讨
一种改进K-means聚类的近邻传播最大最小距离算法
丁硫克百威的液相色谱研究
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
理想变压器的“三个不变”与“三个变”
变压器经济运行分析与应用
变压器经济运行分析与应用