基于改进随机森林的电力系统暂态稳定评估

2022-05-06 13:05刘炼王强陈浩
科学技术与工程 2022年11期
关键词:暂态子集特征选择

刘炼, 王强, 陈浩

(三峡大学电气与新能源学院, 宜昌 443002)

随着现代电力系统的广域互联和电力电子设备的广泛部署,电力系统运行的不定因素剧增且运行状态愈发接近稳定运行的极限,对其进行快速、准确的暂态稳定评估已成为保证系统安全稳定运行的重要手段[1-2]。近年来,随着同步相量测量单元(phasor measurement unit,PMU)在电网中的广泛应用,电力系统运行数据的采集变得更加迅速和精确,数据量变得尤为庞大[3]。同时,由于智能电网建设的逐步推进和人工智能技术的飞速发展,促使基于机器学习的暂态稳定评估方法成为电网安全领域的研究热点[4-5]。

目前,常用于分析电力系统暂态稳定的机器学习算法有支持向量机(support vector machine,SVM)[6-7]、人工神经网络(artificial neural network,ANN)[8-10]、决策树(decision tree,DT)[11-12]和随机森林(random forest,RF)[13-14]等。在文献[6]中,考虑暂态稳定评估的时效性要求,提出了一种基于SVM的预想事故筛选方法。文献[9]基于遗传算法和极限学习机对暂态稳定评估中的特征选择问题进行了探讨。文献[10]通过数据增强技术处理输入数据存在噪声和信息缺失的问题,并基于深度残差网络构建电力系统暂态稳定预测模型。文献[12]提出了一种由线性SVM和DT构成的组合式暂态稳定评估方法。文献[13]为了实现实时的电力系统暂态稳定监测,提出了一个基于迭代随机森林的在线应用框架。

虽然上述方法已经取得了较好的效果,但在实际应用过程中仍会面临以下问题:一方面,随着电网规模的不断扩大,电力系统运行数据的维度也在不断增加,如何选取与暂态稳定标签具有强相关性的关键特征是一个难题;另一方面,在离线训练过程中,由于数据库中的稳定样本远多于失稳样本,导致暂态稳定评估模型会倾向于对稳定样本的学习,容易造成对失稳样本的误判。

基于以上分析,提出一种基于特征选择和改进随机森林的电力系统暂态稳定评估方法。通过最大化联合互信息(joint mutual information maximisation,JMIM)进行特征选择,筛选出初始特征集中的关键特征子集,并基于改进的RF构建关键特征子集与暂态稳定标签之间的映射关系,建立相应的暂态稳定评估模型。在新英格兰10机39节点系统进行仿真实验,结果表明,该方法能够较好地处理样本数据的类别不平衡问题,具有较高的评估精度和较强的泛化能力。

1 关键特征集的构造

1.1 初始输入特征集

电力系统在运行过程中,PMU会实时采集系统运行的电气量信息。常用于反映电力系统运行状态的特征包括节点的电压幅值/相角、负荷节点的有功/无功功率、发电机节点的有功/无功功率和线路传输的有功/无功功率等。这些特征可以组成一个电力系统运行的样本o,通过结合多个运行样本,可以将初始特征集构建为矩阵形式,即

(1)

式(1)中:u为初始输入样本的数量;v为包含电压、相角、有功/无功功率等运行状态信息的特征维度。

1.2 基于JMIM的特征选择

基于机器学习算法建立暂态稳定评估模型的本质就是建立特征数据与暂态稳定标签之间的映射关系。因此,选择合适的输入特征能够降低评估模型的计算负担,提高模型计算的效率。本文中采用JMIM对初始样本进行特征选择,JMIM是一种基于联合互信息和“最大最小原则”的特征选择方法,能够有效处理某些特征的高估问题[15]。JMIM进行特征选择的原理介绍如下。

对于变量X=[x1,x2,…,xm],其熵的计算式为

(2)

式(2)中:p(xi)为xi在X中的概率密度函数。信息熵越大,表明相关变量的信息含量越大,不确定性就越高。

对于X和变量C=[c1,c2,…,cn],X和C之间的条件熵被定义为

(3)

式(3)中:p(xi,cj)为xi和cj的联合概率密度函数;p(xi|cj)为已知cj条件下xi的条件概率密度函数。

熵的大小用于衡量变量之间的稳定性,而互信息的大小用于衡量变量之间的相关性。根据式(2)和式(3),将变量X和C之间的互信息定义为

I(X;C)=H(X)-H(X|C)=

(4)

式(4)中:p(cj)为cj的概率密度函数。互信息I(X;C)越大,表明变量X和C之间的相关性越强。如果两个随机变量之间相互独立,则它们的互信息值为0。

当加入另一条件Y=[y1,y2,…,yn]时,在Y条件下X和C的条件互信息定义为

I(X;C|Y)=H(X|C)-H(X|C,Y)

(5)

根据式(4)和式(5),将X、C和Y之间的联合互信息定义为

I(X,Y;C)=I(X;C|Y)+I(C;Y)

(6)

联合互信息I(X,Y;C)考虑了X、Y整体和变量C之间的联系,I(X,Y;C)越大,表明X、Y和C之间的相关性越强。

基于以上分析,文中将电力系统的初始特征集定义为F={f1,f2,…,fn},需要选择的特征子集定义为S,且fi∈F-S,类别为C。JMIM的计算公式为

fJMIM=argmaxfi∈F-S{minfs∈S[I(fi,fs;C)]}

(7)

式(7)中:I(fi,fs;C)表示特征fi和fs以及类别C之间的联合互信息;minfs∈SI(fi,fs;C)表示每个特征fi加入到集合S时计算I(fi,fs;C)得到的最小值,称为最小联合互信息。其中,I(fi,fs;C)的计算公式为

(8)

式(8)中:p(fi,fs,cj|fs)为已知fs条件下,fi、fs和cj的联合条件概率密度函数;p(fi|fs)和p(cj|fs)分别为已知fs条件下,fi和cj的条件概率密度函数。

每个特征fi计算得到一个最小联合互信息,最终的集合为{minfs∈SI(fi,fs;C)}。JMIM选择集合{minfs∈SI(fi,fs;C)}中使最小联合互信息值最大的特征作为新选择的特征,并通过如下迭代贪婪搜索算法在特征空间内寻找一个大小为k的特征子集S。

2 改进的RF算法

改进的RF算法整体流程如图1所示,主要包括bootstrap抽样方法的改进和DT的加权投票。

R、R′分别为初始样本和抽取样本的不平衡度;w1,w2,…,wT为决策树的投票权重图1 加权随机森林算法Fig.1 Weighted random forest algorithm

2.1 带约束的bootstrap抽样

RF是一种集成学习算法,由多棵DT组成[16]。传统的RF使用bootstrap进行有放回的随机抽样,每次随机抽取初始样本的2/3作为一个子集训练一棵树。bootstrap抽样是RF随机性的保证,但这存在一个问题,假设初始样本集P为类别不平衡数据集,样本的不平衡度为R,其计算式为

(9)

式(9)中:Pmax和Pmin分别表示初始样本中的多数类和少数类样本。

在bootstrap抽样过程中,若随机抽取的子集的不平衡度比R大,表明该子集的类别不平衡问题较为突出,由此类子集训练得到的DT会更加倾向于对多数类样本的学习,不利于对少数类样本的识别。为了降低抽样过程的影响,文中通过在bootstrap抽样中添加约束条件,可以保证在每次抽样过程中至少抽取2/3的少数类样本。该约束条件为

(10)

(11)

式中:P′max和P′min分别表示抽取的多数类和少数类样本。

2.2 加权随机森林算法

传统的RF不加以区分的对待所有的DT,导致分类性能不同的DT具有相同的投票权重。为了提高RF对少数类样本的识别能力,现提出一种加权随机森林算法(weighted random forest,WRF)。在DT训练阶段,通过评估每棵DT的分类性能,为能够准确分类少数类样本的DT赋予一个更高的权重,并通过加权投票的方式获得最终的预测结果。文中将WRF的预测结果定义为

(12)

式(12)中:N为测试集;T为DT的数量;I(·)为指示函数;ft(N)为第t棵DT的预测结果;y表示类别;ωt为第t棵DT的投票权重。当DT的预测结果为真时,指示函数I(·)的值为1,反之为0。

首先,列出如表1所示的混淆矩阵。其中,TP表示将稳定样本判别为稳定样本,FN表示将稳定样本判别为失稳样本,FP表示将失稳样本判别为稳定样本,TN表示将失稳样本判别为失稳样本。

表1 混淆矩阵Table 1 Confusion matrix

文中使用每棵DT对失稳样本分类的精确率Pre(precision)和召回率Rec(recall)的调和平均值F1作为该树的权重,将每棵树的投票权值ωt定义为

(13)

(14)

(15)

F1越大,表明该决策树对少数类样本的分类性能越好。

3 在线暂态稳定评估

基于JMIM和WRF的在线暂态稳定评估流程如图2所示,主要包括离线训练和在线应用两个阶段。

图2 在线暂态稳定评估流程Fig.2 Online transient stability assessment process

3.1 离线训练

3.1.1 数据库生成

通过电力系统仿真软件PSS/E进行时域暂态仿真,生成一个包含多个样本的暂态稳定数据库,并为每个样本附上其对应的暂态稳定标签。

3.1.2 特征选择

通过仿真生成的初始特征集中包含了各发电机、母线和输电线路等关键设备的运行状态信息,特征维度较高。为了降低模型计算的复杂度,通过JMIM挖掘初始特征之间的相关性,剔除冗余特征,筛选出一个与暂态稳定标签具有强相关性的关键特征子集。

3.1.3 模型训练及测试

基于筛选的关键特征子集,对WRF模型进行训练及测试,建立一个能够准确反映关键特征数据与暂态稳定标签之间的映射关系离线暂态稳定评估模型。

3.1.4 知识库建立

考虑到电力系统是一个时变的大系统,经常会因为检修等原因造成系统的网络拓扑结构发生变化。由于初始训练样本中不可能涵盖电力系统所有的运行拓扑场景,当电力系统的拓扑结构发生改变时,原模型会出现评估精度降低甚至变得不适用。因此,需要进行多种电力系统拓扑结构下的仿真,针对不同的运行场景进行暂态稳定分析,建立相对应的离线评估模型。然后,将所有的离线模型集成到一个知识库中,以备后续出现紧急事故时的快速调用。

3.2 在线应用

在应用阶段,首先通过控制中心服务器判断电力系统的网络架构,并从知识库中调用与当前网络拓扑相对应的暂态稳定评估模型。选择PMU采集的关键特征数据输入离线训练好的评估模型,实时监测系统的稳定状况。当系统被判别为稳定运行时,则保持对系统运行状态的持续监测;当系统被判别为失稳运行时,则应立即采取控制措施。

3.3 模型性能评价指标

由于电力系统长期处于稳定运行状态,导致电力系统数据库中稳定样本数量远多于失稳样本,若模型能够较好地分类稳定样本,即使对失稳样本的识别能力较低,模型也能获得较高的总体分类精度。而在电力系统的暂态稳定评估中,将失稳样本判别为稳定样本这类误判情况对系统的影响更大。因此,文中采用WRF模型分类的总体准确率Acc(accuracy)和对失稳样本识别的召回率Rec两个指标作为模型性能的评价指标。其中,Rec用于反映所有失稳样本被正确识别的比例,其计算式见式(15),Acc为正确分类的稳定样本和失稳样本占所有样本的比例,其计算式为

(16)

4 算例分析

4.1 数据生成

为了验证所提方法的有效性,将图3所示的新英格兰10机39节点系统作为测试系统。所有测试均是在一台配置Intel Core i7 3.40-GHz CPU和8 GB运行内存的电脑上进行。

图3 新英格兰10机39节点系统Fig.3 New England 10-machine 39-bus system

在仿真过程中,将负荷模型设置为恒阻抗模型,通过在不同的线路上设置三相短路故障来模拟多种运行工况。模拟总的负荷为[80%,120%]增长变化,以5%为步长,并根据负荷水平相应调整发电机的出力。将故障的持续时间分别设置为0.1、0.15、0.2、0.25、0.3 s,单次仿真时长设置为10 s。文中以任意两台发电机的功角是否超过360°作为暂态稳定的判断依据。最终生成了4 680个样本,其中稳定样本3 694,失稳样本986。随机选取仿真样本的80%作为训练集,其余20%作为测试集。

4.2 特征选择

文中通过JMIM方法分别选择不同维度的特征进行模型性能的测试,测试结果如图4所示。结果表明,随着特征数量的增多,模型的评估精度逐步上升,最后趋于稳定。由于基于机器学习的暂态稳定评估模型需要经常进行更新迭代,在考虑精度的同时,模型的训练时间需越短越好。因此,文中考虑时间与精度的权衡,最终选择初始特征的42维作为关键特征子集。

图4 特征选择的影响Fig.4 Influence of feature selection

为了体现文中所提特征选择方法的优越性,将其与互信息特征选择(mutual information feature selection,MIFS)[17]、联合互信息(joint mutual information,JMI)[18]和最大相关最小冗余(maximum relevance minimum redundancy,MRMR)[19]三种特征选择方法进行对比测试。基于不同方法选择的子集,模型的性能测试结果如表2所示。

表2 不同特征选择方法的对比Table 2 Comparison of different feature selection methods

MIFS和MRMR在特征选择时只考虑单个特征加入的互信息值,而无法排除多个特征相关的情况,因此模型的评估精度总体偏低。JMIM和JMI不仅考虑了多个特征相关的情况,并且在计算特征之间互信息值的同时考虑了类别标签的影响,JMIM是JMI方法的改进,JMIM能够缓解JMI在特征选择过程中对部分特征的高估问题。总体来看,基于JMIM选择的特征子集,模型能够获得最优的评估性能,分类的总体准确率和对失稳样本识别的召回率分别高达99.07%和98.87%。

4.3 不同机器学习模型的性能对比

将WRF模型与不同的机器学习模型进行对比测试,主要包括ANN、SVM、DT和传统的RF,所有的机器学习模型均基于Scikit-learn搭建。在测试过程中,ANN使用单隐藏层网络结构,隐藏层的激活函数使用的ReLU激活函数,SVM使用多项式核函数,DT使用C4.5算法。所有模型在训练过程中使用相同的输入特征。其中,RF和WRF在不同DT数量下评估的准确率如图5所示。结果表明,当DT数量达到100左右时,模型的评估精度趋于稳定。因此,文中将RF和WRF的DT数量均设置为100。

图5 不同决策树数量下的准确率Fig.5 Accuracy under different number of decision trees

不同机器学习模型的性能测试结果如表3所示。总体来看,RF为基于树的集成模型,其评估精度优于SVM、DT和ANN这类浅层模型。此外,由于RF需要经过多次迭代,模型训练的时间复杂度也相对更高。与传统的RF相比,bootstrap抽样的改进和加权投票的方式虽然增加了模型的训练时间,但WRF分类的总体准确率和对失稳样本识别的召回率分别提高了0.22%和1.25%,表明算法的改进在一定程度增强了RF对失稳样本的识别能力,提高了模型的总体分类精度。

表3 不同模型的性能对比Table 3 Performance comparison of different models

4.4 鲁棒性测试

PMU在数据采集过程中,可能会出现两类数据异常情况:①PMU在监测过程中可能会产生测量误差,这会给数据叠加一定的噪声;②由于PMU发生故障和通信链路延迟等原因,可能会造成部分监测数据缺失。本文中针对这两种情况分别进行了模型性能的测试。

根据IEEE C37.118标准,PMU测量的总矢量误差应小于1%[20]。文中通过在数据集中加入不同信噪比(signal to noise ratio,SNR)的高斯白噪声来模拟PMU的测量误差。其中,噪声为20 dB对应的测量误差为1%。文中主要考虑了以下两种测试场景:①在测试集加入噪声;②在训练集和测试集中同时加入噪声。

两种场景下WRF分类的准确率如图6所示,对失稳样本识别的召回率如图7所示。结果表明,由于WRF为基于树的集成模型,原本就对噪声具有一定的鲁棒性。在上述两种场景下,随着噪声的增加,WRF仍能够维持评估的总体准确率在97%以上,虽然WRF对失稳样本识别的召回率下降幅度偏高,但仍能维持在一个可接受的范围,表明了针对数据存在噪声的问题,本文所提方法具有一定的鲁棒性。此外,当训练集和测试集都存在噪声时,模型能够给出更加稳定的评估结果。

图6 不同噪声条件下的准确率Fig.6 Accuracy under different noise conditions

图7 不同噪声条件下的召回率Fig.7 Recall rate under different noise conditions

为了检验数据缺失对WRF模型评估性能的影响,在测试集中考虑了10%、20%、30%和40%四种比例的特征缺失情况。其中,缺失特征的选择是随机的。测试的结果如表4所示。结果表明,随着特征缺失比例的增加,对WRF模型的负面影响也越来越大。由于WRF由多棵树组成,每棵树都是随机选取多个特征进行训练,这在一定程度缓解了特征缺失的影响。总体来看,WRF的评估精度并不会因为特征缺失比例的增加而出现大幅度下降,仍能够维持评估的精度在96%以上,表明了针对数据缺失问题,WRF具有一定的容错性。

表4 不同数据缺失下的性能测试Table 4 Performance test under different data missing

4.5 模型的泛化能力测试

由于电力系统数据库中很难涵盖电力系统所有的运行场景,针对新的运行场景,模型的评估性能也会发生改变。因此,模型的泛化能力也是衡量模型性能的重要指标。

基于4.1节所提的样本生成方法,文中通过考虑多种未包含在初始数据库中的电力系统拓扑结构进行模型的泛化能力测试。针对每种拓扑结构仿真生成300个新样本,将新样本直接输入WRF进行性能测试。其中,电力系统的拓扑结构变化如表5所示,模型的泛化能力测试结果如表6所示。结果表明,虽然拓扑结构的变化在一定程度影响了WRF评估的准确性,但模型仍能够维持评估的精度在94%以上,表明针对未知的电力系统拓扑场景,文中所提模型具有一定的泛化能力。

表5 拓扑结构的变化Table 5 Changes of topological structure

表6 不同拓扑结构下的评估精度Table 6 Assessment accuracy under different topologies

5 结论

为了进一步提高电力系统暂态稳定评估的准确性,文中提出了一种基于JMIM和WRF的电力系统暂态稳定评估方法。在新英格兰10机39节点系统对所提方法的性能进行仿真验证,结果表明:

(1)采用JMIM方法挖掘电网运行数据之间的相关性,能够有效降低数据的维度。JMIM能够筛选一个与暂态稳定标签具有强相关性的关键特征子集,有利于降低后续模型训练的时间复杂度,提高计算效率。

(2)通过在bootstrap抽样中添加约束条件和DT的加权处理,降低了训练样本类别不平衡带来的影响。与ANN、DT、SVM和传统的RF相比,文中的WRF模型对失稳样本的识别能力更强,能够获得更高的评估精度。

(3)针对未知的电力系统运行拓扑场景以及输入数据存在噪声和数据缺失问题,文中所提WRF模型的评估精度不会出现大幅度下降,仍能够给出相对稳定的评估结果,具有较强的鲁棒性和泛化能力。

猜你喜欢
暂态子集特征选择
高一上学年期末综合演练
变电检修中的带电检测技术研究
浅析交流供配电系统线性谐振过电压
基于智能优化算法选择特征的网络入侵检测
故障诊断中的数据建模与特征选择
电能质量暂态扰动的Coinet小波检测方法及其实现
reliefF算法在数据发布隐私保护中的应用研究
一种多特征融合的中文微博评价对象提取方法
集合的运算
每一次爱情都只是爱情的子集