针对样本类不平衡的深度残差网络电力系统暂态稳定评估方法

2024-01-28 03:56刘颂凯崔梓琪阮肇华袁铭洋
智慧电力 2024年1期
关键词:暂态残差卷积

刘颂凯,党 喜,崔梓琪,杨 超,阮肇华,袁铭洋

(1.三峡大学电气与新能源学院,湖北宜昌 443002;2.新能源微电网湖北省协同创新中心,湖北宜昌 443002;3.国网福建宁德供电公司,福建宁德 352100)

0 引言

随着电力系统互联度及新能源渗透率的不断提高,电力系统安全稳定的内在机理变得更加复杂,对其进行评估变得愈加困难[1-3]。造成大部分大电网停电事故发生的主要原因是电力系统暂态失稳,因此,实现满足在线应用的暂态稳定评估对于电力系统的稳定运行有着重要意义[4]。

传统的电力系统暂态稳定评估方法主要包含时域仿真法和直接法。时域仿真法需要求解电力系统的非线性微分代数方程组,其计算量大[5]。直接法[6-9]可以快速计算并提供稳定裕度,但评估结果较为保守。故传统方法难以同时满足在线暂态稳定评估的精度和速度需求。随着同步相量测量单元(Phasor Measurement Unit,PMU)的应用,为基于机器学习的暂态稳定评估奠定基础[10-11]。传统的机器学习算法,如决策树[12-13](Decision Tree,DT)、随机森林[14-15](Random Forest,RF)和支持向量机[16-18](Support Vector Machine,SVM)等由于特征提取能力弱,大多采取“先人工提取特征,然后训练分类模型”的模式,而人工提取特征具有一定主观性且较耗时耗力[19]。

此外,由于实际电力系统的鲁棒性,系统出现暂态失稳的情况并不频繁,从而会出现样本类不平衡问题[20],造成暂态稳定评估模型结果的准确性下降[21]。文献[22]基于改进损失函数加强了失稳样本的拟合程度,增加了对样本错误分类的权重,但该方法受限于失稳场景数据,在实际场景应用会有些困难。文献[23]为减轻深度置信网络对漏判样本的影响,将模型分类结论不同的样本设置为不确定样本,但模型的复杂度也随之增加。文献[24]利用改进深度卷积生成对抗网络产生新的失稳样本,使得模型对失稳样本的识别率有所提升,但是会造成一些数据信息缺失。

本文提出了一种基于改进合成少数过采样技术的深度残差网络(Deep Residual Network,ResNet)电力系统暂态稳定评估方法。首先,通过基于平衡迭代规约层次聚类和边界中点质心的合成少数过采样技术(Balanced Iterative Reducing and Clustering Using Hierarchies and Boundary Midpoint Centroid Synthetic Minority Over-sampling Technique,BIBMCSMOTE)在滤除噪声的少数类样本中合成多样化的新样本形成平衡数据集;然后,基于ResNet 构建电力系统暂态稳定评估模型,解决网络退化问题且能有效地提取数据特征,在生成平衡数据集的基础上增强了模型的评估性能;最后,基于10 机39节点和47 机140 节点系统进行算例验证,验证结果表明了本文所提方法的优越性。

1 改进的合成少数过采样技术

合成少数过采样技术(Synthetic Minority Oversampling Technique,SMOTE)通过在少数样本之间进行线性插值合成新的样本,以达到平衡数据集的作用[25],示意图如图1(a)所示。其在合成新样本时,忽略了一些问题。首先,没有考虑滤除噪声样本的必要性;其次,该算法通过搜索少数样本的最近邻来合成新样本,可能会使新样本与旧样本完全相同;最后,边界样本的信息也很重要,忽略边界样本将导致最终分类结果不准确。本文使用BIBMCSMOTE 算法,可以有效避免以上问题,使用该算法的采样示意图如图1(b)所示。

BI-BMCSMOTE 算法主要分为8 个步骤:

1)为初始数据集中的每个少数类样本找到K个最近邻,将K个最近邻都是多数类样本的少数类样本视为噪声,将其滤除,获取新的少数类样本集H,其总个数为N。然后,将H代入利用层次方法的平衡迭代规约和聚类(Balanced Iterative Reducing and Clustering Using Hierarchies,BIRCH)算法中,输出聚类簇C。

2)找到每个少数类样本h∈H的K个最近邻,其中多数类样本和少数类样本个数分别标记为Kd和Ks。当Kd>Ks时,将此样本设置为边界少数类样本,从而获得边界少数类样本集F。

3)计算每个边界少数类样本fa的抽样概率Oa:

式中:ρa,Kad和分别为边界少数类样本f 的多数类近邻样本密度、个数和归一化后的密度分布;M为边界少数类样本总个数。

4)计算每个簇Cγ∈C的密度分布dγ:

式中:Nγ为簇Cγ中的样本个数;Vγ为簇Cγ中样本点形成的D维超球体积。

式中:G为gamma 函数;rγ为质心vγ到簇Cγ中样本点的最远欧氏距离。

5)计算每个簇Cγ的过采样权重Θγ:

式中:L为簇的总个数。

6)计算每个簇Cγ中需生成的新样本数Nγnew:

将新样本数Nγnew按1:1 的比例分为Nγnew1和Nγnew2,其中Nγnew1为该簇Cγ中需合成的边界少数类样本数,Nγnew2为该簇Cγ中需合成的少数类样本数。设通过步骤3 的抽样概率选择的边界少数类样本集为Sγ1,提取的少数类样本集为Sγ2。

7)计算样本集Sγ1中所有样本点到质心vγ的欧氏距离,所有样本点按欧氏距离从小到大排序:Sγ1=(y1,…,ymid,ymid+1…yη),排序后的样本集Sγ1从中间位置ymid分为近心集Ymin=(y1,y2,…,ymid)和远心集Ymax=(ymid+1,ymid+2,…yη)。将近心集和远心集按顺序排列,从2 个集合中各选取1 个样本点进行配对,在配对的两个样本点连接中点处合成第一轮新样本:

式中:yq为近心集中的任一量。

8)将样本集Sγ2重复步骤7)中样本集Sγ1的操作,最终获得新合成的样本,并加入到初始数据集中形成平衡数据集。

2 深度残差网络

深度残差网络是一种改进型卷积神经网络(Convolutional Neural Network,CNN)。CNN 的分类性能很大程度上取决于网络深度[26],然而在网络达到一定深度后,梯度消失问题会导致模型性能退化。为解决该问题,本文使用一种深度残差学习框架,其基本思想是在构建CNN 时引入恒等映射。ResNet 没有引入新参数,没有增加复杂度,克服了随着层数加深导致精度上的饱和问题,更有利于进行深度训练[27]。

ResNet 由输入层、卷积(Convolutiona,Conv)层、激活函数、批处理归一化(Batch Normalization,BN)层、多个残差模块、均值池化层、全连接层和输出层构成,深度残差网络的结构如图2 所示。

图2 残差网络结构Fig.2 Residual network structure

卷积层增强了原始图的信息量,抑制了噪声的干扰。其中卷积层的卷积核又称为过滤器,最常用的过滤器是3×3 矩阵和5×5 矩阵。首先,过滤器按照从左至右,从上至下的顺序卷积对子矩阵卷积,即先从输入数据的左上角子矩阵进行卷积,卷积计算的结果经过激活函数得到一个新的特征值;然后,过滤器继续与下一个子矩阵卷积,每个子矩阵的大小与过滤器相同;最后,过滤器与输入数据的所有子矩阵分别经过卷积和激活函数计算后,所有新的特征值构成的特征矩阵作为卷积层的输出。本文选用使网络更快地收敛的非线性激活函数ReLU。

批处理归一化层将数据归一化为标准高斯分布,并通过减少内部协变量移位,减轻了深度神经网络对初始参数的依赖,提高了训练收敛速度和准确率。

残差模块是ResNet 的基本组成模块,残差模块结构如图3 所示。已知输入为x,期望输出的是复杂潜在映射Γ(x)。残差模块不直接学习复杂潜在映射Γ(x),而是通过“捷径连接”的方式将短路路径的输入x 恒等输出,并将与其残差路径的输出P(x)相加得到复杂潜在映射Γ(x)。所以目标更改为学习残差P(x)=Γ(x)-x,将残差结果逼近于0。

图3 单个残差模块Fig.3 Structure of single residual module

令第t 个残差模块的输入为xt,则下一层的输出可表示为:

式中:wt为残差函数对应的权重系数;P(·) 为单个残差模块中的映射函数。

通过迭代,深层的第T个残差模块的输出xT的表达式为:

根据反向传播的链式规则可得反向过程的梯度为:

式中:σ为深度残差网络的损失函数。

通过式(9)分析可知,残差模块能有效地缓解反向传播中的梯度消失问题。

均值池化层可以减小下一层输入数据的大小,意味着减小了网络参数,降低过拟合的风险。全连接层连接输出层,在2 者之间通常使用Softmax 分类器来获得最终的分类结果。Softmax 函数为:

式中:fj为样本属于j类的概率;βj为样本属于j类的原始输出值。

3 暂态稳定评估流程

为解决当前电力系统受到噪声干扰和样本不平衡问题,满足在线应用的要求,本文提出基于BIBMCSMOTE 和深度残差网络的电力系统暂态稳定评估模型,评估流程分为离线训练和在线应用2 部分,每部分的具体流程如图4 所示。

图4 暂态稳定评估流程图Fig.4 Flow chart of transient stability evaluation

3.1 训练流程

首先向操作点添加合理的波动,例如系统负载水平、发电机/负载功率分布、负载特性的变化和预想故障等,通过时域仿真计算获得初始数据集,每个样本的特征由母线电压幅值、发电机有功和无功功率以及负荷的有功和无功功率构成[20],根据发电机转子功角差建立样本相应的暂态稳定指标,具体如式(11)和式(12)所示:

式中:δmax为暂态稳定过程中任意2 台发电机功角差的最大绝对值。

判断系统是否稳定的标签y为:

然后,利用BI-BMCSMOTE 算法得到一个更丰富且平衡的数据集,有效缓解了类不平衡问题;最后,随机将样本集以7:3 的比例分为训练样本和测试样本。将样本特征作为ResNet 评估模型的输入,相应的暂态稳定指标作为ResNet 评估模型的输出,挖掘输入和输出之间的隐藏关系。训练完毕之后,基于测试集对ResNet 评估模型进行性能检验。

选取与离线训练相同的样本特征对应的数据输入至预先训练好的暂态稳定评估器中,快速输出分类结果。如果当前状态被确定为暂态稳定,则电力系统将继续被监视;否则,将向电力系统操作人员发送预警信号。

3.2 性能评价指标

使用混淆矩阵描述ResNet 评估模型对测试集的分类性能,1 表示事件为稳定,0 表示事件为失稳,TP,FN分别表示真实稳定事件预测为稳定和失稳,FP,TN分别表示真实失稳事件预测为稳定和失稳,如图5 所示。

图5 暂态稳定评估的混淆矩阵Fig.5 Confusion matrix for transient stability evaluation

为使模型的评估结果更具准确性需考虑以下2方面因素:(1)稳定样本与失稳样本比例不平衡;(2)漏判将不稳定样本分类为稳定样本,将对系统造成巨大的损失。本文采用整体准确率Tac、稳定样本分类准确率Tsr及失稳样本分类准确率Tur作为性能评价指标。3 种性能评价指标的计算公式如式(13)—式(15)所示:

4 算例分析

为验证本文所提方法的优越性,基于PSS/E 仿真软件,在以图6 所示的10 机39 节点系统中进行暂态稳定研究,此系统包含G1~G10 共10 台发电机、39 条母线和46 条线路。全程仿真过程中,编程语言为python。

图6 10机39节点系统Fig.6 10-machine 39-bus system

4.1 构造数据集

在新英格兰10 机39 节点系统中考虑了80%,85%,…,130%共计11 个负荷水平,故障主要设置于每条输电线路的0%,20%,50%和80%处,且故障类型设为三相短路故障。故障持续时间为0.1 s,0.15 s,0.18 s 和0.20 s,仿真持续时间为6 s,仿真步长为0.01 s。总共生成5 984 个样本,其中稳定样本和不稳定样本分别为4 032 和1 952。

4.2 平衡数据集效果分析

为了分析BI-BMCSMOTE 算法处理样本类不平衡问题的效果,选取随机过采样(Random Oversampling,ROS),SMOTE,自适应合成抽样(Adaptive Synthetic Sampling,ADASYN)和 BIBMCSMOTE 进行比较,分类模型均采用ResNet,测试效果如表1 所示。

表1 各种采样方法对评估模型的影响Table 1 Influence of various sampling methods on evaluation model

从表1 分析可得,由于初始数据集中失稳样本很少,以至于模型对失稳样本的分类准确率Tur较低。使用ROS,SMOTE,ADASYN 与BI-BMCSMOTE采样算法都对评估结果有所提升,但BIBMCSMOTE 算法既考虑了噪声的影响还考虑了边界少数类样本,相比其它采样算法,BI-BMCSMOTE算法在处理类不平衡问题上的优势更加明显。

4.3 模型分类性能分析

为验证本文所提方法的优越性,基于相同的数据集对DT,RF,近邻算法(K-nearest Neighbor,KNN),CNN 和ResNet 进行评估性能对比测试。其中,DT 使用CART 算法,其最大深度设为18;RF 选择的最大深度为9;KNN 取最近邻点数为15;CNN采用经典结构,并采用自适应矩估计算法进行训练。不同模型评估性能对比如图7 所示。

图7 各分类器的性能对比Fig.7 Performance comparison between different classifiers

由图7 分析可得,本文所使用的ResNet 分类器评价性能指标均高于其它基准模型,说明ResNet 分类器评估性能要优于其他基准评估模型。是由于ResNet 模型更深的网络层数具有更强大的数据挖掘能力,使其可以建立更加精确的非线性映射关系。

4.4 模型抗噪分析

在实际应用中,运行数据不可避免地存在一些噪声。本实验通过在测试集中添加高斯白噪声模拟实际所产生的测量误差。添加的噪声服从N(0,φ),具体构造如下:

式中:xa为原测试集;为添加高斯白噪声的新测试集;τ为服从均值为0、方差为φ的高斯分布;φ的取值范围为0.01~0.1。

在不同噪声水平下对各模型的影响如图8 所示。

图8 不同噪声水平对各模型的影响Fig.8 Influence of different noise levels on each model

由图8 可见,加入高斯白噪声后各模型的准确率均有所降低。其中,浅层学习模型DT,RF 和KNN 学习能力有限,随着噪声的增大,整体准确率有明显的波动,说明此类模型抗噪能力弱。而CNN模型的整体准确率曲线趋势较为平缓,说明CNN 模型具备一定的抗噪能力,但其准确率仍低于ResNet模型。综上所述,ResNet 模型即使在高噪声情况下,依然可以对样本特征进行有效提取,具有良好的评估性能和鲁棒性。

4.5 模型适应性分析

为了进一步验证本文所提方法在大系统上仍具有同样的适应性,在新英格兰47 机140 节点系统上进行算例分析,采用4.1 节所述方式生成数据集。共计生成2 9520 个样本,稳定样本和不稳定样本数量分别为23 885 和5 635。基于新样本集对各评估模型进行评估性能测试,评估结果如图9 所示。

图9 140节点系统各分类器的性能对比Fig.9 Performance comparison between classifiers of 140-bus system

由图9 可见,虽然仿真系统规模有所扩大,但本文所使用的分类器评估性能仍要高于一般的浅层模型和深层模型,说明本文所提方法在较大系统下依然具有较好的适应性。

4.6 模型的数据处理速度分析

实现实时暂态稳定评估要考虑PMU 测量装置采集频率的影响,即评估模型处理每个样本的时间要小于0.02 s[28]。为进一步验证本文所提方法在大、小型节点系统中的评估性能和对样本集的处理速度,分别在新英格兰10 机39 节点和47 机140 节点系统上进行测试,测试结果如表2 所示。

表2 不同算例规模耗时和评估性能对比Table 2 Comparison of time consuming and evaluation performance between different example sizes

由表2 可知,在大型节点系统中,本文所提方法的评估性能略有下降,这是因为系统所含的节点数越多,包含的特征量就越多,训练过程更加复杂,训练模型也就需要越多时间。本文所提方法在2种不同规模的算例系统中均能保持较好的评估性能,尤其是其失稳样本分类准确率仍然保持在98%以上,可以极大程度避免系统因漏判而导致的严重后果。在线应用过程中,2 种算例规模评估每个样本的应用耗时都远小于0.02 s,能满足在线应用的实时性要求,具有较高的实用意义。

5 结语

本文提出了一种基于BI-BMCSMOTE 和深度残差网络的电力系统暂态稳定评估方法,并在10机39 节点系统和47 机140 节点系统上进行算例分析,得出以下结论:

1)与其他采样方法ROS,SMOTE 和ADASYN相比,BI-BMCSMOTE 算法考虑了噪声影响和边界少数类样本的重要性,提高了ResNet 模型的评估性能。

2)与其他浅层机器学习DT,RF,KNN 和深层机器学习CNN 相比,ResNet 模型不仅具有良好的特征提取能力,还缓解了深层机器学习随着层数加深而导致的精度饱和问题,因此该模型更能满足暂态稳定分类性能评估的准确性要求。

3)与其他评估方法相比,在含有不同高斯白噪声水平情况下,本文所提出的基于BMCSMOTE 和ResNet 模型的方法能够保持较高的整体准确率,说明文本所提方法具有良好的评估性能和强大的鲁棒性。

4)在47 机140 节点系统中,ResNet 模型依然有优异的评估性能,表现了模型良好的适应性。

猜你喜欢
暂态残差卷积
基于双向GRU与残差拟合的车辆跟驰建模
300Mvar空冷隐极同步调相机暂态特性仿真分析
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
从滤波器理解卷积
电力系统全网一体化暂态仿真接口技术
基于傅里叶域卷积表示的目标跟踪算法
除氧器暂态计算研究
平稳自相关过程的残差累积和控制图