电能质量数据质量对综合评估结果的影响分析

2021-09-13 02:27张华赢游奕弘孙一浩张文海
科学技术与工程 2021年24期
关键词:赋权电能权重

张华赢, 汪 清, 游奕弘, 吴 显,孙一浩, 张文海*

(1.深圳供电局有限公司南方电网公司新型智慧城市高品质供电联合实验室,深圳 518020;2.四川大学电气工程学院,成都 610065)

在中国经济由高速发展转向高质量发展阶段的背景下,电力用户对电能质量的要求越来越高[1-2]。中国电力公司多年来在对电能质量在线监测系统的设计与建设,大规模的干扰源普测工作开展的过程中积累了大量的电能质量数据,为深入分析电能质量问题奠定了数据基础[3-4]。然而在实际工况下,由于设备自身缺陷、工作环境和人员误操作等因素的影响,获得的海量监测数据中不可避免地存在着数据质量问题,这些脏数据会干扰后续的电能质量综合评估过程,甚至可能带来错误的分析结果[5-6]。

目前,国际上普遍采用的电能质量标准主要有IEC-61000系列标准以及IEEE Std标准[7]。中国目前已经颁布执行的电能质量标准文件有8项。然而,这些标准仅对电能质量单项监测指标是否合格进行判断,不能反映电能质量整体情况[8-9]。因此如何科学、合理地将多方面的评估指标综合成单一的量化评估结果,是当前电能质量综合评估问题研究的重点。

中外学者对电能质量综合评估方法的研究主要集中在综合指标法、概率统计和矢量代数法、证据理论法、模糊综合评估法等[10-12]。上述方法在评估过程中均未考虑到原始数据中存在数据质量问题时,可能对电能质量综合评估结果造成的影响。文献[10]在模糊综合评判的基础上,引入数据包络分析(data envelopment analysis, DEA)理论,建立了针对长时间尺度的电能质量综合评估模型,然而该方法在计及数据动态特性对综合评估的影响时并未考虑监测系统中所积累的海量电能质量监测数据中异常数据对其评估过程的影响;文献[11]采用区间灰色证据组合模型的方法实现对电能质量的动态综合评估,通过灰色白化权聚类合理地处理不同等级分界点附近的数据指标,同时使用区间型白化权函数有效综合不同专家意见,进而提升评估结果的可靠性。但在标准化样本及选取分界点的过程中未考虑坏数据对其过程的影响进而对后续评估结果产生偏差;文献[12]通过将物元理论与证据理论相结合的方式来量化分析电能质量各项评估指标与各质量等级的关系,构建关联矩阵并进行归一化处理,从而得到各电能质量指标的基本信度函数,避免了证据理论产生基本信度函数时主观性较强的缺点,然而对在数据信息融合的过程中可能丢失部分有用信息,影响评估结果的情况未加考虑。

鉴于此,对存在数据质量问题的电能质量监测数据对电能质量综合评估的影响进行实验研究与精度分析。首先,对电能质量监测数据特点及异常原因进行分析,归纳电能质量数据质量常见问题;其次,结合数据特点提出相应的数据质量问题处理方法;之后在对现有评估方法的基础上结合上述数据异常形式,对监测数据出现质量问题对综合评估过程进行影响分析;最后,通过南方电网某地区实测数据进行算例分析,以期发现数据质量的良好程度对电能质量综合评估结果的影响。

1 电能质量的数据质量问题

根据《电磁兼容 试验和测量技术——电能质量测量方法》(IEC 61000-4-30—2015),电能质量数据可分为实时数据和统计数据[13]。实时数据通常会上传到监测系统主站并在主站数据库中存储,但实时数据的作用一般仅限于电能质量指标越限告警。稳态统计数据通常会存储在电能质量监测装置中,并传输到监测系统主站服务器中,其特点为数据量庞大,蕴含的信息量大,利用价值高,可用于电能质量水平的综合评估等高级应用。所以就电能质量数据而言,主要关注统计数据可能存在的数据质量问题。

现实工况中,由于外部环境变化、人员误操作、相关设备机械故障等因素,统计数据质量问题主要体现在以下方面[14]。

1.1 数据完整性

数据完整性指的是实际数据量与预期数据量的相符程度。若各监测时刻下出现无数据记录或无效数据记录等情况,即发生数据缺失。电能质量系统主站数据库中数据缺失往往由采集系统故障和通讯传输系统故障两方面引起[15],数据缺失情况如图1所示。

图1 电能质量数据缺失情况

1.2 数据准确性

数据准确性指的是数据值与期望值的相符程度。电能质量数据是通过安装在各监测点的在线监测装置采集到的实时电流、电压等波形数据经信号处理方法得到的计算量。对于电流、电压等直接物理量来说,受电网运行情况的影响,其数值在各自的合理范围内波动,而相应地由其所得的计算量同样存在合理的取值范围。目前,对电能质量数据进行准确性校验多采用阈值法。部分指标的参考范围如表1所示。

表1 电能质量数据判定范围

1.3 数据一致性

数据一致性指的是各监测装置数据记录时刻在绝对时间下的相符程度。在目前的实际应用中,为了尽可能降低成本,大多监测装置并未配备精确的全球定位系统(global positioning system,GPS)或远程通信同步方法,而是仍然采用本地时钟作为计时方法,这必然会产生不可避免的时间偏移问题,即各监测装置同一时刻记录的数据信息不对等,如图2所示。

2 电能质量数据质量问题处理方法

目前,在实际工程应用中对于电能质量监测数据出现数据质量问题时还没有一套严格标准的处理方法。但在其他工程领域或行业,数据质量问题时有发生,因此对数据质量的研究(如评价、清洗)也得到了普遍关注[16]。基于电能质量数据自身特点,针对不同的数据质量问题选取相应的处理方法进行数据清洗,以评估不同方法对电能质量综合评估结果的影响。

2.1 数据缺失处理

数据缺失的处理方法可分为:删除法、加权法和插补法。其中加权法适用于缺失机制为随机缺失(missing at random, MAR)的情况,即缺失数据与已观测到的数据有关,而与未观测到的数据无关。电能质量数据缺失机制为完全随机缺失(missing completely at random, MCAR),即缺失数据与已观测到的数据和未观测到的数据均无关[17]。因此,电能质量数据缺失可通过删除法与插补法处理。

目前主站监测系统中在对单一指标进行评估计算过程中多采用删除法。但是当缺失现象严重或样本量较少时,如装置或通信长时间故障,删除法可能会丢掉过多数据,进而对评估结果产生较大误差。因此,在研究数据缺失对电能质量综合评估的影响时,选取工业界广泛认可的多阶拉格朗日内插法[18]修补缺失值作为对比,其修补公式为

(1)

式(1)中:m1为前推期数;m2为后推期数;t为数据缺失的时刻;Pt-k、Pt+i分别为对应数据时刻。

2.2 数据异常处理

关于出现准确性偏差的异常数据,即离群点,可通过将其视为缺失数据进而通过插补法进行修正。需要注意的是,进行基于指标业务范围的数据准确性分析,需要同时考虑到电网中是否有电力扰动事件的发生。当发生扰动事件时,监测数据同样会表现为超越阈值的异常点,此时需要结合事件信息进行综合判定。

2.3 数据偏移处理

电能质量在线监测装置数据出现时间偏移的主要原因有:一是装置出厂设定或安装检定过程中人为授时出现的对时偏差,二是装置内部石英晶振的振荡频率会随着温度等工作环境的变化发生偏移而造成的时钟芯片偏差。考虑电力系统全网同一时刻频率具有一致性的特点,现提出一种基于频率量测偏差的电能质量在线监测装置本地时钟对时方法:

在监测系统主站中获取某一区域部署的x台监测装置的频率采集数据(假设x台装置大多数运行状态良好,且x尽可能地多),时间窗口以一天为例,稳态统计数据每3 min上传一次,即每天有数据样本w=480个。所有数据样本形成x×480维的矩阵。

首先针对时偏差进行检测与校正。对x台监测装置每个时刻记录到的频率数据,即矩阵中的每列数据,通过n-σ准则筛选出每个时刻频率异常的装置记为x1,x2,…,xi。其中n-σ准则公式为

(2)

(3)

若计算所得r<0.95,则该监测装置精准计时功能丧失,需后续人工核验。

若Δft>k则标记该监测装置待后续人工检定。若Δft

3 考虑数据质量的电能质量综合评估方法

电能质量综合评估是在分析单项电能质量指标的基础上,将全部或部分电能质量问题或某项指标的多个特征量通过科学合理的方法整合成一个有机整体,进而得到综合考核值的过程[20]。主要涉及评估指标选取、评估指标权重确定及评估模型搭建。其中评估指标权重的确定作为综合评估过程中的重要一环,一方面能够反映各监测指标之间的相对重要性与差异性;另一方面也能够体现不同类型用户对电能质量的不同要求。由于该评估环节建立在获取的大量监测数据的基础上,因此本文分析讨论数据质量对该评估环节的影响,进而探讨对评估结果造成的影响。

3.1 基于组合赋权法的电能质量综合评估

组合赋权法通过对主观赋权法和客观赋权法进行组合优化而得。其中主观赋权法是决策者根据自己的专业知识、经验等因素,通过主观意愿进行赋权的方法,其主观随意性较大,评价结果不客观。相反客观赋权法虽然客观性较强,但其赋权结果忽略指标的实际重要程度,进而可能造成无法反映客观实际情况的后果。因此,通过对两者进行组合优化,避免单一赋权法容易受自身方法的局限性而造成权重结果出现偏倚的组合赋权法得到越来越广泛地应用。以基于层次分析法的主观赋权法和基于熵权法的客观赋权法并通过最小二乘法进行组合优化的组合赋权法为例,分析数据质量对其权重确定过程的影响。

3.2 数据质量对主观赋权法的影响分析

层次分析法作为一种比较成熟的主观赋权方法,可将复杂的多目标决策问题分解为多个层次结构,然后用求解判断矩阵特征向量的方法,求取不同层次间各元素的权重优先级,最后再加权和的方法递阶归并,进而求得最终权重[21]。

基于专家经验与用户意见对电能质量评估指标进行两两比较,构造比较判断矩阵A=(aij)n×n(n个电能质量评估指标),可表示为

(4)

式(4)中:aij为指标i相对指标j的重要性标度,且矩阵A中各元素均满足:aij>0,aii=1,aij=1/aji。其重要性标度取值如表2所示。

表2 判断矩阵标度定义

根据构造的判断矩阵A求取其最大特征根λmax及对应的特征向量W,所得特征向量W经归一化处理的结果即为各个评估指标的权重分配。

欲知权重系数是否合理,还需要对判断矩阵进行一致性检验,公式为

(5)

式(5)中:CR为判断矩阵的随机一致性比率;CⅠ为一般一致性指标,计算公式如式(6)所示,RⅠ为平均随机一致性比率,取值如表3所示。

表3 平均随机一致性指标

(6)

当判断矩阵A的CR<0.1或λmax=n且CⅠ=0时,认为A通过一致性检验,否则不满足,需对A进行调整。

从主观赋权法的权重求取过程可以发现,其权重的确定不需要原始数据,只需决策者根据自身经验来判断,因此当原始数据中出现数据质量问题时并不会对其权重的确定产生任何影响。

3.3 数据质量对客观赋权法的影响分析

以熵权法为代表的客观赋权法通常立足于数据本身提供的信息,以确定各指标间的权重。因此当原始数据出现数据质量问题时,不可避免地会对其权重的确定造成影响。

首先,考虑数据质量问题中的数据准确性和一致性问题。当原始监测数据出现上述两类问题时,尽管在同一时刻下同一监测点的同一监测指标的监测数值产生了偏颇,但仍能保持数据集的完整性,并未干扰求解权重的算法过程。因此,客观权重计算结果的准确性与数据质量问题的严重程度呈正相关。

但当原始数据存在数据缺失情况时,会遇到:①熵权法中熵值计算公式无意义,导致指标权重无法确定;②基于指标值和指标权重融合的综合评估结果不具可比性等问题。因此引入Bock和Diday的符号数据[22],该算法基于熵权法,通过将数值信息转化为出现频次的方式,可以实现数据的归类与分级,避免数据缺失导致指标没有意义的问题,达到完整计算的目的。

首先确定符号数据评估矩阵。对m个监测点的n个评估指标进行归一化处理后,建立标准化评估矩阵X,可表示为

(7)

式(7)中:xij为第i个监测点的第j个标准化指标。

建立评估等级,将电能质量标准化评估矩阵X转换为符号数据评估矩阵。令B={b1,b2,…,be}表示评估等级,其中bi为区间型符号数据。取e=5,B={[0,0.2],(0.2,0.4],(0.4,0.6],(0.6,0.8],(0.8,1]}。于是X矩阵中各元素指标分别属于B矩阵的不同区间,以此定义区间型符号数据,由{cij=bi|xij∈bi}得到符号数据评估矩阵Y为

(8)

式(8)中:yij表示第i个监测点的第j个指标的符号数据评估值。

为了减小缺失数据对指标权重计算的影响,统计各指标类型下未缺失数据的监测点,以及相应未缺失数据的监测点在各区间出现的频次(缺失数据的频次计为0),计算指标的评估等级频率pij和评估率qi,其计算公式分别为

(9)

(10)

构建指标评估等级频率矩阵Z:

(11)

矩阵Z具有数据完整的特点,可以基于熵权法计算相应权重指标。

(12)

(13)

(14)

式中:μi、σi及υi分别为第i个指标评估等级频率的期望、标准差及指标权重;e=5。

3.4 数据质量对组合赋权法的影响分析

在通过计算分别得到主观权重与客观权重后,基于最小二乘法原理,构造组合权重优化模型[23]。分析数据质量问题对组合权重计算的影响:假设在对n个评估指标求得主观权重向量U=(u1,u2,…,un)和客观权重向量V=(V1,V2,…,Vn)后,则组合权重向量W=(w1,w2,…,wn)满足以下约束方程:

(15)

利用拉格朗日乘子法求解式(15),构造拉格朗日函数L(wi,λ)可表示为

(16)

式(16)中:λ为拉格朗日乘子。

通过求解式(14),即可得该约束条件下最优组合权重向量W=(w1,w2,…,wn)。

可以发现,组合赋权法通过对已求得的主观权重和客观权重设立约束方程进行求解得到组合权重,以期互补两种赋权方法的优缺点。经3.2节及3.3节分析可得,数据质量问题只会对客观权重的求取结果造成影响。因此当出现数据质量问题时,组合权重的求解会因客观权重计算结果的偏差而对其计算结果造成一定程度的影响。具体影响分析结果详见第4章算例分析。

4 算例分析

电能质量综合评估结果表现形式分为定量评估模型和定性评估模型两大类。定量评估模型采用数值化的方法对评估结果进行描述,从而能够对评估对象按优劣程度进行比较;定性评估模型只能给出电能质量水平定性的评估等级,处于相同等级下的评估对象难以进行比较排序。鉴于细化数据质量对电能质量综合评估影响分析的目的,选用定量评估模型。

4.1 原始数据计算

采用的数据集为南方电网某地区某变电站部署的5台电能质量在线监测装置实测数据。根据该区域专家经验与用户意见,选取电压偏差p1、频率偏差p2、电压总谐波畸变率p3、三相电压不平衡度p4、短时电压闪变p5这5项电能质量指标作为评估指标,同时对5台监测装置进行编号。选取某日6 h共120组统计数据,该120组数据均为完整数据,以某组数据为例,如表4所示。

表4 电能质量综合评估实测数据

根据各监测点数据利用熵权法计算得到各监测指标的客观权重V=[0.176 2,0.193 7,0.125 3,0.215 3,0.289 5]。结合该地区实际情况,综合用户意见与专家经验,评估指标的重要性为谐波总畸变率>短时电压闪变>频率偏差>电压偏差>三相不平衡,据此由层次分析法构造判断矩阵进而求得主观权重为U=[0.075 4,0.161 6,0.415 7,0.084 7,0.262 6]。在得到主观权重与客观权重的基础上通过式(15)、式(16)求得组合权重向量

W=[0.113 2,0.173 5,0.295 7,0.144 3,0.273 2]。对原始数据进行去量纲化和归一化处理后,加权求和计算各监测点的综合评估值为S=[0.689 1,0.752 3,0.893 2,0.327 1,0.722 4],可以看出,在数据完好准确的情况下,5个监测点的评估结果为:3>2>5>1>4。

4.2 数据质量对评估结果的影响

4.2.1 数据缺失情况

为了直观地表现数据缺失情况对综合评估结果的影响,现对各监测指标分别600条数据设置不同比例的缺失,以4.1节所得综合评估值为基准值计算误差情况。其中通过3.2节所述引入符号数据对数据缺失情况下进行客观权重的求取。计算结果如图3(a)所示。由图3(a)可知,各监测指标在低比率缺失(30%以下缺失率)的条件下,评估误差较小(均小于10%)。但随着缺失率的增加,评估误差猛增,呈近乎指数形式增长。同时,在相同数据缺失率条件下,不同监测指标的缺失对综合评估误差的影响不同。其中谐波总畸变率的缺失对评估误差影响最大,而电压偏差对评估误差的影响最小。这是因为数据缺失实质上改变了综合评估过程中客观权重的求取过程,而主观权重的求取过程不受影响。引入符号数据构建指标评估等级频率矩阵本质思想仍基于熵权法,当某项指标出现缺失情况时,该指标的信息熵便会减小,提供的信息量进而增大,其权重也相应增大。以谐波总畸变率为例,当其缺失率为50%时,其客观权重u3由0.125 3上升至0.298 5,在主观权重不变的情况下,综合权重w3由0.295 7上升至0.403 2,对最终评估值的结果影响显著增大。

4.2.2 数据异常情况

对原始数据各监测指标数据曲线分别添加不同比例的噪声,使得原始曲线产生异常程度不同的波动,以此模拟数据异常情况来观察数据异常对评估结果的影响,计算结果如图3(b)所示。

由图3(b)可知,相较于数据缺失情况曲线大致呈指数形式增长,数据异常情况下,随着数据异常率的增大误差曲线大致呈线性关系增长。虽然在低比率异常(30%以下异常率)条件下,各监测指标造成的评估误差率达到10%~20%不等,严重程度高于数据缺失情况;但在高比率异常情况下,对评估结果造成的影响要小于缺失情况,例如数据异常率达到50%时,对评估结果影响最大的谐波总畸变率指标造成的评估误差仅为30.5%,远低于同等缺失率下的误差50.8%。这种因为,数据异常情况下主站系统中仍有数据信息的返回,即对客观权重计算的影响明显小于数据缺失情况。以4.2.1节中u3计算为例,在数据异常率为50%的情况下u3由0.125 3仅上升至0.173 7,同样在未改变主观权重的情况下,综合权重w3由0.295 7仅上升至 0.338 7,因此对最终评估值的结果影响较小。

4.2.3 数据不一致情况

以监测点5装置为测试装置,对其数据曲线进行不同程度的时窗滑动,以此模拟对时偏差情况,观察数据不一致对评估结果的影响,计算结果如图3(c)所示。

图3 数据缺失、数据异常及数据不一致情况下误差率

由图3(c)可知,虽然随着数据偏移率的增大,评估误差基本呈线性增长,但增长程度却极为有限。在数据偏移率达到50%的情况,评估误差也仅为5.4%。这是因为在电网正常运行情况下各项监测指标数据应维持在一定范围之内波动,其数据曲线波动具有平稳性,如表1所示。由监测装置对时偏差造成的数据不一致情况虽然从数据质量角度表现为评估误差较小,但如果不加以校正会造成后续数据分析带来的困扰,例如事件溯源、故障预警失效等。

4.3 数据修复方法对比

通过式(1)对缺失数据进行修复并重新计算评估误差来观察拉格朗日内插法的修复性能。同时由于电能质量数据具有平稳性,因此选择简单的均值插补法作为对比算法。其中异常数据的修复可视为数据缺失情况处理。计算结果如图4(a)、图4(b)所示。

图4 数据缺失修复算法、数据异常修复算法及数据偏移修复算法比较

由图4(a)、图4(b)可知,在数据低比率缺失或异常情况下,内插法的修复性能明显好于内插法;但随着坏数据比例的上升,内插法的修复性能下降。这是因为内插法的修复原理是基于原始数据质量的,当坏数据比例较多时,其修复数据的可靠性相应下降。

针对数据一致性问题,基于式(2)~式(5)验证所提的基于频率量测偏差的电能质量在线监测装置本地时钟对时方法,计算结果如图4(c)所示。

由图4(c)可知,所提方法无论在低比率还是高比率数据偏移情况下,均能实现时钟偏移的校正,修复性能明显高于均值法。

5 结论

科学合理的电能质量综合评估依赖于完整、可靠、有效的监测数据。当监测数据中存在数据质量问题时,坏数据势必会对综合评估结果造成影响。为此,对目前现存电能质量监测系统中可能出现的数据质量问题对电能质量综合评估进行细致的影响分析,得到以下结论。

(1)不同类型、不同程度的数据质量问题对电能质量综合评估结果产生的影响不同。相同坏数据比率下,数据缺失情况对综合评估结果造成的误差最大,数据不一致造成的评估结果误差最小。随着坏数据比例的上升,数据缺失情况下评估误差增长迅速,数据异常情况次之,而数据不一致情况增长十分有限。

(2)通过插补法对存在的数据质量问题进行处理,能够明显减小评估误差。但随着坏数据比率的上升,单一的插补法效果逐渐下降。

(3)引入符号数据的处理方法能够很好地解决数据缺失情况下客观权重难以求取的问题,且提出的基于频率量测偏差的电能质量在线监测装置本地时钟对时方法能够基本解决数据不一致问题。

仅考虑监测数据中出现数据质量问题时对电能质量综合评估结果进行影响分析,并采用简单的均值填充和插补法对坏数据处理而未对此方面进行深入讨论。面对日益庞大电能质量监测数据,如何能够更合理地解决棘手的数据质量问题仍是一个值得注意的研究方向。

猜你喜欢
赋权电能权重
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
基于赋权增能的德育评价生态系统的构建
家庭赋权护理干预方案在肺癌放疗患者中的应用
企业数据赋权保护的反思与求解
权重常思“浮名轻”
苹果皮可以产生电能
试论新媒体赋权
为党督政勤履职 代民行权重担当
权重涨个股跌 持有白马蓝筹
澎湃电能 助力“四大攻坚”