检测低压用户窃电的计及专家经验的模糊聚类法

2021-08-05 02:33姚诚智冯小峰周东旭
广东电力 2021年7期
关键词:台区用电量电量

姚诚智,冯小峰,周东旭

(1.广东工业大学 自动化学院,广东 广州 510006;2.广东电网有限责任公司计量中心,广东 广州 510080)

电网在传输过程中的电量损耗可分为技术损失和非技术损失两大类[1-2]。技术损失主要是由电网中发电机、变压器、传输电路等组件中的内阻造成的功率损失;非技术损失主要是由计量装置的故障、抄表错误、用户窃电等行为引起的,其中,用户窃电是造成非技术损失的最主要原因之一[3-5]。由于经济利益驱使,窃电的行为长期存在,且窃电群体规模在局部地区较大,严重损害了电网公司的利益,用户私拉电线等窃电手段也给正常用电埋下了安全隐患。

窃电方法主要包括有表法和无表法。有表法又包括欠压法、欠流法、扩差法和移相法等方法。以单相低压线路用户的电量为例,通过减小电表计量的电压(欠压法)、电流(欠流法)或功率因数(移相法)的数值大小,导致电量计量值减小。而无表法通常的表现形式为用户私拉电线等,这些行为会导致计量设备表码不走。虽然有表法和无表法采用的手段不同,但是都达到了窃电的目的[6]。现阶段用于低压电量计量的智能电表不仅被焊死,且表码不能被用户清零和倒走,还具备检测失压、失流、电压电流不平衡等功能。虽然智能电表全覆盖工作基本完成,但不法分子窃电的手法也在更新,例如攻击计量装置、外加信号干扰、破坏计量或供电回路等,这对现阶段的窃电识别提出了不小的挑战。

随着大数据、人工智能[7-8]的兴起,机器学习已经应用在各行各业中,并且取得了不错的效果,智能电表的数据采集,给机器学习在窃电检测中的应用提供了强有力的支撑;通过运用机器学习技术,可缩小疑似窃电用户的范围,降低现场窃电排查的难度和减少人力成本。在过去的20年时间,国内外研究学者提出了众多不同的窃电检测方案,现有的方案大体可归纳为2种:样本学习[9-10]和异常检测[11-12]。

样本学习以机器学习中的监督学习为基础,依赖于已进行标记的样本,通过对样本的特征值分析、提取,采用模型训练挖掘出样本特征隐藏的规律。决策树(decision tree,DT)[13-14]、支持向量机(support vector machine,SVM)[15-16]、神经网络[17-18]这类典型的机器学习模型,已经广泛运用于窃电检测识别中。文献[19]提出了基于DT和SVM自上而下的方案,由DT处理的数据作为输入提供给SVM分类器,一定程度上降低了假阳率;文献[20]提出了XGBoost、LightGBM、CATBoost三大DT模型来比较预测窃电用户结果,并利用决策树加权特征重要性提取技术,降低了分类器的复杂度,提高了时效性。文献[21]提出基于AdaBoost集成学习的窃电检测法,通过对比误差逆传播(back propagation,BP)神经网络、DT、SVM和k-邻近(k-nearest neighbors, KNN)4种算法,确定以DT作为弱分类器进行集成,在爱尔兰公开数据集上取得了96.5%的受试者工作特征曲线下面积(area under receiver operating characteristic curve, AUC)和准确率(accuracy, ACC);文献[22]提出一种基于对抗式生成网络的生成数据方法,有效弥补了欠采样和过采样带来的不足,并通过随机森林(random forest,RF)、BP和卷积神经网络(convolutional neural network, CNN)检验了算法的可行性。

与样本学习不同,异常检测是以机器学习中的无监督学习为基础,异常检测不依赖于样本标签,很符合现阶段实际用电数据缺少窃电标签的情况。异常检测从2个维度出发:用户自身用电行为与自身历史用电的差异性以及与同一地区用户用电习惯的差异性。文献[23]提出一种基于密度的异常检测算法,通过与K均值(k-means,KM)、高斯混合模型(Gaussian mixed model,GMM)和具有噪声的基于密度的聚类(density-based spatial clustering of applications with Noise,DBSCAN)3种无监督算法进行比较,验证了所提算法在各项指标中的优越性;文献[24]提出自组织映射(self-organizing map,SOM)神经网络和KM算法的结合,该方法可以有效地自动选取聚类簇的个数;文献[25]提出最大互信息系数(maximum information coefficient,MIC)和基于密度峰值的快速聚类算法(fast search and find of density peaks, FSFDP),利用爱尔兰智能电表的公开数据集得到了验证。

综上所述,已有大量的文献从样本学习和异常检测2个方面着手研究,挖掘用户用电特征。目前电网公司的营销系统中的低压窃电工单少,且低压用户只有每天一个点的电量数据,因此现有的文献成果在实际生产中的应用存在一定的局限性。当前的用电稽查工作往往依据的是现场专家经验,初步判断用户疑似窃电嫌疑程度。因此,本文提炼出专家经验,提出预打标签法,并赋予预打标签用户疑似窃电嫌疑程度,在实际的现场排查中具有指导意义。不少反窃电研究文献采用的算例是公开的爱尔兰数据集,窃电用户是构造出来的,且窃电用户的占比可控;但考虑到国内外计量方式不同,用户用电习惯也不一样,本文使用真实的广东某台区低压用户用电数据作为算例。考虑到营销系统中低压窃电工单少的现状,采用监督学习的方法对样本训练较为困难,而无监督学习不依赖于标记样本,故本文从无监督学习入手。现有的数据包括台区的线损电量、电表测量的低压用户日用电量(不含窃电标签),所涉及的特征并不复杂,考虑到硬聚类算法会把样本强行归类的弊端,本文使用软聚类模糊C均值(fuzzy C-means,FCM)聚类算法[26]找出用户的用电异常点。

1 FCM聚类算法基本原理

相较于KM的硬聚类,FCM聚类将模糊的思路融入到了聚类之中,提供了更加灵活的聚类结果。在大部分情况下,数据集中的对象不能划分成为明显分离的簇,使用硬聚类算法强行将集中的对象归类可能会引起一定的误差。FCM在此基础上引入了概率的概念,对每个对象和每个簇赋予一个权值,也就是隶属度,这表示了对象属于该簇的概率,实现了从硬聚类到软聚类的转变。

FCM聚类算法是目前模糊算法中应用最为广泛且较为成功的算法之一,其目标函数为:

(1)

约束条件为

(2)

式(1)、(2)中:n为样本个数;k为聚类个数;xi为第i个样本;cj为第j个类簇中心点;μij为第i个样本到第j个类的隶属度;m为模糊化因子,是一个超参数,一般在{1,2,5}中选取。该目标函数的基本依据是“类内加权误差平方和最小化”准则,约束条件保证了对象到每个聚类中心的权重在同一纲量下进行。在实际工程中,FCM算法采用矩阵的形式加速运算,包括:n×p数据矩阵X、n×k隶属度矩阵U、k×p聚类中心矩阵C,其中p为特征个数。FCM算法是一个不断迭代隶属度和簇中心的过程,迭代时,不断地更新隶属度矩阵U和聚类中心矩阵C,最终收敛达到局部最优或全局最优的状态。求解隶属度矩阵U和聚类中心矩阵C中的系数,可通过拉格朗日乘子法,将式(1)和式(2)的条件极值问题转成无条件极值问题求解,求解的结果如下:

(3)

(4)

当满足迭代终止条件时停止更新,迭代终止条件为

max|μij,t+1-μij,t| ≤ε.

(5)

式中:ε为停止阈值;t为迭代次数。式(5)的含义是:当继续迭代下去,隶属度的变化已经足够的小,即聚类已经达到比较优(局部最优或全局最优)状态,该过程收敛于目标Jm的局部最小值或鞍点。

2 基于FCM聚类的窃电模型

为了解决低压用户窃电问题,本文借鉴文献[26]的思路,提出基于专家经验和FCM聚类算法的窃电检测模型,流程如图1所示,该窃电检测模型包括数据预处理、FCM聚类和窃电检测3个阶段。数据预处理阶段使用预打标签法,初步标记窃电嫌疑用户,通过重构特征和归一化为聚类做准备。FCM聚类阶段使用FCM算法进行聚类,输出隶属度矩阵和聚类中心矩阵。窃电检测阶段选取待验证的用户日用电量数据,按行计算待验证的隶属度矩阵与训练集隶属度矩阵的2范数,通过嫌疑系数σ判断待检测用户是否有窃电嫌疑。

图1 基于FCM聚类的窃电检测模型流程

2.1 缺失电量和零电量过多的问题

通过分析计量自动化系统电量数据可知,低压窃电会引起电量数据呈现用户的日用电量数据缺失电量过多(由破坏计量设备引起)、零电量过多(由存在窃电行为引起)的特征,因此对缺失电量和零电量过多的问题处理显得格外重要。

在论文提出的窃电检测模型中,设定的训练时间为180 d,测试时间设定为30 d。折中考虑2个方面的因素:第一,6个月时间跨度不是很大,大部分计量设备可以成功采集,选取近1个月的时间段来测试,可以直接从近6个月的采集数据中获取。第二,6个月时间段的数据可以平滑用户的一些异常用电行为,更合理地表示用户近6个月的用电习惯;使用1个月时间段的测试数据,用于表示用户近1个月的用电习惯,可以降低测试时间太短所带来的不确定性影响。

在本模型流程中,基于专家经验,先对疑似窃电用户进行标记。存在用电量为负的用户,标记为“存在用电量为负”,这类用户具有强烈的窃电嫌疑,新型的计量设备表码不存在倒走的现象,只有存在窃电行为才会导致负电量的产生;对应时间段内缺失电量超过50%的用户,分别标记为“近1周缺失电量过多”“近1个月缺失电量过多”“近3个月缺失电量过多”和“近6个月缺失电量过多”,这类用户的窃电嫌疑程度很高,正常使用的计量设备不会出现缺失电量的情况,不排除计量设备本身的故障或传输过程中的故障,但是大部分情况下缺失电量的产生是由破坏计量设备引起的;连续出现缺失电量的用户,分别标记为“近1周用电量缺失”“近1个月用电量缺失”“近3个月用电量缺失”“近6个月用电量缺失”,这类用户的窃电嫌疑程度极高,属于计量设备已无法正常工作状态,需要安排相关人员进行现场检查;对应时间段内零电量超过50%的用户,分别标记为“近1个月零电量过多”“近3个月零电量过多”和“近6个月零电量过多”,这类用户有疑似窃电的嫌疑,但是不排除用户可能长期不在家居住;用电量连续为0的用户,分别标记为“近1周用电量为0”“近1个月用电量为0”“近3个月用电量为0”“近6个月用电量为0”,这类用户存在窃电的嫌疑。为了避免窃电行为被察觉,一些用户只窃取大部分电量,反映在数据上是用户的日用电量长期处于低电量。下四分位数在统计学上有重要的意义,即将该一组数据从小到大排列,正好排列在下 1/4 位置上的数据为下四分位数。为了找出长期处于低电量用户,基于专家经验,设置用户近6个月的日电量的下四分位数为阈值,即将该用户近6个月日电量从小到大排序,选取下1/4位置上的日电量作为阈值。根据现场稽查专家经验,当用户日电量低于1 kWh属于低电量,因此阈值最终选取下四分位数或1 kWh。当用户近1周日用电量均低于下四分位数或1 kWh时,标记“近1周处于低电量”;近1个月超过90%的天数日电量低于下四分位数或1 kWh时,标记“近1个月处于低电量”;近3个月超过90%的天数日电量低于下四分位数或1 kWh时,标记“近3个月处于低电量”。除了打上“近1周缺失电量过多” “近1个月零电量过多” “近3个月零电量过多” “近6个月零电量过多” “近1周用电量为0” “近1周处于低电量” “近1个月处于低电量” “近3个月处于低电量”标签的用户,其余在预处理打上标签的用户,直接反馈结果。

2.2 待聚类数据的预处理

2.2.1 相关特征重构

原始的数据为时间序列,选取近6个月的用户数据,数据特征维度为180维,因此需要对数据进行降维操作,将原始数据矩阵X转成特征矩阵P=[p1p2…pp]n×p,其中n为筛选后用户个数,设计出7个具有代表性的特征来表示用户的用电习惯,达到了降维的效果,下面介绍7个特征。

a)一次电气特征p1——近6个月的日用电量平均值,反映6个月的时间内用户的平均用电量水平。

b)一次电气特征p2——除去零电量后近6个月的日用电量平均值,表示用户在家时候的用电习惯,反映用户真实的用电水平。

c)一次电气特征p3——近6个月的日用电量最大值,即峰值。

d)一次电气特征p4——近6个月的日用电量最小值,即谷值。

e)二次电气特征p5——近6个月的日用电量标准差,表示用电量的离散程度,公式为

(6)

f)二次电气特征p6——近6个月的日用电量波动程度,反映用户用电量的波动变化,公式为

(7)

用电量在一段时间内变化的越剧烈,p6值越大,反之越小。当用户的用电量一直处于波动状态,且波动的幅度很大,那么用户可能存在窃电行为。

g)二次电气特征p7——近6个月日用电量与台区线损之间的相关度,表示用户使用电量情况是否与台区线损有一定的相关性,公式为

(8)

经过相关特征重构,特征矩阵为P(n×p),当近6个月台区线损率的标准差大于5%时,p取7,否则取6。本文构造的相关特征提供了不同的信息,相互补充,对聚类算法均有正向作用,特征信息的构造在窃电检测模型中起到了至关重要的作用。

2.2.2 特征归一化

在聚类之前,需要对特征重构数据进行标准化或者是归一化处理,保证数据在同一纲量下进行运算,避免一些数据太大或者是太小影响到聚类算法,本文对特征矩阵P采用归一化处理,将特征数据固定在[0, 1]之中,即

(9)

2.3 FCM算法

a)步骤 1: 初始化隶属度矩阵U(0)。

b)步骤 2: 在第t步,使用式(4),用隶属度矩阵U(t)更新聚类中心矩阵C(t)。

c)步骤 3: 使用式(3)更新隶属度矩阵U(t+1)。

d)步骤 4: 如果满足收敛条件式(5)则停止迭代,输出U和C(为了表述方便,记最终输出的U(t)为U,最终的C(t)为C),否则返回步骤 2继续迭代。

2.4 待测样本评估

本文提出的模型是检测用户近1个月是否较过去6个月的总体趋势表现异常,通过FCM聚类算法,获取用户的隶属度矩阵U和聚类中心矩阵C。选取待测用户近1个月的用电量数据,构造与6个月特征类似的近1个月特征:①近1个月的日用电量平均值p′1;②除去零电量后近1个月的日用电量平均值p′2;③近1个月的日用电量最大值p′3;④近1个月的日用电量最小值p′4;⑤近1个月的日用电量标准差p′5;⑥近1个月的日用电量波动程度p′6;⑦近1个月日用电量与台区线损之间的相关度p′7,当特征p7存在时p′7也存在,反之不使用这个特征。

(10)

式中:u=[u1u2…up]为U中的一个行向量;u′=[u′1u′2…u′p]为U′中对应的行向量。d(u,u′)为一常数,可以得到所有待检测用户的窃电嫌疑程度向量d=[d1d2…dn]T。为了避免随机性给检测结果带来影响,使用10次FCM聚类算法,取窃电嫌疑程度的平均值作为最终的窃电嫌疑程度。当窃电嫌疑程度大于嫌疑系数时,记该用户为窃电嫌疑用户,在本模型中,嫌疑系数σ的取值为0.7,且为了进一步区分嫌疑程度,当0.7

a) 标记“存在电量为负数” 的用户的窃电嫌疑程度为2。

b) 标记 “近1个月用电量缺失”“近3个月用电量缺失”“近6个月用电量缺失” 的用户的窃电嫌疑程度为1.5。

c) 标记“近1周用电量缺失”“近6个月用电量为0”“近6个月缺失电量过多” 的用户的窃电嫌疑程度为1。

d) 标记“近3个月用电量为0”“近3个月缺失电量过多”“近6个月零电量过多”“近3个月处于低电量” 的用户的窃电嫌疑程度为0.9。

e) 标记“近1个月用电量为0”“近1个月缺失电量过多”“近3个月零电量过多”“近1个月处于低电量” 的用户的窃电嫌疑程度为0.8。

f) 标记“近1周缺失电量过多”“近1个月零电量过多” 的用户的窃电嫌疑程度为0.7。

g) 标记“近1周用电量为0”“近1周处于低电量” 的用户的窃电嫌疑程度为0.6。

对于一些预处理中打了标签也进行聚类的用户,选择d向量中对应的值与标签窃电嫌疑程度赋予值中的较大者作为最终的疑似窃电嫌疑程度。通过对疑似窃电嫌疑程度的排序,给现场实际排查提供优先级,可达到减少工作量和提高针对性的目的。

3 算例分析

3.1 数据的获取与处理

3.1.1 数据集的来源

本实验的计算机的处理器为Intel(R) i7-4720HQ,运行内存为8.00 GB;本实验使用的编程语言为Python,数据工具库包括Numpy、Pandas、Matplotlib。

算例数据集来自真实场景,选自广东省某地区的真实低压用户用电数据和台区线损电量数据,用户共5 048名,来自46个台区,共记录709 d(2019年1月1日至2020年12月10日)的数据。

3.1.2 数据预处理

真实的低压用户的用电量数据存在缺失值和零电量,采用第2章提出的预打标签法,见表1,初步找出用电异常的用户,并进行标记。真实的台区线损数据中存在负的损失电量,这是由于抄表人员误抄导致的,将负线损电量设置为缺失,在计算相关度时忽略负线损数据。本文使用的线损数据为线损率,线损率是线损电量与供入电量之比,供入电量是线损电量和台区用户用电量之和的结果,需要利用原始用户用电量数据和台区线损数据,计算出台区的线损率。

表1 部分初步标记的用户

3.2 实验结果与分析

3.2.1 基于FCM模型的结果分析

表2 台区1用户的聚类中心矩阵

由表2可知,7个簇中心坐标之间的差异较大,表明该台区的数据可分离性较高,每个聚类中心中的7个特征也存在一定的差异性。

选取2020年10月1日至2020年10月31日的数据作为校验算例,重构近1个月用电数据的特征,采用第2章提出的窃电检测模型进行检验,当疑似窃电嫌疑程度大于0.7时认为该用户有疑似窃电的嫌疑。结果显示,台区1共16户用户被打上了标签,其中被打上了“近1个月疑似窃电”和“近1个月高度疑似窃电”标签的用户共5户。选取一些具有代表性的疑似窃电用户的近1个月用电量曲线与台区线损率,如图2所示。

从图2中可以看出:某些缺失电量过多的用户,如图2(a)中显示的用户,其日用电量在10月1日至10月13日处于0,这类用户的窃电嫌疑程度很高;图2(b)中的用户标记为“近3个月处于低电量”,且该月使用的电量均处于1 kWh以下,窃电嫌疑程度很大;图2(c)中的用户被算法标记为疑似窃电用户,从图中可以看出该用户该月的日用电量与台区线损高度负相关,判断该用户的窃电嫌疑程度较大;图2(d)中的用户被算法标记为高度疑似窃电,从图中可以看出该用户的波动程度较大,但是与台区线损没有很强的相关性。在进一步的检验中,将标记为“近1个月疑似窃电”和“近1个月高度疑似窃电”的用户与该台区的线损率进行相关度计算,结果见表3。

其中用户7和用户32分别对应图2中的(d)和(c),从表3可以得出,用户32与台区1线损率的相关度超过了-0.5,表明该用户的日用电量与台区线损率有高度的负相关性,与从图3的观察结果一致。用户7与台区1的相关度不大,为了更进一步证实该用户有窃电的嫌疑,查看该用户近6个月来的日用电量曲线与台区线损的关系,如图3所示。

图2 部分已标记用户的用电特征示意图

表3 疑似窃电用户用电量与台区线损率的相关度

图3 用户7近6个月的用电特征示意图

从图3中可以看出,用户7在近6个月大部分时间的日用电量小于10 kWh。通过分析发现,该用户在8月中旬至9月底与台区1的线损率存在高度的负相关。在9月21日至9月23日,该用户用电量急速下降,而该地台区线损率则骤增,怀疑该用户有高度窃电嫌疑;因此,基于FCM算法的窃电检测模型判断该用户高度疑似窃电有合理的依据。

3.2.2 FCM模型与其他方法性能对比

为验证本文提出的预打标签法的有效性,设计了未进行预打标签的对比实验。由于真实数据中存在180 d的用电数据全部缺失的用户,这类用户没有对聚类算法起到任何的积极作用,因此需要剔除。FCM的超参数的选取参照第2章,窃电检测的结果见表4。通过对表4的分析可知,除了用户9、用户25和用户26以外,其余的5户用户均为实验组窃电检测模型中标记的疑似窃电用户,且窃电标记相同。用户9在对比实验未预打标签模型中标记为“近1个月疑似窃电”,而在预打标签模型中标记为“正常”,这需要现场稽查验证。对于实验组中绝大部分已经预打标签的用户,未预打标签的模型并没有将这类用户标记为疑似窃电,可以推断在聚类的过程中,未预打标签模型将零电量过多的用户聚类为一个类,将这些用户视为正常用电用户,此模型可能会造成一定程度的漏判。

表4 2种预处理的窃电检测结果对比

为了确定FCM软聚类的优越性,使用KM硬聚类算法进行对比实验。其中,超参数的选取与本文提出的基于FCM聚类类似:簇个数k=7,停止条件ε=0.001,最大迭代次数T=1 000。但是KM算法不具备FCM算法的隶属度概念,求得的结果只有聚类中心矩阵Q(k×p)和样本聚类标签v(1×n),因此在求解2范数时需要进行改动:计算待测样本与所属类的聚类中心之间的欧几里得距离,大于窃电系数时标记为窃电用户,在测试中嫌疑系数σ设置为0.5。为了确保预打标签的方法不对检测结果造成影响,在KM聚类算法中, 基于2.4节提出的专家经验对其疑似窃电程度赋予一定的数值,在对应的标签下数值减去0.2,如标记为“近1周用电量为0”“近1周处于低电量”的用户,该用户的窃电嫌疑程度为0.4,以此类推。采用KM硬聚类算法和FCM软聚类算法的检测结果见表5。

表5 2种算法窃电检测结果对比

结果显示,使用KM聚类的标签用户共13户,其中标记为“近1个月疑似窃电”的用户共2户,分别是用户17和用户32,而使用FCM聚类的标签用户共16户,其中标记为“近1个月疑似窃电”或“近1个月高度疑似窃电”的用户共5户;用户32在本文提出的窃电检测模型中已检测出疑似窃电,用户17、用户32的疑似窃电嫌疑程度分别为0.53和0.68,该窃电嫌疑程度与本文提出的基于FCM窃电检测模型的窃电嫌疑程度略有出入,在KM算法中窃电嫌疑程度大于σ则检测为疑似窃电。用户17的近6个月日用电量和台区线损率关系如图4所示,通过分析并没有明确的信号指向该用户有窃电的嫌疑,与台区线损的相关度计算结果为-0.15也指向了这一点。

图4 用户17近6个月的用电特征示意图

为了检测算法的准确性,安排稽查人员对台区1进行逐户稽查,发现共15户用户有窃电行为,见表6。通过结果分析可知,本文提出的基于FCM窃电检测模型能够很好地甄别出疑似窃电用户,但是不可避免会有一些误判,如用户20和用户22,经过核实该用户长期不在家居住,导致了模型的误判;模型还漏判用户9,但是可以发现该用户的疑似窃电嫌疑程度接近0.7。为了保证模型的泛化性,在参数阈值的选取中只取小数点后1位的数,保证尽可能多的窃电用户被检测出来,且避免模型过拟合。虽然未进行预打标签法的实验结果准确率达到了100%,所预测的疑似窃电用户全部为窃电用户,但是该模型遗漏了许多窃电用户,查全率只有53%。KM聚类算法的检测结果也出现了较多的漏判,如漏判了用户6、用户7、用户9、用户23和用户27,而且出现了错判用户17的情况,虽然在运行速度上,该算法运行速度为0.8 s,优于本文提出的窃电检测模型1.03 s,但是在准确率上明显逊色于FCM窃电检测模型,本文提出的模型在性能上更加优秀,而且本文提出的模型从预处理到输出窃电检测结果,处理5 048名用户用时12.8 s,满足了时效性。

表6 台区1窃电算法检测结果和现场稽查情况

4 结论

针对目前营销系统中低压窃电工单少的问题,提出基于FCM聚类算法的窃电检测模型,并在真实的广东某地区低压用户数据上进行实验,得到以下结论:

a)基于FCM聚类算法的窃电检测模型可以不依赖于用户窃电标签,并对每个用户赋予疑似窃电嫌疑程度,按疑似窃电嫌疑程度排序,可以指导实际工作中的排查优先级,减轻工作量。经现场稽查结果可知,所提出的模型可以准确识别出低压窃电用户。

b)对不采取初步标记处理的日用电量数据进行聚类,会导致窃电检测模型将一些窃电用户识别为正常用户,对于这个问题,本文基于专家经验,提出预打标签法,提高了窃电检测模型的查全率;

c)基于FCM聚类算法的窃电检测模型效果要优于KM窃电检测模型,具有较高的准确率,且该算法在处理大量用户日用电量数据时也具有时效性。

猜你喜欢
台区用电量电量
02 国家能源局:1~7月全社会用电量同比增长3.4%
01 国家能源局:3月份全社会用电量同比增长3.5%
储存聊天记录用掉两个半三峡水电站电量
9 月份全社会用电量同比增长6.8%
国家能源局:3月份全社会用电量同比下降4.2%
四川2018年7月转让交易结果:申报转让电量11.515 63亿千瓦时
降低台区实时线损整治工作方法
电量隔离传感器测试仪的研制
北斗通信在小型水电厂电量采集中的应用
三合一集中器作为台区线损考核表计的探讨