违约用电与窃电的多维度智能分析经验算法和分类算法

2023-09-29 01:28
江西电力 2023年4期
关键词:分析模型降维用电

刘 松

(1.国网江西省电力有限公司鹰潭供电分公司,江西鹰潭 335000;2.上海电力大学,上海 200090)

0 引言

目前,少数电力用户受经济利益驱使,窃电现象屡有发生。随着科学技术的快速发展,通过高科技手段进行窃电和违约用电的行为越来越多。这些技术手段不但隐蔽性强,而且查处困难。现阶段查处违约用电、反窃电的主要方法是安排人员进行现场巡视排查,通过仪表应景设备进行排查。传统反窃电侦查方法普遍耗时耗力,并且准确性偏低。现有的反窃电系统,由于接入数据源少,分析模型单一,不具备自学习功能,造成研判角度单一,无法适应针对性重点排查要求。为解决准确判断违约用电与窃电的技术难题,文中运用经验学习、标签库、知识图谱等技术,构建针对专变、一般工商业和居民的违约用电与窃电分析模型,可准确定位违约用电和有效查处窃电行为,辅助用电稽查人员利用智能化手段开展用电治理。

1 总体设计

该算法的目标是建立经验算法和分类算法,构建违约用电与窃电分析模型;通过各类模型训练、验证和完善,优化模型的计算效率,提升模型分析的准确性、及时性和可靠性;实现违约用电、窃电的处理流程与经验算法、分类算法相互验证、自我提升;若异常未消除,系统自动重新纳入训练,更新分析模型,实现自学习和自优化的功能。

1.1 建立基于多源数据融合的用户标签库

以用电信息采集系统的数据为基础,结合营销系统用户档案、发行电量与电费,构建违约用电与窃电分析数据源,开展三方面工作[1]:一是建立海量数据存储与计算平台。由于违约用电和窃电分析涉及对用户进行多维度、全方位、深层次的分析,运用分布式存储与并行计算技术,对档案、负荷、电量和事件等数据进行处理;二是数据预处理。建立数据清洗规则,完善计量在线监测模型,按照业务分析的需求开展数据处理和归集工作;三是建立全省用户的标签库。根据不同用户类别的用电属性、异常状态、用电特性、负荷特征与变化趋势等,构建全省专线、专公变、低压工商业、分布式电源和居民的标签库,满足数据挖掘和机器学习的需求。

1.2 建立机器学习构建违约用电与窃电分析模型

针对专线、专变和低压工商业及居民的用电特征、违约用电与窃电行为方式及对负荷、电量的影响,结合营销系统违约用电与窃电查处流程、计量在线监测、国家企业征信信息和用户标签信息,运用决策树、逻辑回归(Logistic regression)和支持向量机(SVM)等多种经验学习算法,及分类器组装方法(Bagging和Boosting)构建专线与专变违约用电分析模型、专变窃电分析模型、低压工商业与居民窃电分析模型,通过样本数据对各类模型进行训练、验证和完善,及压力测试优化模型的计算效率,从而提升模型分析的准确性、及时性和可靠性,满足在用电信息采集系统大数据平台上在线分析运行的要求。

1.3 通过查处结果与经验学习不断地训练、完善和提高

通过违约用电与窃电模型分析的疑似用户进入待办事项进行观察,如果在设定的一段时间内,相关异常现象没有消除,则直接进入异常处理流程,处理结束归档后,系统从二方面进行工作:一是监控异常实际处理情况。如果一周内疑似用户的异常现象是否再次发生,如果再次发生,则重新进入异常监控与处理环节;二是针对处理结果优化分析模型。根据异常处理结果及重复发生处理结果,系统自动将分析不准确的用户重新纳入模型进行训练,训练后自动更新分析模型,实现机器自学习和模型自优化功能。

1.4 研发用户违约用电与窃电分析处理软件

基于HPLC 高频采集、计量在线监测和用户用电多维度统计的数据,运用分布式存储与并行计算框架、微服务和机器学习等技术,在用采大数据平台开发用户违约用电与窃电智能分析软件,具备五方面功能:一是数据集成与预处理模块。实现用电信息采集系统内部和外部数据接入,按分析需求进行清洗、存储、统计和归集;二是开发违约用电与窃电分析模块。包括专线和专变用户违约用电分析模块,专变与三相工商业用户窃电分析模块,低压用户窃电分析模型;三是异常工单管理模块。包括待办事项工单、异常处理工单、处理结果监控、异常处理结果统计分析等功能,形成多分析维度、多时间尺度、多异常类型的违约用电与窃电的统计分析模块,多样化对比展示;四是分析模型自学习模块。根据异常处理的结果及一周内的系统自验证的情况,针对分析不准确的用户重新进行训练和验证及模型更新功能;五是开展全景展现模块。基于知识图谱、单线图和电网GIS开发违约用电与窃电全景展现模块,辅助操作员精准定位异常用户,进行快速处理和排查。

2 分析模型原理

为做好违约用电与窃电有关的数据分析与预测工作,基于历史数据和训练内容形成知识库,结合经验学习实现模型的优化,形成适应业务发展的数据分析模型,知识库需要包括知识名称、知识类别、知识内容等最终形成违约用电与窃电知识库,满足运用知识图谱展现违约用电与窃电用户的信息,并为以后窃电工作提供参考依据。违约用电与窃电知识库管理包括:知识编辑、知识审核和知识展示三大功能。基于大数据、经验学习技术建设的违约用电与窃电智能分析分为三步。

2.1 违约用电与窃电分析影响因素的降维方法

基于违约用电与窃电都会涉及失压、失流、断缺相、电能表开盖、电能表停走等异常,及对应不同维度负荷、电量的变化,通过对影响因素梳理,基于PCA、LDA、LLE 等数据降维方法的研究理论线损影响因素降维方法。对违约用电与窃电的影响因素多种多样,考虑到影响因素关联程度各有不同、回归模型的性能,对其进行降维处理,LLE 是一种非线性降维算法,它能够使降维后的数据较好地保持原有流形结构[2],降维算法的思路可概括为:

1)对局部近临点的选取。对于从电力公司获取的停电故障数据集:

利用样本点之间的在高维空间的距离寻找每个样本点di对应的n个近临点。

2)计算样本点的局部重建权值,即:

式中:dij(j=1,2,…,n)为di的j个近临点;wij是di和dij之间的权值。

3)利用权值矩阵W降维,得到低维嵌入Y。即:

式中,M=(I-W)T(I-W)。使Lagrange 乘子法,取M的值最小的d个非零特征值所对应的特征向量作为低维坐标Y。通常最小特征值几乎为零,因此取2~(d+1)间的特征值所对应的特征向量作为输出结果。

2.2 基于K-mean聚类方法的违约用电与窃电用户分类方法研究

基于K-mean聚类方法研究违约用电与窃电用户的分类方法,构建不同类别用户的分类指标,并进行专变、专线用户与台区(低压用户把台区作为一个参考因素)分类。K-Means算法以欧式距离作为相似度测度,采用误差平方和准则函数作为聚类准则函数。该算法分为4 个步骤:

1)初始化:确定类别数目k和初始聚类中心点。

2)类划分:按照式(4)计算N个样本和k个初始中心点的距离,按照距离大小将N个样本分配给最近的中心点,形成k个聚类。

3)聚类中心点求解:计算每类中所有对象的平均值,并以此作为k个聚类新的聚类中心。

4)收敛判断:用式(5)判断是否收敛。

2.3 基于多元线性回归的违约用电与窃电分析模型研究

针对违约用电与各类窃电分析模型分类预测,分别应用多元线性回归、支持向量回归机等回归方法进行疑似率求解模型的构建,并结合计量在线监测的异常关联负荷、电量的变化,及时排查并进行疑似率计算。基于粒子群优化(Particle Swarm Optimization,PSO)算法的支持向量回归机(Support Vector Regression,SVR)的配电网理论线损计算方法,SVR 是支持向量机的一个子类,其特点是最终输出函数为线性函数,因而广泛应用于函数拟合、预测问题等领域。PSO 是一种优秀的群智能优化算法,具有收敛速度快、寻优能力强等特点[3]。在SVR-PSO 训练过程中,利用粒子群算法动态地搜索支持向量回归机的最优训练参数,提高SVR-PSO 的计算精度。

如图1所示,在SVR-PSO 训练过程中,通过向支持向量回归机SVR 输入训练样本集和PSO 训练参数。通过训练,并输入测试样本集形成临时预测模型,输出预测结果,计算f值,当未达到阈值进行PSO迭代,修正PSO 上一次训练参数。继续PSO 训练直到f值满足阈值,形成最终预测模型。

图1 SVR-PSO工作流程

3 相关算法优化

为解决违约用电和窃电数据中的样本平衡性问题、稀疏矩阵问题,从以下几个方面对相关算法进行优化:

1)解决样本平衡性问题,即采样问题。从丰富类别的样本中随机选取和窃电用户相同数目的样本,以平衡数据集。模型训练过程中反复从未经训练的样本集中抽取,以能够识别更多的样本数据特征。此过程优势有两点,其一,解决样本平衡性问题;其二,增强模型的鲁棒性[4]。

2)解决稀疏矩阵问题。采用CNN 模型中池化层来解决该问题。池化(Pooling)实际上是一种形式的降采样。其中“最大池化(Max pooling)”是最为常见的一种非线性池化函数,如图2所示。

图2 池化过程

它将输入数据划分为若干个矩形区域,对每个子区域输出最大值。直觉上,这种机制能够有效的原因在于:在发现一个特征之后,它的精确位置远不及它和其他特征的相对位置的关系重要。池化层会不断地减小数据的空间大小,因此参数的数量和计算量也会下降,这在一定程度上也控制了过拟合。其优势在于三点:其一,特征不变形,池化操作是模型更加关注是否存在某些特征而不是特征具体的位置;其二,特征降维,池化相当于在空间范围内做了维度约减,从而使模型可以抽取更加广范围的特征。同时减小了下一层的输入大小,进而减少计算量和参数个数。其三,在一定程度上防止过拟合,更方便优化。

3)通过对CNN 模型的损失函数进行优化,将交叉熵损失函数及自定义损失函数二者之和作为模型训练最终损失函数。经过反复训练,根据最终分类结果概率,再结合相关业务知识进行判定。若出现用电行为可疑,则将其窃电概率映射为较大概率。

4)自学习能力的构建。从窃电用户的数据特点以及卷积神经网络的局部连接、权值共享、下采样等优势,利用卷积神经网络分别针对专变、低压用户(380 V、220 V)构建反窃电模型,具体卷积神经网络结构如图3所示。

图3 反窃电模型组织结构图

反窃电模型每一层都有多个Feature Map,每一个Feature Map 中均含有多个神经元,输入通过一种过滤器作用,提取输入的一种特征,得到一个不同的Feature Map,其中卷积神经网络训练中相关参数分别为学习率为0.01、批次大小为30、训练次数为5000次;损失函数为交叉熵损失函数以及自定义损失函数之和;神经元激励函数选取relu,选取随机梯度下降法;最后通过激活函数softmax输出最终分类结果,反复训练,选取最优分类模型。

针对低压用户窃电分析建立台区线损与用户用电关联分析模型,分析哪些用户在用电时候,台区线损处于合理范围,且不用电的时候,台区线损属于高损,结果卷积神经网络分析这些用户窃电置信度,辅助开展现场精益排查。

4 实施效果

通过该项目的实施,提升了对反窃电用户的监测水平,提高了反窃电工作准确性,为电量电费追补提供有力的技术手段,为追补电费提供技术保证,大幅度提高了反窃电稽查工作效率,有效地提高公司整体经济效益。在近1 年的使用过程中,反窃电工单派发率99%,违约用电工单派发率99%,反窃电反馈及时率99%,违约用电工单反馈及时率99%,征信系统推送率99.5%。完成基于知识图谱的违约用电与窃电智能分析、全景可视化软件一套,集成在用电信息采集系统中,成果在江西公司11 地市97 县开展应用,已查获违约用电与窃电案例28 件。

5 结语

违约用电与窃电的多维度智能分析经验算法和分类算法解决了从海量数据中快速甄别定位窃电用户,对用户窃电时间、窃电方式、窃电地点进行准确的定位,大大提高了防窃电的技术水平和窃电处理的效率,同时降低财务成本、物资成本、人力成本;提升了监测水平和反窃电工作的准确性,为电量电费追补提供有力的技术手段和技术保证,大幅度提高反窃电稽查工作效率,有效提高电力公司整体经济效益。可广泛应用于各电力公司准确判断、定位电力专线用户、专公变用户、低压工商业用户和居民用户违约用电及窃电的情况。

猜你喜欢
分析模型降维用电
用电安全
基于BERT-VGG16的多模态情感分析模型
混动成为降维打击的实力 东风风神皓极
用煤用电用气保障工作的通知
安全用电知识多
降维打击
用电安全要注意
层次分析模型在结核疾病预防控制系统中的应用
全启发式语言分析模型
抛物化Navier-Stokes方程的降维仿真模型