停电范围内配网设备信息智能挖掘系统设计

2021-12-07 07:45罗宇剑罗宇勤孙栋梁
电子设计工程 2021年23期
关键词:查全率键值数据挖掘

罗宇剑,林 海,罗宇勤,彭 磊,孙栋梁

(1.国网湖南供电服务中心(计量中心),湖南长沙 410007;2.国网湖南省电力有限公司,湖南 长沙 410004;3.国网湘西供电公司,湖南吉首 416000;4.北京恒泰实达科技股份有限公司,北京 100194)

因为配电网长期暴露在自然环境中,线路设备不但会自然老化,而且会遭受各种自然灾害。为保证配电网安全可靠运行,对配电网络进行定期检查,发现配电网络运行中的缺陷及各种自然、机械因素造成运行问题并及时解决[1]。

运用传统人工统计巡游线路方法,巡游线路上以小组形式巡游,工作人员手持各种纸本资料,手工巡游记录。这一做法存在如下缺点:人力、物力耗费资源大,检查效率低,管理人员不能有效监督检查结果。配电网络的线路越复杂,网络密度越大,负荷越大。第一线工作人员和管理人员都认为,传统的方法已经不太适合快速发展的配电网络建设[2]。如何以信息化方式来改进当前检测工作,已经成为当前信息挖掘系统越来越迫切的问题。为解决该问题,提出了一种停电范围内配网设备信息智能挖掘系统设计方法,利用检测信息来解决配电网运行及变化对周围环境的影响问题,在设备运行过程中及时发现问题及各种外部因素,及时提出解决方案,消除问题,保证设备安全运行。

1 系统硬件结构设计

系统配电网应用分析功能中的停电范围分析,可提供电力营销系统中接通线路的停电信息。将临时停电与计划停电区别开来,根据实际情况,对停电动态实时分析。

1)动态分析停电情况

利用动态可视化网络信息图,分析配电网各线路节点的连接情况,确定停电范围、负荷分布和跟踪[3]。

2)实时分析停电情况

配电网络实时GIS 是将配电设备的GIS 数据、调度数据网络的SCADA 数据和负荷监测数据集成在一起,实现对配电变压器、开关、线路、闭合器、分段器等配电设备的综合采集和监控[4]。运用统计计算功能,对数据进行可靠性分析,使配电网运营人员能准确地掌握配电网设备运行状态实时情况[5]。

信息智能挖掘系统设计主要包括:数据引擎、数据简化器、数据筛选器、显示模块、控制电路等[6]。在停电范围内设计配电网设备信息智能挖掘系统的硬件结构如图1 所示。

图1 系统硬件结构

如图1 所示,该系统应用数据简化器,将分布在停电范围内的设备信息简化为可以被挖掘的设备停电事件信息,并在显示模块中,将经过数据筛选后的文本数据展示出来。

1.1 数据引擎

资料库引擎是储存、处理及保护资料的核心服务模块,可以使用数据库引擎来控制存取权限和快速处理事务,从而满足系统处理配网设备运行中产生的大量数据应用程序需求[7-9]。将数据库引擎作为联机事务处理或联机数据分析关系数据库,并使用SuperMap SDX+提供综合空间对象类型支持。

对于数据库引擎文档,主题顺序是按照主要任务顺序使用数据库引擎来实现数据存储系统[10-12]。为存储系统所需的关系表或XML 文档而设计并创建数据库,并将执行访问和修改结果存储在数据库中。SuperMap SDX+空间数据引擎包括数据应用网站和程序,以及生成和使用SQL Server 工具,为单位或客户部署提供日常管理化支持方案以优化数据库性能[13-15]。

1.2 数据筛选器

采用单片机实现硬件电路设计,图2 为数据筛选器。

图2 数据筛选器

通过串口使门禁控制器和读卡器之间快速通信,该串口使用一个交换电路来保证两个设备中,至少有一个设备能一直通信,向门禁控制器发送的所有命令均为合法命令,经单片机程序确认,实现了数据过滤和隔离[16]。与此同时,单片机也可以通过另一个串口对接入控制器和控制计算机进行通信,在分析通信内容的基础上,得出接近卡片的合法内码数据,并存储于大容量EPROM 中,作为数据比对的基础。

1.3 控制电路

短路电流会引起电气设备绝缘损伤,产生强烈电动势,一旦出现该问题,就要求电路迅速、可靠地切断电源。该控制电路中,最常见的控制电源设备为过流继电器。

电路中零压、欠压保护指的是电动机在运行过程中,电源电压消失而导致电动机停转现象发生;当电源电压恢复时,电动机会自动重新启动(也称为自启动),很容易引起设备故障。

常见的失压和欠压保护是采用低压继电器,控制直流低压部分与直流高压部分,降低失压、欠压概率,防止三相电动机运行时出现超负荷电流问题而设置的保护。

2 软件部分设计

2.1 功能模块设计

数据采掘系统主要有四大功能模块:

1)系统管理模块

该模块主要负责系统用户、安全、服务、资源统一管理。通过友好的界面,系统可直接向用户提供所需的相关资源和服务。

2)数据预处理模块

该模块主要负责数据采集、清理、集成、选择和转换等操作,首先从大量数据源中收集相关原始数据,然后调用接口服务和清除算法对所收集数据进行清除,分类整合清除后的数据,选择有用数据类型,存储于数据存储区数据层。

3)数据挖据模块

该模块对预处理后的数据在接口上进行合理分类,然后调用服务,按类别进行详细分析,以发现隐藏在预处理模块中的有用信息。在此基础上,通过决策管理,选择合适的挖掘算法实现数据挖掘。

4)结果评估模块

该模块通过模型评价和比较,选择最优数据挖掘结果并使其可视化,以知识表示形式呈现给用户。

2.2 Apriori算法

应用Apriori 计算方法可以对停电范围内配网设备中信息传输通道分类,从而更好识别和分类信息,按照优化后计算方法优化信道。

式(1)中,a1、a2、a3分别表示信道过程中属性值、系统参量、挖掘模型识别边距;K(G)表示停电范围内信道边界程度。

由于设计的挖掘过程使用质数排列方式,所以需要对数列重新编辑,计算公式为:

式(2)中,∂2N表示预估出现数列畸变系数;∂u∂v表示设计的挖掘过程参数阈代关联系数。

根据上述内容,进行Apriori 计算,计算公式为:

2.3 算法实现

通过Map/Reduce并行编程模型,可以整合云计算技术和海量数据挖掘。这个模型是一种主从式结构,所有用户请求都被看作任务。当处理杂乱无章的大规模数据时,首先要把它划分成无数个块,然后把大规模计算任务扩展到无限规模机器集群上完成数据归一。图3 显示了Map/Reduce 大规模数据挖掘算法过程。

图3 数据挖掘算法流程

算法具体实现步骤如下:

step1:通过使用Map(mapping)函数分析大型数据集中不同结构数据类型,并给出表示数据特征的键key 和值value。

step2:使用Map 函数将用户的挖掘请求作为一个对应作业处理,将其分成几个不同映射任务,并将这些子任务分配给数据挖掘平台不同机器来处理,然后将键值分配到,从而生成新的对应键值对

step3:合并相同key2 键值作为映射输出结果,通过随机配对阶段将不同映射结果一一配对,形成新的键值对集合值

step4:判断是否所有子任务都已经完成了映射,然后进行step5,否则返回step3。

step5:为Reduce 函数定义一个新的键值对,然后为它赋值,形成新的键值对,并将其写入文件之中。

step6:合并上述文件,即为信息智能挖掘结果,对这些结果进行可视化处理后,可展示给用户。

3 实 验

为了验证停电范围内配网设备信息智能挖掘系统设计的合理性,进行实验验证分析。

3.1 实验指标

1)信息筛选查全率

设挖掘出来的配网设备信息量为xa,停电范围内全部配网设备信息量为xi,基于此可得出信息筛选查全率为:

式(4)中,信息筛选查全率越高,说明信息筛选越精准。

2)信息挖掘误差

设挖掘次数为n,筛选出来的信息量为xa,信息浏览但未使用信息量为xc,停电范围内全部配网设备信息量为xi,由此计算信息挖掘误差:由式(5)可知,信息挖掘误差越小,说明信息智能挖掘精准度越高。

3.2 实验结果与分析

3.2.1 查全率

以往使用人工统计巡游线路信息挖掘方法存在信息筛选不完全,而停电范围内配网信息智能挖掘系统信息筛选完全,针对该情况,进行实验验证分析,结果如图4 所示。

图4 两种方法信息筛选查全率

由图4 可知,使用人工统计巡游线路信息挖掘方法,最高查全率为55%,而使用停电范围内配网信息智能挖掘系统最高查全率为93%,由此可知,使用停电范围内配网信息智能挖掘系统信息筛选查全率较高。

3.2.2 挖掘误差

分别使用两种方法分析信息挖掘误差,结果如表1 所示。

表1 两种方法信息挖掘误差

由表1 可知,使用人工方法最高信息挖掘误差为0.52,最低为0.35;使用所研究方法最高信息挖掘误差为0.15,最低为0.05。由此可知,使用停电范围内配网信息智能挖掘系统信息挖掘误差较小。

4 结束语

文中提出停电范围内配网设备信息智能挖掘系统设计方案,数据简化器是在系统的硬件设备上增加的,通过它可以对数据进行一定程度过滤,应用Apriori 计算方法可以更好识别和分类信息,提高数据挖掘过程的效率,从而确保信息的优先性,避免传统方法中的数据混乱。

猜你喜欢
查全率键值数据挖掘
探讨人工智能与数据挖掘发展趋势
非请勿进 为注册表的重要键值上把“锁”
海量图书馆档案信息的快速检索方法
基于词嵌入语义的精准检索式构建方法
一键直达 Windows 10注册表编辑高招
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究
注册表值被删除导致文件夹选项成空白
基于Web的概念属性抽取的研究