基于历史票联想的电网工作票智能填写与校验方法研究

2021-10-13 10:25黎颖刘晶易满成彭政马逢强俞思帆黄薇蓉徐炫东刘健欣
电子制作 2021年19期
关键词:知识库校验安全措施

黎颖,刘晶,易满成,彭政,马逢强,俞思帆,黄薇蓉,徐炫东,刘健欣

(广州市供电局,广东广州,510000)

0 引言

近年来,计算机技术不断发展,供电企业的信息化程度也在不断提高。网络技术被逐渐应用于供电局的生产信息管理系统[1-3],工作票应用填写和智能校验模块应运而生。工作票制度是保证电网维护、检修、试验等工作中人身与设备安全的重要措施,关联电网运行、维护检修等多项业务。工作票中涵盖工作任务、工作设备、工作时间、工作手续等丰富的信息,并且工作票包含的部门角色非常多,流程复杂,任一环节管控不到位都将带来安全风险[4-5]。因此,研究电网工作票智能填写与校验方法具有非常重要的意义。

目前不少电网运行单位的工作票仍采用手工开票与校验的方式,且工作票流转各环节高质量决策的依据不足,主要存在如下弊端:作业时间集中、电网接线复杂、作业环境不明确等因素,对工作票填写与审核质量造成较大影响[6-7];由于工作票作业总体时间受生产计划时间、安全措施布置时间、其他指令性工作安排冲突等约束,对开票审票效率提出更高要求;工作票签发、接收、许可、监督、评价等环节难以快速获取作业风险、设备状态、停电冲突、人员履职能力等支撑信息,难以对工作必要性、可行性等充分评估,增加工作票管理各环节决策的难度[8-9]。工作票管理业务场景具有“海量、高频、复杂”的特征,因此需深入研究工作票管理业务体系、挖掘智能化应用功能来支撑工作票执行与管理的智能化与自动化[10-12],这是作为大数据与业务融合的切入点之一。

为提高工作票管理系统的智能化,解决工作票高质量决策依据不足造成的弊端,提出了一种基于历史票联想的电网工作票智能填写与校验方法。该方法可显著提高工作票填写正确率和风险预估准确率,并且减少调度人员的工作量。

1 理论分析

工作票由检修相关人员、工作时间、工作地点、工作内容及电网安全措施构成。应用算法对工作票中的信息进行文本挖掘[13-15],获得该工作票信息的关键词,工作人员可参考该关键词,使工作票的填写变得有规律可寻。

根据工作票大数据研究现状以及电力公司对工作票大数据挖掘和智能化处理的需求,按照CRISP-DM流程进行数据挖掘工作,如表1所示。

表1 数据挖掘工作流程

工作票文本包括问题描述、问题解决方案等字段。为了让计算机理解这些自然语言,需要利用合适的文本表示方法对工作票文本进行向量化表示,方便进行工作票的数据挖掘。向量空间模型将文本表示为带权重的空间向量,通过计算向量之间的相似性来度量文本的相似性[16-17]。常见的词语权重计算方法有词频(Term Frequency, TF)、TFIDF(Term Frequency-Inverse Document Frequency)等方法。本文采用TF-IDF方法计算词权,计算公式如式1所示。

其中,wi,j指特征词i在文档di中的权重,它由词i在文档di中出现的频率tfi,j和逆向文档频率dfi计算得出。

首先计算工作票文本中提取的所有单词的TF-IDF分数。取前k个得分最高的单词作为工作票的特征保留。接下来表示每张工作票的特征向量v(di),如式2所示。

每张工作票的特征向量为k维,分别表示每个特征词在文本中的权重大小。

2 模型建立

2.1 电网工作票填写与校验模型

历史票联想的工作票决策模型是通过调用工作票数据知识库[18]、计算工作任务的文本相似度来实现。

首先要进行历史票参数优选,参数优选流程如图1所示。①根据计算工作票数量和种类的需求,进行知识分析,获取基础信息;②利用关联规则算法搜索知识库中的规则,判断知识库中是否有计算工作票数量的规则,若有,继续执行,否则回到步骤①;③判断此工作票计算规则能否满足精确推理要求,如果满足,继续执行,否则,进入步骤⑤;④进行精确推理,获得优选参数并返回给工作票应用;若存在计算工作票数据的多个结果,则根据不同结果排序给出可信度最高的工作票数据结果;⑤检测是否产生新的规则知识,若是,则保留推理规程,进行知识库更新[19]。

图1 历史票参数优选流程图

当用户在点击智能开票时,会计算用户所填工作任务与知识库工作任务之间的相似度,若该值高于一定阈值,如90%,则可认为这两个工作任务的安全措施内容是可通用的,将该历史工作票的安全措施返回即可[20]。如图2所示为文本相似度TF-IDF模型。

图2 文本相似度TF-IDF模型

计算文本相似度即为历史工作票联想功能。当下达对某个开关的检修任务时,可通过联想功能调用历史数据知识库,将与本次任务相关信息与知识库中信息一一对比,分别计算历史数据与本次任务的相似度,进而提取相似度最高的信息关键词,这些关键词构成了本次任务工作票的主要内容。

2.2 厂站拓扑的安全措施自动生成

以厂站第一种工作票图3为例,作业类型是开关投产前试验,图4是厂站接线拓扑图。接口会传过来工作票ID、厂站第一种工作票、110kVxx变电站、10kVxx开关投产前试验这四个字段。

图3 厂站第一种工作票

图4 厂站接线拓扑图

(1)对工作任务进行正则校验,对应的工作票类型为厂站第一种工作票,作业类型为开关投产前试验的正则校验规则,假设校验通过。

(2)提取工作任务中的关键信息并进行查询,对应的工作票类型为厂站第一种工作票,作业类型为开关投产前的工作任务。

(3)安全措施字段中,例如应投切的相关直流电源(空气开关、熔断器、连接片)、低压及二次回路、应设遮栏、应挂标示牌(位置)、是否需线路对侧接地、是否需办理二次设备及回路工作安全技术措施单、其他安全措施和注意事项等,这些字段基本都是相似的,根据典型工作票提前梳理并存储于数据表,在用的时候直接查询取值。

最终,工作票类型为厂站第一种工作票、作业类型为开关投产前试验的工作任务,对应的安全措施生成。

3 结论

为解决传统工作票在流转各环节时高质量决策依据不足的弊端,提出了基于历史票联想的电网工作票智能填写方法。主要结论如下:

(1)采用TF-IDF方法挖掘历史工作票数据,可有效获得历史票信息的关键词,使工作票的填写变得有规律可寻。

(2)将历史票关键词联想与厂站拓扑设备的内在关联相结合,可以辅助判断各类作业风险的相对大小,为作业人员配置和选取监督地点提供支撑依据。

(3)对比传统工作票填票方式,智能填票方法可有效促进电网工作票填写的全面性和精确性,降低电力系统工作的出错率。

猜你喜欢
知识库校验安全措施
10kV配电线路维护工程的安全措施分析
使用Excel朗读功能校验工作表中的数据
汉语近义词辨析知识库构建研究
农村电网电力工程的技术问题分析与施工安全措施
电能表在线不停电校验技术
精通文件校验的“门道”
玩轮滑
基于FPGA的CRC32校验查找表算法的设计
我国联合虚拟参考咨询系统知识库现状研究*
——基于与QuestionPoint的对比
两幅照片背后的故事