“AI虚拟调度指挥”在配网生产指挥中心的研究与实现

2021-08-18 14:04
电气技术与经济 2021年4期
关键词:引擎语音调度

石 磊

(上海宏力达信息技术股份有限公司)

0 引言

随着社会的发展,人们对电力需求不断增加,配电网规模也随之变大,电力用户数量不断增长[1]。配网生产指挥中心作为配网业务枢纽,一方面接入的信息化系统众多,信息数据日益增加而利用效率不断降低[2];另一方面因配网生产指挥面广,存在大量简单重复串行的机械流程,不仅指挥效率低,易造成配网生产指挥业务“枢纽拥堵”效应[3]。因此配网生产指挥业务迫切需要流程再造,利用人工智能技术提升效率[4]。

在此领域,部分学者已经率先开展了研究工作。文献[5]提出电网调控操作智能助手的方案,通过态势感知电网异常和事故点,为操作人员提供智能辅助决策。文献[6]研究了基于DNN-HMM神经网络的原理和特点,通过声学模型训练和语料制作,应用于D5000厂区提高工作效率。文献[7]基于电网调控业务现状和痛点,提出“虚拟调度员”概念,但仅对相关技术进行研究,缺少实际案例的设计和验证过程。

本文提出通过机器学习配网线路调度规程、专家经验、电网业务数据后,利用语音识别、语义理解、多轮人机对话等技术,实现“虚拟调度指挥员”。并将研究成果应用于国网某省级公司配网分支线计划检修和配网主干线计划检修的生产环境中。

1 现状分析

配网生产指挥中心主要工作分布于配网主干线和配网分支线。配网主干线调度工作过程包括调度员根据计划检修开具主干线操作票,依照工作步骤通过与现场人员电话交互完成配网主干线的调度指挥工作。配网分支线调度涉及的过程相对简单,但调度员还需面对业务规则更加复杂,智能化、安全化水平要求更高的调度指挥业务,因此需研究引入更加稳定、安全、可靠的AI智能引擎,彻底实现配网调度的智能化指挥。

配网生产指挥中心作为配网业务枢纽涉及到调度自动化、配电自动化、PMS、OMS、配网管控平台、现场电话等诸多信息。每日处理的故障、异常信息达到千条以上,并在日益增加中。以人口超过1000万的某超大型城市为例,配网生产指挥中心一年至少处理500余起故障,以及上千万条缺陷信息,指挥人员每天需要查看至少3000条以上自动声光报警信息,其中有大量、单一的重复性工作。

2 AI引擎关键技术

本文通过利用语音识别、NLP自然语言处理、多轮人机对话等技术构建一套能够自主理解配网调度规程、专家经验、电网业务数据的配网智慧生产指挥AI引擎。

2.1 语音识别技术

在电力配网领域,目前还没有直接可用的语音模型,所以需要针对具体的电力业务进行专门模型训练。语音识别模型训练优化功能包括声学模型训练和语言模型训练两个组成部分[6]。

(1)声学模型训练

声学模型训练需通过大量的音频数据帮助引擎训练模型。由于电力配网工作环境的特殊性,需要在现场噪音下对基本音素识别,语音数据为PCM格式,采样率8k,对每一个音频文件进行人工标注,标注出音频中的文字内容,以及文字的对应时间信息。

(2)语言模型训练

电网调度指挥语音识别语言模型采用BERT模型,调度语句的每个输入切分单元共包含4个类别的特征,即语义特征、位置特征、关键字特征和命名实体特征,如图1所示。通过此方法,可提升模型对调度指挥生产过程中语言的适应性[8]。

图1 语言模型结构

语言训练模型需要提供大量的调配工作中的文档文件,如日常工作记录、对话记录、专业术语,并将所有文档整理成指定格式,通过引擎的训练接口上传并训练,优化已有的语言模型[9]。

2.2 NLP类算法

电力行业有其专业性,不能完全复用通用的NLP,需要针对电力行业特性进行技术校准和调整,让AI可以真正理解现场人员的电力特性的用语表达。

NLP类算法主要包括分词(含词性标注)、实体识别和语义相似度模型[10-11],来自语音识别转为文字后的文本,经过分词算法和实体识别算法的处理后,将文本中的“班组、姓名、设备名称、工作内容、收发令时间”等关键信息抽取出,与操作票中对应的“班组、姓名、设备名称、工作内容、收发令时间”进行相似度比对,在达到一定阈值的情况下,则给出“是/否”匹配的信号到对话引擎,由其通过预置好的对话模板给出回应文字,并由语音合成后通过电话语音告知对方。语义理解数据打标实现过程详见图2。

图2 数据打标实现过程

2.3 多轮人机对话

虚拟调度指挥人机对话模式属于人机对话技术发展的第三阶段,是从第一代语音助手,第二代机器人聊天模式,逐步发展到当前的人机场景化任务执行模式。AI配网生产指挥体系能充分理解含有“指代、省略”等复杂语境与现场工作人员的意图,并对不理解的信息主动发问。

人机多轮对话引擎主要是实现流程的控制,即现场配网人员与机器人沟通的流程控制,是整个机器人的大脑,可以理解用户的通话内容,给出正确的应答。多轮人机对话引擎之间的模块交互设计如图3所示。

图3 模块交互图

多轮人机业务对话技术替代人工进行电话指挥,实现多线程、多任务的并行处理工作,打破业务高峰期人工接派单迟缓、许可等待“枢纽堵塞”的问题。

3 应用实践

本系统已在国网某省级公司开展试点,应用于配网分支线计划检修和配网主干线计划检修的生产环境中。

3.1 总体技术架构设计

AI智能引擎功能模块部署在配电自动化主站中,作为整个配电自动化主站中的一项子模块,与配电自动化主站、电话交换系统、调控云系统实现业务数据集成交互。通过语音识别、语义意图理解、机器学习专家库等技术构建调度及抢修业务智能虚拟指挥。配网生产指挥总体技术架构如图4所示。

图4 总体技术架构图

3.2 语音识别功能设计

配网调度对话过程,由于施工现场的环境吵杂音、电力专属名词、维修工人的行业对话习惯、现场语速和方言夹杂等问题。同时电力业务不同于传统客户服务咨询,要求的准确率非常高,不能出现识别错误,否则带来操作风险。

(1)数据采集与处理

为了提高语音识别准确度,首先需要采集大量电网调配人员在真实工作环境下的语音数据,并对每一个音频文件进行人工标注,标注出音频中的文字内容,以及文字的对应时间信息。音频数据转写主要由人工完成,包括对音频数据校对、标注属性和转写内容、质检、音频任务管理等多个重要流程,详见图5。

图5 语音标注流程图

(2)模型训练与部署

在通用语音模型基础上,结合生产调度领域相关数据进行训练,为虚拟调度提供“听觉”能力[12]。将工作人员的通话语音信息实时转换成文字记录,大幅减少工作人员的人工通话内容记录工作,以提高工作效率[13]。AI虚拟调度指挥系统语音识别模型训练技术过程如图6所示。

图6 模型训练技术过程

具体的工作包含以下三个部分。

(1)电话系统区

电话系统区主要处理两项工作,一是通过电话录音系统将人工调度录音传到服务器中,在将录音数据拷贝给AI训练工程师进行训练;二是AI引擎将合成的语音流传回到电话系统,满足现场人员与“虚拟调度员”通话条件。

(2)语音识别模型训练区

在训练区中需要处理和收集两类数据,一类是电力专业领域语料数据,包含人名、地名、线路名和过去的调度操作票等文本数据;第二类是通过电话系统拷贝的语音数据,通过AI训练师利用工具进行标注并审核,得到训练语言模型的训练数据。

(3)模型部署运行&后处理区

模型训练后,语音合成模型部署到生产区,并提供调用API的服务。当虚拟调度员跟现场进行通话时,实时语音流通过调度电话软交换系统,以SIP协议的方式传输到AI引擎,AI引擎将语音流数据调用语音识别API,获取识别文本。识别文本传输给AI引擎,AI引擎反馈调度对话文本,调用语音合成模型,得到语音流文件,最后传输给调度电话软交换系统。

通过以上三个作业步骤,完成了语音从训练到生产使用的完整过程,实现智能化的计划检修调度语音人机交互。

3.3 应用效果

在试点项目中,AI引擎技术进行专门的电力操作票识别和语音训练,电力操作票识别学习不少于1000张,调度指令不少于40000条。系统可对不理解的信息主动发问,正确下达指挥命令。

系统运行后,在故障抢修生产方面,可避免误报事故、提升抢修效率、降低故障报修量等。项目价值见下表。

表 项目价值体现

在配电网运行方面,“虚拟调度指挥员”可以并行许可同时开展的现场作业,缓解配网调度“枢纽堵塞”问题,缩短停电时间,可多向用户供电:

式中,N为停电项目数;T为停电时间,min;Q为停电项目应供电量。由式(1)可知,减少停电项目越多,挽回经济损失越多。

以某一个中大型城市为例,平均每天约有150个停电作业项目,以每个项目缩短停电时间10min计算,平均每天可多供电43250kWh,每年多供电约1578万kWh,挽回因停电造成的经济损失在千万元以上。

4 结束语

本设计研究成果应用于国网某省级公司配网分支线计划检修和配网主干线计划检修的生产环境中,其中配调业务一半以上人工由配电AI负责完成。通过对配调业务流程优化调整,将生产指挥虚拟坐席角色扩展到配网生产指挥全部专业,预计1~2年时间可代替绝大部分的人力流程性工作,释放的人力可以进行更多有价值的高级业务工作,提升配网调度工作能效。

猜你喜欢
引擎语音调度
《调度集中系统(CTC)/列车调度指挥系统(TDCS)维护手册》正式出版
基于强化学习的时间触发通信调度方法
一种基于负载均衡的Kubernetes调度改进算法
魔力语音
基于MATLAB的语音信号处理
虚拟机实时迁移调度算法
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
蓝谷: “涉蓝”新引擎
无形的引擎