王宏刚,王一蓉,赵晓龙
(国家电网有限公司大数据中心,北京 100000)
据统计调查数据显示,我国能源的总体利用率在32%左右。为实现节能减排,我国加大了能源设施建设,更加关注能效评价指标和用能效率[1]。用户侧分布式能源结构是我国能源体系的重要组成部分。用户能源包括电负荷、热负荷、冷负荷、燃气和燃油负荷。用户能源结构和用能角色发生了很大的变化。因此,如何降低用能费用、提高用户用能的合理性是当前研究的关键[2-3]。
在当前用户用能信息管理研究中,文献[4]方法设计了家庭用能信息管理系统,采集用户用电设备的电能数据,并加入了优化调度算法,基于实际用电情况规划合适的用电方案,帮助用户节能并提高用能效率。文献[5]系统使用了可编程逻辑控制器,集成了交流电源插座、控制模块和数据处理平台,在监测用户的用能信息的同时,对用户电力设备进行控制。文献[6]系统通过采集不同设备相应的各类能源数据和参数,自动生成事件记录报告并发送到系统主站,并根据当前用户侧能源需求进行优化配置。新的用户用能管理业务不断涌现,对系统用能信息的交互提出更高的要求。由于用户侧的用电设备存在多种型号和种类,与系统之间交互存在障碍,用能信息难以互通互联。
基于上述技术的不足,本文设计了1种用户综合用能信息管理与异常识别系统。该系统通过构建1套整体系统架构,进而实现采集时间间隔、采集精度和数据大小等关键参数的设置与计算;通过构建电能异常识别报警模块,监测用户的用能数据异常情况;通过改进型Apriori算法模型,实现用户能耗模式关联和数据分析。
本文设计的用户综合用能信息管理与异常识别系统的总体目标是对用户的电负荷、热负荷、燃气负荷等多种能源的使用情况进行监测。该系统将采集到的综合用能信息存储到执行的数据库中进行用能分析,以及时发现没有合理利用能源或能源有效利用率不高的情况,分析用户用能特性,识别用能异常情况,提醒运维人员对异常情况进行处理[7]。该系统的创新点如下。
①系统能够设定采集终端的采集时间间隔、采集精度和数据大小等关键参数,为用户建立综合用能信息档案,并可随时生成采集任务,以实时掌握用户用能数据。
②系统中的模块监测到用户某项用能数据超过系统设定的阈值或出现其他异常情况时,能够及时识别,并能实现异常数据信息的即时报警。
③通过数据挖掘技术,如改进型Apriori算法模型,可实现用户的能耗模式关联分析,并将不同运行模式数据挖掘出有价值的数据信息,从而提高异常数据诊断能力。
本文设计的用户综合用能信息管理与异常识别系统在整体架构上包括采集层、数据层和网络层。
采集层能够通过接收系统实现采集任务的发送,进而输出用户综合用能信息。该层能够通过热力参数的采集使用热量表实现实时流量、累计流量、供回水温度等数据的采集。其中:燃气表中的燃气参数包括实时流量、使用燃气量和燃气表状态量等;智能水表能够获取用户用水量、水流量、温度等用水数据[8]。采集层执行网络层发送的采集任务,并根据系统设定参数定时或实时采集综合用能数据。集中器将多种能源采集设备获取的数据汇集起来,共同发送到数据层中存储[9]。
数据层主要提供用能信息管理、系统日志管理、资源管理、源数据管理、数据交换等服务,支持关系数据库管理系统(relational database management system,RDBMS)、HBase、MongoDB、Phoenix等主流数据库的读写,使用DataX工具读取数据交换配置Json文件,完成数据任务[10]。
网络层负责与系统用户进行交互,提供用能信息管理服务界面,下发综合用能信息采集任务,对用能行为异常进行识别和报警。网络层从多个维度对用能信息进行分析,在采集到的用户用能数据出现异常时,将触发系统的报警模块。
用户综合用能信息管理与异常识别系统整体架构如图1所示。
图1 系统整体架构示意图
通过确定各类用能情况和各单元用能数据后,系统用户可直观地观察到综合的用能情况。系统能够根据不同维度和不同能源类型进行统计和展示[11]。系统提供异常行为识别和报警功能,使用数据挖掘技术对异常用能数据进行识别和诊断,分析多种能耗设备运行参数和用能情况,实现用能行为异常的识别,找出用户用能过高的原因[12]。在系统的报警侧输入设定好的阈值,当被监测的某项能源使用情况超出阈值,系统自动触发报警模块完成报警。
用能异常识别报警时,报警模块通常通过硬件结构设置系统的阈值,将输出数据信息与设定阈值进行对比。当两者数据信息匹配时,则出现正常运行信息。当两者数据信息匹配时,则在模块的显示界面和系统客户端界面上显示报警信息,提醒运维人员或用户及时采取相关的保护措施。在异常数据信息监测时,还可以监测反映用户综合用能信息的多种数据信息,如管道压力、水流量、环境温度、用电功率等。这些数据信息能够被全方位地实时监测。异常识别数据信息模块还包含了压力传感器、温度传感器、流量传感器、信号采集模块、控制器、显示模块和报警器等。这些数据传感过程由STM32F103VET6处理器控制,能够实现对采集到的用户用能数据进行处理和分析,将实时用能数据显示在液晶显示模块和上位机中[13]。
用能异常识别报警模块整体结构如图2所示。
图2 用能异常识别报警模块整体结构
模块设计中使用PCM300H压力传感器,对用能场景中燃气管道、燃油管道和水管道的压力进行监测。该压力传感器测量量程可达到0~1.6 MPa,输出的电流信号范围为4~20 mA,监测精度为0.2%FS[14]。温度传感器中使用的热电阻主要有Pt10、Pt100、Cu50、Cu100。电阻值与温度的对应关系为:
Rt=R0(1+At+Bt2)
(1)
式中:Rt为报警模块电路中热电阻的电阻值;R0为报警模块电路在0 ℃时的电阻值;t为报警模块电路工作时的温度;A、B均为报警模块电路在工作过程中的热电阻温度系数[15]。
用能信息经过主控芯片分析处理后,识别到异常用能数据时,报警模块电路中的报警模块自动开启。报警响应采用蜂鸣器和发光二极管(light emitting diode,LED)灯两种方式。
报警模块电路如图3所示。
图3 报警模块电路
报警模块电路中的报警模块采用液晶显示器(liquid crystal distplay,LCD),以有效显示异常输出数据信息。报警电路内部还包含ILI9341液晶控制芯片,并自带GRAM显存。主控模块使用8080接口与液晶显示模块通信。RDX引脚用于读取数据信号和命令信号。CSX引脚用于接收片选信号[16]。LED报警灯分别与主控芯片的3个GPIO引脚相连接。报警灯的亮灭与对应GPIO引脚的电平有关。发出报警时蜂鸣器响起,则LED报警灯亮,并在显示模块和上位机显示报警消息。
用户异常用能行为诊断模型采用Apriori算法对用户的能耗模式进行关联分析,挖掘不同运行模式数据汇总隐藏的有价值的数据,为用能异常行为诊断提供数据支持[17]。该模型通过综合用能信息与规则库的一致性判断用能行为是否处于异常状态。
异常用能行为诊断流程如图4所示。
图4 异常用能行为诊断流程
假设诊断模型中用户综合用能属性数据集合为I={i1,i2,…,ix},数据所有属性的事务集合为T={t1,t2,…,tm}。其中:SA、SB分别为用能数据属性项[18]、关联规则为SA⟹SB。则计算支持度和置信度可表示为:
(2)
式中:SA在关联规则中为规则前项;SB为规则后项;S为支持度;C为置信度;N为全部数据数量;P为关联规则出现的概率。
同时满足最小S和C的关联规则为强关联规则,使用lift(SA⟹SB)衡量是否为有效强关联规则。首先找出所有频繁项目集,然后生成关联规则并进行筛选。如果lift(SA⟹SB)>1则表示其为有效强关联规则。
本研究诊断模型对Apriori算法进行了优化,对改进的项目集都采用2个线性表存储方式,以存储事务列表和事务列表对应项[19]。在k维项目集X={i1,i2,…,ik}中,存在1个j∈X,如果满足式(3)条件,则表示X不是频繁项目集。
|Lk-1(j)| (3) 式中:Lk-1(j)为频繁项目集汇总包含项目j的数量;k-1为项目集维度。 在每次自连接时对Lk-1的所有项目进行计算,移除Lk-1中包含的频繁项目集,得到L′k-1后保证L′k-1中所有项目数不小于k-1,用L′k-1生成候选项目集,减少生成项目集的数量。经过Apriori算法挖掘规则后,对得到的异常用能规则进行解读,建立异常规则库。如果当前采集到的综合用能数据与诊断规则库一致,则可以判断出现异常用能行为。 本研究应用试验对系统进行测试,并对测试用能信息进行分析,验证系统异常用能行为识别的有效性。本测试使用应用服务器、数据库服务器、接口服务器和试验计算机搭建试验环境;使用Nmon工具监控系统资源使用情况;使用HttpWatch分析系统资源;使用Quality Center工具对测试过程进行管理。 试验环境如图5所示。 图5 试验环境示意图 为了保证试验环境符合用户实际的应用场景,试验环境的配置参数与用户系统参数需保持一致。 本次试验环境下的试验数据集如表1所示。 表1 试验数据集 在表1中,设备采用应用服务器,其内存为16 GB,数据库服务器的硬盘为300 GB,型号为Power Edge M910,CPU为Intel(R) Xeon(R) CPUX5650@2.67 GHz,数据库为Oracle 11.2.0.3.0 64 bit,并发连接设置为Processes 1500,中间件布署为Xmx 1024 MB。试验环境中,数据库服务器主要保存系统采集到的用户综合用能数据,包括用户用能区域表、实时监测统计表、设备能耗信息表、用能区域监测点表等数据。本研究从数据库中选取多种类型的用能信息作为试验数据集,为应用测试提供数据。 对系统的用能信息采集功能进行测试时,本研究选择采集用户的用水流量数据,环境温度设定为20~25 ℃,用水管道压力在715~720 kPa范围内。试验时间设定为10 min。本研究在试验过程中突然增加用水流量,使用文献[3]系统和文献[4]系统进行采集作为本文系统的对比试验,得到用户的用水流量数据如图6所示。 图6 用水流量数据 由系统采集到的用户用水流量数据可知,试验在7~8 min时间段内出现用水异常现象。此时,用水流量突然增加到30 L/min以上,用水异常现象持续时间为1~2 min。文献[3]系统采集到的最大用水流量数据为33.8 L/min。文献[4]系统采集到的异常用水流量数据为32.1 L/min。在试验初期(0~7 min内),用水流量稳定在23 L/min左右。试验时间超过9 min后,用水流量开始下降,最终降低到25 L/min以下。试验过程中,文献[3]系统检测到的用水流量异常情况仍存在较长的反应时间;文献[4]系统采集到的异常用水流量数据低于实际数据,最大异常用水流量相差2.1 L/min,采集结果存在较大的误差。 本文系统采集到的用水流量数据精度最高,可全方位实时监测用水流量变换情况。出现用水异常情况时,系统的响应速度更快,实时性更强,采集到异常用水流量最大值为34.2 L/min。系统在8 min 10 s时报警模块自动开启并发出报警信号,在蜂鸣器响起的同时LED灯点亮,对异常行为反应更加迅速。试验过程中,系统运行稳定,总体工作情况较好,能够观察到较小的用水流量波动情况,提高了用户用能的安全性。 从试验数据集中抽取设备能耗数据,将能耗数据进行预处理后划分为4种用能模式,并在试验数据中加入300条异常能耗信息,共有25个属性。将试验数据划分为5组,使用异常用能诊断模型对试验数据进行诊断。试验时间设定为5 min。3种系统得到的系统诊断结果如图7所示。 图7 系统诊断结果 由系统诊断结果可知,第三组数据中的异常能耗信息数量最多,文献[3]系统识别的异常能耗信息数最多为55条,对第一组数据中的异常能耗信息的识别结果最少为21条。文献[4]系统最多识别出43条异常能耗信息,识别到第二组能耗数据的异常信息数最少为23条。本文诊断模型通过对试验数据集中的设备能耗数据进行数据挖掘,产生多个候选项目集,将异常能耗数据与模型中的异常规则进行解析,识别出的异常能耗数据的数量最多。其中,第三组的异常能耗数据高达68条,识别出第二组数据中的异常信息数量较少为30条。系统通过对异常规则进行分析,可得出用户电力设备的异常用能行为,有助于提高用户的能耗利用率。 本文设计了用户综合用能信息管理与异常识别系统,对用户综合用能数据进行实时的动态掌握,对用户的用能进行有效的追踪,智能化、数字化管理用户用能信息,并识别异常用能行为,对于突发的异常用能现象进行报警。该系统设计了用能异常识别报警模块,可连接多个传感器模块采集用户综合用能信息并进行实时监测。主控芯片检测到异常用能数据或超过设定阈值后,由报警模块自动开启发出报警信号,并在液晶显示模块和上位机上显示报警信息。使用改进后的Apriori算法构建异常用能行为诊断模型,并优化了数据库的映射方式,可减少计算支持度的事务集。将综合用能信息离散化后进行诊断,可基于数据层数据识别存在的异常用能行为。 随着系统监测的用户数量和用能设备的增加,系统产生的数据量急剧增加,在以后研究中需要应用大数据技术提高系统的数据处理、分析和存储能力。3 应用测试
4 结论