基于机器学习的建筑复杂用能系统运行状态异常检测

2022-10-13 08:46周璇王馨瑶闫军威雷尚鹏梁列全
关键词:信息熵聚类工况

周璇 王馨瑶 闫军威 雷尚鹏 梁列全

基于机器学习的建筑复杂用能系统运行状态异常检测

周璇1王馨瑶1闫军威1雷尚鹏1梁列全2

(1. 华南理工大学 机械与汽车工程学院,广东 广州 510640;2. 广东财经大学 信息学院,广东 广州 510320)

建筑复杂用能系统运行状态的异常检测研究对建筑安全稳定、高效节能运行具有重要意义,但是由于受到建筑外部环境因素繁多、内部人行为的不确定性、设备运行数据复杂等多方面因素的影响,其异常运行状态的检测存在信息特征提取困难、运行异常状态难以界定等问题。本研究在运行参数分类的基础上,利用信息熵对不确定性的定量化描述与无监督学习的适应性,提出基于信息熵并融合-均值聚类与自组织映射模型的复杂用能系统运行状态二次聚类异常检测方法。针对夏热冬暖地区某大型办公建筑中央空调系统的实际监测数据,通过-均值聚类对外部参数进行初次聚类并划分一次工况、计算各工况下子系统运行参数的信息熵、自组织映射模型二次聚类判定异常运行状态等步骤,实现建筑复杂用能系统的运行状态异常检测。结果表明,本研究提出的方法在单主机运行工况下的平均类内异常检测正确率(简称类内异常检测率)为97.45%,双主机运行工况下的类内异常检测率为96.70%。此外,本研究针对不同工况中类数量与类内异常率相关指标之间的关系展开进一步的讨论与分析,得出结论:单、双主机的类内异常检测率随着其所在类内运行状态总数的减少而升高。本研究为建筑能源大数据背景下的复杂用能系统运行状态异常检测提供了新的系统化思路与方法。

复杂用能系统;信息熵;-均值聚类;自组织映射模型;异常检测

建筑节能减排是我国实现“30.60”“碳达峰”与“碳中和”目标的重要途径。建筑能耗占我国当前总能耗的40%[1],建筑运行过程中,不当的控制策略或不合理的用能行为可能导致16%的住宅建筑能源浪费[2]、15%~30%的办公建筑能源浪费[3]。有效检测建筑复杂用能系统的异常运行状态是实现建筑安全、高效、节能运行的关键。

建筑复杂用能系统是指满足建筑正常运行、维护等需求所使用的电气、通风、空调等多台设备联锁工作构成的复杂系统,其运行状态受到室外环境参数、室内人员数量、室内人员用能习惯等多方面因素影响,需要多个相互耦合、相互约束的运行参数进行表征[4]。此类复杂系统主要以消耗电力能耗为主,且涉及多个设备的运行参数,参数的度量单位、采集周期可能各不相同,造成参数的量化尺度存在多样性。并且,此类复杂设备能耗受人行为的随机性影响较大,其异常状态多数情况下仅表现为能耗或部分运行参数与正常值的偏离,难以对异常运行状态进行量化。现有复杂用能系统异常运行状态的检测大多依赖运维人员的经验,机器学习理论的提出与建筑能源管理系统的建设大大推动了建筑复杂用能系统异常运行状态检测技术的快速发展。

建筑能源管理系统指通过各种传感器采集建筑运行的分类分项能耗、设备运行参数和环境参数等大量数据,实现建筑能源可视化、运行状态在线监测与分析等功能的系统,为建筑管理者提供了建筑节能监管的有效平台[5]。截至2017年,我国有33个省市已建成大型公共建筑的能耗实时监测系统[6],为开展复杂用能系统运行状态异常检测工作提供了有效的数据支撑。

本研究述及的建筑复杂用能系统的运行状态采用多个参数表征,其异常运行状态定义为:在满足建筑正常使用需求的前提下,表征系统运行状态的能耗及其各参数与历史数据存在明显差异的状态。

20世纪,经验规则方法、模拟建模方法在建筑运行状态异常检测领域占据主导地位[7]。经验规则方法[8-9]大多是根据专家经验设定异常检测的阈值或历史数据提取异常特征。该方法建立在先验知识的基础上,需要人为介入,具有较高的异常识别率,但识别、诊断、处理的效率较低,系统难以及时反馈。模拟建模方法则通过软件模拟建筑内复杂用能系统运行状态,利用模拟结果进行定性或定量的异常检测,其优点在于剖析全面、异常因果清晰,但建模过程复杂,耗时长,局限性较大[10-11]。随着数据量的增加,机器学习方法逐渐应用于建筑复杂用能设备运行状态异常检测,并在近十年内发展迅猛。该方法针对异常检测的目标进行问题规划,在大量数据的基础上,提取时间或空间维度的模式特征,进而区分正常模式与异常模式[12]。

1 建筑复杂用能设备运行状态异常检测方法

表1所示文献大多将建筑复杂用能系统运行状态的异常检测流程分为3步:第1步是数据降维特征选择,高维数据经降维处理后选择或合成有效变量,提取数据的有效特征;第2步是模式划分与基准建立,选择正常运行数据的有效变量表征方法,将模式进行划分,并建立相应的异常检测基准;第3步是异常状态检测,选择合适的分类器对运行数据进行异常标记,实现异常状态检测。建筑复杂用能系统运行状态异常检测的现有研究以知识发现为主,旨在为设备安全、节能运行与控制提供保障,仍处于初期探索阶段。

表1 多变量建筑复杂用能系统的异常检测相关文献比较

针对复杂用能系统运行数据存在数据维度差别较大、异常状态难以界定、异常状态等级难以划分、特征提取困难等问题,本研究拟在建筑能源管理系统(BEMS)采集数据的基础上,提取复杂系统监测参数的信息熵特征,采用-均值聚类算法划分复杂运行工况,建立各工况下系统运行状态信息熵向量的二次聚类自组织映射模型,最终通过夏热冬暖地区某建筑中央空调系统的运行数据验证方法的准确性。

本研究提出的建筑复杂用能系统运行状态异常检测方法流程如图1所示,主要流程分为3个步骤:

图1 BEMS异常检测流程

1)数据降维与特征选择

为解决运行参数种类多、关联复杂的问题,将监测参数细分为4类参数,包括环境参数、设备参数、运行参数和其他参数,并采用Z-SCORE方法对数据标准化,以解决不同数据量纲差异的问题。

2)模式划分与基准建立

考虑建筑复杂用能系统运行状态受外界环境条件和室内人行为影响,模式划分以环境参数和设备参数为基础,结合Silhouette指标和-均值聚类算法对设备运行工况进行分类。

3)异常状态检测

异常状态的检测本质上是规律提取的过程,自组织映射算法通过对输入样本与目标值之间的相近神经元进行调整,达到利用信息关联性自适应调整网络的目标。本研究通过信息熵与自组织映射模型的结合,实现异常类别的分离与检测,并对结果进行分析与讨论。

2 信息熵与聚类算法原理

2.1 信息熵

BEMS采集的复杂用能系统运行数据大多为高维数据,存在特征参数之间具有强相关性、数据集可能存在的属性冗余等问题,易造成建模过程复杂,拟讨论在保留原始特征参数信息基础上的高维问题的低维表征方法。常用的方法有信息熵、相关性分析、序列分解等。

信息熵作为一种对系统复杂程度和无序性进行度量的指标,具有量化不确定信息的特性,在异常状态特征提取、异常检测领域[23]、故障程度判别[24]等领域,取得了较好的识别和诊断效果。本研究利用信息熵提取复杂用能系统多维监测参数特征。信息熵值的大小与系统信息的不确定程度呈正相关性[23],熵值越大,系统混乱程度越高,熵值越小,系统稳定程度越高。

2.2 K-均值聚类算法

考虑到复杂设备运行状态受建筑外部参数与内部参数影响,不同运行工况下的差异较大,为提高异常检测精度,拟对系统运行工况进行划分,以降低同一工况状态之间的差异性。机器学习算法中常用于工况划分的方法包括-均值聚类、决策树等。

-均值聚类算法通过度量数据集中的距离差异性,实现类间分离,具有响应速度快、可靠性高的优点[25],多用于异常检测[26]、故障诊断[27]等工作的前期数据处理与工况划分。本研究采用-均值聚类算法对复杂用能系统工况影响较大的外部参数进行初步聚类,得到不同气象参数及人行为影响下的不同工况,再结合设备运行参数实现工况的二次划分。

3)比较样本与类中心的距离,并将该样本分至最小距离类别,重复计算所有样本点;

5)若类中心所处的位置再次改变且未达到计算阈值,则重复进行步骤2)-4)。

2.3 自组织映射算法

建筑复杂用能系统的运行状态受外界噪声干扰与不确定人行为的影响,其异常状态检测的准确性依赖于模型对数据抽象特征的提取能力。由于复杂设备运行参数繁多,且异常运行状态并无统一定义,现有研究大多采用神经网络、支持向量机等模型实现异常状态的分类检测。

自组织映射(SOM)算法可以实现无规律的数据处理与聚类,具有分类能力强、分类泛化性能好、过程可视化等特点,在电力设备数据挖掘[28]、异常检测[29]等领域已得到广泛应用。本研究拟采用SOM模型对不同工况的信息熵特征进行二次聚类,以区分异常运行状态。SOM算法训练过程中获胜神经元及其临近范围的其他神经元均将进行权值调整[30],确保算法的学习效果,结构见图2。

图2 自组织映射算法原理结构

3 实例分析

3.1 研究对象

本研究以某夏热冬暖地区办公建筑的中央空调系统为对象,验证所提出方法的有效性。设备配置信息见表2。

表2 设备配置信息

该建筑面积为87 000 ㎡,2015年建成了建筑能耗监管与空调节能控制系统,可采集建筑分类分项能耗数据与空调系统运行数据。本研究利用系统采集的2017年1月1日至2018年12月31日的数据集验证复杂设备运行状态异常检测方法的有效性,数据集共105 535条数据,采集周期为150 s。

3.2 数据分类与标准化

3.2.1监测参数分类

监测参数种类繁杂,且参数之间相互耦合,参数大小存在较大差异。根据国家标准[31]与相关文献[32],将建筑复杂用能系统运行状态监测数据分为外部参数和内部参数两大类,其中外部参数指系统外界环境参数、室内人数,以及人行为等参数;内部参数指系统内部参数,如设备数量、设备运行状态等。进一步细分为环境参数、其他参数、设备参数、运行参数4类,监测参数耦合关系如图3所示。

图3 复杂用能系统运行状态监测参数耦合关系

本研究的对象为中央空调系统,系统监测参数如表3所示,参数说明如下:

1)环境参数,主要包括温度、相对湿度、光照强度等外界环境参数,其中,干球温度和相对湿度直接影响室内环境热舒适性和中央空调系统的能耗与运行状态。因此,本研究采用室外干球温度和相对湿度作为外部环境参数;

2)设备参数,主要指设备型号与设备数量等设备配置,如中央空调系统制冷主机设备数量等。该参数决定设备之间的匹配程度,对系统运行能耗和能效影响较大。本研究采用的设备参数包括4类设备类别,24台设备,设备明细见表3;

表3 动态监测参数分类及数量

3)运行参数,主要指反映设备运行状态的运行参数,其中制冷主机运行参数包括冷冻水供回水温度、冷却水进出口温度等共15项参数,冷冻水泵、冷却水泵、冷却塔风机运行参数包括频率、实时功率两项参数,这些参数直接反映了设备的运行状态以及能耗特征;

4)其他参数,主要指影响建筑运行能耗的人行为相关参数,如室内人数、室内人员行为等参数,该参数直接影响复杂用能系统能耗,但存在较大的波动性与不确定性,难以直接获取。冷冻水供回水压差传感器安装于总管处,受管网沿程阻力、末端开启程度影响。本研究参照文献[33]通过总管冷冻水供回水压差间接表征人行为因素对建筑运行的影响。

3.2.2数据标准化

上述监测参数存在量纲与数量级的差异,需要采用适当的标准化方法将原始数据映射到相同标准下进行建模处理,常用数据标准化方法有Z-SCORE方法,如式(2)所示:

3.3 基于K-均值聚类的运行工况划分

3.3.1基于Silhouette的聚类簇确定

建筑复杂用能系统运行状态受外部因素影响较大,首先采用-均值聚类方法对外部参数进行聚类,划分出不同气象条件及人行为因素影响下的设备运行工况。-均值聚类算法的难点在于确定聚类簇数,本研究采用Silhouette指标确定聚类簇数,指标数值越大,表明聚类效果越好,即簇内相关性和簇间差异性显著,该指标计算公式为

如图5所示,通过外部参数聚类的方法得到的Ⅰ-Ⅴ类设备运行工况划分,由于外部参数直接受到环境以及人行为的影响,因此聚类出来的不同工况反映了不同外部条件下主机的负荷状态。第Ⅳ类设备运行工况内部联系最为紧密,取值范围最为集中,处于均值附近区间,符合建筑所处的夏热冬暖气候区空调季温高湿重的特点。第Ⅴ类设备运行工况中,温度、湿度、压差三者的变化呈现出离散程度高、幅度范围较大的数据特性,明显区分于第Ⅰ类至第Ⅳ类数据,因此确定第Ⅴ类设备运行工况属于外部环境参数变化异常的运行工况,需要运维人员特别关注。

图4 聚类范围内的Silhouette指标值变化

图5 外部参数聚类结果

3.3.2设备运行工况划分结果分析

设备运行工况与外部参数密切相关,而中央空调系统在实际运行中,存在着制冷主机运行数量的多重匹配问题。本节结合制冷主机运行数量的不同,将设备运行工况进一步划分为单主机运行与多主机运行,最终得到10类系统运行工况,结果见图6。

图6 建筑中不同主机运行数量下的设备运行工况数据分布

本文研究对象的冷源系统主机采用“三用一备”形式,现有运行情况表明常见运行工况为单主机和双主机运行工况。三主机运行工况仅发生在紧急会议等临时性需求需要迅速降低冷冻水出水温度时。三主机运行工况的数据记录为65条,仅占总体数量0.062%,4台冷水机组全部开启的运行工况未出现。考虑三主机运行工况发生概率极低,且数据量过少难以实现精准建模,本研究舍弃此类数据,剩余数据总量为105 470条。其中单主机运行数据68 398条,占比64.85%;双主机运行数据37 072条,占比35.15%。不同数量主机运行下的设备运行工况数据分布如图6所示。针对不同运行主机数量的各设备运行数据采用Z-SCORE方法处理,得到各工况下的无量纲数据,见表4。

表4 各工况下的数据分布

3.4 基于SOM算法的运行异常状态检测

3.4.1子系统信息熵计算与分析

中央空调系统由多个子系统构成,本节考虑实际将子系统分为4类,分别为制冷主机类、冷冻水泵类、冷却水泵类、冷却塔类。结合第2.1节信息熵计算过程,针对不同子系统、不同运行工况下分别进行信息熵特征计算,过程如下:

4)各子系统信息熵值计算与整合。设备参数共由4类设备构成,由于不同设备间参数数量、变化范围不同,通过每一类设备的运行参数进行信息熵值的求解,最终得到各子系统10种工况运行状态的表征向量。

表5 各工况下子系统运行参数的信息熵取值范围

根据第2.1节可知,制冷主机类信息熵值普遍高于其他类型子系统,符合制冷主机类设备采集参数繁多、状态向量构成复杂的特点。整体来看,各类子系统信息熵区间长度较原始数据更为集中,但仍存在取值范围交叉的现象,需要进一步利用SOM模型进行异常检测。

3.4.2基于SOM算法的异常运行状态分类

SOM模型用于提取各子系统中信息熵构成的数值矩阵中隐含的类别信息,将10种系统运行工况的运行状态表征向量分别构建SOM模型,并将其可视化以便于异常类区分,具体步骤如下:

图7(a)示出了不同工况下多数类神经元与少数类神经元的数量差距,蓝色空间占据越多,说明该情况的出现频率越高,反之,白色空间体现了少数类的异常情况。图7(b)展现了神经元之间的连接关系。无论单、双主机运行,各子系统工况下少数类神经元与多数类神经元之间连接颜色较深,表示模型在映射到二维平面的过程中,少数类神经元与多数类神经元的权向量差异较大,符合异常数据特性。图7显示单主机运行工况中,各系统工况的多数类与少数类间的数量差别较为明显,少数类易于辨识。但图8的多数类中出现了第Ⅱ类、第Ⅴ类少数类不唯一的现象,原因为以上两类工况下的数据量相对其他工况较少,存在样本量的局限性,可以通过结合神经元间权值相似度进行判定,如第Ⅱ类4号神经元与其他神经元权值差别较大,第Ⅴ类2号神经元权值差别较大,因此以上两类的少数类分别为4号和2号神经元。

图7 单主机SOM二次运行状态分类结果

图8 双主机SOM二次运行状态分类结果

3.5 结果验证与分析

SOM模型分类结果中的少数类判定为异常运行状态,通过将模型判定结果与BEMS报警记录、现场检修记录、实际运行数据进行人工逐一比对,检验异常检测结果的正确性,验证结果见表6。

表6 少数类异常检测结果

结合表6可得,SOM模型二次分类所得少数类单、双主机工况平均类内异常检测率为97.07%,单台机运行工况下平均类内异常检测率为97.45%,双台机运行工况下平均类内异常检测率为96.70%,均达到较高的类内异常检测率。单台主机与双台主机的第Ⅴ类工况类内异常检测率均达到100%,得出第Ⅴ类工况为异常运行工况的结论,证明异常数据在数据分布上与正常数据具有明显差异性,解释了该工况下数据量少、数据变化区间大的产生原因,验证了-均值聚类工况划分以优化类内异常检测率的必要性。

为深入探究异常检测率的影响因素,分析了单、双主机运行工况下的类内异常检测率与与类内运行状态向量总数、少数类占总数比例的关系,如图9、图10所示。

图9 单台主机运行工况少数类内异常检测率的变化

图10 双台主机运行工况少数类内异常检测率的变化

由图9(a)、10(a)可见,单、双主机少数类内异常检测率随着其所在类内运行状态向量总数的减少而升高。

由图9(b)可知,对于单主机运行工况,少数类内异常检测率随其数量在总量中所占的比例的降低而增加,这是由于少数类占总数比例低,异常特征提取效率提升,能够被准确地以最低的数量成本辨识。而对比双主机运行工况,由于双主机运行可完全满足建筑冷量需求,少数类内在总量中所占的比例较为稳定。其中,系统第Ⅴ类工况下运行状态向量总数量仅为 9 条,因此呈现出少数类占总数比例较大的现象。对于双主机运行工况,少数类内异常检测率随着少数类占比的增加而增加。

4 结论

本研究提出了一种基于信息熵和二次聚类的建筑复杂用能系统异常运行状态检测方法,并采用夏热冬暖地区某办公建筑中央空调系统数据进行方法验证,得出主要结论如下:

(1)经过-均值聚类算法划分运行工况后,采用信息熵与SOM模型进行异常特征提取,聚类的效果良好,各工况平均类内异常检测率达97.07%,部分运行工况下的类内异常检测率可达100%;

(2)制冷主机运行数量的不同导致类内异常检测率存在一定差异,单主机运行过程异常特征检测较为准确,各工况平均类内异常检测率为97.45%;

(3)不同系统工况下,类内异常检测率随其所在类运行状态向量的减少而逐渐增加,在系统工况的少数类内异常检测率较高,受外部参数影响较为明显。

本研究提出的基于二次聚类的复杂用能系统异常检测方法,尝试解决复杂用能系统异常运行状态检测过程中存在的设备运行状态耦合、特征提取困难、异常状态难以界定等问题。后续工作将在此基础上,尝试识别具体故障类型,并提出对应的措施,为建筑安全运行与节能减排提供有效解决方案。

[1] 中国建筑节能协会.中国建筑能耗研究报告2020[J].建筑节能(中英文),2021,49(2):1-6.

China Building Energy Conservation Association.China building energy consumption annual report 2020[J].Journal of BEE,2021,49(2):1-6.

[2] XU C,CHEN H. A hybrid data mining approach for anomaly detection and evaluation in residential buildings energy data[J].Energy and Buildings,2020,215:109864/1-13.

[3] KATIPAMULA S,BRAMBLEY M R. Review article:methods for fault detection,diagnostics,and prognostics for building systems—a review[J].HVAC&R Research,2005,11(1):3-25.

[4] 苗露. 基于监测数据的建筑复杂用能设备运行性能预测与分析研究[D].天津:天津大学,2014.

[5] BUTTERWORTH H.Handbook of energy efficiency in buildings[M].Amsterdam:Elsevier,2019:597-673.

[6] 丁洪涛,刘海柱,殷帅. 我国公共建筑节能监管平台建设现状及趋势研究[J].建设科技,2017(23):10-11.

DING Hongtao,LIU Haizhu,Yin Shuai. Research on the current situation and trend of public building energy conservation supervision platform construction in China[J].Construction Science and Technology,2017(23):10-11.

[7] LEE K P,WU B H,PENG S L. Deep-learning-based fault detection and diagnosis of air-handling units[J].Building and Environment,2019,157:24-33.

[8] GUNAY B,SHEN W,YANG C. Characterization of a building’s operation using automation data:a review and case study[J].Building and Environment,2017,118:196-210.

[9] SUN L L,WU J H,JIA H Q,et al. Research on fault detection method for heat pump air conditioning system under cold weather[J].Chinese Journal of Chemical Engineering,2017,25(12):1812-1819.

[10] VERBERT K,BABUSKA R,de SCHUTTER B. Combining knowledge and historical data for system-level fault diagnosis of HVAC systems[J].Engineering Applications of Artificial Intelligence,2017,59:260-273.

[11] LIANG Y X,MENG Q L,CHANG S. Fault diagnosis and energy consumption analysis for variable air volume air conditioning system: a case study[J].Procedia Engineering,2017,205:834-841.

[12] LI Y F,O'NEIL Z. An innovative fault impact analysis framework for enhancing building operations[J].Energy and Buildings,2019,199:311-331.

[13] LIU J H,LIU J Y,CHEN H X,et al. Abnormal energy identification of variable refrigerant flow air-conditioning systems based on data mining techniques[J].Applied Thermal Engineering,2019,150:398-411.

[14] GUO Y B,TAN Z H,CHEN H X,et al. Deep learning-based fault diagnosis of variable refrigerant flow air-conditioning system for building energy saving[J].Applied Energy,2018,225:732-745.

[15] PAN Y,ZHANG L M.Data-driven estimation of building energy consumption with multi-source heterogeneous data[J].Applied Energy,2020,268:114965/1-15.

[16] PEÑA M,BISCARRI F,GUERRERO J I,et al. Rule-based system to detect energy efficiency anomalies in smart buildings,a data mining approach[J].Expert Systems with Applications,2016, 56: 242-255.

[17] FAN C,XIAO F,ZHAO Y,et al. Analytical investigation of autoencoder-based methods for unsupervised anomaly detection in building energy data[J].Applied Energy,2018,211:1123-1135.

[18] LUO X J,FONG K F,SUN Y J. Development of clustering-based sensor fault detection and diagnosis strategy for chilled water system[J].Energy and Buildings,2019,186: 17-36.

[19] LIU X,DING Y,TANG H,et al. A data mining-based framework for the identification of daily electricity usage patterns and anomaly detection in building electricity consumption data[J].Energy and Buildings,2021,231:110601/1-22.

[20] DU Z M,FAN B,JIN X Q,et al. Fault detection and diagnosis for buildings and HVAC systems using combined neural networks and subtractive clustering analysis[J].Building and Environment,2014,73: 1-11.

[21] SHI Z X,OBRIEN W. Development and implementation of automated fault detection and diagnostics for building systems:a review[J].Automation in Construction,2019,104:215-229.

[22] FAHIM M,FRAZ K,SILLITTI A. TSI:Time series to imaging based model for detecting anomalous energy consumption in smart buildings[J].Information Sciences,2020,523:1-13.

[23] BARUM H,BARRETT J,CLARK L O,et al. Entropy and information causality in general probabilistic theories[J].New Journal of Physics,2010(3) 1-32.

[24] AI Y T,GUAN J Y,FEI C W,et al. Fusion information entropy method of rolling bearing fault diagnosis based on-dimensional characteristic parameter distance[J].Mechanical Systems and Signal Processing,2017,88:123-136.

[25] 孙吉贵,刘杰,赵连宇. 聚类算法研究[J].软件学报,2008,19(1):48-61.

SUN Jigui,LIU Jie,ZHAO Lianyu,Clustering algorithms research[J].Journal of Software,2008,19(1):48-61.

[26] 贾凡,严妍,张家琪. 基于-means聚类特征消减的网络异常检测[J].清华大学学报(自然科学版),2018,58(2):137-142.

JIA Fan,YAN Yan,ZHANG Jiaqi.-means based feature reduction for network anomaly detection[J].Journal of Tsinghua University(Science and Technology),2018,58(2):137-142.

[27] QIN H Y,ZHOU H P,CAO J W.Imbalanced learning algorithm based intelligent abnormal electricity consumption detection[J].Neurocomputing,2020,402:112-123.

[28] GHADIRI S M E,MAZLUMI K. Adaptive protection scheme for microgrids based on SOM clustering technique[J].Applied Soft Computing,2020,88:106062.

[29] YAZDANI S,MONTAZERI G M. A novel gas turbine fault detection and identification strategy based on hybrid dimensionality reduction and uncertain rule-based fuzzy logic[J].Computers in Industry,2020,115:103131/1-14.

[30] 杨占华,杨燕. SOM神经网络算法的研究与进展[J].计算机工程,2006, 32(16):201-202, 208.

YANG Zhanhua,YANG Yan. Research and development of self-organizing maps algorithm[J].Computer Engineering,2006,32(16):201-202,208.

[31] 中华人民共和国住房和城乡建设部. 国家机关办公建筑和大型公共建筑能耗监测系统分项能耗数据采集技术导则[G/OL].(2008-06-24).https://www.mohurd.gov.cn/gongkai/fdzdgknr/tzgg/200807/20080702_174380.html.

[32] 胡振中,袁爽. 建筑能耗与环境监测系统标准化数据提取技术[J].清华大学学报(自然科学版),2020,60(4):357-364.

HU Zhenzhong,YUAN Shuang.Standardized data extraction techniques for building utility consumption and environmental monitoring systems[J].Journal of Tsinghua University (Science and Technology),2020,60(4):357-364.

[33] YUN G Y,CHOI J,KIM J T. Energy performance of direct expansion air handling unit in office buildings[J].Energy and Buildings,2014,77:425-431.

Anomaly Detection of Complex Building Energy Consumption System Based on Machine Learning

ZHOU Xuan1WANG Xinyao1YAN Junwei1LEI Shangpeng1LIANG Liequan2

(1. School of Mechanical and Automotive Engineering,South China University of Technology,Guangzhou 510640,Guangdong, China;2. School of Information,Guangdong University of Finance and Economics,Guangzhou 510320,Guangdong,China)

The research on the anomaly detection of the operation state of complex energy consumption system is of great significance to the safe, stable, efficient and energy-saving operation of buildings. However, due to the influence of many factors, such as the variety of external environmental factors of buildings, the uncertainty of insider behavior, the complexity of equipment operation data and so on, the detection of abnormal operation state often meets some difficulties in information feature extraction, abnormal operation state definition and so on. Based on the classification of operation parameters and by using the quantitative description of uncertainty by information entropy and the adaptability of unsupervised learning, this paper proposed a secondary clustering anomaly detection method for the operation state of complex energy consumption system based on information entropy and by integrating-means and self-organizing mapping model. According to the actual monitoring data of the central air-conditioning system of a large office building in the hot summer and warm winter area, the external parameters were clustered for the first time through-means, and the steps such as dividing the primary working conditions, calculating the information entropy of the operating parameters of the subsystem under each working condition, and determining the abnormal operating state by secondary clustering of self-organizing mapping model were used to realize the abnormal detection of the operating state of the complex energy consumption system of the building. The results show that the average intra class anomaly detection accuracy of the method proposed in this study is 97.45% under the operation condition of single machine and 96.70% under the operation condition of two machines. In addition, this study further discussed and analyzed the relationship between the number of classes and the relevant indicators of in class anomaly rate under different working conditions. It concludes that the in class anomaly detection rate of single and dual hosts increases with the decrease of the total number of operating states in their class. This study provides a new systematic idea and method for the abnormal operation state detection of complex energy consumption system under the background of building energy big data.

complex energy consumption system;information entropy;-means;self-organizing maps model;anomaly detection

Supported by the Natural Science Foundation of Guangdong Province (2018A030313352,2017A030316162)

TK01;TU831

1000-565X(2022)07-0144-11

10.12141/j.issn.1000-565X.210422

2021-06-25

广东省自然科学基金资助项目(2018A030313352,2017A030316162)

周璇(1976-),女,副研究员,主要从事节能技术、数据挖掘等研究。E-mail: zhouxuan@scut.edu.cn

猜你喜欢
信息熵聚类工况
一种傅里叶域海量数据高速谱聚类方法
基于信息熵可信度的测试点选择方法研究
热网异常工况的辨识
基于知识图谱的k-modes文本聚类研究
一种改进K-means聚类的近邻传播最大最小距离算法
不同工况下喷水推进泵内流性能研究
误使用工况下儿童安全座椅安全性的开发与验证
汽车行驶工况识别模型搭建的方法研究
基于模糊聚类和支持向量回归的成绩预测
近似边界精度信息熵的属性约简