基于神经网络的建筑能耗预测

2023-09-21 15:48陈湘萍蔡永翔
智能计算机与应用 2023年9期
关键词:能耗神经网络误差

吴 烨, 陈湘萍,蔡永翔

(1 贵州大学电气工程学院, 贵阳 550025;2 贵州电网有限责任公司电力科学研究院, 贵阳 550007)

0 引 言

随着社会的进步,经济的发展,建筑能耗也在快速的增长,据统计全球的建筑能耗约占总能耗的40%[1],而中国建筑能耗约占中国能源消耗的21.7%[2]。确有效的建筑能耗预测是节能的基础[3]。

国内外学者对能耗预测进行了大量的研究,目前常用神经网络来进行能耗预测。 Kawashima 等[4]提出了基于神经网络的每小时负荷预测进行预测控制,并与传统机器学习方法进行对比,得出神经网络有更好效果的结论;许馨尹等[5]基于EnergyPlus 软件对办公建筑在气候变化的情况下进行能耗模拟,结果表明气候对建筑能耗有影响;Amber 等[6]建立多元回归模型对用电能耗进行模拟,结果表明环境温度对于建筑能耗有着显著影响。

在基于机器学习方法的能耗预测中,张卓渊[7]提出一种基于生成对抗网络的建筑能耗预测方法,以LSTM(Long Short-Term Memory Network)神经网络为生成器,卷积神经网络(CNN)为判别器,对比其他模型有着更高的精度;井文强等[8]针对局部最优问题,提出改进灰狼优化BP(Back Propagation)神经网络的预测模型,通过改变原始收敛因子使得该模型有较好的精度和泛化能力;曾国治等[9]基于CNN 的特征提取能力和循环神经网络(RNN)的时序学习能力,提出了CNN-RNN 模型来预测建筑能耗,效率提高的同时还有不错的精度;邵必林等[10]基于注意力机制和LSTM 神经网络建立预测模型,更好的捕捉重要信息并反映变化趋势。 总的来说,基于机器学习的能耗预测主要是用LSTM 神经网络、BP 神经网络,又或者用优化算法优化后神经网络,例如基于粒子群优化算法(PSO)进行优化、基于灰狼算法(GWO)优化以及基于LM(Levenberg-Marquardt)算法优化等。

EnergyPlus 软件是美国能源部和劳伦斯·伯克利国家实验室基于BLAST 和DOE-2 基础上开发的建筑能耗模拟软件,能够用于对建筑的采暖、制冷、照明以及其他能源消耗进行能耗模拟分析,也可以进行二次开发,增加新功能,满足使用者多样化的需求[11]。

综上所述,目前针对能耗预测用的最多的就是神经网络。 本文基于EnergyPlus 模拟获得能耗数据,考虑到能耗数据是一个长时间序列数据,因此在神经网络的选择上选择了处理长时间序列较其他神经网络有优势的长短期记忆网络(LSTM)来建立能耗预测模型, 通过平均绝对误差MAE,均方误差MSE以及均方根误差RMSE来判断训练网络预测的精度,并与传统BP 神经网络预测模型进行对比,验证预测结果的准确性。

1 LSTM 神经网络与数据获取

1.1 LSTM 神经网络介绍

LSTM 是循环神经网络的一个变体,解决了传统循环神经网络在处理长时间序列时出现的梯度消失和梯度爆炸问题[12]。 LSTM 单元结构图如图1 所示。

图1 LSTM 单元结构图Fig. 1 LSTM unit structure diagram

LSTM 的门控结构如图2 所示。 LSTM 通过遗忘门、输入门和输出门这3 个特殊的门控结构来实现信息的保护和控制[13]。

图2 LSTM 的门控结构Fig. 2 Gating structure of LSTM

遗忘门如图2(a)所示,遗忘门会读取上一时刻的输出ht-1和当前的输入xt,ft输出的值来确定Ct-1是否丢弃,其计算如式(1):

其中,σ代表的是Sigmoid 激活函数;bf代表偏置向量;Wf代表遗忘门权重系数矩阵。

输入门如图2(b)所示,实现信息更新需要两个步骤,一是通过Sigmoid 层确定更新信息,再由tanh层确定备用更新内容;二是结合两部分生成的信息对Ct进行一个更新。 其计算如式(2)~式(4):

其中,tanh 代表双曲正切激活函数;Wi和WC分别代表由σ和tanh 确定的输入门权重系数矩阵;bi和bC分别代表由σ和tanh 确定的偏置向量;Ct代表当前的状态。

输出门如图2(c)所示,通过运行Sigmoid 激活函数得到ot值,将当前的状态Ct经过tanh 函数处理后的值与ot值相乘得到ht,得到t时刻的输出,并且也作为下一时刻的输入,如式(5)、式(6):

其中,Wo代表输出门权重系数矩阵;bo代表偏置向量;ot代表的是t时刻的输出。

1.2 数据获取

本文所用的建筑能耗数据是通过EnergyPlus 软件模拟得到的,在EnergyPlus 软件中添加空气回路(Variable Air Volume,VAV)、冷却水回路(制冷机以及冷却塔)、载热盘管以及锅炉,形成一个简单的供暖、通风和空气调节(Heating Ventilation and Air Conditioning, HVAC)系统,并在理想条件下进行能耗模拟。

在EnergyPlus 软件中设置HVAC 系统时,主要是对Zone、System 以及Plant 这3 个对象进行设置。对VAV 主要在HVAC Template: System/Zone VAV里进行设置, 在 System VAV 里设置 System Availability Schedule 为Office HVAC、Cooling Coil Design Setpoint 为 13 ℃、 Minimum Outdoor Air Schedule Name 为 Office Minimum OA 以及Economizer Type 为Fixed Dry Bulb 等,其他具体设置见表1。

表1 HVAC 设置表Tab. 1 HVAC setting table

在EnergyPlus 软件中建立HVAC 系统,考虑到HVAC 系统的复杂度,在本文选用了简单的HVAC系统,大部分均采用默认数值,因为建筑有5 个区,所以Zone: VAV 要按相同参数设置5 个区。 在办公建筑中,室内负载对能耗影响较大,本文中室内负载包括人员数量、照明设备以及电气设备,其中室内负载见表2。

表2 室内负载Tab. 2 Indoor loads

本文中所用的建筑如图3 所示,该建筑位于美国的芝加哥,长30.5 m、宽15.2 m、高3 m,占地面积为463.6 m2,四面墙上都有窗户。 由于建筑空间过大,因此把空间分为东区、西区、北区、南区以及中区,中区到外墙的距离均为3.7 m,在天花板和5 个区之间还有一个集气室,建筑围护结构及传热系数见表3。 用EnergyPlus 软件模拟之前,要选择USA_IL_Chicago-OHare.Intl.AP.725300_TMY3 天气文件。

表3 围护结构及传热系数表Tab. 3 Envelopes and heat transfer coefficients

图3 建筑图Fig. 3 Architectural drawing

用EnergyPlus 软件进行能耗模拟,把模拟结果分为“每天”和“每小时”进行最后的结果输出,工作安排是做六休一。 由于本文设计的建筑有着5 个热区,在本文中只选择了南区作为研究对象,“每天”和“每小时”的能耗模拟结果如图4 和图5 所示,可以看出工作日的能耗高于休息日的能耗,在休息日不论是照明能耗还是设备能耗都是最低。 本文基于EnergyPlus 的模拟数据,把“每天”和“每小时”的模拟结果作为训练集以及测试集。

图4 “每天”的模拟结果Fig. 4 Simulation results of “daily”

图5 “每小时”的模拟结果Fig. 5 Simulation results of “hourly”

1.3 基于LSTM 的预测流程

由于LSTM 神经网络对于长时间序列数据有着十分出色的预测能力,因此本文采用LSTM 神经网络来对能耗数据进行预测,具体的LSTM 预测流程图如图6 所示。

图6 LSTM 预测流程图Fig. 6 LSTM prediction flow chart

2 预测模型建立

2.1 数据处理

(1)数据集划分。 本文通过EnergyPlus 软件进行一年的能耗模拟,模拟结果以两种输出方式输出,如图4 和图5 所示。 第一种输出365 天的数据,以前300 天为训练集,后65 天为测试集;第二种输出8 760 个小时的数据,以前8 000 个小时为训练集,后760 个小时为测试集。

(2)数据归一化。 由于样本数据之间的类型和数值大小各不相同,会导致绝对值相差很大。 为了消除奇异样本数据导致的不良影响,会对数据进行归一化处理,将样本数据转换为[0,1]之间的数,归一化也可以加快训练网络的收敛性。 归一化计算式(7):

其中,x代表样本数据;xmin代表样本数据最小值;xmax代表样本数据最大值;x*代表归一化之后的值。

2.2 评价指标

为了确定LSTM 训练网络预测的效果、精确度以及稳定性,本文中采用平均绝对误差MAE,均方误差MSE和均方根误差RMSE作为预测模型的评价指标。MAE体现预测结果和测试值之间的差值,式(8);MSE体现出预测结果的变化程度,式(9);RMSE则能更好的反映出预测结果的精度,式(10)。

其中,yi代表LSTM 预测模型的预测值,xi代表测试值。

2.3 参数选取

在EnergyPlus 软件中选择输出数据为室外温度、室内温度、照明能耗、设备能耗以及HVAC 能耗。 其中,照明能耗和设备能耗在工作时都会产生能耗,会使得室内的温度上升,从而对HVAC 的能耗有一定程度上的影响。 因此,本文中主要使用室外温度、室内温度、照明能耗以及设备能耗作为输入来预测HVAC 的能耗。

本文以室外温度、室内温度、照明能耗以及设备能耗作为LSTM 神经网络的输入,HVAC 能耗作为LSTM 神经网络的输出。 以“每天”输出为主,预先设置神经元数目为128、256、512,分别进行5 次训练,得到不同的MSE值,并取得平均值见表4。 神经元数目为256 时MSE的值最小,因此确定神经元数目为256。 按“每小时”输出的参数选取与按“每天”输出相同。 Adam 具有适应稀疏梯度和缓解梯度震荡的优点,本文中采用Adam 求解器进行优化。在网络训练时,在全连接层使用Dropout 并设置为0.2,其目的是在每次训练批次中,以一定的概率忽略一定数量的神经元,这样防止在网络训练过程中出现过拟合的问题。

表4 不同神经元数目MSE 对比Tab. 4 MSE comparison of different neuron numbers

2.4 网络训练

本文中的LSTM 网络设置为5 个层,分别有输入层、隐含层、全连接层、输出层以及回归层。 基于不断的测试,选定输入层的数目为4,输出层的数目为1,全连接层把Dropout 设置为0.2,采用Adam 求解器来进行优化,训练次数设置为250,为了防止梯度爆炸,梯度设置为1,初始学习率设置为0.01,经过150 次训练后乘以0.5 来降低学习率。 “每天”LSTM 网络训练图如图7 所示。

图7 “每天”LSTM 网络训练图Fig. 7 LSTM network training chart of “Daily”

由图7 可知,本次训练迭代次数为250,由于是按“每天”进行输出,仅有300 个训练集,训练时间约为43 s,训练曲线都是随着迭代次数的增加而逐渐下降,RMSE曲线在大约170 次迭代之后趋于平缓,RMSE的值趋近0.05,而LOSS曲线则是在100 次迭代之后趋于平缓,且LOSS的值趋近0。 “每小时”LSTM 网络训练图与“每天”的类似,差别在于训练集的增多会导致训练时间的延长以及RMSE的值趋近0.1。

3 结果分析与对比

本文分别对“每天”和“每小时”两种输出进行预测,预测结果如图8 和图9 所示。 由图8 可以看出预测值的变化趋势和测试值的数据基本保持一致,而从图8(b)所示的预测误差图,预测的误差值在[-2.5×107,1.2×107]之间,其最大误差约为-2.5×107,而最小误差值则趋近0;由图9 可见,在预测曲线与测试值的变化趋势基本一致,拟合程度更好,而误差值也只在[-3.6×106,7.36×106]之间波动,不论是最大误差还是最小误差都优于前者。

图8 LSTM“每天”测试结果Fig. 8 LSTM test results of daily

图9 LSTM“每小时”能耗预测图Fig. 9 LSTM test results of hourly

为了验证训练模型的准确性,本文选择与BP神经网络模型进行对比,BP 神经网络与训练网络有相同的结构,即输入层为4,隐含层节点数256,输出层为1,迭代次数为250,学习率为0.01,最小误差设置为0.000 01,两种输出方式的预测结果图如图10和图11 所示。 对比相同训练集的BP 模型和LSTM模型,由图10 可知,BP 网络预测值的变化趋势比LSTM 网络预测值的变化趋势更为接近测试值,但在误差上则是LSTM 网络模型占优;由图11 可知,BP 网络模型的预测值的变化曲线和测试值大部分是重合的,但在峰值前后会有一部分和测试值有细微的误差,误差范围在[-1.4×107,7.5×107]之间,而相对于LSTM 模型的测试结果,不论是测试结果的变化趋势还是预测值与测试值之间的误差都是LSTM 模型有着一定的优势。

图10 BP“每天”测试结果Fig. 10 BP test results of daily

图11 BP“每小时”测试结果Fig. 11 BP test results of hourly

同时,对LSTM 模型和BP 模型的性能评价指标进行计算,见表5。 从表5 中可以看出,LSTM 模型仅在“每天”测试结果的MAE指标比BP 模型差,而其他的指标则LSTM 模型都优于BP 模型,说明LSTM 模型对处理时间序列数据的效果比BP 模型要好。

表5 不同模型的评价指标Tab. 5 Evaluation indicators for different models

4 结束语

本文基于EnergyPlus 软件进行能耗模拟得到的模拟数据,建立LSTM 神经网络预测模型,并与BP神经网络预测模型进行对比分析,通过平均绝对误差MAE,均方误差MSE和均方根误差RMSE这3 个评价指标对模型进行评估。 实验结果表明,LSTM神经网络预测模型不论是MAE、MSE还是RMSE都是优于BP 神经网络预测模型,可以更精确的预测能耗,能更好的反映出建筑能耗的变化趋势。

本文还有一些不足,LSTM 神经网络预测模型的输入仅考虑了室外温度、室内温度、照明能耗以及设备能耗这些因素,对于人员数目、风速、湿度以及光照等因素没有考虑,以后会把这些因素考虑进去。另外,在本文中也只分析了采暖能耗,没有对制冷能耗进行分析。 在于对LSTM 的优化上,本文只引入了Adam 求解器进行了最简单的优化,后续会考虑用群体智能优化算法来对LSTM 网络进行优化,提高预测的准确度。

猜你喜欢
能耗神经网络误差
120t转炉降低工序能耗生产实践
能耗双控下,涨价潮再度来袭!
探讨如何设计零能耗住宅
角接触球轴承接触角误差控制
Beidou, le système de navigation par satellite compatible et interopérable
神经网络抑制无线通信干扰探究
压力容器制造误差探究
日本先进的“零能耗住宅”
基于神经网络的拉矫机控制模型建立
九十亿分之一的“生死”误差