基于决策树算法的短期电力负荷大数据预测模型

2022-06-28 17:46蔡颖凯曹世龙康乃荻宋晓文
制造业自动化 2022年6期
关键词:决策树聚类负荷

蔡颖凯,张 冶,曹世龙,康乃荻,宋晓文

(国网辽宁省电力有限公司,沈阳 110000)

0 引言

电力负荷预测的主要目的是对负荷的发展趋势实行估计,其需以电网系统自身的波动变化和负荷的影响因素为依据[1],并结合电力系统的历史负荷数据、电网的运行特性、负荷自身的变化规律以及自然条件等,构建数学预测模型完成。电力负荷的预测通常包含长期、中期以及短期和超短期四种,其中,短期预测指的是日度预测[2],通常情况下,直接关联电力系统的运行状态和调度规划;其预测精度越高,则可提升电力系统设备的利用和调度性能。短期电力负荷的波动会受到多种因素的影响,两者之间呈现非线性,同时具有显著的复杂性和滞后性,其导致负荷的时间序列发生随机性;对于负荷预测的结果存在极大影响;除此之外,海量、混杂、且没有规则的数据,也影响负荷预测的效率和实时性。决策树也称为判定树,是常见的数据挖掘方法,能够自动完成目标分类和预测[3],该方法是通过构建决策模型的方式完成[4],其在构建过程中,仅需要训练数据即可;并且可靠完成混杂、无规则数据的分类。

赵洋等人基于时间卷积网络为核心,提出相关预测方法[5];祝学昌的基于IFOA-GRNN研究相关的方法[6];但是上述方法在预测过程中,没有对数据实行填补处理,因此,预测结果仍旧存在一定不精准性。因此,本文针对短期电力负荷的特性实行深入分析后,以负荷大数据为依据,采用改进的决策树方法完成短期电力负荷预测。

1 基于改进决策树的短期电力负荷预测

1.1 短期电力负荷预测模型

本文为实现短期电力负荷预测,以决策树为基础,将梯度直升机与其结合实现优化改进,形成梯度提升决策树算法,用于完成短期电力负荷预测,基于改进的基于改进决策树的短期电力负荷预测模型如图1所示。

图1 基于改进决策树的短期电力负荷预测模型

该模型整体分为两个部分,分别为负荷大数据处理模块、短期负荷预测模块,前者是对电力负荷大数据实行预处理[7],包括数据聚类、选取、变换、填补等,完成负荷大数据的处理,获取原始数据中的所需数据的选择;文中选择的为气象和负荷两种数据,并通过其他处理完成数据维度的下降、数据类型转换以及缺失数据填补,为短期电力负荷预测提供更加有效、可靠、真实的数据。后者则是依据获取的大数据[8],完成负荷预测,并实行负荷预测结果的修正。

1.2 短期电力负荷大数据预处理

1.2.1 短期电力负荷数据聚类

获取原始数据中所需的气象和负荷两种数据,是实现短期电力负荷预测的基础,其中气象数据包括气温、相对湿度、云量、雨量水气压和阵风的最大风速[9],这些因素均是影响负荷变化的主要因素。因此,需先对上述所需的数据实行获取,文中采用C均值模糊聚类算法完成所需数据的聚类。

设给定的原始数据集用X{x1,x2,…,xn}表示,对其实行聚类处理,获取的类别数量用c表示,聚类中心用mj(j=1,2,…,c)表示。xk表示X中的任意样本,以Xi为参照,第k个样本对其的隶属程度用μik=μXi(xk)表示,其也表示xk对应的隶属函数。聚类损失指标函数计算公式为:

式(1)中:b表示平滑因子,μj(xi)表示第i个样本的隶属函数。

以mj、μj(xi)为参照,J对两者的偏导均为0,依据式(2)、式(3)的约束条件,获取J的最小值为:

式(2)、式(3)中:mj表示各个聚类中心,对其实行初始化处理后,按照上述两个公式,实行循环处理后获取聚类中心ms,满足所需的精度标准后,确定聚类中心和隶属函数,完成所需数据聚类。

1.2.2 短期电力负荷预测所需数据填补

短期电力负荷预测原始数据,由于存在偏差、统计不完整或者获取方式等差异[10],会导致原始数据存在缺失等现象。因此,完成所需数据的聚类后,为保证聚类获取数据的完整性,采用低秩矩阵填充理论和奇异值阈值算办法完成。

构建聚类获取的存在缺失数据的矩阵,用M∈Rm×n表示,其中m×n表示阶数,因此,该矩阵也为不完整矩阵,确定矩阵中的缺失元素[11],并完成矩阵补全,即可恢复完整数据。

由于M∈Rm×n存在近似低秩特点,因此采用低秩矩阵填充理论完整矩阵补全,基于该理论矩阵的补全公式为:

式(4)中:S表示完成数据填补之后的矩阵,rank(S)表示S的秩;Ω表示位置集合,属于M∈Rm×n中被观测获取的元素,如果矩阵Mi,j不为空,则(i,j)∈Ω;核范数用‖S‖*表示,用于约束目标矩阵的低秩特点,且其可描述矩阵S中全部的奇异值总和,其式为:

式(5)中:σk表示奇异值。

在进行海量大模数据填补,则用需完成大规模矩阵的填充,为保证填充效果[12],采用奇异值算法完成矩阵M∈Rm×n求解。其详细步骤如下:

设Dτ表示奇异值收缩算子,属于S,其式为:

式(6)中:U、V均表示阶酉矩阵;∑表示对角矩阵,为非负实数;τ表示收缩步长,属于奇异值收缩因子;T表示待填补数据解释。

Dτ(∑)表示正数,且为奇异值减去τ后得出,其式为:

式(7)中:{·}+=max(0,t),表示大于零的数。

通过上述步骤即可获取新的矩阵,在此基础上,获取求解低秩矩阵补齐问题的迭代序列,其式为:

式(8)中:k和k-1表示迭代次数,中间矩阵用Y表示,其估计值用Y k-1和Y k表示;权重系数用δk表示;PΩ表示数据集合,且该集合没有数据缺失情况。基于上述全部步骤,完成矩阵填补,即完成短期电力负荷预测所需数据填补,获取填补后的数据T~。

1.3 基于决策树的短期电力负荷预测

完成数据填补处理后,即可获取完整的负荷预测所需的大数据,以该数据为依据,完成短期电力负荷预测。本文为保证预测结果的可靠性[13],采用基于梯度提升决策树模型完成短期电力负荷预测。该模型是的核心是生成数量为m弱回归树,且需位于损失函数负梯度的方向上;并且,为获取强回归树[14],采用组合方式对m个弱回归树,实行处理完成,基于此,即可实现短期电力负荷预测模型构建。

设模型中日属性向量用A表示,模型的初始值为f0,以属性向量为依据,各个弱回归树的预测输出值用fi(A)表示,其中i=1,2,…,m,所有的预测输出值累加值为F(A),其计算公式为:

设M和L(y,g(a))分别表示迭代次数和损失函数,则基于梯度提升决策树模型的负荷预测详情如下所示:

步骤1:模型初始化:获取L(y,g(a))最小化常数值c,计算公式为:

文中采用平方误差损失函数作为回归树的损失函数,其计算公式为:

式(10)中:模型对于负荷的预测值用g(a)表示。

步骤2:模型迭代:确定搜索方向,其以负梯度方向为主,在此基础上,通过最速下降法,逐步完成迭代,接近目标结果;计算L(y,g(a))的负梯度和梯度,其计算公式分别如式(11)、式(12)所示:

式(12)、式(13)中:∂表示梯度参数。

构建1棵弱回归树,以(Ai,rmi)为基础完成,以此获取数量为m棵的弱回归树叶节点区域用Rmj表示,j=1,2,…,Q,Q表示叶节点数量。

采用线性搜索方法获取Rmj中的最小c值,其计算公式为:

更新回归模型,并且为了避免更新过程中发生过拟合现象[15],引入学习速率v,0<v≤1,将其和模型的正则化结合,则更新公式为:

式(15)中:I()表示指示函数;如果Ai位于Rmj范围内,则I()取值为1,反之为0。

通过上述步骤循环后,即可获取预测模型F(A)=fM(A),将日属性向量X热爱如模型中,即可获取短期电力负荷预测结果。

由于短期电力负荷中存在一定的随机分量,因此,为进一步提升负荷预测精度,对预测结果实行修正,文中采用专家系统完成。利用专家经验修正基于改进决策树的短期电力负荷预测结果,实现预测结果和实际结果最大程度吻合。

2 测试分析

为测试本文方法对于短期电力负荷预测的应用效果,将本文方法用于某地区的电力公司,获取该地区2020年7月~12月的历史负荷数据作为实验使用数据,该数据的获取间隔时间为60s;除此之外,获取该地区在同一时间内的气象历史数据,该数据的获取间隔时间为1h。文中对日负荷实行预测,将一天划分成72个时间点,对各个时间的负荷变化情况实行预测,获取各个时间点的负荷预测结果。该公司目前面临多个运行情况下,风险值较高现象,期望能够有效控制短期电力负荷,使整体运行风险值均低于0.0005。

为测试本文方法对于短期电力负荷大数据聚类中的应用效果,从相同类的相似度和不同类的差异度为基础,确定类内和类间两种相似度评价指标,结合两个指标得出综合相似度评价指标,取值范围在0~0.1之间,其值越小,表示聚类效果越佳,其计算公式为:

式(15)中:Iai、Irij分别表示第i个样本数据的类内相似度和类间相似度两个指标;ni表示类内的数据数量;x表示数据样本;Xi和Xj类的聚类中心分别用ci和cj表示。

依据式(15)获取本文方法的聚类结果,获取本文方法在不同的分类数量下,对于气象大数据和负荷历史大数据的聚类结果,如图2所示。

图2 聚类效果测试结果

依据图2测试结果得出:本文方法能够良好地完成短期电力负荷大数据的聚类,气象大数据在不同的聚类数量下,ψI的取值均在0.065以下,但是分类数量为8时,ψI的取值最小,为0.014左右;历史负荷大数据在不同的聚类数量下,ψI的结果均在0.055以下,其分类数量为5时,ψI的取值最小,为0.011左右。因此,本文方法聚类效果良好,并且,所需的两种数据分别在分类数量为5个5时,聚类效果最佳。

本文方法在进行数据填补时,为避免模型更新时发生过拟合现象,引入学习速率完成模型更新,本文采用指示函数作为本文方法数据填补效果的衡量标准,获取该值结果以及变量矩阵的所在范围,结果如图3所示。

图3 数据填补性能测试结果

依据图3测试结果得出:本文方法在进行数据填补过程中,指示函数结果为1,且变量矩阵的所在范围均是弱回归树叶节点区域,因此,本文方法能够保证模型的更新,保证良好的数据填补性能。

为测试本文方法是否预备预测能力,采用本文方法对休息日和工作日两种场景下的负荷实行预测,并获取预测结果,如图4所示。

图4 短期电力负荷预测可行性测试结果

依据图4测试结果得出:采用本文方法对工作日和休息日中的72个时间点进行负荷预测后,均可获取负荷预测结果,并且,预测结果清晰呈现出两种场景下,负荷的差异结果,两者的负荷最大值分别为1920kW和886kW左右。因此,本文方法具备短期电力负荷预测能力,能够完成不同场景下的短期电力负荷预测,并且呈现负荷的波动变化情况。

为衡量本文方法对于短期电力负荷的预测效果,获取在晴天、持续降雨、寒潮以及高温干燥4种气象条件下,本文方法对于短期电力负荷的预测结果,由于篇幅有限,结果仅随机呈现两种气象天气的负荷预测结果,如图5、图6所示。

图5 寒潮气象条件下负荷预测结果

图6 高温干燥气象条件下负荷预测结果

依据图5、图6测试结果得出:本文方法的短期电力负荷预测效果良好,能够获取不同气象条件下负荷的变化结果,并且预测得出的负荷波动变化情况随着时间的变化发生改变,因此,本文方法的短期电力负荷预测效果可靠、实时,为电力系统的运行提供可靠依据。

短期电力负荷的可靠预测,对于电力系统的规划和运行状态掌握具有重要意义,为分析本文方法的应用性,测试在不同的阵风最大风速下,本文方法应用后,电力系统在运行管控中,切负荷、储能调度、风电分散接入三种运行情况下,电网的风险值结果,如表1所示。

表1 电网运行风险值结果

依据图表1测试结果得出:本文方法应用后,电网在三种运行情况下,阵风最大风速的逐渐变化,电网的风险值结果也发生相应的变化,但是所有风险值均低于0.00042。表示本文方法应用后,能够可靠预测短期电力负荷预测,并依据预测结果,对负荷实行有效处理,以此可保证电网在不同运行状态下的安全运行。

3 结语

电力系统的调度、规划和运营均需结合短期电力负荷预测结果完成,因此,负荷预测的可靠性、实时性尤为重要,其直接影响电力系统的安全运行。因此,本文研究基于决策树算法的短期电力负荷大数据预测模型。对该模型测试后得出:本文方法的大数据聚类效果良好,可有效完成数据填补,并具有短期电力负荷预测能力,可靠获取不同气象条件下的负荷值,为电力系统的运行提供可靠依据。

猜你喜欢
决策树聚类负荷
人造革合成革拉伸负荷测量不确定度评定
3项标准中维持热负荷要求对比分析
Opening flexible resources by integrating energy systems: A review of flexibility for the modern power system
面向WSN的聚类头选举与维护协议的研究综述
决策树和随机森林方法在管理决策中的应用
改进K均值聚类算法
决策树学习的剪枝方法
决策树多元分类模型预测森林植被覆盖
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法