基于数据挖掘的电力负荷预测系统设计

2021-12-07 07:45郭大亮于楚凡宋子涛

电子设计工程 2021年23期

郭大亮，沈峰，于楚凡，宋子涛

（1.国家电力投资集团有限公司，北京 100029；2.国家电投集团中央研究院，北京 102209）

随着我国在电力领域的不断发展与进步，关于电力负荷所产生的问题也在不断增加，因此如何有效规范地对电力负荷进行调度、规划等预测成为我国研究的重点[1-2]。短期负荷预测是我国相关工作者制订规划与检测安全的基础，也是我国电力市场短期未来发展的根本参考，因此短期的负荷预测显得尤为重要[3-4]。

近几年来，我国的相关工作者对短期负荷预测这一项目点进行了不断地研究，共总结出了3 类主要方式：分别为时间行列模型与回归模型计算法、智能分析法、混沌计算法，但由于负荷变化过于庞大，所受干扰成分较多，因此这些方式在应用时都会存在一定的瑕疵和约束[5-6]。其中，时间行列与回归模型计算法的计算量过小、进度较快，但得到的结果精密度却并不高，且成本投入过大。智能分析预测法系统的鲁棒性没有安全保障，不具有权威性。混沌预测法的系统虽然可以避开复杂的数值计算，但还处于发展阶段，因此其通用性较差，且缺乏学习能力[7-8]。

人造神经网络的保障性较高且非线性映射能力与学习能力较强，但其受环境因素的影响较大，并且该网络实际上是依靠梯度下降法调试的方式使目标函数变小，因此其泛化性能不强，无法得到广泛使用。

数据处理技术可以对负荷预测的历史数据进行聚类分析，还可以将当日预测的负荷数据与之前的历史负荷数据进行对比，并整合成一个完整的数据集合，然后再运用模糊神经网络（Fuzzy Neural Network，FNN）模型进行负荷预测。经过对比结果显示，文中系统方式跟上述所有方式相比具有更高的精确性与应用性。

1 系统硬件设计

文中系统的硬件结构如图1 所示。

图1 电力负荷预测系统硬件结构

观察图1 可知，基于数据挖掘的电力负荷预测系统硬件结构由数据源层、数据连接层、数据库层、数据挖掘层、系统应用层、集成层、用户层组成。

1）数据源层主要负责整合系统访问的所有电力负荷数据，包含了社会用电数据、策划数据、环境数据、水电站数据、社会整体电力负荷数据、线损数据等[9]。

2）数据连接层指的是系统与网络之间的连接层，是系统访问数据库的主要渠道[10]。

3）数据库层是电力负荷数据的暂存空间，当处理数据量过大时可将多余的数据交由数据库层进行保存。

4）数据挖掘层以数据挖掘作为核心技术对所有的负荷数据进行深度挖掘，并构建相关模型从而为接下来的预测提供数据支持。

5）系统应用层主要负责对构建的模型进行剖析与总结，为用户与负责人提供更加直观的表达。

6）集成层负责对所要挖掘的数据进行收集与规划。

7）用户层主要分为系统负责人员与客户两大类，他们是该系统的主要参与者与应用者。

系统电路图如图2 所示。

图2 系统电路图

1.1 电力负荷数据预处理模块

电力负荷数据预处理模块主要针对数据源层中的所有历史负荷数据，这些历史负荷数据并不是绝对完整与可用的，因此需要电力负荷数据预处理模块对这些数据进行预处理，以方便接下来使用[11-13]。电力负荷数据预处理模块内部芯片为美国Intel 公司生产的IT20154 芯片，芯片结构如图3 所示。

图3 电力负荷数据预处理芯片结构

观察图3 可知，模块预处理的内容主要分为两个方面，分别为偏差数据处理和不可用数据处理，其中对偏差数据的处理主要采用定性推理方法，对缺失数据则采用关联规则填充方法[14]。对于历史数据中的不可用数据来说，该类数据的产生主要是由于在存放与传输的过程中受到了彼此之间的影响，出现了数据紊乱与纠纷的现象，电力负荷数据预处理模块针对这一类数据主要采取修复与处理的方式来进行解决，保证不会影响到接下来的一系列过程。电力负荷数据处理模块电路图如图4 所示。

图4 电力负荷数据处理模块电路图

1.2 数据仓库与多维分析

数据仓库中包含了许多缓存数据，该类数据的存在是为了填补偏差数据之间的空白以及帮助不可用数据进行修复与销毁。文中系统在数据库的应用中，采取了缓存数据分布式处理，这些缓存数据对偏差数据与不可用数据的填补与修复不会影响这两类负荷数据的整体结构，而是减少这两类数据所受环境以及天气因素的影响，从根本上弥补了这两类数据的不足，以完成接下来的多维分析，从而实现对数据的多维统计分析与查询，分析和查询结果可以通过报刊、图像等不同形式形象地表示出来，并支持相关客户端获取所得分析结果[15]。

2 系统软件设计

数据挖掘是一个从大量数据中挖掘出未知并且有价值的负荷数据规律的过程，文中所设计的系统软件主要具有归类、合并、维系和总结4 种功能。

其中，归类是指将所有数据对象根据其具有的特征性分组成为多个区域的一项具体操作，而合并则是通过数据挖掘理念对这些区域的负荷数据对象依次进行挖掘，并找到它们总相似性的过程，维系的目的在于确定原始数据在该类别中的稳定现象，上述三大功能是实现总结功能的基础[16]。

在总结的过程中，文中所设计的软件不但需要找到这些负荷数据的差异性与相似性，还需要对最终模型的构建进行预览与分析，因为电力负荷所处的环境中所包含的温度、湿度、降雨量、空气波动等因素对最终模型的构建都有一定的影响，而这些因素彼此之间的相互影响又难以进行绝对比较，因此在总结的过程中需要通过数据挖掘理念将这些因素数据指标标准化，方便最终总结功能的正常运行。电力负荷预测系统软件流程如图5 所示。

图5 电力负荷预测系统软件流程

文中利用BP 神经网络单向传播的多层前向特点，将输入信号节点通过节点依次传输，而彼此节点之间又具有不相互影响的特点，这使得负荷预测误差趋向极小值，降低了上述总结过程中其他因素的影响。

为了增强文中所设计软件的包容性，该软件所应用的神经网络在构建模型时需要经过输入、生成、推理、干预共4 个过程才能完成，各过程之间所依据的信息语言、学习概念、应用规则都存在着一定的差异性，使得在应用该系统进行最终总结模型构建时大大地增强了涵盖指数与包容性。

3 系统功能

为了检测文中提出的基于数据挖掘的电力负荷预测系统与传统的电力负荷预测系统的功能，进行实验对比，系统实验环境如图6 所示。

图6 实验环境

设定实验参数如表1 所示。

表1 实验参数

根据实验参数和实验环境，选用文中设计的基于数据挖掘的电力负荷预测系统、传统的基于动态测量的电力负荷预测系统与基于人工智能的电力负荷预测系统。

系统对电力负荷的辨识率实验结果如图7所示。

图7 系统对电力负荷的辨识率实验结果

系统对电力负荷的辨识时间实验结果如图8所示。

图8 系统对电力负荷的辨识时间

观察图8 可知，文中提出的基于数据挖掘的电力负荷预测系统预测辨识的时间远远小于传统系统，这是因为文中所设计的系统在进行预测时不但需要从理论概念出发，还需要从社会、环境、发电站等多个与电力负荷相关联的方面依次进行采集与建模分析，这是文中系统的一大亮点，即具有极大的包容性，而正是因为该系统需要对多种状态下的电力负荷都进行分析，所以它对任何状态下的电力负荷都具有极高的识别度，这也是文中提出的基于数据挖掘的电力负荷预测系统的预测辨识时间远远小于传统系统的重要原因。

在对电力负荷进行精准预测的过程中，所需要的电力负荷数据是十分巨大且不间断的，因为电力负荷数据的特征性会随着时间的流逝一直在改变，所以只有对电力负荷进行24 小时的不间断预测，才能尽可能降低系统对电力负荷的预测结构和实际数据结果之间的偏差，而文中系统的集成接口主要负责对负荷数据自动采集的工作，并且它的工作状态并不会受到该系统工作状态的影响，具有极强的自主工作能力，而这也是文中系统的特色开发工具之一。该系统的主要挖掘对象为水电负荷和社会负荷，通过深度挖掘技术来建立相关模型与多元线性同归神经网络是该文采取的主要手段，在经过大量的实验与实际操作验证后，发现文中系统对电力负荷预测的精确性最高，抗外界干扰性最强。

4 结束语

数据挖掘技术是一种抗干扰较强且设计范围较广的多层次应用技术，在经过大量的实际操作与实验总结后，发现该技术所具有的特征点对我国的电力负荷预测领域有着极大的突破与帮助，因此文中基于该技术核心理念设计了相对应的预测系统，事实证明，文中所设计系统的抗干扰性与针对性是传统预测系统远远不具备的，在电力负荷预测领域有着极高的研究价值与发展前景，另外，随着我国该领域的不断发展与创新，也希望该系统在未来可以获得更大的提升，发挥更大的使用价值。