一种基于全过程优化支持向量机的短期电力负荷预测方法

2018-12-06 02:51简献忠顾祎婷
电力科学与工程 2018年11期
关键词:烟花向量负荷

简献忠, 顾祎婷

(上海理工大学 光电与计算机工程学院 教育部及上海市现代光学系统重点实验室,上海 200093)

0 引言

电力系统短期负荷预测是指以小时、天或周为单位对电力系统的负荷进行预测,然后根据预测结果制定电力系统的日调度计划以及周调度计划。电力负荷预测不仅为电力系统拟定调度计划和供电计划提供依据,同时也是电力系统可靠的、经济的、安全的运行的基础。所以,电力负荷预测这一问题已经受到越来越多的关注,对于提高电力负荷预测的准确性的研究也越来越多。电力负荷的精确预测可以让机组检修的计划和电网的运行方式更加经济合理,同时也能大大降低发电成本、有效地提高电力系统的社会效益和经济效益。

传统的负荷预测主要是凭借调度员或者一些有经验的专家经行主观判断。后来随着统计学的发展产生了时间序列法、回归分析法等数学方法。随着人工智能技术的迅速发展,神经网络[1~4],如遗传灰色 RBF模型[1],各种优化神经网络[2]以及动态神经网络[3];极限学习机[5~8],如正则化极限学习机[6]、增量优化极限学习机[7];小波理论[9,10]、支持向量机[11~16]等一系列智能算法被应用于电力负荷预测中。其中支持向量机SVM模型是近几年比较热门的一种根据统计学理论提出的小样本学习方法。传统SVM回归模型存在大规模样本训练困难、对于缺失及异常数据敏感等缺陷,所以往往需要对其进行改进。在支持向量机参数选取方面,文献[12]采用人群搜索算法对支持向量机参数进行优化选择;在输入数据的处理方面,文献[15]对支持向量机进行输入集优化;在核函数的选取方面,文献[16]对其进行核函数组合优化。在电力负荷预测方法上,已有文献表明针对支持向量机的改进均采用局部优化的思想且预测准确度不高。主要存在如下3个方面的问题:(1)对于电力负荷预测的输入特征集的优化方法还存在一定的局限性;(2)支持向量机电力负荷预测模型的预测相关参数的优化算法还存在一定的局限性;(3)SVM核函数的选取过于单一,难以满足电力负荷预测模型的需求。各改进模型仅针对支持向量机回归算法中存在的单一问题进行优化,没有对整个预测过程进行系统研究缺乏全过程优化的建模思考,因此进行有效的全过程优化对电力负荷预测就显得尤为重要。

针对以上局部优化应用于短期电力负荷预测存在的问题,本文提出了一种全过程优化的SVM模型进行短期电力负荷预测。采用全过程优化的建模思想从3个方面对支持向量机模型进行优化:首先对于输入特征集的优化,采用模糊C均值聚类算法对其进行处理,对输入数据中的异常值进行修正,减小支持向量机预测模型冗余度及训练样本集过修正度。然后针对核函数的优化选取,通过对不同核函数进行预测准确度的对比,最终采用了组合核函数作为本文支持向量机模型的核函数。最后关于支持向量机的参数优化选择具有爆发性、隐并行性、多样性和瞬时性等优点的烟花算法。实验结果表明全局优化SVM的预测准确度高于局部优化。

1 支持向量机

1.1 支持向量机原理

支持向量机(SVM)最早是在1990年由美国Vapnik教授提出的,主要在分类和回归两个领域得到广泛的应用。本文主要介绍支持向量机在回归中的应用即支持向量回归(SVR)。支持向量机分为线性支持向量机和非线性支持向量机两种,显然电力负荷采取非线性支持向量回归模型。支持向量机在解决非线性回归问题的核心思想是:将输入向量进行一个非线性映射Φ:x→Φ(x),使得映射后的高维空间上的数据能够进行线性回归,从而解决原来空间的非线性回归问题。这个映射对于解决非线性支持向量机问题的十分重要,通常在支持向量机中会用一个核函数来定义这个映射。

给定一组样本{(x1,y1),(x2,y2),…,(xn,yn)}⊂Rn×R,其中xi(i=1,2,…,n)为输入向量,yi为对应的输出向量。基于结构风险最小化原则,SVM通过最小化一个正则化风险函数(1)得到一个目标函数(2)。

(1)

f(x)=〈ω·Φ(x)〉+b

(2)

(3)

(4)

其中αi≥0,原始的优化问题转化为如下对偶问题:

(5)

其中αi≥0(i=1,…n)。解决上述对偶问题可以得到α*,而参数ω,b可由式(6)计算得到。

(6)

1.2 核函数

定义核函数为K(xi,xj)=〈Φ(xi)·Φ(xi)〉,核函数巧妙地解决了在高维特征空间中计算的复杂的问题,它将高维空间中的复杂的内积运算转化为低维的简单的核函数运算。这也为利用高维特征空间解决非线性的分类或回归问题提供了思路。常见的核函数有:

线性核函数:K(xi,xj)=xiTxj

多项式核函数:K(xi,xj)=(γxiTxj+r)p,γ>0

径向基核函数:K(xi,xj)=exp(-‖xi-xj‖2/σ2)

两层感知器核函数:K(xi,xj)=tanh(γxiTxj+r)

2 全过程优化建模思路与方法

2.1 全过程优化建模思路

全过程优化支持向量机是针对SVM预测过程中的各个环节采用相应的优化方法对其进行控制和优化。具体优化环节包括输入特征集优化、核函数选择与优化、参数组合优化及训练速度优化。优化的目的是减小预测误差提高预测精度,有助于更准确的制定用电计划。全过程优化的步骤如下:

步骤1:利用模糊C均值聚类算法对输入特征集进行处理,对输入数据中的异常值进行修正,去除远处样本点。这样可以达到减小数据冗余、修正训练样本的目的,同时也有助于提高训练速度和预测精度。

步骤2:通过比较几种常见的核函数各方面的性能,综合考虑实际案例特点,选择合适的核函数作为支持向量机预测的核函数。

步骤3:采用优化算法从而提高其预测精度的角度对SVM的参数进行择优。由于烟花算法具有爆发性、隐并行性、多样性和瞬时性等优点,将其用于 SVM 的 核函数参数与惩罚系数C的优化选取中。

步骤4:构建全过程优化SVR电力负荷预测模型,结合实际电网数据验证该全局优化模型的精确性和有效性。

2.2 全过程优化建模方法

2.2.1 基于FCM的输入特征集优化

输入特征集的选取和处理作为支持向量机预测模型的第一个环节,对于提高SVM预测模型的预测精度十分重要。通常可以通过使用一些人工智能的方法对输入特征集进行处理,使处理后的输入特征集只保留最优超平面附近的样本点,除去较远的样本点,减少数据冗余,提高预测精度。本文采用模糊C均值聚类算法来解决SVM模型的输入特征集选取问题。具体实现步骤如下:

步骤1:将 SVM的输入个体以列向量的形式存放到输入矩阵P中;

步骤2:设定需要聚类数目C和加权指数m(具体选取参考文献[17]), 对SVM模型的输出矩阵P进行模糊核聚类分析,然后得到一个输出隶属度矩阵U;

步骤3: 根据隶属度矩阵U, 每个SVM输入个体对于每个类都有一个隶属度,将SVM输入个体归入其隶属度最高的一类中;

步骤4:计算每一类中所有SVM输入个体的平均泛化误差并与给定阈值λ进行比较,将每一类中平均泛化误差大于阈值的SVM个体选择出来,作为异常点;

步骤5:对于异常点本文采用随机线性法进行修正。对第j个异常值xj,令xj=k1xj-1+k2xj+1,其中和xj-1和xj+1为前一个正常值和后一个正常值。k1,k2⊂[0,1]且k1+k2=1。最终修改后的SVM个体作为优化后的输入特征集。

2.2.2 核函数的选择

由于核函数实际上定义了一个低维向高维的映射,是将非线性问题转化为线性问题的关键,所以核函数的选取对SVM预测模型特别重要。不同的核函数在非线性映射能力、参数数量、数值限制条件、全局性及正定性方面有所不同,对SVM预测结果的影响也不同。常见的核函数包括RBF、线性核函数、Sigmoid核函数、多项式核函数和小波核函数等,其特性比较如表1所示。

表1 核函数特性比较

现有的SVM局部优化模型对于核函数的选取过于单一,难以满足电力负荷预测模型的需求。通过比较各核函数的特性,发现RBF核函数学习能力强、泛化性能较弱;而多项式核函数泛化性能力强、学习能力较弱,因此考虑将两者进行组合,定义如下:

(7)

λ是用来调节组合核函数中多项式核函数和 RBF 核函数作用大小的常数,同时为了保证组合核函数不改变原来映射空间的合理性,λ取值范围为[0,2]。

项目试运行期间,县级山洪灾害监测预警应用系统发挥作用显著,预报预警效果明显。据统计,2012年汛期,河南省共有34个县发布预警155次,向 421个乡(镇)、3 682个村责任人发布预警短信10.788万条,使用预警语音广播12 421次,安全转移5.3万人,无一人伤亡。

2.2.3 基于烟花算法的参数优化

现有的支持向量机电力负荷预测局部优化模型的参数优化算法还存在一定的局限性,因此本文采用了爆发性、隐并行性、多样性和瞬时性好的烟花算法。烟花算法是一种新型智能寻优算法,用来解决全局复合函数最优化问题。当烟花爆炸后,火花的散落将充满烟花周围的局部空间,爆炸过程可以看做是一个在局部空间内对最优点的搜索,在最优区域不断的进行下一次爆炸,直到一个火花命中了最优点或在设定误差之内。算法中还引入了高斯变异算子,它能增强局部寻优能力和火花的随机性,防止早熟。

首先在搜索区域随机初始化20个烟花算子,确定参数的边界范围,1≤a1≤2、1≤a2≤2、0.2≤RS≤2、200≤RP≤500。为了达到烟花差异化的目的,每个烟花的爆炸半径和爆炸产生的火花数目是根据其相对于烟花种群中其他烟花适应度值计算得到的,每次烟花xi爆炸产生的火花数目Si和爆炸半径Ai的计算公式分别为:

(8)

(9)

式中:f(x)即目标函数;xmin和xmax表示参数的潜在空间范围;m为初始烟花数目,用来调整每次爆炸的火花数目;ymax是当前烟花种群中适应度最大值;Am为初始烟花爆炸半径,用来调整每次爆炸半径的大小;ymin为是当前烟花种群中适应度最小值;i表示迭代次数;ξ代表计算机常量的最小值,用来避免除零。

在烟花爆炸过程中,产生的火花可能会超出可行域Ω的边界范围,当火花xi在维度k上超出边界,将通过下公式的映射规则映射到一个新的位置。

(10)

g=gaussain(1,1)

(11)

(12)

为使烟花种群中优秀的信息能够传递到下一代种群中,在产生爆炸火花和高斯变异火花后,算法会在候选者集合(包括烟花、爆炸火花和高斯变异火花)中选择一定数量的个体作为下一代的烟花。假设候选者集合为K,烟花种群大小为N。候选者集合中适应度值最小的个体会被确定性地选择到下一代作为烟花,剩下的N-1个烟花的选择是基于其与其他点的距离,距离的定义如下:

(13)

剩余烟花被选择的概率的计算公式为:

(14)

3 实验数据及分析

3.1 数据预处理

本文所用到的实验数据来自宾夕法尼亚新泽西-马里兰观测系统,这是一个美国的完善的电力市场。包括18个月的小时观测,从2015年1月1日到2016年6月31日共13 104个小时的数据。

在SVM中对于输入数据的预处理本文采用如下办法:首先对于一些缺失数据采用其相邻数据的平均值进行代替;其次本文采用线性转化的方式将数据成比例的转化到[0,1]区间内。这样做有两个好处,第一是避免了大范围的数据属性,将数据属性限定在一个较小范围,第二是较小的数值有利于减少计算据量。具体的预处理方法如下:

(15)

式中:x是原始数据;x′是处理后数据;maxA和minA分别为输入样本集A的最大值和最小值。最终将得到的预测数据反线性变换回去,得到最终的预测数据,与实际值进行比较从而得到实验结果。

3.2 实验结果及分析

分析短期电力负荷曲线的变化趋势,考虑小时负荷曲线周期性的变化规律,本文选取预测负荷的前一天的小时负荷、前30天同一时段的小时负荷以及当时的风速、温度、湿度作为预测模型的输入向量集。本次实验采用MATLAB 2016a进行仿真,电脑采用英特尔酷睿双核CPU 5750及2G内存。

评价一个预测模型的性能的评价标准有很多,不同的评价指标反映的是模型不同的方面的性能。本文采取了其中的两种评价标准对提出模型进行评估:(1)平均绝对百分误差(MAPE);(2)平均绝对比例误差(Mean Absolute Scaled Error, MASE)。两个评估参数的具体其定义见表2。

表2 评价参数定义

MAPE反映了实际值与预测值之间的误差的百分比。MASE是一个比例误差,具体由来见文献[18],它越小说明模型预测越精确。两种种评价标准的实验结果如表3、表4所示。

表3 MAPE参数对比

表4 MASE参数对比

从表格中可以看出,无论是MAPE还是MASE本文提出的模型与未经优化的SVM模型相比都有提高。其中MAPE参数提高了1%。而MASE参数也有所提高,从而证明本文提出的全过程优化SVR模型的有效性。

图1为2016年1月31日的小时负荷预测曲线,其中红色的为实际负荷曲线,黑色的为预测负荷曲线。从图中可以看出,这一天的预测值仅在刚开始的几个小时有较大误差,随后误差较小,所预测的负荷变化趋势与实际变化趋势完全符合。

图1 2016年1月31日小时负荷预测曲线

图2 2016年前90天小时负荷预测曲线

图2为2016年前90天的小时负荷预测曲线,共包含2 160个小时的数据。其中上面两条曲线是实际电力负荷曲线和运用本文全过程优化SVM模型的预测曲线,最下面的曲线为两者的误差值曲线。从图中可以看出预测曲线的变化趋势与实际负荷的变化趋势基本符合,两者的误差曲线也无明显波动,从而说明了本文模型的稳定性。

4 结论

电力负荷预测是电力系统可靠、经济、安全运行的基础。本文针对现有的局部优化负荷预测模型存在的三方面的问题,提出了一种全过程优化支持向量机模型,提高了短期电力负荷预测的准确度。首先针对输入特征集的优化问题上,采用模糊C均值聚类算法对输入特征集进行处理;然后通过比较核函数在非线性映射能力、参数数量、数值限制条件和全局性方面的特点,采用一种组合核函数作为支持向量机预测的核函数,解决了目前核函数选取单一的问题;最后为了解决参数优化问题,提高预测精度,采用了爆发性、隐并行性、多样性和瞬时性好的烟花算法对支持向量机的参数进行优化。针对实际案例实验表明本文提出的模型与未经优化过的模型进行比较,发现预测精度从各个方面都有显著提高。预测结果表明未经优化的支持向量机的平均绝对百分误差为4.17%,采用烟花算法的局部优化模型的平均绝对百分误差为3.25%,而本文提出的全过程优化支持向量机模型的平均绝对百分误差为2.28%。

猜你喜欢
烟花向量负荷
国庆烟花秀
向量的分解
聚焦“向量与三角”创新题
放烟花
烟花
烟花
防止过负荷时距离保护误动新判据
主动降负荷才是正经事
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线