基于HP滤波的SARIMA中期电力负荷预测

2016-08-16 02:30崔和瑞穆玉佩
关键词:季节性滤波负荷

崔和瑞,穆玉佩,彭 旭

(华北电力大学 经济与管理学院,河北 保定 071003)



基于HP滤波的SARIMA中期电力负荷预测

崔和瑞,穆玉佩,彭旭

(华北电力大学 经济与管理学院,河北 保定 071003)

在用时间序列模型做电力负荷预测时,季节性是中期负荷预测重点分析的因素项。对全国2004年1月到2013年12月的电能消耗数据建立SARIMA模型,在模型定阶和参数显著性检验中发现,季节性因素的参数在调整过程中多数情况下不显著,这与季节性本身相矛盾,不利于SARIMA模型建立后的预测过程。鉴于这种情况,对原序列进行修整,将HP滤波法应用到ARIMA模型建立之前,提取不同频率的波谱序列。并运用OLS法分别建立模型进行分析,弱化趋势性、季节性等因素之间的相互作用,最后根据HP滤波原理对2014年1月到11月的电能消费量做出综合预测。从预测结果看,这种方法可以降低由序列趋势性、季节性等因素相互影响产生的相对误差,提高预测精度。

电力负荷;SARIMA模型;HP滤波;曲线拟合;长记忆性

0 引 言

中期电能消耗在一定程度上,受到往期消耗量和季度的影响,其中还包含一些突发事件所引起的耗电量波峰等。这些因素以目前的预测技术,暂时被区分为趋势性、季节性、周期波动性、不规则变动等。在负荷预测建立模型时,这几个方面对整体序列的影响相互叠加,形成负荷预测中建立模型的一大难点。

在国内外关于中期电力负荷预测的文献中,相对于神经网络模型[1],考虑到季节性因素的时间序列模型更符合序列规律的分析。A.Azadeh等[2]通过模糊系统和数据挖掘技术,对伊朗的电能需求做出预测,充分考虑到了季节性等因素,相较于普通OLS方法明显降低了预测误差。同样,在考虑到电力需求的季节性、趋势性等因素的前提下,应用SVM模型进行电能需求预测分析,也比普通OLS法预测误差小[3]。而对于趋势性,可以通过优化GM(1,1)模型以及结合神经网络模型进行分析[4-6]。可见在中期负荷预测中,趋势性、季节性等因素是影响负荷预测精度的关键因素。SARIMA模型消除了季节性和不规则变动要素的影响,常用于月度电能消耗的预测[7-8]。针对趋势性、季节性、周期性等,序列分解常被用于这类的叠加效应分析过程[9-10]。其中,应用Hodrick-Prescott(HP)滤波法对趋势项、周期项等进行分解,在模型的建立上有一定的优越性。学者何永秀等[11]在对能源价格进行分析时,采用了HP滤波法,通过分离序列的趋势性和波动性,进而分析中国市场与国际市场的同步性。

1 理论分析

1.1ARMA模型建立及预测

1.1.1SARIMA模型的建立及预测

季节型自回归移动平均模型(Seasonal Auto- regressive Integrated Moving Average, SARIMA)是以传统ARMA模型为基础,以季节性因素为调整对象整理所得的时间序列模型[12-13],即

(1)

式中:L是后位移算子;φp(L)、θq(L)、ΦP(L)、ΘQ(L)分别是AR、MA、SAR以及SMA的滞后算子多项式;εt是白噪声序列。

在做季节型时间序列分析时,有三个问题应重点分析:①平稳性检验;②季节性分析;③SARIMA型定阶及预测。下面逐次介绍上面的三个问题。

平稳性检验:时间序列yt平稳是建立ARMA模型的前提,当其满足以下三个条件时,称序列yt为弱平稳或协方差平稳:

(2)

对序列yt进行ADF单位根检验,若yt为非平稳序列,对其进行差分变换直至平稳。令wt=Δdyt表示yt经d阶单整得到的平稳序列。

季节性分析:首先定义自相关函数:

(3)

(4)

1.1.2长记忆性检验原理

时间序列的长记忆性检验是由Hurst在1951年提出的,主要应用于对序列随机游走过程的检验。针对模型定阶分析过程中,产生的高阶问题,本文采用重标极差分析 (R/S)方法对序列进行了长记忆性检验,原理如下[14-16]:

(5)

③根据赫斯特指数的值H,结合长记忆性的判断准则如公式(6),判断序列的长记忆性。

(6)

1.2分析方法改进原理

1.2.1Hodrick-Prescott滤波法

Hodrick-Prescott(HP)滤波法[12-13]是由Hodrick和Prescott在分析战后美国经济周期的论文中首次提出,是一种将经济时间序列看做波谱并进行分析的方法。这种方法将原序列分为两组:带长期趋势性的序列 G={g1,g2,…,gn}和带短期波动性的序列C={c1,c2,…,cn},它们与原序列的关系是:

(7)

序列分离过程必须满足损失函数最小原则:

(8)

1.2.2模型建立及误差分析

改进模型建立的基础是将原序列通过滤波分析一分为二,然后根据所得到的序列特点,建立模型做预测分析。具体步骤如下:

(9)

(10)

⑧根据HP滤波原理,得到原序列的预测结果:

(11)

⑨对模型预测结果进行误差分析,检验的误差类型包括相对误差(Relative Error,RE):

(12)

均方误差(Mean Squared Error,MSE):

(13)

平均绝对百分误差(Mean Absolute Percentage Error,MAPE):

(14)

平均绝对误差(Mean Absolute Error,MAE):

(15)

图1 基于HP滤波的组合模型流程图Fig.1 Model flow chart based on HP filter

2 实证分析

本例证中选取了中国2004年1月~2014年11月的全社会电力消耗量作为研究数据,其中2004年1月至2013年12月的数据作为模型建立的参考数据,2014年1月至2014年11月的数据用于计量预测误差,如图2所示。

图2 2004年1月~2013年12月全国电力消耗量Fig.2 Monthly electricity consumption data of the country from January 2004 to December 2013

2.1SARIMA模型

从图2中可知原序列存在截距项与趋势项,且原时间序列是非平稳的。对原数据做带有截距项和趋势项的ADF单位根检验,检验结果如表1。

表1 关于电能消耗一阶差分的ADF单位根检验

通过ADF检验可知,在5%的显著水平下,原序列的一阶差分平稳。观察一阶差分序列的自相关函数图,得出周期为12的季节变动规律。又由于一阶差分序列存在负值,选择季节型加法模型对原序列进行调整,并对调整后的序列进行相关性分析。

在95%的置信水平上,相关系数的置信区间为

(16)

根据相关性分析可知偏自相关系数在1,2,11处,自相关系数在1,11,13处均在置信区间之外,由此建立SARIMA模型。并以相关系数的显著性作为模型调整的依据,得到参数估计结果计入表2。

如表2所示,对ARIMA(11,1,13)(1,1,1)12模型参数的t统计量进行分析,并采用逐一剔除不显著项的方法对模型进行定阶调整。其中SMA(1)项系数检验结果中,P=0.11远大于置信水平0.05,拒绝参数显著性假设。说明季节性随机干扰因素对电能消耗量的变动产生了影响,但是相对于电能前期消耗量、周期性消耗量、非季节性干扰因素等对未来耗能的影响,这种影响是不显著的。

表2 季节型ARIMA模型的参数估计值

建立模型ARIMA(11,1,13)(1,1,0)12,根据t检验结果,依次剔除参数项AR(11)、MA(13),得到ARIMA(2,1,11)(1,1,0)12模型。对模型做参数显著性检验,并将t检验值计入表2,计算得出P值均小于置信水平0.05,模型参数显著。其中非季节自回归项为AR(1)、AR(2),非季节移动平均项为MA(1)、MA(11),季节自回归项SAR(1)。根据此模型对2014年1月到11月份的用电量进行预测,并将预测值计入表6。

在模型定阶分析过程中发现,非季节性移动平均项MA(11)的存在对模型建立及预测有显著影响。这说明即使距离预测值较远的数据,所产生的误差等随机因素对现期预测也是有影响的。但是通过定阶调整可知,季节性随机因素对未来电能消耗量的影响不显著。本文认为导致这种数据影响出现的原因是:月度电力消费数据可能存在长记忆过程。

假设存在长记忆性,用R/S方法进行检验:

(17)

H=0.837

(18)

根据序列长记忆性判断准则有:0.5<0.837<1,因此电力消耗的月度时间序列存在长记忆过程。即较远时段的观测值会对现期预测产生影响,除了受季节性和周期性的影响外,与数据序列存在长记忆性也相关。

2.2曲线拟合预测模型

(19)

(20)

应用Matlab软件得到拟合多项式为

G=-0.000 017 501 9×t4+0.004 222 9×t3-

0.288 568 3×t2+29.516 060×t+1 556.294

(21)

根据式(19)对2014年1月至11月的电能消耗量进行预测,并将预测值计入表6。

2.3基于HP滤波法的组合预测模型

图3 HP滤波法序列分离图Fig.3 Data separation based on HP filter

图4 2004年1月~2013年12月序列曲线拟合的相对误差图Fig.4 Relative error of the curve fitting about sequence {G} from January 2004 to December 2013

拟合多项式为

G=-0.000 015 186 5×T4+0.003 629 0×T3-

0.239 788 0×T2+28.156 179 0×T+1 564.292

(22)

表3 序列的预测值

图5 序列{C}一阶差分的自相关图Fig.5 Correlogram of d{C}

表4 ARIMA模型的参数估计值

表5 序列的预测值

表6 2014年1月~11月电力负荷预测结果

根据表6对预测值进行相对误差分析,并将误差计入表7。

表7 模型预测相对误差

由表7可知,通过OLS多项式曲线拟合进行预测分析时,这种拟合方式对序列的整体平滑走势预测效果较好,但是对波动性预测效果较差,所以模型对各个月份的预测精度均较低,相对误差最大达到了21.33%。而SARIMA模型中由于月度数据的季节波动性与趋势性之间的相互作用,随着预测区间的延长,预测精度下降,7月份之后的预测误差均值为3.533%,明显大于前六个月的预测误差均值1.901%。

根据表7做出相对误差绝对值的曲线图,如图6所示,首先曲线拟合的相对误差整体偏大,11个月份均不能得到最优的预测结果。SARIMA模型在对3月、5月和6月的耗电量预测中拟合精度相对较高,但是整体趋势上,改进模型对其他月份的拟合效果均比SARIMA模型好。而且进行长期预测时,在7月份到11月份,改进模型的预测结果都是最优的。

图6 模型预测相对误差的绝对值Fig.6 The absolute value of relative error

分析三个预测模型的均方误差、平均绝对百分误差和平均绝对误差,并将数值计算结果计入表8。

表8 模型预测误差

如表8所示,三个模型中改进模型的均方误差值最小,说明改进模型的预测能力最稳定,预测精度最高。观察平均绝对百分误差,其中改进模型对应的误差值是1.82%,小于SARIMA模型的2.643%、曲线拟合模型的6.428%,说明改进模型的预测结果与真实值的差距最小,预测效果最好。通过对模型进行平均绝对误差的比较,也可以发现改进模型的误差值是最小的。所以从整体预测效果分析,改进后的模型提高了电力能源月度消耗量的预测精度。

3 结 论

(1)本文将HP滤波法应用到时间序列的数据调整中,将原序列分解成带不同周期性和趋势走向的序列,应用SARIMA模型和多项式曲线拟合组合预测的方法,减弱了时间序列不同波动项之间的相互干扰。从预测结果中分析,随着预测时段的延长,改进后模型具有更精确的预测效果,同时也保证了多步预测的精度。

(2)R/S方法的检验结果说明,月度电能消耗存在长记忆过程。这一结论,可能是由于受到数据量的干扰产生的。而从实际定阶分析上看,高阶自回归项或移动平均项影响到了电力负荷的预测结果,所以在用时间序列做中期电力负荷预测时,可以考虑其长记忆过程,结合季节型分形自回归聚合滑动模型进行分析。

[1] 陈强,金小明,姚建刚,等.基于改进ABC算法的中长期电力负荷组合预测[J].电力系统保护与控制, 2014, 42(23): 113-117.

[2] AZADEH A, SABERI M, GHADERI S F, et al. Improved estimation of electricity demand function by integration of fuzzy system and data mining approach[J]. Energy Conversion and Management, 2008, 49(8): 2165-2177.

[3] MATTEO De Felice, ANDREA Alessandri, FRANCO Catalano. Seasonal climate forecasts for medium -term electricity demand forecasting[J]. Applied Energy, 2015, 137 : 435-444.

[4] COSKUN Hamzacebi, HUSEYIN Avni Es. Forecasting the annual electricity consumption of Turkey using an optimized grey model[J]. Energy, 2014, 70: 165-171.

[5] 牛东晓, 孟明. 季节型增长趋势电力消费预测研究:基于中国的实证分析[J].中国管理科学, 2010, 18(2):108-112.

[6] 牛东晓, 陈志业, 邢棉, 等. 具有二重趋势性的季节型电力负荷预测组合优化灰色神经网络模型[J]. 中国电机工程学报,2002,22(1):30-33.

[7] WANG Yuanyuan, WANG Jianzhou, ZHAO Ge, et al. Application of residual modification approach in seasonal ARIMA for electricity demand forecasting: A case study of China[J].Energy Policy, 2012,48:284-294.

[8] 乔占俊. 基于Census X12-SARIMA模型的中长期负荷预测[J].电力系统及其自动化学报,2014, 28(1): 34-38.

[9] 马哲, 舒勤.基于ESPRIT分解算法的短期电力负荷预测[J]. 电力系统保护与控制, 2015,43(7): 90-96.

[10] ZHU Xiaomeng, LUAN Weixin, ZHU Yisheng. Analysis of macroeconomic time series by the HP filter[C].2011 International Conference on E-Business and E-Government, ICEE 2011-Proceedings, 2011, 3003-3006.

[11] HE Yongxiu, WANG Bing, WANG Jianhui, et al. Correlation between Chinese and international energy prices based on a HP filter and time difference analysis[J]. Energy Policy, 2013, 62: 898-909.

[12] PINDYCK Robert S,RUBINFELD Daniel L. Econometric Models and Economic Forecasts(4thEdition) [M]. China Machine Press,1999.

[13] 樊欢欢, 张凌云.EViews统计分析与应用[M].北京:机械工业出版社,2009.

[14] 朱慧明, 林静. 贝叶斯计量经济模型[M].北京:科学出版社,2009.

[16] LAHIANI, Scaillet O. Testing for threshold effect in ARFIMA models: Application to US unemployment rate data [J].Science Direct, 2009, 25(2): 418-428.

[17] 陈果. 基于遗传算法的ARMA模型定阶新技术[J].机械工程学报,2005,41(1):41-45.

[18] YOSHIHIRO Ohtsuka, UAKASHI Oga, KAZUHIKO Kakamu. Forecasting electricity demand in Japan: A Bayesian spatial autoregressive ARMA approach[J]. Computational Statistics and Data Analysis, 2010, 54(11): 2721-2735.

Medium-term Power Load Forecasting Based on SARIMA Model with HP Filter

CUI Herui, MU Yupei, PENG Xu

(School of Economics and Management, North China Electric Power University, Baoding 071003, China)

The seasonal component has been a key factor in time series models for medium-term power load forecasting. A Seasonal-ARIMA (SARIMA) model is developed based on the electricity consumption data from January 2004 to December 2013. During the model order selection and the parameter significance testing, the parameters of seasonal components turn out to be quite non-significant in most cases. And that is not conducive to forecast the data. To address this issue, the hybrid time series model based on the HP filter is utilized to extract the spectrum sequences with different frequencies before the model is established. Then the sequences are separated into two parts, each for setting up a model to analyze interactions among various factors including trend component and seasonal component. Finally, based on the HP filter principle, an integrative forecast can be made for the electricity consumption from January to November in 2014. Experimental results demonstrate the new method reduces the relative error caused by the interaction between the trend component and the seasonal component and make more accurate forecast.

power load; SARIMA model; HP filter; curve fitting; long-memory

10.3969/j.ISSN.1007-2691.2016.04.13

2015-11-06.

国家自然科学基金资助项目(71471061).

崔和瑞(1967-),男,教授,研究方向为电力系统分析、能源系统理论与政策; 穆玉佩(1990-),女,硕士研究生,研究方面为电力市场经济分析、经济计量分析与预测;彭 旭(1990-),男,硕士研究生,研究方向为电力能源消耗、经济计量分析。

TM714

A

1007-2691(2016)04-0079-08

猜你喜欢
季节性滤波负荷
3项标准中维持热负荷要求对比分析
粕类季节性规律:豆粕篇
Opening flexible resources by integrating energy systems: A review of flexibility for the modern power system
季节性需求放缓 钾肥价格下行
蔬菜价格呈季节性回落
远离季节性过敏
主动降负荷才是正经事
基于自适应Kalman滤波的改进PSO算法
RTS平滑滤波在事后姿态确定中的应用
基于线性正则变换的 LMS 自适应滤波