基于改进模糊支持向量机方法的车尔臣河径流预报

2016-04-13 03:25
水资源开发与管理 2016年1期
关键词:支持向量机

曹 伟

(新疆水利水电科学研究院, 新疆 乌鲁木齐 830049)



基于改进模糊支持向量机方法的车尔臣河径流预报

曹伟

(新疆水利水电科学研究院, 新疆 乌鲁木齐830049)

【摘要】针对径流时间序列固有的非线性和随机性特点,本文提出了基于灰色关联分析的模糊支持向量机预报方法。该方法在传统支持向量机任意逼近的非线性映射能力上,引入模糊隶属函数来考虑气候和流域下垫面变化下径流样本对预报结果的影响。此外,预报因子选取是中长期径流预报的一大难点,考虑到相关系数法只能衡量因子间线性相关程度的不足,本文采用灰色关联分析来量化预报因子与预报对象的关联程度,并按关联度大小挑选出对径流过程影响显著的预报因子。将该方法应用于新疆车尔臣河的月径流预报中,与GRNN神经网络模型和A-FSVM模型的预报结果比较表明:该方法能提高径流中长期预报精度,是一种有效的径流时间序列预测模型。

【关键词】支持向量机; 车尔臣河; 径流预报

径流中长期预报由于具有较长的预见期,在防汛抗旱、水资源优化配置等方面具有重要意义。然而径流的形成受到水文、地形、气象等诸多因素的影响,呈现高度的非线性和随机性特征[1],依据传统的预报方法难以描述其变化规律。支持向量机建立在统计学习中的VC维理论和结构风险最小原理基础上[2],它将具体问题转化为一个二次型寻优问题,较好地解决了小样本、非线性、高维数和局部极小点等实际问题[3]。传统的支持向量机模型对所有样本点都等同处理,实际上在描述径流预测问题时,由于气候和流域下垫面条件的变化[4],近期的样本较远期样本更能反映水文系统当前状态,因此,根据重要性的不同,输入样本应有不同的误差要求。Chun-Fu Lin将模糊数学和支持向量机结合起来,提出模糊支持向量机[5],可以很好地解决上述问题。通过引入模糊隶属度函数,调整不同时期样本点对预测结果的贡献程度,提高了模型鲁棒性。

如何选择合适的预报因子对中长期径流预报精度的提高有重要影响,传统相关系数法因考察因子间线性相关程度而广泛应用于预报因子的筛选。然而,径流过程及其影响因素是随机非线性的,两个因子之间的线性关系不好并不能排除这两个因子之间非线性关系很好的可能性[6]。灰色关联分析是灰色系统理论的重要组成部分,通过因素间时间序列的比较来确定哪些是影响大的主导因素,该方法弥补了采用数理统计方法作系统分析需要大量样本数据、需要典型概率分布、计算量大的缺陷,对样本大小和数据有无规律都同样适用[7]。鉴于此,本文引入灰色关联分析来挑选预报因子。该方法对因子间相关性具有更全面的分析能力,能提高中长期径流预报的精度。

1方法介绍

1.1灰色关联分析

灰色关联分析通过研究系统发展演变过程中具有复杂关系的灰色因子变量之间相对变化趋势是否一致,找出影响系统发展的优势与劣势因素,主导、潜在因素,定量描述系统发展变化态势[8]。灰色关联分析非常适合动态历程分析,在系统发展过程中,若两个因素变化的趋势具有一致性,则二者关联程度较高;反之,则较低。该方法具有原理简单、排序明确、对数据相关类型无特殊要求的特点,具有极大的实际应用价值。

设X0={x0(1),x0(2),…,x0(n)}为特征序列,Xi={xi(1),xi(2),…,xi(n)},i=1,2,…,m为相关因素序列。首先对时间序列进行无量纲化处理,求各序列的初值像:

(1)

(2)

(3)

关联度计算公式如下:

(4)

1.2模糊支持向量机回归

1.2.1支持向量机

支持向量机回归(SVM)通过定义合适的核函数实现从输入空间到高维特征空间的非线性变换,在这个特征空间中求取最优线性分类面,使分类平面与最近点(支持向量)之间的距离最大,然后将SVM问题转化为一个二次规划问题,从而求解。SVM能使无法用线性函数拟合或线性拟合精度较差的问题在高维空间中,达到较好的线性拟合效果,因此,SVM增强泛化性能的同时不增加问题求解的复杂度[9]。

根据统计学原理,SVM的拟合函数为

(5)

式中, X∈RD,Y∈R,X为输入;y为相应的输出;W为空间超平面;b为偏置量,通过非线性射Φ将数据映射到高维特征空间。

根据结构化风险最小原理,拟合函数估计问题可以等价为:

(6)

引入函数K(xi,x),得到f(x)表达式如下:

(7)

常用的核函数主要有线性核函数、多项式核函数、径向基核函数与两层感知核函数等。核函数的合理选取有助于提高模型精度,故本文选择径向基核函数作为SVM核函数。

1.2.2模糊支持向量机及隶属度函数

径流的形成受到水文、气象等诸多因素的影响。由于时间推移,气候及流域下垫面变化,径流时间序列不同时期样本点,对预测结果的贡献并不相同,因此,上述支持向量机模型中,每个样本点具有相同影响程度的计算方法并不合理。模糊支持向量机将模糊集理论的中隶属度概念引入到支持向量机中,通过选择模糊隶属度函数,突显近期样本对预测结果的影响。设原始样本点(Xi,yi),其中Xi是预报因子,yi是预报变量,1≤i≤N,N为样本长度,引入隶属度si将原来的样本点(Xi,yi)扩展为(Xi,yi,si),si是时间序列ti的函数,即si=f(ti)。

f为模糊隶属度函数,边界f(t1)=α,f(tN)=1(0<α≤1),即时间序列中的第一个样本xi对最终预测贡献最小,最后一个样本xN对最终预测贡献最大。本文中模糊隶属度函数采用其中的2次逼近模糊隶属度函数:

(8)

1.3计算步骤

基于灰色关联分析的模糊支持向量机方法的径流预报步骤如下:ⓐ确定径流预报的输入因子,采用灰色关联分析计算因子与预报径流的关联程度;ⓑ按照关联度大小,挑选对径流过程影响程度大的预报因子;ⓒ采用两次逼近模糊隶属度函数计算不同时期样本点模糊隶属度si,将样本点(xi,yi)扩展为(xi,yi,si);ⓓ以径流实测值和预报因子作为样本,采用SCE-UA算法进行FSVM最优参数辨识;ⓔ以优选的参数值作为FSVM参数,采用训练样本对其进行训练,建立FSVM模型;ⓕ根据建立的灰关联模糊支持向量机模型对检验期样本进行预报,验证模型预报性能。

2模型应用

车尔臣河位于新疆塔里木盆地东南缘的巴音郭楞蒙古自治州且末县与若羌县境内。河流发源于昆仑山北坡的木孜塔格峰(海拔6973m),上游汇集昆仑山、阿尔金山诸冰川支流,为冰雪融水与地下水混合补给型河流,全长813km,流域面积4.86万km2,其中山区集水面积2.47万km2。车尔臣河历史上曾经是塔里木河水系“九源一干”之一,河流出山口(大石门水库处)多年平均径流量7.96亿m3,下游且末水文站多年平均径流量5.62亿m3。本文选用且末水文站1961—2005年共45年月径流资料,对该站进行径流中长期预报研究,其中1961—2000年月径流过程作为模型训练样本、2001—2005年的月径流过程作为模型检验样本。

2.1挑选预报因子

预报建模中通常未来值和过去值存在某种确定的函数关系,利用过去的观测值估计未来值是一种行之有效的方法,选取预报月前12个月径流量作为初选预报因子,采用灰色关联分析计算各初选预报因子与预报径流的关联程度如下:γ1=0.79,γ2=0.72,γ3=0.66,γ4=0.68,γ5=0.72,γ6=0.69,γ7=0.56,γ8=0.65,γ9=0.76,γ10=0.82,γ11=0.84,γ12=0.81。

同时作为对比,采用自相关函数方法挑选预报因子γ1,γ2,γ5,γ6,γ7。

2.2基于灰色关联分析的模糊支持向量机预测

首先根据流域特点及综合特性选取模糊隶属度α=0.7。本文支持向量机的核函数选取的是径向基函数,因此支持向量机预测方法含有3个参数:c,ε,σ。SCE-UA方法融合复合型搜索技术和自然界中的生物竞争进化原理,具有很好的参数辨识能力,本文选用SCE-UA算法用于参数寻优,得到模型正规化参数c=0.32,ε=0.01,σ=1.87。

为论证模糊支持向量机回归的有效性,选用GRNN神经网络模型进行模拟和预测,GRNN的输入与G-FSVM的相同;另外,为证明灰色关联分析挑选预报因子的优势性,采用模糊支持向量机进行预测,预报因子采用由自相关函数方法挑选出的预报因子(A-FSVM)。

下表给出了检验期为60个月的预报误差统计结果,包括模型平均相对误差(MRE)与标准差。首先G-FSVM和GRNN相比较,G-FSVM预报结果的平均相对误差(3.16%)小于GRNN神经网络模型(6.10%),其标准差也明显小于GRNN模型,因此FSVM相较于神经网络模型具有更高的预报性能。G-FSVM和A-FSVM相比较,G-FSVM和A-FSVM预测效果基本相同,两种模型均具有较高的预报能力,但G-FSVM预报结果的各项指标明显优于A-FSVM,因此本文基于灰色关联分析挑选预报因子方法优于相关系数法。由此可知,基于灰关联分析的模糊支持向量机模型较传统模型预报精度更高,泛化能力更强,是一种可靠有效的径流中长期预报模型。

模型预报误差统计对比表

3结语

本文建立了基于灰色关联分析的支持向量机模型。该模型考虑气候和流域下垫面条件变化对径流的影响,将模糊集理论中的模糊隶属度引入到支持向量机方法中,使样本数据能根据重要性的不同而具有不同的误差要求。令近期样本具有较高的模糊隶属度,远期样本点具有较低隶属度,从而使反映气候和流域下垫面近期状态的样本点对径流预报结果产生更重要的影响。同时,该方法采用灰色关联分析挑选预报因子,克服了传统数理统计方法考察因子间线性相关程度,出现定性分析与定量分析不符的缺陷。将本文提出的方法与A-FSVM和GRNN神经网络在实际水文系统模拟的对比分析表明:采用灰色关联分析挑选月径流预报的预报因子优于传统相关系数法,基于灰色关联分析的模糊支持向量机模型预报结果极大提高了传统模型的预测精度和泛化能力,是一种可靠有效的径流中长期预报模型。

参考文献

[1]王文圣,丁晶,李跃清.水文小波分析[M].北京:化学工业出版社,2005.

[2]Comes C,Vapnik V. Support-vector networks[J].Machine Learning,1995,20(3):273-297.

[3]Vapnik V N. Statistical Learning Theory[M].New York:Wiley,1998.

[4]贾仰文,高辉.气候变化对黄河源区径流过程的影响[J].水利学报,2008(9):52-58.

[5]Lin CF, Wang SD.Fuzzy support vector machines[J].IEEE Transaction on Neural Networks,2002,13(2):464- 471.

[6]汤臣友,官学文.现代中长期水文预报方法及其应用[M].北京:中国水利水电出版社,2008.

[7]邓聚龙.灰色预测与决策[M].武汉:华中理工大学出版社,1988.

[8]王军玺,刘严如,李月娇.基于区域发展目标的兰州市水资源可持续承载能力预测研究[J].水利建设与管理,2013(3):81-86.

[9]宓永宁,陈默,张茹.灰色拓扑法在大伙房水库总氮预测中的应用[J].水利建设与管理,2009(3):72-73.

Qarqan River runoff forecast based on improved fuzzy support vector machine method

CAO Wei

(XinjiangWaterResourcesandHydropowerResearchInstitute,Urumqi830049,China)

Abstract:In the paper, fuzzy support vector machine forecast method based on grey correlation analysis is proposed aiming at inherent nonlinear and randanicity of runoff time series. Fuzzy membership function is introduced into the method on randomly approximate nonlinear mapping ability of traditional support vector machine. Influence of runoff sample on forecast results under underlying surface change in climate and river basin is considered. In addition, selection of forecast factor is a major difficulty in medium and long-term runoff forecast. The defect that correlation coefficient method only can be used for measuring linear correlation degree among factors is considered. The method is applied in month runoff forecast of Qarqan River in Xinjiang, and it is compared with forecast results of GRNN neural network model and A-FSVM model. The results show that the method can improve medium and long-term forecast precision of runoff, and it is an effective runoff time series forecast model.

Key words:support vector machine; Qarqan River; runoff forecast

中图分类号:TV143

文献标志码:A

文章编号:1005- 4774(2016)01-0053-04

DOI:10.16616/j.cnki.10-1326/TV.2016.01.015

猜你喜欢
支持向量机
基于支持向量回归机的电能质量评估
基于智能优化算法选择特征的网络入侵检测
数据挖掘技术在电厂经济性分析系统中的应用Q
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
管理类研究生支持向量机预测决策实验教学研究