基于模糊C均值聚类和支持向量机算法的燃煤锅炉结渣特性预测

2014-09-22 02:04王宏武孙保民张振星康志忠
动力工程学报 2014年2期
关键词:结渣训练样本均值

王宏武, 孙保民, 张振星, 信 晶, 康志忠

(华北电力大学 电站设备状态监测与控制教育部重点实验室,北京102206)

目前,由于煤炭市场供应紧张,电站锅炉燃用煤种多变且煤质持续下降,实际燃用煤质偏离锅炉设计要求的情况较多,导致燃煤锅炉受热面结渣问题日益突出,严重影响了锅炉运行的经济性和安全性.燃煤锅炉结渣是一个复杂的物理化学过程,不仅与燃煤本身的特性有关,还与炉膛尺寸结构、炉膛的温度场及炉内空气动力场有关.因此,对燃煤锅炉结渣情况进行及时准确的预报显得尤为重要.随着对结渣机理及其影响因素的深入研究,近年来国内外已开发出多种燃煤锅炉结渣的诊断和预测技术[1-5].

目前针对锅炉结渣情况的评判方法有单指标评判方法和多指标评判方法.单指标评判方法利用影响锅炉结渣的某一项指标来对锅炉结渣情况进行评判,单一评判指标包括煤质特性和锅炉动态运行特性,但该方法存在准确率偏低的问题.多指标评判方法是将几个评判指标综合起来预测煤结渣特性的方法,包括模糊数学、模式识别、神经网络和支持向量机等方法.

模糊综合评判法是由邱建荣等[6]针对单指标评判混煤结渣特性准确率偏低的缺陷而提出的,将4种常规的煤灰特性指标构成评判因素集,经加权计算得到综合指数R,从而对锅炉结渣特性进行预测.运用模糊神经网络对煤灰结渣特性进行预报,不仅考虑了燃煤电厂结渣评判时的模糊性,同时兼顾神经网络模型自适应能力强的优点.钱诗智等[7]所建模型采用3层BP神经网络,通过对模型训练并进行验证,表明除对混煤的评判结果与实际情况稍有差别外,对单一煤种的评判均与实际情况相符.徐创学等[8]基于大量样本试验数据,建立了人工神经网络结渣预测模型.徐志明等[9]建立了最小二乘支持向量回归机燃煤锅炉结渣预测模型,对5台锅炉结渣特性进行预测,取得了较好的预测结果.

支持向量机(SVM)是 Vapnik[10]及其同事于1995年提出的一种新的机器学习方法,目前已成为模式识别和数据挖掘等领域的重要研究手段[11].笔者提出一种基于模糊C均值聚类算法(FCM)预处理的支持向量机模型来预测锅炉结渣特性,模糊C均值聚类算法可以真实地反映锅炉结渣的模糊性和不确定性[12-13],可以克服上述方法的缺点.根据不同数据样本点对产生最优超平面各有不同重要性的原则,应用模糊C均值聚类算法模糊预处理数据,并且最小化成本函数惩罚项,然后用凸二次规划求解约束优化问题的对偶形式,最后得到原问题的最优超平面.与常规支持向量机相比,该算法首先对训练样本集依据不同样本相似度特征进行聚类分析,并根据不同类别分别建立支持向量机预测模型,使得每个支持向量机预测模型只保留最优超平面附近的样本点,去除远处样本点,减小冗余及训练样本集过拟合度,提高了预测精度.

1 模糊C均值聚类算法

1.1 模糊C均值聚类算法原理

模糊C均值聚类算法是由 Dunn[14]和Bezdek[15]提出的一种聚类算法.在模糊聚类划分中,每一个样本不是严格地划分为某一类,而是以一定的隶属度属于某一类.通过模糊聚类可以得到每个样本属于各个类别的隶属度.

假设样本集为X={x1,x2,…,xn},模糊聚类就是将X 划分为c类(2≤c≤n),V={v1,v2,…,vc}是c个聚类中心.整个样本集的聚类情况由1个隶属度矩阵U表示

式中:uik表示第k个样本属于第i类的隶属度,0≤

为了在模糊空间MFCM中获得一个最佳的模糊分类,采用如下的模糊C均值聚类准则

式中:dik=‖xk-vi‖,为样本xk与聚类中心点vi之间的距离,一般采用欧几里得距离;m为模糊加权指数,通常取m=2;JFCM(U,V)表示各类样本到聚类中心加权距离的平方和,权重是样本xk对第i类隶属度的m次方.

模糊C均值聚类准则为求JFCM(U,V)的极小值.模糊C均值聚类算法的具体步骤如下:

(1)设定聚类数目c、模糊加权指数m和初始隶属度矩阵U0,迭代步数I=0.

(2)计算聚类中心V

(3)修正U

1.2 分类判别方法

对于检验样本类别的判断,采用欧几里得距离进行判别.设检验样本为x′,与第i个聚类中心的欧几里得距离为

判别规则为:若Di=argvi∈Vmin{d(x′,vi)},则x′属于第i个类别.

2 支持向量机算法

支持向量分类机是一种基于结构风险最小化原则,以构造最优超平面为目标进而对数据进行分类的统计学习方法.最优超平面就是要求分类超平面不仅能将两类数据正确分开,而且使分类间隔最大.

假设存在样本集(xi,yi),其中i=1,…,n,xi∈Rd,yi的取值为1和-1,满足:

寻找使分类间隔最大的最优超平面,即令2/‖w‖最大.则构造最优超平面的问题转化为满足约束条件下最小化即φ(w,b)=w·w的问题.

利用Lagrange优化方法将上述最优超平面问题转化为其对偶问题,即存在约束条件

对于αi,求解下列函数的最大值

式中:αi为原问题中与每个约束条件对应的Lagrange乘子,这是一个不等式约束下二次函数寻优的问题,求解上述问题后得到最优分类函数f(x).

式中:b*为分类闻值,可以用任意一个支持向量求得,也可以通过两类中任意一类对支持向量取中值求得;α*i为Lagrange乘子.

利用核函数映射,在高维特征空间中通过非线性变换将非线性问题转化为线性问题,在变换空间求解最优超平面.K(xi,xj)=φ(xi)·φ(xj)为映射函数的点积,称为核函数.引进核函数K(xi,xj)来代替非线性映射,从而将原始空间中的样本映射为高维特征空间中的向量[16].

3 基于模糊C均值聚类和支持向量机算法的燃煤锅炉结渣特性预测

3.1 样本输入量和输出量的选择

将模糊C均值聚类和支持向量机算法相结合,进行燃煤锅炉结渣特性预测.为了说明该算法预测结果的有效性,进行了FCM-SVM和标准SVM性能的对比.

结渣指标中最主要的指标是煤灰的熔融温度指标,煤灰的软化温度tST越低,煤就越容易结渣.煤中的酸性氧化物具有较高的熔点,而酸性氧化物与碱性氧化物发生反应会使灰熔点降低,碱酸比(B/A)可反映燃烧过程中生成低熔点盐类的倾向.SiO2和Al2O3是煤灰中主要的酸性氧化物,SiO2易与碱性氧化物生成熔点较低的硅酸盐.在碱酸比相同时,硅铝比(w(SiO2)/w(Al2O3))高的煤灰具有较低的熔点.硅比是与灰渣黏度有关的指数,当硅比增大时,灰渣黏度增大,使得灰渣在较高温度固化的可能性增加.除了以上4个煤种本身的特性外,炉内结渣的实际表现还与锅炉的设计结构和运行工况有关.

引入无因次实际切圆直径(即锅炉在热态运行时实际切圆直径与炉膛等效宽度的比值)来表征炉内空气动力场对锅炉结渣的影响.

式中:dsj为实际切圆直径;a和b分别为炉膛的宽度和深度.

φd如果偏大,气流偏斜且火焰容易贴墙.烟气中的煤灰颗粒呈熔融状态,容易在炉壁上结渣.

随着炉膛烟气温度的升高,到炉壁时仍处于熔融状态的烟气中颗粒数量以及灰渣烧结速度和黏附强度均呈指数关系增加.在煤粉燃烧过程中,烟气温度高于软化温度时,煤灰颗粒易融化,在炉壁上容易结渣.当烟气温度低于煤灰软化温度时,煤灰颗粒不易融化,在炉壁上不易结渣.引入无因次炉膛烟气平均温度(即锅炉在热态运行时炉膛烟气最高温度与软化温度的比值)来表征炉内火焰温度场对锅炉结渣特性的影响.

式中:tmax为炉膛烟气最高温度.

对于燃煤锅炉结渣特性的预测,影响预测结果的预测因子形成预测数据样本,数据样本选择评判准确率较高的4个静态单一指标(即软化温度tST、碱酸比、硅铝比和硅比(G)及无因次炉膛烟气平均温度φt和无因次实际切圆直径φd作为判定依据.将结渣程度作为预测模型的唯一输出.

3.2 模糊C均值聚类划分

将模糊C均值聚类和支持向量机算法相结合来预测燃煤锅炉结渣特性时,采用模糊C均值聚类对训练样本进行模糊聚类,可以得到c个聚类中心及1个c×n的模糊划分矩阵,这个矩阵包含了每个样本对应于每个类别的隶属度.以每个训练样本最大隶属度所在的类别作为此样本的类别,这样就将训练样本集分成了c个子样本集,再运用支持向量机算法对其,得到了c个支持向量机预测模型.

采用聚类有效性函数分类系数Fc(U;c)来优化确定训练样本集的模糊聚类数,即对于c≥2的模糊聚类数范围,针对不同的模糊聚类数c对训练样本集进行聚类,并计算相应的分类系数Fc(U;c).

分类系数越接近1,表示模糊性越小,聚类效果就越好.

3.3 分类判别

由于进行聚类分析的样本数值差异很大,单位不统一,如果利用欧几里得距离进行分类判别,数值大、离差大的变量所起的作用势必会覆盖数值小、离差小的变量.为了保证每个变量的权重相等,首先对聚类中心和测试样本进行归一化处理.然后计算测试样本输入向量到各聚类中心的欧几里得距离,最小的欧几里得距离即为所对应的子样本类.进行判别分析后,将待测样本划分到各个已经分好的类中,利用该类对应的支持向量机预测模型进行燃煤锅炉结渣特性预测.

3.4 参数选择

通过核函数的映射将非线性不可分问题转化为高维特征空间中的线性可分问题,核函数的选择在很大程度上影响着支持向量机预测模型的分类性能.所以选用如下的RBF核函数:

确定核函数后,还需要确定2个非常重要的参数,即惩罚参数C和核函数参数g.组合(C,g)的值对预测模型的分类性能有很大的影响.

3.5 锅炉结渣特性预测流程图

利用FCM-SVM预测模型对锅炉结渣特性进行预测,其流程图见图1.

3.6 算例分析

经过对大量文献资料中所用到的结渣数据[17-18]进行统计,得到了40组锅炉结渣样本,其中30组数据作为训练样本来训练模糊C均值聚类支持向量机预测模型参数(见表1);10组数据作为测试样本用于验证模型的性能(见表2).

对30组训练样本进行模糊C均值聚类,通过计算分类系数来确定最佳模糊聚类数,结果见表3.由表3可知,当模糊聚类数c取3时,分类系数为0.897 806,在所有分类系数中最接近1,所以当c取3时聚类效果最佳.图2给出了按照隶属度最大原则对训练样本形成的聚类分布结果.随着软化温度的升高,将训练样本分为3类,其中第一类有12个样本点,第二类有11个样本点,第三类有7个样本点,每一类的聚类中心见图2.聚类后的每一类样本存在相似的特征参数,使每一类训练样本所建立的支持向量机预测模型过拟合度减小,预测精度提高.

对待测试的10组样本进行判别分析,可以判别出每个测试样本所属的类别,再用该类别所建立的支持向量机预测模型进行预测,对于各样本的输出,实际结渣程度用3、2和1表示,其中3为严重结渣,2为中等结渣,1为轻微结渣.

图1 FCM-SVM预测流程图Fig.1 Flow chart of the FCM-SVM prediction model

表1 训练样本各指标Tab.1 Indices of various training samples

表2 测试样本各指标Tab.2 Indices of various test samples

表3 聚类效果Tab.3 Clustering effect

图2 预测样本聚类结果及聚类中心Fig.2 Clustering effects and centers of prediction sample set

基于径向基核函数训练建立好的模型,采用遗传算法结合7层交互验证法对组合(C,g)的值进行寻优.设定初始种群数为20,最大迭代数为500,重组概率为0.7,C 和g 的寻优区间均为(0,100).上述3个模型寻优得到的最优组合结果为(22.91,0.02),(3.33,8.79)和(29.40,0.008 9).

将FCM-SVM的预测结果与标准SVM的预测结果进行比较,结果见表4.

利用训练好的FCM-SVM预测模型对10个测试样本进行校验,10个预测结果全部正确,正确率达100%.普通SVM预测模型的正确率为80%,所建立的FCM-SVM模型的预测正确率高于标准SVM预测模型的正确率,从而证明了FCM-SVM预测模型的有效性,因此模糊C均值聚类支持向量机预测模型能够减小训练样本的过拟合度,具有较强的泛化能力和较高的预测准确性.

表4 FCM-SVM与标准SVM预测结果的比较Tab.4 Comparison of testing results between FCMSVM and standard SVM algorithm

4 结 论

所提出的将模糊C均值聚类与支持向量机算法相结合的预测模型能减小训练样本的过拟合度,具有较强的泛化能力.采用FCM-SVM预测模型对10台锅炉的结渣特性进行预测,预测结果正确率达100%,可以实现对锅炉结渣特性的精确预测.

[1]李文艳.电站锅炉煤粉燃烧过程及结渣的数值模拟[D].北京:华北电力大学,2003.

[2]方庆艳,周怀春,汪华剑,等.3种型号 W火焰锅炉结渣特性的数值模拟[J].动力工程,2008,28(5):682-689.FANG Qingyan,ZHOU Huaichun,WANG Huajian,et al.Numerical simulations of the slagging characteristics in three types of W-flame boiler[J].Journal of Power Engineering,2008,28(5):682-689.

[3]周俊虎,赵晓辉,杨卫娟,等.神华煤结渣倾向和结渣机制研究[J].中国电机工程学报,2007,27(8):31-36.ZHOU Junhu,ZHAO Xiaohui,YANG Weijuan,et al.Study on the ash deposition propensity and mechanism of Shenhua coal[J].Proceedings of the CSEE,2007,27(8):31-36.

[4]DUCHESNE M A,MACCHI A,LU D Y,et al.Artificial neural network model to predict slag viscosity over a broad range of temperatures and slag compositions[J].Fuel Processing Technology,2010,91(8):831-836.

[5]KONDRATIEV A,JAK E.Predicting coal ash slag flow characteristics (viscosity model for the Al2O3-CaO-'FeO'-SiO2system)[J].Fuel,2001,80(14):1989-2000.

[6]邱建荣,马毓义,曾汉才.混煤的结渣特性及煤质结渣程度评判[J].热能动力工程,1994,9(1):3-8.QIU Jianrong,MA Yuyi,ZENG Hancai.Slagging characteristics of blended coals and comprehensive evaluation of slagging degree[J].Journal of Engineering for Thermal Energy and Power,1994,9(1):3-8.

[7]钱诗智,陆继东,宋锦海.基于模糊神经网络的煤灰结渣预报[J].自然科学进展,1997,7(2):119-123.QIAN Shizhi,LU Jidong,SONG Jinhai.Prediction of the slagging characteristics based on fuzzy neural network[J].Progress in Natural Science,1997,7(2):119-123.

[8]徐创学,张心,康爱军.基于人工神经网络数据挖掘技术进行煤灰结渣特性分析[J].热力发电,2004(6):27-30,87.XU Chuangxue,ZHANG Xin,KANG Aijun.Analysis of the slagging behavior of coal based on neural network data-excavating technology[J].Thermal Power Generation,2004(6):27-30,87.

[9]徐志明,文孝强,孙媛媛,等.基于最小二乘支持向量回归机的燃煤锅炉结渣特性预测[J].中国电机工程学报,2009,29(17):8-13.XU Zhiming,WEN Xiaoqiang,SUN Yuanyuan,et al.State prediction of slagging on coal-fired boilers based on least squares-support vector machine for regression[J].Proceedings of the CSEE,2009,29(17):8-13.

[10]VAPNIK V.The nature of statistical learning theory[M].New York:Springer Verlag,1999.

[11]石志标,宋全刚,马明钊,等.基于改进粒子群优化支持向量机的汽轮机组故障诊断[J].动力工程学报,2012,32(6):454-457,462.SHI Zhibiao,SONG Quangang,MA Mingzhao,et al.Fault diagnosis of steam turbine based on MPSOSVM algorithm[J].Journal of Chinese Society of Power Engineering,2012,32(6):454-457,462.

[12]徐巍,陈祥光,彭红星,等.基于模糊C-均值聚类与支持向量机的PMV指标预测系统[J].系统工程理论与实践,2009,29(7):119-124.XU Wei,CHEN Xiangguang,PENG Hongxing,et al.PMV index forecasting system based on fuzzy C-means clustering and support vector machine[J].Systems Engineering-Theory&Practice,2009,29(7):119-124.

[13]赵欢,王培红,钱瑾,等.基于模糊C-均值聚类的锅炉监控参数基准值建模[J].中国电机工程学报,2011,31(32):16-22.ZHAO Huan,WANG Peihong,QIAN Jin,et al.Modeling for target-value of boiler monitoring parameters based on fuzzy C-means clustering algorithm[J].Proceedings of the CSEE,2011,31(32):16-22.

[14]DUNN J.A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters[J].Journal of Cybernetics,1973,8(3):32-57.

[15]BEZDEK J C.Pattern recognition with fuzzy objective function algorithms[M].New York:Plenum Press,1981:62-78.

[16]王春林,周昊,周樟华,等.基于支持向量机的大型电厂锅炉飞灰含碳量建模[J].中国电机工程学报,2005,25(20):72-76.WANG Chunlin,ZHOU Hao,ZHOU Zhanghua,et al.Support vector machine modeling on the unburned carbon in fly ash[J].Proceedings of the CSEE,2005,25(20):72-76.

[17]赵显桥,曹欣玉,兰泽全,等.燃煤锅炉结渣倾向性模糊预测分析[J].电站系统工程,2003,19(5):9-11.ZHAO Xianqiao,CAO Xinyu,LAN Zequan,et al.Fuzzy forecasting analysis on slagging tendency of coal-fired boiler[J].Power System Engineering,2003,19(5):9-11.

[18]王洪亮,王东风,韩璞.基于模糊神经网络的电站燃煤锅炉结渣预测[J].电力科学与工程,2010,26(6):28-32.WANG Hongliang,WANG Dongfeng,HAN Pu.Forecasting slagging properties of coal fired boiler in power station based on fuzzy neural network[J].Electric Power Science and Engineering,2010,26(6):28-32.

猜你喜欢
结渣训练样本均值
人工智能
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
火电厂四角切圆锅炉结渣问题的研究
水洗及水浴对秸秆燃料燃烧结渣特性的影响
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法
电站锅炉沾污结渣的处理方法比较*
关于均值有界变差函数的重要不等式