基于粗糙集与PSO-SVM的二甲醚催化燃烧预测模型*

2013-01-10 05:55刘国璧袁宏俊
通化师范学院学报 2013年10期
关键词:二甲醚约简粗糙集

刘国璧,孙 群,袁宏俊

(1.安徽电子信息职业技术学院,安徽 蚌埠 233030;2.安徽大学 数学与计算科学学院,安徽 合肥230039;3.安徽财经大学,安徽 蚌埠 233030)

二甲醚是具有轻微醚香味的无色气体,具有良好的汽化、冷凝、压缩等特性,在化学中有很多用途,它具有良好的安全性和制冷效果,可以替代氟利昂(CFC)作为抛射剂和制冷剂使用.二甲醚起燃温度较高,燃烧不完全,采用催化燃烧的方式,使二甲醚在催化剂作用下、在较低温度和较低的燃料浓度下深度氧化,引发快速的燃烧反应,实现完全燃烧,获得较高的转化率.对二甲醚催化燃烧的研究目前比较少,广东工业大学的余倩利用神经网络,对二甲醚催化燃烧过程进行了初步研究[1],对催化剂的性能进行了描述和预测.由于神经网络具有一定的局限性,本文提出构造基于粗糙集方法的PSO-LS-SVM混合预测模型,对LS-SVM的惩罚因子C和径向基函数的参数δ进行优化选取.首先利用粗糙集理论对预测模型的输入样本进行降维处理,简化LS-SVM的结构;然后利用粒子群优化算法对LS-SVM的惩罚因子C和径向基函数的参数δ进行优化,以提高模型的预测精度;最后通过实例检验该模型的有效性.

1 研究方法理论基础

1.1 粗糙集

粗糙集理论(rough sets)是波兰学者帕拉克(Z.Pawlak)于1982年提出的,是用于数据分析的一个新的数学方法,它能表达不确定、不精确的知识.粗糙集理论在研究数据挖掘、知识约简等领域获得了广泛应用,特别是在数据挖掘领域,取得了很大成功,是当前许多学者和研究工作者的研究热点.根据粗糙集属性约简原理,能够有效剔除冗余信息,挖掘出反映被评价目标的关键指标,得到约简指标体系.粗糙集理论在很多论文[2-5]和著作中已有了详尽的介绍,这里不做雷述.

1.2 粒子群优化算法

1995年,Kennedy和Eberhari提出了一种进化算法——粒子群优化(particle swarm optimization,PSO),该算法是受生物界鸟群觅食的启发而提出的最优解的一种方法.

PSO的思想是[6]:位于初始位置的若干个粒子,每个粒子有自己的个体最优解pi,b,整个粒子群有群体的最优解gb,所有粒子在解空间中搜索,利用迭代找到最优解.粒子根据下式对自己的位置和速度进行更新.

vi(k+1)=ø(k)vi(k)+
α1γ1i(k)[pi,b-xi(k)]+α2γ2i(k)[gb-xi(k)]

xi(k+1)=xi(k)+vi(k+1)

其中γ1i,γ2i为[0,1]区间内均匀分布的随机数,ø(k)为惯性函数,α1,α2为加速常数.

1.3 LS-SVM

LS-SVM是SVM的一种,它将SVM中的不等式约束变成等式约束,把最小二乘线性系统作为损失函数代替SVM采用的二次规划方法,和SVM相比,LS-SVM求解过程更加简便和快速,需要的计算资源也较少,对解决问题的精度和速度均有一定的提高.

LS-SVM选择误差ξi的二范数为损失函数:

2 基于粗糙集的PSO-SVM二甲醚催化燃烧预测模型

基于粗糙集的PSO-SVM二甲醚催化燃烧预测模型的基本思想是:利用粗糙集方法对预测模型的输入样本进行降维处理,将处理后的数据作为模型的输入;利用粒子群优化算法对LS-SVM的惩罚因子C和径向基函数的参数δ进行优化;利用训练后的LS-SVM对二甲醚催化燃烧进行预测仿真.具体步骤如下:

第1步 对初始数据进行预处理.把数据转化到[0,1]范围内;

第2步 对初始数据进行粗糙集分析.利用粗糙集得到约简指标体系.将之作为LS-SVM的输入样本;

第3步 初始化LS-SVM的结构.设置惩罚因子C和径向基函数的参数;

第4步 粒子速度和位置初始化.随机生成粒子的速度矩阵和位置矩阵;

第5步 计算粒子的适应度.随机生成一个种群,求所有粒子的适应度值.以LS-SVM的均方误差函数E作为粒子适应度的评价函数,得到最优解;

第6步 寻找个体极值和全局极值;

第7步 迭代停止控制.达到最大迭代次数或期望误差,若满足条件则转到(8),否则,返回(5);

第8步 生成最优解.算法迭代停止时,得到最优解,得出仿真模型,进行二甲醚催化燃烧预测研究.

基于粗糙集的PSO-SVM算法流程如图1所示:

图1 基于粗糙集的PSO-SVM算法流程图

3 实例分析

为了对模型的有效性进行验证,本文以二甲醚催化燃烧为例,数据来源于文献[7],构建基于粗糙集的PSO-SVM预测模型,对二甲醚催化燃烧进行研究,同时与LS-SVM的预测效果进行比较.

3.1 粗糙集分析

选取二甲醚催化燃烧的评价指标时,根据国内的相关研究成果,确定评价指标体系,根据粗糙集理论,利用MATLAB中的约简函数y=redu(c,d,S)对评价指标体系进行约简,经过筛选后最终得到四个评价指标,即焙烧时间、活性粒子半径、活性粒子元素第一电离能和活性粒子元素单质熔点.约简后的信息系统数据如表1所示.

3.2 预测结果分析

评价指标确定之后,就以约简后的指标数据作为LS-SVM模型的输入,对二甲醚催化燃烧进行预测.将表1中的数据分为训练集和测试集,前10组数据作为训练集,对网络进行充分的训练,后5组数据作为测试集,检验模型的有效性.

利用Matlab7.0软件,群体规模为200,粒子维数为2,c1=2,c2=2,vmax=200,动量项系数为0.325,迭代次数为40,最后,得到支持向量机的C=8.51,核参数ξ=7.316,对于PSO算法,利用0.8-0.4线性递减的惯性权重策略,c1=c2=2.粒子的最大速度1,最大循环迭代次数为200,PSO算法最优适应度函数值的变化曲线如图2所示.

图2 适应度函数变化曲线

由图2可知,适应度函数值fitness下降较快.开始时,适应度值迅速下降.100次迭代后,达到较稳定的状态.

图3 模型实际值与预测值

由图3可知.采用基于粗糙集的PSO-SVM模型的预测精度较高,仿真效果较好.其中第十一组和十二组数据的误差较大,分别为5.88%和6.49%,第十三组、第十四组和第十五组数据的预测误差都很小,绝对误差均低于2%,预测效果较为理想.同时,为了对该模型的有效性进行验证,本文对LS-SVM模型以及基于粗糙集的粒子群优化的LS-SVM的预测性能进行了对比分析.结果见表2所示:

表2 不同预测模型的性能比较

从表2可以看出,基于粗糙集的PSO-SVM模型具有更好的预测性能,训练误差以及测试误差都较低,模型泛化仿真能力均较好,验证了模型的有效性.

4 结束语

由于影响二甲醚催化燃烧的因素较多,提出把粗糙集、粒子群优化算法以及LS-SVM相结合,构造基于粗糙集的PSO-SVM模型对二甲醚催化燃烧进行模拟仿真.具有以下几方面的特点:

(1)利用粗糙集约简影响因素,将约简后的指标作为模型的输入,提高模型的泛化能力;

(2)利用粒子群算法对LS-SVM的初始参数进行训练,将PSO算法优化后的参数作为LS-SVM的惩罚因子C和径向基函数δ;

(3)为了验证模型的性能以及有效性.利用建立的模型进行实例研究.

结果表明,基于粗糙集的PSO-SVM方法具有较好的适用性,对于影响因素较多的预测问题有较好的预测结果.当然该模型也存在一些不足.比如,程序复杂,扩展性等方面有待进一步的研究和改进.

参考文献:

[1]余倩.六铝酸盐催化剂的制备及其在新能源二甲醚催化燃烧研究中的应用[D].广州:广东工业大学博士论文,2008.

[2]卜益民.粗糙集和神经网络在数据融合中的应用研究[J].计算机技术与发展,2013(4).

[3]王若鹏.基于粗糙集理论的浏醴高速公路景观质量评价[J].北京石油化工学院学报,2003(4).

[4]雍龙泉.基于粗糙集理论的企业持续竞争优势研究[J].伊犁师范学院学报2006(9).

[5]刘寿春.基于粗糙集理论的设计规则提取及其应用[J].2004(2).

[6]薛定宇,陈阳泉.高等应用数学问题的MATLAB求解[M].北京:清华大学出版社,2008.

[7]余倩.六铝酸盐催化剂的制备及其在新能源二甲醚催化燃烧研究中的应用[D].广州:广东工业大学博士论文,2008.

猜你喜欢
二甲醚约简粗糙集
MTBE装置醚后碳四中二甲醚含量高的原因及优化
粗糙集与包络分析下舰船运行数据聚类算法
掺氢对二甲醚层流燃烧特性的影响
LNG与二甲醚替代船用柴油经济性分析
基于粗糙集不确定度的特定类属性约简
基于Pawlak粗糙集模型的集合运算关系
近似边界精度信息熵的属性约简
实值多变量维数约简:综述
广义分布保持属性约简研究
一种基于粗糙集理论的社交网络潜在路径研究