基于NSGA-II结合BP网络算法的乙醇制备C4烯烃优化模型

2023-11-04 10:18杨杰
山东化工 2023年17期
关键词:烯烃转化率收率

杨杰

(青岛科技大学 数理学院,山东 青岛 266100)

C4烯烃是重要的化工原料,常被用来合成橡胶原料、制作润滑油添加剂、生产有机物等[1]。以乙醇为原料制备C4烯烃具有清洁低耗的特点,然而温度和催化剂组合往往会对C4烯烃的选择性和收率产生影响。确定乙醇偶合制备C4烯烃的最佳工艺条件,使得烯烃收率最大化,有利于我国化工产业与石油工业进一步发展。

近年来,乙醇偶合制备烯烃工艺的参数优化领域涌现大量研究成果。李艳春[2]采用传统控制变量优化法及对照实验矩阵,通过交叉对比得到使C4烯烃收率尽可能高的工艺条件;任涛等人[3]基于方差分析与随机森林算法筛选影响因子,并通过L-M算法与粒子群算法得到烯烃收率最优值;张中城等人[4]采用控制变量及逐步回归分析,建立规划模型求得最优解,并对目标函数进行拟合效果评估,验证结果合理性;Wang等人[5]利用Logistic模型分析了温度与乙醇转化率和烯烃选择性的关系,然后通过构建神经网络逼近催化剂组合与温度对C4烯烃收率的非线性关系,训练模型预测烯烃产率的最大值。

由已有成果可知,常用的优化方式主要为多元回归后建立单目标优化模型或采用各启发式算法,实际中,两类方法都存在许多难点。优化效率很大程度取决于输入反应物剂量与表型关系的模型建立是否准确,目前对于现有的多种模型选择和建立方法在不同应用条件下系统性的优劣研究比较不足。基于催化剂组合作用曲面往往为非线性且非多项式的曲面,如建立的回归模型精度不高,则难以准确拟合,不利于进一步参数优化。启发式算法有时无法有效处理约束条件,表现不稳定易陷入局部最优解,导致搜索精度降低。同时,在大多数化工系统中,设计寻求条件最优解实验时往往忽略了系统过程的目标最大化,使得所建立的模型与实际系统有偏差。

本文的研究方法主要为将回归预测数学模型与搜索算法相结合,可在一定程度上互相弥补缺点,提高优化效率。具体工作可表示为基于反应过程性能数据,利用多元回归与BP神经网络模型拟合一定数量的输入输出变量,分别建立预测模型,近似地反映工艺参数与烯烃收率之间的关系,分析对比模型预测误差,基于精度更高的模型进行下一步优化。考虑乙醇转化率与烯烃收率同时最大为目标函数建立双目标优化模型,采用NSGA-II求解多目标优化模型的Pareto最优集,并结合BP网络模型进一步预测最优集工艺参数对应的烯烃收率,确定最优方案。

1 数据预处理

本文应用的数据集为某化工实验室针对不同催化剂在不同温度下做的一系列乙醇偶合制备C4烯烃实验的化学反应性能(包括催化剂组合、温度、乙醇转化率、C4烯烃及其他附加生成物选择性)数据,根据催化剂组合的不同可分为13组,每一组又包含在若干不同温度下的多组实验数据,总计69组,部分样本信息如表1所示。

表1 反应性能数据样本信息

已知烯烃收率计算公式为乙醇转化率与C4烯烃选择性的乘积,则可计算出任一组反应数据对应的烯烃收率值。催化剂组合包含Co负载量、Co/SiO2和HAP装料比及乙醇浓度,由于本文主要目的为探究乙醇偶合制备C4烯烃的最优催化剂组合与温度条件,装料比以比值形式存在不利于数据处理,则为了利于后续分析计算,将催化剂组合拆开,得到Co/SiO2的质量、HAP质量、Co负载量与乙醇单位时间进量四个指标,与温度一起共同作为影响烯烃收率的5个自变量。

2 烯烃收率回归预测

2.1 多元回归模型

多元回归分析是一种用来研究随机变量间相关性的统计学方法。在对变量的实际观测进行分析和计算的过程中,对模型的参数进行确定,构建出一个变量与另一组变量之间的量化关系,即所谓的回归方程。在经过了统计测试被认定为具有明显的回归效果之后,可被用来对因变量的变化趋势进行预测和控制,所构建的数学模型就是所谓的回归模型[6]。

基于数据预处理后的数据,建立反应条件与烯烃收率的多元回归模型。设定Co/SiO2的质量、HAP质量、Co负载量与乙醇单位时间进量,温度分别为x1、x2、x3、x4、x5,C4烯烃收率y作为因变量,选取数据集中前12组不同催化剂组合下共59条数据作为训练集,其余数据作为试验集,以备后续回归预测检验。表2给出了相关数据集所做回归方程的回归参数,其回归方程如下:

表2 回归方程模型参数

(1)

由表2可知,决策系数R2为0.92,调整后为0.897>0.7,可认为催化剂组合温度条件与烯烃收率拟合效果较好,各助剂条件与温度可解释烯烃收率变化情况的92%,自变量与因变量间相关性程度高,模型可信。德宾-沃森检验值接近于2,可认为回归模型各解释变量数据相互独立,不存在自相关性,可以进行线性回归分析。此外,表3进一步给出上述回归方程的方差分析及显著性检验结果。

表3 回归方程模型方差分析

由表3可知,F=54.781>F0.05=2.61,P=0.000<0.05,则回归方程模型有统计学意义,且在0.05水平上,该模型有显著意义,故可认为该多元非线性回归方程有效,可用来模拟催化剂组合条件与温度对烯烃收率的影响关系。

2.2 BP网络模型

BP(Back Propagation,即反向传播)网络主要分正向传播与反向计算误差两个过程。正向传播中根据权重wi和阈值bj对输入值加权求和计算,最终经Sigmoid函数映射到(0,1)区间得到输出值。逆误差计算则是通过计算输出值与目标值之间的平方损失函数,对各层神经元连接权进行链式求导,更新权值并不断迭代传播过程,直至损失函数计算所得误差最小,学习训练次数使用完毕。

2.2.1 参数设置

本文主要采用三层BP神经网络构建模型,输入层为催化剂组合与温度,隐藏层为多个神经元,输出层为烯烃的产率,最终预测结果为输入不同的催化剂组合和温度条件,输出网络模型下与目标值间误差最小的烯烃收率预测值。将提出的BP神经网络模型的参数初始化如下:确定输入层节点为5,隐含层网络层数为1,隐含节点数为5,输出层节点为1,学习率为0.01,误差阈值为0.000 001,迭代次数为1 000次。

2.2.2 迭代计算

首先对13组不同催化剂组合实验数据集进行划分,总计69组实验数据中,采用48条数据用于训练样本,11条数据用于验证,10条数据用于测试。利用Matlab神经网络工具箱编程进行数据训练与测试,烯烃预测结果如图1、2所示,图3进一步展示了BP网络对三个数据集非线性回归拟合的效果。

图1 训练集预测结果对比

图2 测试集预测结果对比

图3 训练、验证和测试的结果图

由图1、2可知,训练集预测结果中两条折线高度重合且均方根误差为298.377 6,可认为BP神经网络对前59组实验数据回归预测效果较好。在测试集预测结果对比图中,可观察到测试集中除4号和5号样本外,其余样本预测值皆与真实值差距较小,可认为BP网络对测试集数据对应的工艺参数具有精度较高的烯烃收率预测结果。

由图3可知,实线与虚线接近重合,样本数据经BP网络训练后的输出值与目标值拟合情况较好,且R值都在0.9以上表明神经网络对数据集训练充分,网络具有良好的性能。

2.3 预测结果对比

经多元回归与BP网络模型对实验数据集回归预测,分别得到测试集的10组数据集在两类模型下的烯烃收率预测值,其与真实值的对比结果如表4所示。同时,本文选取3个评价指标进一步分析比较两类模型对测试集的预测精度(表5所示),这三个指标包括平均绝对误差(MAE)、平均偏差误差(MBE)和均方根误差(RMSE),其计算公式如下:

表4 模型预测结果对比

表5 测试集预测结果误差对比

(2)

(3)

(4)

MAE与RMSE的范围为[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,两个值越大,值越小,说明预测模型拥有更好的精确度。MBE可确定模型存在正偏差还是负偏差。

从表4和表5可以看出,通过对比两种预测模型的烯烃收率预测结果以及各指标数值,可知经BP网络模型得到的烯烃收率预测值的误差整体上要明显小于多元非线性回归模型,表明BP神经网络在当前数据的情况下,对烯烃收率的预测值有较高的精准度。BP神经网络更适用于处理复杂的非线性系统,受样本分布影响较小。通过逆误差传播算法不断调整内部权重,提高网络优化效果[7]。相比多元回归模型,BP神经网络在预测烯烃收率方面精度更高,应用范围更广。

3 多目标优化

NSGA-II(Non-dominated Sorting Genetic Algorithm-II,即非支配排序遗传算法)是在NSGA基础上改进的一种基于支配的多目标优化算法,这是一种基于Pareto最优概念的遗传算法。其拥有一系列智能优化算法的优势,鲁棒性高,计算高效,被广泛用来解决多目标优化问题,具有极强的适用性。利用非支配排序技术,其能确保搜索所得解更接近真实Pareto前沿,同时引入拥挤度距离,使得非支配解的多样性显著提高。精英化策略给出最优当前解的前提下保留了最优父代解,提高了算法收敛性[8-9]。

多目标优化问题通常由决策变量、约束条件及目标函数组成。在该类问题中,满足各目标的最优解一般不同,即在实际问题中各目标互相制约,不存在单个最优解[10]。因此,采用NSGA-II算法求解多目标优化问题有利于得到各目标函数与期望值偏离最小的Pareto最优解。基于上文多元回归与BP神经网络模型对烯烃收率回归预测误差的分析比较结果,选用BP神经网络模型作为求解多目标优化模型最优集工艺参数对应烯烃收率的预测模型,有助于提高预测精度并确定误差最小的最优方案。

3.1 模型建立

在乙醇催化偶合制备C4烯烃实验过程中,首要目标是使烯烃收率达到最大。同时考虑化学反应过程的具体情况,生成物中除C4烯烃外还存在大量副产物,如乙烯、乙醛、脂肪醇等其他有机物,此类杂质的存在将大大影响目标产物的选择性与收率。在化学反应过程中,随着时间的推移化学反应将逐渐达到化学平衡,即反应物消耗速率等于生成物生成速率,当生成物浓度增加到一定值时化学反应会逆向移动,导致反应物消耗减少、化学产物降低。因此,在建立模型求解优化目标时,应同时重视化学反应实际系统的动态过程与模型预测系统输出的能力,从实际生产的角度出发,使得底物转化率与目标产物同时最大化。结合乙醇偶合制备烯烃化学反应过程与相关数据,本文建立以下多目标优化模型:

1)决策变量:依据反应条件信息,将Co/SiO2的质量、HAP质量、Co负载量与乙醇单位时间进量、温度作为五个决策变量,分别为x1、x2、x3、x4、x5。

2)约束条件:依据反应过程相关数据,可知各决策变量边界范围如下:

(5)

3)目标函数:分别设乙醇转化率为γ、烯烃收率为δ,乙醇转化率定义为乙醇在偶合制备C4烯烃实验过程中的消耗质量比率,与催化剂组合与温度条件存在紧密联系;烯烃收率定义为乙醇转化率与C4烯烃选择性的乘积,乙醇转化率与C4烯烃选择性皆随反应条件的变化而波动,则烯烃收率也直接受其影响。考虑到应保证化学反应过程中底物转化率及目标产物收率尽量高,据此给出下列双目标函数:

(6)

3.2 NSGA-II算法求解

采用NSGA-II求解上述多目标优化模型可由如下具体步骤实现[11-13]:

1)染色体编码:实际问题中五个决策变量的一组排列组合信息皆位于一条染色体上,分别占据一个基因位,采用二进制编码进行数据处理。

2)初始化种群与适应度计算:随机生成初始种群,并将目标函数乙醇转化率与烯烃收率最大取相反数转换成求最小值,作为适应度函数,对新生成的种群与父代一同进行快速非支配排序,多次迭代得Pareto前沿。

3)精英策略选择:通过非支配排序与拥挤度计算,选择个体生成新代种群,进行交叉变异。

4)迭代终止:达到设定最大迭代次数时算法终止,输出结果。

在进行计算时,算法相关参数设置为:初始种群大小N=69,交叉概率Pc=0.7,变异概率Pm=0.3,最大迭代次数M=100。采用Matlab 2016b编程实现NSGA-II,在软件中运行算法程序可得图4示二维Pareto前沿。

图4 Pareto前沿解集

由图4可知,该算法具有良好的收敛性,可以得到分布均匀的Pareto最优解集。本文多目标优化模型为两个目标函数,则其Pareto前沿呈一条线,可看出乙醇转化率与烯烃收率存在相互制约关系,一方数值增长必然存在另一方数值下降。分别从Pareto前沿解集中随机选取5个最优解,其对应的催化剂组合、温度条件与对应的乙醇转化率和烯烃收率结果见表6。

表6 NSGA-II最优结果

3.3 优化结果验证

对于NSGA-II算法求得的Pareto最优解集,还需要进一步验证结果的可靠性。图5展示了五组数据集的BP网络预测迭代情况。基于BP网络模型强大的非线性映射能力,将上文求得的Pareto最优集组合作为输入参数代入BP网络模型进行烯烃收率预测,最终预测精度最高的解集将作为最佳催化剂温度组合。同时,将所得到的结果进一步与经典遗传算法优化 BP网络(GABP)方法得到的预测结果进行比较分析,来验证NSGA-II算法的精确度与卓越性。将选出的五组Pareto最优集数据中五个决策变量首先进行归一化处理,并利用BP网络模型迭代训练,得到预测及误差结果如表7所示。

图5 Pareto最优集BP网络预测迭代过程

表7 Pareto最优集BP网络预测结果

由图5可知,BP网络模型迭代10次,误差曲线呈阶梯形变化,整个迭代过程是稳健的,计算过程逐步逼近最优解。总误差为0.000 01,有效性检查为6,学习效果良好,表明对五组Pareto最优解数据所预测的结果为全局最优解,可作为有效结果进行误差分析从而筛选最优解。

由表7可知,第二组工艺参数经BP网络映射后输出的烯烃收率预测值与目标值误差最小,精度最高。因此,该组解集对应的催化剂与温度条件可作为乙醇偶合制备烯烃的最佳方案。结果表明,当Co/SiO2质量为33 mg,HAP质量为168.28 mg,Co负载量为0.5%,乙醇进量为0.3 mL/min,温度为400 ℃,乙醇转化率与烯烃收率可达最大,分别为64.67%,35.921%。

为进一步比较NSGA-II和经典遗传算法分别优化BP网络模型获得的烯烃收率预测误差,将五组Pareto最优集数据分别运用BP与GABP算法进行烯烃收率的回归预测,两类方法预测对比结果如图6所示。表8进一步展示了最优方案工艺参数在两类算法下对应的烯烃收率误差情况。由对比结果可知,NSGA-II结合BP算法的输出值与目标值间均方根误差小于GABP,对烯烃收率的预测值更符合实际,可认为本文所运用的算法具有良好的适用性与精确度。

图6 Pareto最优集预测结果对比

表8 两种预测方法结果对比

4 结论

基于乙醇偶合制备C4烯烃实验性能数据,建立了回归预测与多目标优化模型,得到实现乙醇转化率与烯烃收率最大的工艺条件,可实现较高的生产收率。采用NSGA-II算法与BP网络模型相结合的方法,有助于提高反应变量间映射关系及预测的准确性,确保在全局中搜索最优解。后续将对该模型算法进一步完备参数设定处理与仿真验证,提高实际应用效果。

猜你喜欢
烯烃转化率收率
我国全产业领域平均国际标准转化率已达75%
甲醇制芳烃的催化剂及其制备方法
煤制烯烃副产混合碳四的综合利用
烯烃不稀罕
曲料配比与米渣生酱油蛋白质转化率的相关性
大数据分析技术在提高重整汽油收率方面的应用
MTO烯烃分离回收技术与烯烃转化技术
透视化学平衡中的转化率
新型N-取代苯基-9-烷基-3-咔唑磺酰脲类化合物的合成及其抗肿瘤活性
过硼酸钠对高碳烯烃的环氧化