S Zorb精制汽油辛烷值优化模型及工业应用

2022-05-05 11:56赵明洋欧阳福生
石油炼制与化工 2022年5期
关键词:性质损失神经网络

王 杰,陈 博,刘 松,赵明洋,欧阳福生,高 萍

(1.华东理工大学化工学院石油加工研究所,上海 200237;2.中国石化上海高桥分公司)

重油催化裂化(RFCC)可以转化成汽油、柴油等轻馏分以及部分低碳烯烃[1-2],目前在我国汽油池组成中重油催化裂化汽油约占70%[3]。由于原油中的硫元素多集中于重油馏分中,导致重油催化裂化汽油的硫含量较高,因此催化裂化汽油脱硫技术成为学者们研究的重点[4]。S Zorb技术[5-7]因具有脱硫率高、氢耗低、研究法辛烷值(RON)损失小的优点而被广泛关注。然而,在某石化企业S Zorb装置的实际运行过程中,精制汽油的RON平均损失高达1.35。因此,在保证汽油脱硫效果的前提下,降低其RON损失成为该装置亟待解决的问题。

S Zorb装置操作复杂、影响因素很多,而且各影响因素之间存在强偶联性及复杂的线性或非线性关联关系,因而对S Zorb工艺过程的建模模拟比较困难。人工神经网络[8]能够在过程机理不明或复杂情况下寻找系统过程输入、输出之间的关系,从而建立数据驱动模型。BP神经网络模型是目前人工神经网络应用最广泛的模型之一。因此,本课题基于该石化企业S Zorb装置近3年的运行数据,采用BP神经网络并结合遗传算法对S Zorb工艺过程进行建模、优化,并通过工业试验对模型优化效果进行验证,旨在通过模型优化操作变量而在保证汽油脱硫效果的前提下降低其RON损失。

1 数据预处理及特征选择

数据预处理是指从工业装置采集并整理出与研究目标关联的高质量数据,为数据挖掘提供基础;特征选择是指从大量的物料性质变量和工艺操作变量中选取出用于建模的关键特征变量。

1.1 数据预处理

构建S Zorb装置运行过程模型的数据主要包括原料油、吸附剂和产品的性质数据及部分操作变量数据。因此,以国内某石化企业1.2 Mt/a的 S Zorb装置为研究对象,采集了该装置2017年4月至2020年5月之间273个变量的数据,变量分类及其数量和名称见表1。在本研究中,精制汽油产品的RON是模型的输出变量,其采集频次为2次/周,因此原料和吸附剂性质变量的取值为产品RON测定时间点对应的运行数据,而装置操作变量的取值为RON测定时间点前后2 h的平均值。此外,因受到硫分析仪最低检测限的制约,当硫质量分数低于3.2 μg/g时统一记为3.2 μg/g。最后,得到325组数据样本。建模时,产品RON和产品硫含量作为目标特征变量,不进行相关性分析。

表1 数据采集的变量类别、变量数及名称

1.2 特征选择

特征选择是指从已有特征变量中筛选出部分对目标变量影响显著性高的变量用于构建模型。本研究采用最大互信息系数、Pearson相关系数等方法,筛选具有代表性和独立性的建模变量。

1.2.1最大互信息系数

最大互信息系数(MIC)[9]是一种基于信息的无参数探索方式,可以用以度量两个变量间的线性或非线性相关性,筛选出与产品RON相关性高的特征变量。MIC的取值为0~1,数值越大则表明两个变量间的相关性越大;反之则相关性越小,甚至无关,对建模的意义也就越小。

除产品RON和产品硫含量外,对271个性质变量和操作变量数据进行归一化处理,计算其与产品RON间的MIC,结果如表2和表3所示。

表2 性质变量与产品RON间的MIC

由表2可知:在原料和吸附剂性质变量中,变量与产品RON间MIC最大的性质变量为原料RON,说明产品RON主要是由原料RON决定的;再生吸附剂硫含量、碳含量与产品RON间的MIC较小,均低于0.1,说明其与目标特征变量的相关性很小。因此,通过最大互信息系数法筛选出原料RON、原料硫含量、饱和烃含量、烯烃含量、芳烃含量、待生吸附剂碳含量和待生吸附剂硫含量共7个性质变量作为特征变量,用于构建模型。

由表3可知,由于S Zorb装置的操作变量多达262个,为了避免建模变量过多导致模型过于复杂,以0.3作为操作变量与产品RON间MIC的阈值,选择变量与产品RON间MIC较大的前30个操作变量作为特征选择的初步结果。

表3 操作变量与产品RON间的MIC

1.2.2Pearson相关分析

Pearson相关系数(r)法是被广泛应用于描述变量间线性相关性的一种方法,其取值范围为|r|≤1,变量间的Pearson相关系数及其相关性如表4所示。

表4 变量间的Pearson相关系数及其相关性

由表4可知:当|r|<0.4时,可以判定变量间的相关性较低,变量的独立性较强;当|r|>0.7时,变量间的线性相关性较显著,变量间相互影响。因此,选择以|r|<0.7为判定界限,当变量间的|r|>0.7时,则剔除对目标变量影响小的变量。

为了减少变量的重复使用和数据冗余,针对MIC法筛选出的7个性质变量和30个操作变量,采用Pearson相关系数法分别分析性质变量间的相关性和操作变量间的相关性,以消除变量间的多重共线性问题,结果见图1和图2。

图1 性质变量间相关性分析

图2 操作变量间相关性分析

由图1可知:在性质变量中,饱和烃含量与烯烃含量之间的|r|=0.93,说明二者之间高度线性相关;虽然饱和烃含量、烯烃含量与产品RON的MIC分别为0.314 6和0.257 0,前者大于后者,但根据文献[10-12]可知,原料烯烃含量对产品辛烷值损失有较大影响,这是因为在加氢精制过程中,烯烃加氢饱和反应是造成产品RON损失的直接影响因素。因此,选择烯烃含量作为模型的特征变量。

由图2可知,在操作变量与产品RON间的MIC较大的前30个操作变量中,许多变量间存在高度线性相关性。为防止操作变量间的多重共线性对模型预测过程的影响,需要选择线性相关性较弱且较容易调节的变量作为输入特征变量来建立模型。因此,根据操作变量间的相关性分析结果,选择14个操作变量、7个性质变量为模型输入特征变量,以产品RON为输出变量,来构建S Zorb装置运行模型,结果见表5。

表5 建模变量筛选结果

2 模型的建立

BP神经网络[13]是一种多层前馈型网络结构模型,分为输入层、隐含层(一层或多层)、输出层。数据从输入层输入,经激活函数变换后进入隐含层,并依次计算进入下一隐含层,直至到达输出层;同时其误差也会反向传递不断更新权值和偏置,直至预测结果满足精度要求为止。

BP神经网络应用最广泛的激活函数是ReLU函数[14],如式(1)所示。

ReLU(x) = max(0,x)

(1)

ReLU函数在计算过程中不仅能减小计算量、降低网络密度,还能缓解数据过拟合现象。

2.1 BP神经网络模型结构

2.1.1隐含层

隐含层神经元的数目是BP神经网络关键因素之一。神经元数目过多,则模型运算时间过长,样本容易出现过拟合现象;反之,则模型不能很好地学习。因此,建立BP神经网络模型必须先确定隐含层神经元的数目。其计算经验式[15]如式(2)所示。

(2)

式中:H是隐含层神经元的数目;m为输入层神经元的数目;n为输出层神经元的数目;L是一个可调节的常数,调节区间为 1~10。

将输入变量和输出变量的数量代入式(2),可得隐含层神经元数为4~15。因此,可建立21-Y-1结构三层神经网络模型(Y为4~15),然后将数据样本导入该模型,在相同的初始权值、偏置和参数下进行模型训练,计算并比较每个模型运算结果的均方误差(MSE),结果见表6。当训练结果MSE最小时,隐含层神经元数即为最佳隐含层神经元数。从表6可知,模型隐含层神经元数目为14时,模型训练结果的MSE最小,因此产品RON预测模型的最佳三层网络结构为21-14-1。

表6 隐含层神经元数量与训练结果MSE的关系

2.1.2BatchNormalization层

Batch Normalization层[16](简称BN层)的作用在于保持神经网络每层的输入分布尽可能相同,从而加速模型收敛、提高模型的泛化能力。在神经网络每层输入前添加BN层进行预处理,可将每层输入转换为均值为0、方差为1的标准正态分布;同时,为了增强网络的表达能力,可通过网络参数γ和β对该标准正态分布进行缩放和平移,参数γ和β可在网络训练过程中由自动学习得到。

2.2 BP神经网络模型预测结果

将325组数据样本按照4∶1分为训练集和测试集,得到260组训练集数据样本和65组测试集数据样本。采用建立的BP神经网络模型对训练集样本和测试集样本进行模拟运算,分别得到训练集和测试集的预测结果。BP神经网络模型的结构和运算参数如表7所示;训练集和测试集的拟合效果如图3所示;预测值与实际值的MSE、平均绝对误差(MAE)、以及预测值与实际值拟合曲线的决定系数(R2)见表8。由图3和表8可知,训练集和测试集的MSE和MAE均较小,且二者相近;预测值与实际值拟合曲线的R2均接近1。这说明所建BP神经网络模型具有良好的预测效果。

表7 BP神经网络参数

图3 BP神经网络模型预测值与实际值的拟合效果★—训练集; ■—测试集

表8 所建BP神经网络模型的评价结果

3 产品RON优化模型

在所建BP神经网络模型的基础上,针对具体原料性质不同,可采用智能优化算法优化操作变量,在保证脱硫效果的前提下减少产品RON损失,为S Zorb装置生产提供指导。在汽油的国Ⅵ标准中,硫质量分数的限制为不大于10 μg/g,为了使装置在硫含量控制上有较大空间,本研究设定硫质量分数的限制范围为0~5 μg/g。

目前,应用较广的智能优化算法主要包括粒子群算法(PSO)、遗传算法(GA)、模拟退火算法(SA)和蚁群算法(ACO)等。文献[17]研究表明,GA算法对石油化工过程的优化具有良好的适用性,因而本研究选用GA作为优化算法。GA[18]是一种模仿自然生物进化原理,按照“适者生存”原则寻找最佳生存条件的搜索优化算法,其通过选择、交叉和变异等算子来完成对全局最优解的寻找。本研究中,设置种群规模数为50、最大迭代次数为200,以产品RON的BP神经网络预测模型作为适应度函数,将个体产品RON的预测结果作为其适应度,如式(3)所示。

fi=yRON,i

(3)

式中:fi为个体产品i的适应度;yRON,i为个体产品i的RON预测值。

首先,依据个体产品适应度大小选择较好的个体样本,按照某种规则遗传给下一代。其核心在于选择算子,本研究采用轮盘赌法[19]选择个体样本,由式(4) 进行计算。

(4)

式中:pi为个体样本i被选中的概率;N为种群规模数。

交叉是GA产生新个体样本的主要运算,决定了GA的全局搜索能力。若样本中两个变量随机交叉可能会导致某些有效基因缺失。一般而言,GA 中的变量交叉的概率为0.6~0.9。由于交叉概率越大,高适应度的个体样本结构越易被破坏,因而本研究交叉概率取值为0.6[20]。

变异是GA产生新个体样本的另一种主要运算,其决定了GA的局部搜索能力。一般情况下,GA 中的变量变异概率为0~0.1;通常变异概率的取值较小,本研究变异概率取值为0.01[21]。

在设定GA算法的参数后,以第10组数据样本为例,在保证产品硫含量达标和其他性质指标不变的前提下对S Zorb装置操作变量进行优化,从而减小产品RON损失,结果见表9。

表9 部分操作条件优化结果

由表9可见,利用将BP神经网络模型与GA算法相结合的产品RON优化模型,对第10组数据样本的14个操作变量进行优化后,S Zorb装置汽油产品RON损失的降幅达34.67%,优化效果显著。按照同样方法对325组数据样本进行优化,结果如图4所示。

图4 325组建模数据样本的产品RON损失降幅★—RON损失降幅; ——平均RON损失降幅

由图4可知,在325组数据样本中,产品RON损失降幅最高达51.93%,产品RON损失平均降幅为33%,产品RON损失降幅大于30%的样本数超过58%。这表明,利用该优化模型调控S Zorb装置操作参数,可在保证产品硫含量满足质量标准要求的同时,有效降低产品RON损失。

4 模型工业应用

为了验证优化模型对操作参数的优化效果,在保证原料性质稳定的前提下,于2020年9月17日至9月18日将优化模型在某企业S Zorb装置上进行了工业应用试验。

4.1 工业试验方案

(1)2020年9月17日上午8点对原料、产品、待生吸附剂和再生吸附剂进行采样分析;从装置控制系统采集06:00—08:00的操作变量数据,并进行数据整定。

(2)考虑装置实际运行条件限制求,在不调节反应过滤器压差、原料换热器管程进出口压差、反应器质量空速、还原器压力、反应器顶部与底部压差、反应系统压力等6个操作变量的前提下,依据物料性质变量数据,利用产品RON优化模型对其余8个操作变量进行优化、调节。

(3)操作变量优化、调整到位后,分别在当天20:00采样(样本1)和次日上午08:00采样(样本2),对原料和产品进行分析,计算产品RON损失。

4.2 工业试验结果

根据原料性质不同,采用产品RON优化模型对8个操作变量优化的结果如表10所示。

表10 8个操作变量的优化结果

工业试验的产品优化结果如表11所示。由表11可知,在原料性质稳定的前提下,通过产品RON优化模型可以使产品RON损失降低25%,且产品硫质量分数始终小于3.2 μg/g。

表11 模型的优化结果

5 结 论

(1) 以S Zorb装置的工业数据为基础,采用MIC和Pearson相关系数,从包括原料油性质、吸附剂性质、产品性质和操作变量在内的273个变量中筛选出了21个输入变量和1个输出变量,建立了结构为21-14-1的BP神经网络产品RON优化模型。该模型预测值与实际值的平均绝对误差和拟合决定系数分别为0.116 3、0.960 1,说明其具有较好的拟合度和泛化能力。

(2)将所建BP神经网络预测模型与GA算法结合,优化S Zorb装置的操作变量,可以显著降低汽油产品RON损失。工业试验结果显示,在保证脱硫效果的前提下,产品RON损失降幅为25%,有效降低了RON损失。

猜你喜欢
性质损失神经网络
弱CM环的性质
基于递归模糊神经网络的风电平滑控制策略
彰显平移性质
随机变量的分布列性质的应用
胖胖损失了多少元
完全平方数的性质及其应用
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
玉米抽穗前倒伏怎么办?怎么减少损失?
菜烧好了应该尽量马上吃