基于深度神经网络的脱硫系统预测模型及应用

2021-03-30 00:35马双忱林宸雨周权吴忠胜刘琦陈文通樊帅军要亚坤马采妮
化工进展 2021年3期
关键词:吸收塔浆液密度

马双忱,林宸雨,周权,吴忠胜,刘琦,陈文通,樊帅军,要亚坤,马采妮

(1 华北电力大学(保定)环境科学与工程系,河北保定071003;2 深能保定发电有限公司,河北保定072150)

当前,国家正加快推进以5G、人工智能、工业互联网、物联网为代表的新型基础设施建设(新基建),电力行业的智能化建设也蓬勃发展。国内大型火力发电厂很早就实现了厂级DCS 数据监控,历史运行数据丰富,为实现数据驱动的神经网络建模提供了有利条件。

由于脱硫系统受各种复杂工况的影响,且具有大惯性、非线性等特点[1],化学机理建模只能较粗略地对脱硫系统重要指标进行预测。当前化学机理建模的手段主要是通过传质理论、化学动力学建立系列微分方程求解[2-4],或通过离子平衡规律、电中性原理建立守恒方程求解[5]。化学机理建模的优势在于可以计算和判断各主要化学物质的浓度和存在形式,并可以对物质的空间分布进行分析。但是,化学机理建模也面临因计算代价大从而过度简化、无法考虑复杂工况等问题,导致预测效果较差,模型迁移能力不强。

随着人工智能技术的高速发展,神经网络技术逐渐被应用于对脱硫系统进行建模预测[6]。早期技术主要是基于简单的反向传播(back propagation,BP)设计神经网络[7-10],但因BP网络结构简单,存在一些问题。苏翔鹏等[11-12]采用了基于径向基函数(radical basis function,RBF)的改进模型,改善了BP 网络易陷入局部最小值的缺陷;李军红等[13]利用的广义回归神经网络(generalized regression neural network,GRNN)是基于RBF 网络改进的神经网络模型,针对样本较少的情况,预测效果有所改善。但上述改进仍未考虑脱硫系统大惯性的特点,Fu等[14]使用的LSTM网络,能实现信息在时序上传递。不过因其设计的网络只使用了LSTM一种结构,神经网络在结构设计上还有改进空间。

基于上述分析,本文采用多种网络结构和数据处理技术设计深度神经网络模型,模型预测误差水平和训练代价显著下降。

1 神经网络输入数据预处理

1.1 输入数据降噪预处理

本文采用华北某2×350MW 电厂2019 年7 月1日到27 日按分钟记录的脱硫环保数据集(共计40000条)进行网络参数训练,模型选取的14个分析指标和DCS监测值基本变动范围如表1所示。

本文对DCS 提供的原始数据采用指数滑动平均技术(exponential moving average, EMA)进行降噪。因为电厂监测系统测量值易受温度、湿度等影响而漂移[15],EMA可以使得数据输入更重视变化趋势而不是瞬时振荡,对神经网络模型训练过程、防止过拟合有积极作用。

本文采用的EMA公式如式(1)、式(2)所示。

式中,vt为t 时刻指数滑动平均值;rt为t 时刻的原始值;β为递减系数;l为窗口长度,min。

为更好地平衡降噪和趋势保留,对不同变量,本文采用不同的l值,使得测量噪声得以消去,而变化趋势得以保留。图1 中,展示了入口烟气流量、SO2含量经过滑动平均的分析结果(l 分别取7min 和5min)和监测值的对比。对其他变量,模型采用的l值基本为5~15min。

1.2 最小分析时间周期划分

目前基于神经网络的脱硫系统相关预测模型,大都是基于前1min 的DCS 监测值预测后1min 的监测值。这样模型的预测误差虽然较小,但由于控制系统的响应很难达到如此小的时间精度,实际应用中仍需要对一个时间段(一般为控制系统最小响应时间)取平均,再带入网络计算,而由于网络是针对1min设计和训练的,容易造成较大误差。所以,本文在建模初始就进行了最小分析时间周期的划分,在数据预处理、网络架构上都适当考虑了适应较长预测时间的需求,只需要对模型参数调整即可改变最小预测周期。

图2展示了本文所建立模型的预测误差随最小分析周期变动的箱线图。箱体下端为25%分位数的位置,箱体上端为75%分位数的位置,这表明箱体包含了50%误差值分布。除了箱体的上下边缘外,箱线图还展示了几个偏离程度较大的异常点。

表1 神经网络的输入指标和其波动范围

图1 数据EMA降噪结果展示

显然,最小分析周期增大,误差边缘范围扩大、异常点增多,这是做长时段预测必然面对的情况,电厂可以根据容忍的误差限和最短工况反应时间选定网络参数。本文模型采用最小分析周期为3min,且预测效果达到预期后选择尽可能简单的深度神经网络结构加速运算过程。当前情况下,模型的训练时长为1分17秒,计算输出结果仅需数秒,小于最小分析周期,可以满足工业实际需求。

为了体现输入工况的时滞性并减少异常值输入对模型影响,模型在处理输入时还采用了加权周期处理,周期设置一般取3~5个最小分析单元。之后的预测结果表明,此做法增加了模型的鲁棒性,模型对异常输入的响应不敏感。图3展示了本文所建立模型的数据预处理过程。

2 神经网络结构及训练方法

2.1 神经网络模型结构

本文所建立的深度神经网络模型结构如图4所示,除了常规的输入层、输出层和全连接层外,还引入了LSTM 层、ReLU 层和dropout 模块,增强了网络的预测能力和泛化性能。

在神经网络结构中,循环神经网络(recurrent neural network,RNN)一般用于解决时序问题。但RNN 在训练过程中容易发生“梯度消失”现象[16]。LSTM本质也是一种RNN,但由于其巧妙设计了门限结构[17-18],可将之前的工况影响选择性地记忆或遗忘,并能解决RNN的“梯度消失”问题。近年,LSTM已在电厂NOx排放量预测[19-21]和电力市场及负荷预测[22-24]中应用。本文模型使用的LSTM 层的基本运算流程如图5 所示,模型中架设设1 个LSTM层,含如图5 所示节点神经元128 个,梯度阈值设置为1,并采用L2 正则化方法,正则化系数为0.0001。

模型在LSTM 层和全连接层后都架设了ReLU层。相较于LSTM 层、全连接层使用的sigmoid 或tanh 激活函数,使用ReLU 激活函数计算神经元响应,计算复杂度显著下降。另对深度神经网络而言,ReLU激活函数可显著降低因sigmoid激活函数接近饱和区时导数趋于0带来的梯度消失现象。此外,在输入小于0时,ReLU层的输出也为0,减少了网络间相互依赖过程,对防止模型过拟合有积极作用[25]。

图2 最小分析周期变化对模型性能的影响

图3 模型数据预处理过程

图4 深度神经网络的设计结构

图5 LSTM网络结构的运算流程

2.2 模型训练过程

网络参数训练采用自适应矩估计(adaptive moment estimation, ADAM)方法控制梯度下降过程[26]。设置初始学习速率0.013,最小学习批次为256,为防止梯度爆炸,设置梯度阈值为1。模型最大训练轮数为60 轮,每20 轮后,学习速率降低到原先的0.6。

在模型训练过程中,采用dropout 技术防止模型过拟合,该技术由人工智能领域著名学者Hinton等[27]在2014 受自然选择和有性生殖过程启发而提出。如图6所示,dropout技术在深度神经网络的训练过程中,按照一定的概率将部分神经网络单元暂时隐藏,此时相当于从原始的网络中选取一个更简洁的网络进行训练。在本文提出的深度神经网络模型训练中,在第二个ReLU层后使用了一个dropout模块,丢弃率取0.2。

图6 Hinton展示的dropout示意图[27]

3 模型的输出结果分析

根据前文神经网络结构和计算方法,模型输出值为下个最小分析周期的pH 和出口SO2浓度。但在电厂实际运行中,脱硫率是运行人员判断吸收塔实时脱硫能力、对控制策略做出调整的重要参考指标。目前主流的脱硫系统神经网络模型也大多以脱硫率预测结果来评价模型的性能。故本模型将预测的出口SO2浓度转化,增加脱硫率指标,一则贴近现场需求,二则方便与其他模型预测性能进行比较。脱硫效率计算公式如式(3)所示。

式中,η 为脱硫率,%;Cout为出口SO2浓度,mg/m3;Cin为入口SO2浓度,mg/m3。

按工业习惯,入口SO2浓度使用上一最小分析周期中入口SO2浓度计算脱硫率。

3.1 关于脱硫率和pH的预测结果分析

图7、图8 展示了训练后神经网络模型在测试集上的预测结果与实际值对比。测试数据集采用华北某2×350MW电厂2019年7月28日到30日中按分钟记录的一段DCS监控数据(共4000条)。从图中展示的系统出口SO2含量、脱硫率的DCS降噪处理后的实际值(蓝线)和神经网络预测输出结果(红线)的对比可以看出,预测出口SO2含量和脱硫率变化趋势和实际值对应,模型预测效果良好。

图7 出口SO2浓度降噪后实际值和预测值的对比

图8 出口脱硫率降噪后实际值和预测值的对比分析

此外,图9 展示了DCS 降噪前的实际监测值(蓝线)和降噪后的实际值(绿线)以及神经网络的预测值(红线)在测试集2400~4000min的一段局部 对 比。图 中3100~3200min、3400~3500min 及3700~3900min内,DCS监测值振荡严重,而神经网络预测值平滑变动。可以看出,神经网络的预测结果能跟随出口SO2含量的变化趋势,但不会跟随监测噪声振荡,表明模型的预处理手段和系数选取合适。

图9 出口SO2浓度降噪后实际值和预测值的对比(局部放大)

DCS 对pH 监测时,也会发生同样的随机波动误差,但除此之外,由于pH 计管每隔2h 冲洗一次,会导致测定点pH 瞬间升高,所以此时DCS 测量的pH数据不能很好地反应吸收塔浆液真实情况。不过,鉴于本文的数据预处理技术,神经网络模型对此刻的突变并不敏感。这表明在DCS 监测值因某种原因失真的情况下,模型预测值可以实现一定程度上的“软测量”功能,辅助运行人员决策。图10 就展示了这种情形,图中蓝线为DCS 实时反应的pH,绿线为预处理降噪后的pH,红线为神经网络的预测输出结果。

3.2 关于脱硫率和pH的预测结果指标评价

由前文3.1 节所讨论的,为降低DCS 监测数据中振荡噪声带来的影响,在模型评价中使用经过降噪处理,并以3min 为最小分析周期取平均值合并的实际值作为真实值标准评价模型的预测误差。本节采用了3 个指标:均方根误差(root mean square error,RMSE)用于反映泛化误差水平、平均百分误差(mean absolute percentage error, MAPE)用于直观体现预测值的偏差水平、误差值的方差用于直观反应模型的泛化能力。上述指标计算公式如式(4)、式(5)所示。

表2集中展示了浆液pH、出口SO2浓度和系统脱硫率的预测结果主要评价分析指标RMSE、MAPE和误差的方差。结果表明,模型预测能力很强,预测误差很小。

表2 神经网络输出指标和其波动范围

图11 预测pH和脱硫率误差的频次分布直方图

图11(a)、(b)为模型预测pH和脱硫率的误差频次分布图,可以看出,预测结果的误差分布接近均值为0的正态分布,说明模型的预测效果较好。

3.3 本模型与其他主流神经网络预测性能对比

图10 浆液pH实际值和预测值的对比分析

神经网络的结构种类有很多,为验证本文使用深度神经网络模型预测脱硫率和pH具有良好效果,本节采用目前主要流行的深度BP神经网络、LSTM神经网络模型与本文提出的人工深度神经网络的预测效果进行对比。对比指标选择浆液pH 和系统脱硫率,最小分析时间周期均取5min,对比的参数是RMSE 和MAPE。对不同的模型,输入参数采用同样的数据处理和降噪手段。

本文对比采用的深度BP 神经网络参照文献设计[7-10],为提高网络性能,BP隐含层数量增至10层,LSTM 神经网络参照Fu等[14]文献模型的参数和架构设计,因Fu等在文献中已经对比LSTM神经网络相对RNN网络的优势,本文不再设计RNN对比。

如图12 所示,本文提出的深度神经网络模型对于pH 的预测值RMSE=0.0947,优于深度BP 的0.116、仅使用LSTM 层模型的0.1095;脱硫率方面,本文模型脱硫率预测值的RMSR=0.1066,而深度BP 的预测值RMSE=0.2781,几乎是本文深度神经网络模型预测泛化误差的两倍,而仅使用LSTM 的预测值RMSE=0.2351(Fu 等[14]文献中所求RMSE=0.2909,可能因其数据未经本文预处理手段,噪声较大,降低模型性能),仅仅略优于深度BP 的预测效果。上述结果说明,本文提出的深度神经网络模型在5min 尺度上的预测结果要明显优于主流的BP神经网络和仅使用LSTM神经网络。

图12 不同网络预测pH和脱硫率误差主要指标对比

4 模型应用案例

4.1 模型的石灰石供浆密度对出口SO2和脱硫率影响仿真

脱硫系统出于自身安全性的考虑,往往不能进行大范围、多状态试验,导致探究脱硫系统内各变化因素对系统的影响一般通过建立中试平台实验完成,但这种做法往往存在较大的误差,不能很好反应脱硫系统真实情况。本文神经网络模型建立完成后,事实上提供了一种基于计算机仿真的工况诊断与优化分析方法,并且因模型在训练时使用的是特定电厂的数据,相对于一般的中小试实验更有针对性。

本节案例选取石灰石供浆密度对系统脱硫性能的影响,测试值位点选择为系统各工况参数均值附近最大概率分布区间内的中位数值。测试范围为监测情况下该工况参数变动范围的95%,测试因素变化时,其他工况参数条件不变。

图13 为本文深度神经网络的仿真结果。图中可见,石灰石供浆密度在达到1260kg/m3左右时,对系统脱硫率的贡献就非常有限,而增大到1270kg/m3以上时,过高的石灰石浆液密度甚至抑制了塔内反应,导致脱硫率下降,出口SO2浓度上升。

图13 吸收塔石灰石浆液密度对出口脱硫率和出口SO2浓度的影响

从化学传质和反应的角度可以解释上述模型的仿真结果:一般情况下,石灰石浆液密度升高,脱硫率增大,是因密度较低时,CaCO3含量不足,化学反应不充分导致脱硫率低,同时CaSO4密度小,也使石膏晶体不易生成长大。但是当浆液密度过大时,浆液中CaCO3的浓度趋于饱和,增加的石灰石溶解并不充分,不能进一步提升脱硫率,并且因为生成的CaSO4溶解度小,过饱和的CaSO4可能覆盖在碳酸钙表面,阻滞反应。此外,由于吸收塔浆液密度和石灰石浆液密度具有关联性,长期输入过高密度的石灰石浆液可能间接提升吸收塔浆液密度,触发石膏排出泵工作,导致未反应的CaCO3也一并排出,造成脱硫剂浪费,并降低石膏品质。

4.2 结合仿真结果对电厂实际工况的分析

图14 为该厂脱硫系统2019 年7 月1 日到31 日(共44640条)按分钟记录的吸收塔石灰石浆液密度频次分布图。2019年7月工况下,超过1260kg/m3的时间段占比为6.45%,其中超过1270kg/m3的时间段占比为1.91%。该厂部分时间段存在石灰石供浆密度过大而对脱硫反应不利的情况。电厂应尽量减少供浆密度超过这一限值的情况。

图14 监测时段吸收塔石灰石浆液密度频次分布图

由于神经网络模型属于端对端模型,对于输入和输出之间容易测试影响,而对于其他中间过程则属于“黑箱”,故本文作者课题组同时也设计了基于化学机理的过程模型[4]补充探讨中间过程,使得诊断过程更加全面。通过该机理模型推理反应线索,认为过高的石灰石供浆浆液密度除了影响吸收塔内的化学反应,还会导致吸收塔浆液密度过高、结垢倾向大。结合工程经验,还可能导致浆液循环泵叶轮磨损,在吸收塔壁、吸收塔底部和循环泵入口滤网结垢[28]。综上,应对电厂脱硫系统相关位置做结垢分析。

图15 是2020 年3 月该电厂脱硫系统垢样分析,包括电厂吸收塔塔壁、吸收塔底部和循环泵入口滤网垢样的SEM 图。观察到吸收塔壁垢样[图15(a)]颗粒直径主要在20μm 以上,晶体生长痕迹明显,且以片状形式堆叠生长,结构紧凑、晶体间空隙较小,表面附着直径2~3μm 杂质颗粒。与健康生长石膏[图15(b)]相比,晶体结构存在差异,健康生长石膏多为六棱柱结构、晶体间有明显空隙、表面无细小杂质[29-31],推测造成差异的原因是浆液中CaSO4过饱和,结晶在吸收塔塔壁可以生长的物质表面。此外,吸收塔底部与循环泵入口滤网结垢样品晶体[图15(c)]整体偏小,一般在5~10μm,且存在较多细碎颗粒。结合XRD 结果,结垢样品的主要存在物质为CaSO4·2H2O。综上所述,可以判断该厂部分时段吸收塔浆液密度过大,CaSO4过饱和,在吸收塔壁、吸收塔底部和循环泵入口结垢。

综上,本节先通过神经网络的仿真结果,得到了该电厂石灰石浆液密度过高、影响脱硫系统主要化学反应的参考边界,再经对该厂7月工况下石灰石浆液密度的分布情况分析,判断有6.45%的时间段该厂石灰石浆液密度偏离了最适范围。随后通过化学机理模型,判断吸收塔内存在结垢风险,之后进行SEM、XRD 等化学分析也印证了这一结论。该诊断过程体现了基于数据建模、机理建模与实验分析相互协调补充的脱硫系统智慧环保体系基本工作流程。

图15 吸收塔壁垢样、健康石膏和循环泵滤网入口垢样的SEM图

5 结论

本文设计了一种基于LSTM 层、ReLU 层和全连接层按单元组合的深度神经网络模型,能够实现对脱硫塔出口SO2浓度、浆液pH 和脱硫率进行预测。由于考虑了脱硫系统重要指标在时序上的惯性以及采用了合适的网络架构和数据处理技术,模型对系统pH、SO2排放量和脱硫率有很好的预测效果,可实现对未来数分钟的SO2排放浓度趋势预判,为运行人员提前优化运行,保证SO2的排放处于合理范围内,降低其波动性。

另外,由于模型预测结果对监测噪声和异常突变并不敏感,在某些情况下DCS 监测数据失真时,模型的预测结果能起到一定的“软测量”补充作用。

该模型还可以用于对脱硫系统进行计算机仿真实验,探究各个重要参数变化对脱硫系统脱硫率、出口SO2浓度或pH 的影响,与化学机理分析相配合,对脱硫系统进行工况诊断和运行优化。

猜你喜欢
吸收塔浆液密度
考虑滤过作用及黏度时变性的盾构壁后注浆扩散模型研究
胰腺实性浆液性囊腺瘤1例
『密度』知识巩固
密度在身边 应用随处见
浅论硫酸装置干吸工序串酸流程对尾气和成品酸的影响
湿法脱硫二级吸收塔除雾器堵塞研究
粉煤灰掺量对盾构隧道同步注浆浆液性能的影响试验研究
“玩转”密度
密度应用知多少
误诊为中心性浆液性脉络膜视网膜病变的孤立性脉络膜血管瘤1例