基于支持向量回归与极限学习机的高炉铁水温度预测

2021-04-15 09:33王振阳江德文王新东张建良刘征建赵宝军

工程科学学报 2021年4期

王振阳，江德文，王新东，张建良，刘征建，赵宝军

1)北京科技大学冶金与生态工程学院，北京 100083

2)河钢集团有限公司钢铁技术研究总院，石家庄 050023

3)昆士兰大学化学工程学院，圣卢西亚 QLD 4072

2000 年以来，我国生铁产量快速增加，并于2019 年全年产量达到8.06 亿吨，约占当年世界生铁产量的63%。能耗方面，我国钢铁行业能耗约占工业总能耗的16%，而炼铁工序又占钢铁全流程能耗的70%左右。在此背景下，高炉作为炼铁工序的主反应器，其稳定顺行对我国钢铁工业的节能降耗与高效生产尤为重要。然而高炉原燃料波动造成的炉型改变，以及设备破损导致的不均匀传热等多种内外因素使高炉炉况波动时有发生，给炼铁工序的增产降耗带来影响[1−2].

铁水温度是高炉炼铁的一项重要参数，不仅可以反映当前铁水本身质量与高炉炉缸热状态，且通过其变化趋势和幅度也能预判高炉运转方向。因此，若能通过当前时刻的各项冶炼参数预测一定时间后的铁水温度变化趋势与幅度，则可以提前采取应对调控措施，减少炉况波动，稳定高炉热制度，从而促进高炉稳定顺行与炼铁工序节能降耗[3−6].

基于此，国内外研究学者对铁水温度展开了多种构建机制条件下的机器学习与模型预测研究，取得了一定进展。崔桂梅等分别采用模糊神经网络[7]与分布式神经网络[8]构建铁水温度预测模型，使铁水温度预测误差在±10 ℃内的准确度达到90%。石琳等[9]基于样条变换的非线性偏最小二乘回归方法，控制铁水温度预测值与测量值的相对误差小于0.11。Zhang 等[10]以均方根误差和相关系数为标准，对比分析了3 种深度学习算法与7 种浅层学习算法对高炉铁水温度的预测效果，认为浅层神经网络（SNN）对当前铁温预测精度较高，且计算资源消耗较低，适合在线反馈。此外，Zhang 等[11]还通过整合单一模式树构建集合模式树，并据此进一步将铁水温度预测均方根误差降低至7.33。基于多元自适应回归样条（MARS）算法和滚动时域估计（MHE），Diaz 等[12]和Hashimoto 等[13]对铁水温度预测的平均绝对误差分别为11.2 ℃和11.6 ℃。通过结合粒子群算法（APSO），Su 等[14]和Zhao 等[15]分别以极限学习机（ELM）和最小二乘支持向量机（LS-SVM）作为基础算法预测铁水温度，模型取得较好预测精度和泛化性能.

基于数据驱动的预测模型还包括基于时间序列的自回归算法、贝叶斯网络算法等，其中以支持向量回归（Support vector regression，简称SVR）为基础的模型在炼铁领域应用较为广泛[16−18]，已成功实现对铁水硅含量[19]和高炉故障的预判[20]。此外，极限学习机（Extreme learning machine，简称ELM）因隐藏神经元的参数无需调整，而获得快速的训练速度和良好的工业适应度[21−23]。因此，本研究以支持向量回归和极限学习机算法为基础，在日平均数据的时间维度下，对铁水温度进行模型学习和预测研究，期望在拓宽时间维度的基础上获得工艺可接受的铁水温度预测准确度，为高炉在线实际应用提供基础模型支撑.

1 理论与方法

1.1 SVR 算法

回归预测模型的构建一般是基于训练样本集D={(xm，ym)}而获得形如f(x)=wTx+b模型中w和b等未知参量，传统回归模型通常是直接以预测值f(x)与测量值y之间的差别计算损失，并通过优化损失函数以降低误差，使f(x)与y之间的差别（损失）减小，损失函数J(θ)如式（1）所示.

其中，m为样本量，xi为第i个训练样本特征值组合，yi为第i个训练样本测量值，hθ(xi)为第i个训练样本特征值组合预测函数，θ为选定的某个预测函数标号.

对于SVR 算法，可允许f(x)与y之间存在 ε的偏差，即仅当|f(x)−y|>ε才计算损失。若训练样本是线性可分的，则在样本空间中，可通过式（2）描述其划分出的超平面.

其中，w为法向量，b为位移项。若将x从低维空间映射到高维空间的特征向量表示为Φ(x)，则高维空间划分的超平面模型如式（3）所示.

此时，样本空间任意点x到超平面（w，b）的距离r与间隔宽度γ分别如式（4）、（5）所示.

以f(x)为中心，构建宽度为2ε的间隔带，若训练样本落入此间隔带，则认为是预测正确。进一步地，将核函数[24]引入SVR 后如式（6）所示.

式中：

其中，k(xi，x)为核函数，拉格朗日乘子≥0、ai≥0，其中核函数的选择至关重要，通过优化选择适用的核函数（例如：径向基核函数、线性核函数、多项式核函数或Sigmoid 核函数），从而最终确定基于SVR 的预测模型.

1.2 ELM 算法

ELM 是用于单层前馈神经网络的训练学习方法，单层前馈网络拥有三层神经元，即输入层、隐藏层和输出层。对于含有N个样本的数据集(xk，tk)，其单层前馈神经网络数学模型如式（8）所示.

其中，xk=[xk1，xk2,···,xkn]表示第k个样本的N维特征，tk=[tk1，tk2,···,tkn]表示对应的目标向量，βi是输出权重矩阵，用于连接第i个隐藏和输出节点，g(wi，bi，xk)为非线性分段连续函数，极限能力满足ELM 定理，wi和bi为随机确定的模型参数。因而，式（8）可写成隐含输出矩阵形式，如式（9）、（10）所示，其中，H为隐含层输出矩阵，β为输出权重矩阵，T为目标矩阵.

根据最小二乘法理论，结合奇异值分解方法，ELM 的解可表示为式（11）.

2 铁水温度预测模型

2.1 特征参量提取与数据标准化

高炉生产过程中会产生两类参数，即人为调控的主动操作参数以及反馈炉况的被动状态参数，均会对铁水温度的走向变化产生不同程度的影响。本文依据冶金原理以及现场监测条件，选取国内某4000 m3级别高炉2014 年至2019 年时间范围内22 项特征参量的日平均数据构成初选数据集，特征参量与实际数据样本分别如表1 和图1 所示.

表 1 铁水温度预测的初选特征参量Table 1 Primary data items for hot metal temperature prediction

图1 所示铁水温度的初选特征参量共计22项。特征参量过多将增加模型计算复杂度，并大幅提高计算时间，因此需要对主要特征参量进行提取。本文依据冶金原理、Pearson 相关系数以及Spearman 相关系数对初选特征参量进一步筛选，以减少后续模型训练与预测过程中的无效计算，降低模型的计算复杂度，以适应工业生产条件.Pearson 与Spearman 相关系数计算方法分别如式（12）与（13）所示，式中，X为特征向量，Y为目标向量，ρ(X,Y)和Rs分别为X与Y的Pearson 和Spearman相关系数，cov(X，Y)为X和Y的协方差，Var(X)与Var(Y)为X与Y的样本方差，N为样本数，R(Xi)与R(Yi)分别为元素Xi和Yi在X和Y中的排序。经计算，初选特征参量与铁水温度的相关系数计算结果如图2 所示.

图 1 铁水温度初选特征参量样本散点图Fig.1 Scatter plot of the primary characteristic parameters of hot metal temperature

由图2 可知，对铁水温度发展走向的影响因素较多，既包含影响高炉直接与间接还原度的炉腹煤气指数、煤气利用率等，也包含影响高炉物料与热量平衡的炉料结构、水温差等。具体来看，对后续铁水温度存在显著正相关关系的特征参量主要为当前铁水温度、煤气利用率、铁水硅含量、利用系数、铁水日产量和综合负荷等，存在显著负相关关系的特征参量为炉腹煤气指数、水温差、焦丁比、燃料比、焦比和透气性等。通过预实验计算，并综合考量计算复杂度与预测精准度，最终选取如表2 所示特征参量进行模型拟合，其中1～4 项为操作参数，5～14 项为状态参数，删除相关度较低的冗余特征参量.

本文使用零–均值规范法对数据进行标准化处理，以消除特征参量之间量纲和取值范围差异的影响。零–均值规范可以减小噪声点的影响，且不受特征参量最大值和最小值的限制，在当前数据标准化中使用较为广泛，其计算公式如式（14）所示，其中：为原始数据的均值，σ为原始数据的标准差，z*为标准化处理后的样本值.

2.2 铁水温度模型预测与结果表征

图 2 铁水温度与初选特征参量之间相关系数。（a）Pearson 相关系数；（b）Spearman 相关系数Fig.2 Correlation coefficient between hot metal temperature and primary characteristic parameters:(a)Pearson; (b)Spearman

表 2 铁水温度终选特征参量Table 2 Final characteristic parameters of hot metal temperature

铁水温度特征参量提取及数据标准化处理后，形成的数据集将用于模型的训练与测试。数据集中随机抽取80%的数据用于支持向量回归与极限学习机模型的训练，使模型不断学习和构建特征参量与目标参量之间的映射，即将表2 所示特征参量数据与下一日铁水温度数据构建关联映射，使模型能够实现预测下一阶段铁水温度变化趋势与幅度的目标。而后利用剩余20%的数据构成测试集，对模型的预测准确度进行验证，并利用测试集反馈结果不断优化模型超参数，最终形成铁水温度预测模型，其中SVR 选用高斯RBF 核函数，宽度系数为0.01，惩罚系数为10；ELM 选用Sigmoid 激活函数，隐藏节点数设置为100，在此超参数设置下，两种算法多次预测结果平均值较佳.SVR 与ELM 算法的预测结果与测量值的比对如图3 所示.

由图3 可知，两种算法对铁水温度的追踪结果较好，部分样本点预测值与测量值重合度较高。此外，对于与测量值有偏差的预测样本点，其对铁水温度增减变化趋势的预判也较为理想。事实上，对铁水温度增加或减少的预知将有助于高炉操作者预判下一阶段高炉炉缸热状态变化走势，从而可以提前采取应对操作措施，维持高炉稳定顺行，促进节能降耗.

图4（a）和（b）分别为基于SVR 与ELM 两种算法对铁水温度的预测值与测量值所构成的散点图。可以看出，两种模型的数据点均围绕对角线方向延伸分布，且在对角线区域数据点分布较为紧密，预测值与测量值吻合度较高。此外，散点主要分布在对角线±10 ℃范围内，说明预测值的偏差多集中在±10 ℃以内。图4（c）为基于SVR 与ELM算法的铁温预测误差概率密度分布函数，经对比后发现，相比ELM 算法，SVR 算法预测误差概率函数分布曲线的延伸范围较小，曲线散点更加集中，说明对测量值的追踪效果较好.

图 3 铁水温度测量值与预测值比对。（a）基于SVR 算法；（b）基于ELM 算法Fig.3 Comparison of measured and predictive values of hot metal temperature：(a)prediction value based on support vector regression (SVR)；(b)prediction value based on extreme learning machine (ELM).

图 4 铁水温度预测值与测量值偏差。（a）基于SVR 的铁温预测值与测量值偏差；（b）基于ELM 的铁温预测值与测量值偏差；（c）基于SVR 与ELM 预测铁温误差概率密度分布函数Fig.4 Deviation of predictive value of hot metal temperature from the measured value:(a)based on SVR; (b)based on ELM; (c)the probability density distribution function of hot metal temperature error based on SVR and ELM

图5 为SVR 和ELM 对铁水温度预测结果的百分比误差散点分布与统计图。在±0.5%范围内的点个数除上所有点的个数，即为分布概率。经统计计算，SVR 和ELM 的预测百分比误差在±0.5%以内的分布概率分别为81.0%和78.0%，在±1.0%以内的分布概率分别为99.0%和98.3%，说明百分比误差主要集中在±0.5%，基本不超过±1.0%。对比两种算法预测误差散点分布图，SVR 算法更好地控制了误差偏离严重预测点的数量，因而百分比误差点波动较低.

图 5 铁水温度预测的百分比误差散点分布统计图。（a）SVR;（b）ELMFig.5 Scatter distribution statistics of percentage error in hot metal temperature prediction:(a)SVR; (b)ELM

对SVR 和ELM 算法预测结果进行综合分析.算法预测准确度一般应从多方面予以定量化衡量与表征[25]，本文选取平均绝对误差（Mean absolute error，MAE）用以表征模型预测值与测量值之间整体偏差的绝对值；选取平均绝对百分比误差（Mean absolute percentage error，MAPE）用以表征模型预测值与测量值之间整体偏差的相对值；选取均方根误差（RMSE，Root mean square error）用以表征模型预测值相较测量基准值的偏差波动；选取命中率（Hit rate，HR）用以表征在工艺可接受范围内的模型预测可信度，其计算方法分别如式（15）至（18）所示：

其中，n为测试集中样本总数量，和yi分别为铁水温度预测值与测量值，c为命中率判定边界值，本文选取c值为10 ℃，即以误差（−10 ℃，10 ℃）范围内为基准进行命中率计算，计算结果如表3 所示。由此可知，无论是从偏差绝对值与相对值角度，亦或是从偏差波动与命中率角度，SVR 与ELM算法均对铁水日平均温度实现了较好的预测。相较而言，SVR 算法对铁水温度的预测优于ELM 算法，其平均绝对误差、平均绝对百分比误差、均方根误差与±10 ℃以内的命中率表现较佳.

表 3 SVR 与ELM 算法铁水温度预测结果综合定量表征Table 3 Quantitative characterization of SVR and ELM model prediction results of hot metal temperature

3 结论

（1）正相关影响铁水温度变化的特征参量主要为煤气利用率、铁水硅含量和利用系数等；负相关影响铁水温度变化的特征参量主要为炉腹煤气指数、水温差和焦丁比等。铁水温度受到高炉直接与间接还原度以及热量平衡相关特征参量的影响较大.

（2）基于SVR 与ELM 算法构建的模型均对铁水温度实现了较好的预测效果，前者在预测值与误差值散点分布，平均绝对误差和百分比误差，以及误差波动方面表现较佳，对铁水温度±10 ℃范围内的预测命中率为94%.