基于动态随机森林算法的铜浮选精矿品位预测

2023-01-13 03:39雷雨田王庆凯
矿冶 2022年6期
关键词:铜精矿精矿分析仪

雷雨田 王庆凯 王 旭

(1.北京矿冶研究总院,北京 100160;2.矿冶过程自动控制技术国家重点实验室,北京 102628;3.矿冶科技集团有限公司,北京 100160)

精矿品位作为评价浮选过程性能的重要指标之一,在一定程度上反映了工艺生产率和产品质量。精矿品位的影响因素不仅繁多,而且大都具有非线性、强耦合、大滞后等特点,导致我们很难及时得到精矿品位。实际生产中的铜精矿品位大多采用人工取样离线化验获得[1],由于人为主观因素的差异,获得的品位数据也存在着一定的不确定性,浮选过程精矿品位的建模预测也因此受到了越来越多的关注。

浮选过程精矿品位预测模型主要分为机理模型、数据模型与混合模型。由于浮选过程十分复杂,一般的机理模型不能十分准确地描述实际的矿物浮选过程。数据模型则是根据实际生产过程中累积的大量历史数据来构建预测模型。随着信息化技术的高速发展与基本控制系统及各类传感器的全面应用,浮选过程中大量的生产数据可以被及时收集和存储,这也使得通过获取浮选过程的过程参数建立数据模型成为了一个热门的研究方向。因此,目前大多数的预测模型都采用数据建模方法,常见的有偏最小二乘法(PLS)[2]、主成分分析法(PCA)[3]、独立成分分析法(ICA)[4]等多元统计数据分析法和支持向量机(SVM)[5]、人工神经网络(ANN)[6]等机器学习方法以及基于模糊推理的模糊系统[7]。FERNANDEZ-DELGADO等[8]对比了179种分类算法在121个UCI数据集上的分类性能。结果表明,综合来看,随机森林算法的分类性能最优[9]。随机森林算法不仅原理简单、易于实现,其占用计算资源小且性能强大,在许多实际生产过程中也得到了广泛应用。

基于上述分析,本文利用国内某大型选矿厂浮选流程中泡沫图像分析仪获取的泡沫特征参数及其它相关生产数据,采用动态随机森林算法对铜精矿品位进行建模预测,并分析随机森林算法的预测效果。

1 随机森林算法简介

随机森林(Random Forest)算法是Bagging(Bootstrap aggregating)集成方法[10]中最具有代表性的算法,是BREIMAN[11]将Bagging集成学习理论[12]与随机子空间方法[13]结合后提出的一种机器学习算法。该算法由多棵决策树组成。决策树因其单分类器的属性,存在着过拟合、易收敛到局部最优解和性能提升瓶颈等问题。根据多分类器的思想由多棵决策树组合而成的随机森林算法由此诞生。随机森林算法的建立分为生成森林与进行决策两个过程,如图1、图2所示。

图1 随机森林生成图Fig.1 Random forest generation diagram

图2 随机森林决策图Fig.2 Random forest decision diagram

随机森林的核心思想就是对训练集进行Bootstrap有放回地重复采样,形成多个训练子集。每个子集生成一棵决策树,进而组成随机森林。最后统计所有决策树的分类结果,根据得票数得到最终分类结果。

测试集最终所属类别的表达式见式1。

(1)

式中,Y表示类别标签;Ci(X)表示每棵决策树的分类结果;D(X)表示最终分类结果。

2 随机森林预测模型建立

国内某大型铜矿选矿厂浮选流程依次采用两次粗选两次扫选作业。其中,一次粗选铜精矿即粗Ⅰ铜精矿进入后续浮选柱精选流程,粗Ⅱ铜精矿经再磨分级后进入浮选柱精选流程,扫Ⅰ与扫Ⅱ浮选泡沫返回前一作业进行再选,扫Ⅱ底流作为该浮选流程最终的尾矿。本文采用机器学习里的动态随机森林算法对浮选流程中粗Ⅰ铜精矿品位进行模拟预测。将浮选流程中泡沫图像分析仪获取的泡沫特征参数及其它相关生产数据中的一部分数据用来建立动态随机森林模型,另一部分数据用于测试所建预测模型的准确性。

2.1 变量相关性分析

通过对现场浮选流程分析得知,影响粗Ⅰ铜精矿品位的操作变量和原料属性变量,一共有15个。结合BFIPS-Ⅲ浮选泡沫图像分析仪提取出来的15个泡沫特征参数,一共得到了30个与粗Ⅰ铜精矿品位相关的过程变量,详细变量见图3横坐标描述。过程变量个数的多少很大程度上代表了其内部蕴含信息的多少,但是过程变量个数过多,复杂性也会越明显。因此需要通过相关性分析对过程变量进行降维选择,根据相关系数大小筛选出一定数量的关键变量进行研究。

在进行过程变量与粗Ⅰ铜精矿品位相关性分析之前,首先需要对收集到的数据进行预处理,包括异常生产数据清除等操作。然后进行过程变量的相关性分析,根据相关系数大小筛选出一定数量的关键变量进行随机森林模型建立。30个过程变量与粗Ⅰ铜精矿品位相关性分析结果如图3所示。

图3 过程变量相关性分析结果图Fig.3 Process variable correlation analysis results graph

图3中,横轴表示过程变量,纵轴表示过程变量与粗Ⅰ铜精矿品位的相关系数。根据过程变量的相关系数筛选出7个影响铜浮选精矿品位的关键变量,具体变量如表1所示。

表1 影响铜浮选精矿品位的关键变量Table 1 Key variables affecting the grade of copper flotation concentrate

其中Y轴流速代表溢流泡沫流出浮选槽顶部的速度。表1中7个变量里,前5个变量是泡沫图像分析仪提取出来的粗Ⅰ浮选槽顶部的浮选泡沫特征参数,后2个变量是浮选流程中的两个关键药剂变量。

2.2 随机森林模型建立

将7个影响粗Ⅰ铜精矿品位的关键变量作为动态随机森林模型的输入,粗Ⅰ铜精矿品位作为模型的输出,以此建立动态随机森林预测模型。

随机森林决策树数量设为500棵。模型预测结果如图4所示。

图4 动态随机森林建模预测结果图Fig.4 Dynamic random forest modeling prediction results graph

图4a中的虚线是实际生产过程中品位分析仪测得的粗Ⅰ铜精矿品位测量值,实线是动态随机森林模型对粗Ⅰ铜精矿品位的预测值。图4b中实线是动态随机森林模型预测值与品位分析仪测量值之间的绝对误差,深色虚线和浅色虚线分别表示模型预测绝对误差为±1%和±2%的范围界限,以便于直观了解模型的预测效果。

2.3 模型误差分析

为了评价模型的预测性能,需要构建合适的评价指标体系。本文采用平均绝对误差MAE(Mean Absolute Error)、均方误差MSE(Mean Square Error)、预测绝对误差在±1%的样本数百分比和预测绝对误差在±2%的样本数百分比作为模型的预测性能评价指标。MAE能够较为准确地反映模型的精矿品位预测值与品位分析仪测量值之间的平均差距大小。MSE能够反映模型的精矿品位预测值与品位分析仪测量值之间的偏差程度。±1%和±2%预测绝对误差在一定程度上代表了生产现场可接受的预测误差范围。

MAE与MSE的计算公式分别如式2~3,模型预测结果见表2。

(2)

(3)

表2 模型预测评价结果Table 2 Model prediction evaluation results

从表2数据可以看出,基于动态随机森林算法的预测模型对粗Ⅰ铜精矿品位的预测平均绝对误差在1%以下,预测绝对误差在±2%的样本数百分比在90%以上,模型的预测精度较高。

3 结论

1)采用动态随机森林预测模型能较准确地预测下一个测量周期的铜精矿品位,预测趋势准确,预测精度高,可用于指导作业者及时调整作业决策,确保最终精矿品位的稳定。

2)将通过相关性分析提取出的关键变量作为动态随机森林模型的输入,粗Ⅰ铜精矿品位作为模型的输出,以此建立的动态随机森林预测模型未涉及到原矿品位等需要依赖品位分析仪的变量,在品位分析仪故障期间也可以得到品位预测值,在一定程度上可以避免因品位分析仪故障导致缺乏品位数据无法指导作业者操作的情况发生。

猜你喜欢
铜精矿精矿分析仪
Sekisui CP3000与STA Compact Max凝血分析仪检测项目比对分析
生物质烘干钛精矿对其酸解性能的影响
Sievers分析仪(苏伊士)
试论高杂钼精矿净化技术
试论高杂钼精矿净化技术
铜精矿中降低二氧化硅含量的方法研究
一种用于深空探测的Chirp变换频谱分析仪设计与实现
影响我国进口铜精矿采购成本的因素分析
提高某选矿厂铜精矿品位的优化试验
铜铋混合精矿超声波分散磁选分离工艺