基于溶液图像时序特征的元素组分含量动态监测系统

2021-11-05 01:30陆荣秀陈明明朱建勇
计算机应用 2021年10期
关键词:时序组分分量

陆荣秀,陈明明,杨 辉,朱建勇

(1.华东交通大学电气与自动化工程学院,南昌 330013;2.江西省先进控制与优化重点实验室(华东交通大学),南昌 330013)

0 引言

稀土是非可再生的重要战略资源,是革新传统产业、发展新兴产业及国防科技工业至关重要的元素。如图1 所示的溶剂串级萃取方法[1]是国内外大部分稀土分离企业采用的方式。在萃取生产现场,通常将萃取段和洗涤段中组分含量变化敏感的萃取级设置为监测级,采用每天定时采集监测级的溶液样本进行离线化验的方法[2]获取萃取槽体的组分含量值,并以此为依据,根据操作经验调整工艺参数,整个过程耗费时间久,难以实时反馈萃取分离的效果和控制产品的质量。现有的基于设备升级改造的检测方法,例如X 射线荧光(X Ray Fluorescence,XRF)分析法、分光光度法等[3-4],都存在硬件装置结构复杂、可靠性低、使用及维护成本高的不足,没能 在稀土分离企业中推广使用。

图1 稀土萃取分离的工艺流程Fig.1 Process flow of rare earth extraction and separation

因稀土元素的电子层结构较独特,部分稀土元素离子能在可见光区域形成吸收峰从而显现出颜色特征,故一些学者在稀土元素组分含量的检测中应用了颜色特征这一特质。文献[5]在HSI(Hue,Saturation,Intensity)颜色空间下分析镨/钕混合溶液图像色度(H)特征分量与元素组分含量之间的关系,通过最小二乘方法建立了H 分量一阶矩与元素组分含量的关系模型。在此基础上,文献[6]以镨/钕混合溶液图像中的色调(H)和饱和度(S)分量为输入,采用最小二乘支持向量机算法(Least Squares Support Vector Machine,LSSVM)建立了元素组分含量的预测模型,实现了稀土元素组分含量的快速检测。文献[7]研究了光照对镨/钕溶液图像H、S、I 分量一阶矩的影响,并利用加权最小二乘支持向量机(Weighted Least Squares Support Vector Machine,WLSSVM)建立组分含量软测量模型。上述方法在应用时每次都要输出稀土溶液的组分含量值,占据内存空间且耗时,因此有必要先对稀土萃取工艺流程进行初步的工况判断,决定是否需要输出组分含量的值,以达到节省计算量和时间的目的。

本文利用萃取槽体溶液图像的时序性,借鉴时序图像在葡萄叶片病害中的动态监测[8]、电熔镁炉异常工况的诊断[9]等领域的成功应用,提出基于溶液图像时序特征的稀土元素组分含量动态监测系统。首先,根据稀土槽体监测级的溶液图像时序特征跟踪不同时段组分含量分布的变化,结合生产指标采用鲸鱼优化算法(Whale Optimization Algorithm,WOA)优化的最小二乘支持向量机分类模型判断萃取过程是否位于最佳工况;然后,据此判断是否启动图像检索系统并输出组分含量值,这种方式只在萃取工况超出最佳工况时才需要进行组分含量预测,可以更快更好地掌控稀土萃取工艺的工况,确保两端出口产品最终达到所需纯度。由镨/钕萃取过程数据进行仿真实验,实验结果表明,本文建立的稀土元素组分含量动态监测系统可以对稀土萃取过程进行较为准确的监测。

1 组分含量动态监测系统设计

在实际的稀土萃取工业流程中,为了提高萃取过程的自动化程度,首先需解决组分含量的实时在线监测问题。针对具有颜色特征的稀土萃取过程,利用时序图像特征开发元素组分含量监测系统的思想可为稀土萃取过程组分含量在线监测提供新思路,基本流程如图2所示。

图2 的基本思想是:首先,利用稀土溶液图像信息采集装置定时采集时序图像,之后对时序图像提取时序特征;然后,结合生产指标构造分类器进行分类,若分类结果是标签为最佳工况的类别,则表明此时的工况是最佳工况,无需对稀土萃取过程工艺参数进行调整,等待下一次时序图像的判断;反之,则启动图像检索系统,依据分类结果,进入相应的组分含量区间图像库中进行相似度计算,按照相似度大小依次输出检索结果,取最相似的两幅图像对应组分含量的平均值作为预测输出,为稀土萃取过程调整工艺参数提供参考依据。

图2 监测系统的流程Fig.2 Flowchat of the monitoring system

2 时序特征提取方法

溶液图像的时序特征是元素组分含量监测系统的工况判断依据。首先,利用图像采集装置采集稀土槽体混合溶液的时序图像;然后对图像进行背景分割、图像滤波、提取中心区域,得到剪裁大小为128×128 的正方形图片,在此基础上提取溶液图像的最佳时序特征,为后续构建分类器判断工况做好准备。

由于萃取槽体稀土溶液图像与组分变化密切相关,故要提取混合溶液图像的时序特征,为了避免单一颜色模型的片面性,本文选用多颜色空间融合的方式进行时序特征描述。首先需根据被检测稀土元素的离子特征颜色特点,在不同颜色空间(如HSI、YUV(Luminance-Bandwidth-Chrominance)等)下,从包含多种稀土元素组分含量信息的稀土混合溶液图像中提取出与该元素组分含量关系密切的颜色特征分量;然后采用混合颜色空间颜色特征提取方法[10]进行稀土萃取溶液图像特征分量的融合,再采用主成分分析(Principal Component Analysis,PCA)方法对融合后的特征降维,以期获得该稀土元素在混合溶液图像中的最佳特征分量,为后续判断工况奠定基础。

混合颜色空间颜色特征提取的基本思想是针对HSI 和YUV 这两个都比较符合人类视觉系统的颜色空间,可将这两个颜色空间的颜色分量融合成为3 个综合颜色分量作为混合颜色空间的颜色分量,从RGB(Red,Green,Blue)颜色空间转换至HSI 和YUV 颜色空间的方法如式(1)~(3)所示。其他的颜色空间(如Lab颜色空间)与RGB颜色空间之间转换方式比较复杂,故在此处不予采用。由于YUV 颜色空间对于色度的描述不够准确,混合颜色空间的色调分量和饱和度分量只采用HSI颜色空间的H和S分量。根据式(4)将两个颜色空间的三个分量对应的一阶矩进行融合,得到混合颜色空间对应分量的一阶矩:

其中θ的计算公式为:

μMIX⁃1、μMIX⁃2和μMIX⁃3分别表示混合颜色空间下色调分量、饱和度分量和亮度分量颜色一阶矩的值。为图像中第y个像素的第x个分量颜色一阶矩的值,N表示样本图像的像素点的个数。WHSI和WYUV分别表示HSI空间的权重和YUV空间的权重。

权重的确定的具体步骤为:首先,对于某一颜色空间求其3 个分量的一阶颜色矩,通过PCA 方法得到降维后的一维颜色矩,把该颜色空间的一维颜色矩经分类器分类对工况进行识别,得到分类准确率;然后,通过上述方法确定另一颜色空间对于工况分类的准确率;最终,根据得到的工况判断准确率进行归一化处理,从而确定不同颜色空间的最佳权重。

主成分分析是一种多变量的统计方法[11],此方法具有参数设置简单、不受参数限制等优点,大多应用于模式识别、故障诊断、过程监测等相关领域。主成分分析的本质[12]是对于一组可能存在相关性的变量,利用正交变换的方法变换为一组线性不相关的变量,转换后的变量就称为主成分。

获取的时序图像共有m个样本点和n个参数变量,则构成一个样本集合矩阵Xm×n。

步骤1 对样本集合矩阵Xm×n进行Z-score 标准化处理,得到标准化样本集合矩阵Z。

步骤3 求相关系数矩阵R的特征值λj和特征向量v。

步骤4 将特征向量v根据特征值从大到小的顺序按列排列,计算各参数变量的贡献率cj及累计贡献率Ck:

式中k(k

工程上当Ck≥85%时[13],便可认为前k个主元保留了原始数据的大部分信息,被保留的信息是降维后的颜色特征分量,即提取得到的稀土混合溶液时序特征。

3 基于WOA的最小二乘支持向量机分类模型

3.1 最小二乘支持向量机

最小二乘支持向量机是一种从支持向量机(Support Vector Machines,SVM)中改进而来的一种算法,用于解决模式分类和函数估计等问题[14]。LSSVM 将SVM 优化问题的非等式约束经过替换变为等式约束,损失函数采用最小二乘线性系统,简化了计算的复杂性,从而提高了计算效率[15]。LSSVM的具体实现过程如下:

1)给定训练集T={(xi,yi)|i=1,2,…,l},xi∈Rn表示n维的训练样本输入向量,yi∈{+1,-1}是输出变量组。

2)在高维空间中构造函数:

其中:ω为可调权向量,φ(xi)是非线性核映射函数,b为偏差参数。

3)由结构风险准则,最优ω和b可经下述函数最小化得到:

其中:C是平衡训练误差与模型适应度的正则化参数,ξi是随机误差。

4)构造拉格朗日函数求解LSSVM的优化问题:

其中αi是第i个拉格朗日算子。根据卡罗需-库恩-塔克(Karush-Kuhn-Tucker,KKT)条件,分别求解L(ω,b,ξ,α)对ω,b,ξ,α的偏微分。

5)可通过式(11)求解α=[α1,α2,…,αl]T和b:

其中:e=[1,1,…,1]T,I是单位矩阵,Ω是核矩阵,本文采用径向基核函数(Radial Basis Function,RBF),则Ωij=φ(xi)⋅φ(xj)=k(xi,xj)=exp。

6)最后,在求解优化问题后,非线性分类器的函数表达式即LSSVM模型的输出为:

3.2 WOA-LSSVM模型的建立

鲸鱼优化算法(WOA)是2016 年提出的一种新的元启发式算法[16]。该算法对鲸鱼的收缩包围、“螺旋气泡网”策略和随机捕猎机制不断逼近猎物的狩猎过程进行数学模拟,具有调节参数少、全局收敛性强、收敛速度快等特点。

在收缩包围猎物阶段,座头鲸能够识别猎物的位置并将其包围,WOA 假定当前的最佳候选解是目标猎物或接近最优解,进而如果存在更优解则在每次迭代中更新位置,这一行为可表示为:

式中:t表示当前迭代次数,X*为当前得到的最佳解的位置向量,X为当前鲸鱼的位置向量,X(t+1)代表迭代后下一次的目标位置向量,A、C是系数向量,定义如下:

式中:a为收敛因子,值随迭代次数增加由2线性降至0,r为区间[0,1]内的随机变量。

其次是泡泡网攻击猎物阶段,该阶段包含两种行为,数学模型如下:

1)收缩包围机制(Shrinking Encircling Mechanism,SEM):这种行为是通过减小式(14)中的a值实现的,A的波动范围也随a的减小而减小。

2)螺旋式位置更新机制(Spiral Updating Position,SUP):座头鲸以螺旋运动的方式不断接近猎物,数学模型为:

式中:D′=|X*(t)-X(t)|表示第i条鲸鱼和猎物的最优距离,b是定义螺旋形状的常数,l是[-1,1]的随机数。

座头鲸在捕猎时,在收缩包围猎物的同时,会沿着螺旋线的路径游动,为了模拟这种行为,各按照50%的概率选择以上两种机制,数学模型为:

式中p为[0,1]的随机数。

最后是随机搜索捕食阶段,座头鲸是根据彼此的位置随机搜索,数学模型为:

其中Xrand为随机鲸鱼位置向量。

LSSVM 模型是通过调节惩罚参数C和核函数宽度σ来提高模型的预测性能,故本文采用鲸鱼优化算法对其参数进行优化,以提高模型的学习能力和泛化能力,从而达到提高分类正确率的目的。具体过程描述如下:

首先,对样本集进行归一化并设定参数值,即设置WOA的5个参数,分别是鲸鱼种群数N、最大迭代次数M、鲸鱼个体空间维度dim,鲸鱼种群位置的上界和下界;其次,初始化种群位置并定义适应度函数,并对个体适应度进行计算,选出当前最优个体并设置该个体的位置为最优;接着,根据随机产生的数p决定鲸鱼个体进行螺旋式位置更新或收缩包围运动;最后,循环迭代至WOA 满足终止条件,输出寻优得到的参数值。WOA-LSSVM算法流程如图3所示。

图3 WOA-LSSVM算法流程Fig.3 Flowchart of WOA-LSSVM algorithm

通过WOA 对LSSVM 进行参数寻优,可以避免传统人工反复试错的过程,结合WOA的调节参数少、结构简单、收敛速度快等特点,实现对LSSVM 的惩罚参数C和核函数宽度σ的快速寻优,来提高WOA-LSSVM 状态识别的正确率。实验中,以最小二乘支持向量机的平均分类准确率作为适应度函数,评价鲸群中每个个体的适应度,适应度较高的成员被保留,试图找到搜索空间内的最佳适应度所对应的C和σ。

4 元素组分含量预测

根据图2,当实时监测的溶液图像时序特征经分类器分类得到的结果不是最佳工况,说明稀土混合溶液中的组分含量超出理想工况对应的区间,需要启动图像检索系统,利用图像检索算法获取元素组分含量值。

4.1 特征提取

HSV颜色空间是一种针对人类视觉感知构造的一种颜色模型,色调、亮度和饱和度是三种人眼能看到的主要色彩直觉要素[17]。现有的基于HSV颜色空间的直方图检索算法大多采用3个分量进行非等间隔量化[18],但在用于检索的过程中,H分量的重要性没有得到充分体现,因此在提取稀土元素图像的颜色特征时,采取改进的HSV颜色空间算法。在改进的算法中,考虑在合适的范围里,将H分量进行量化,统计H分量的直方图信息,而S和V分量不统计直方图信息,只计算每幅图像S和V分量的一阶矩的值,以此来提高检索的准确率[19]。

4.2 图像相似度度量

图像相似度计算主要用于对于两幅图像之间内容的相似程度进行评判,根据相似度值的高低来判断图像内容的相近程度。为综合利用HSV 颜色空间的分量信息,本文通过计算两幅图像间H 分量直方图的欧氏距离以及S、V 分量一阶矩值的差,并对这3个值进行线性加权的方法进行特征匹配。图像间的相似度由最终的线性加权值Q确定,具体计算公式如下:

其中:H′表示两幅图像间H分量直方图的欧氏距离,Hr表示待检索图像的H 分量直方图,Hd表示检索数据库中图像的H 分量直方图;S'表示两幅图像间S 分量一阶矩值的差的绝对值,μsr和μvr分别表示待检索图像S 和V 分量的一阶矩值;V'表示两幅图像间V 分量一阶矩值的差的绝对值,μsd和μvd分别表示检索数据库中图像S 和V 分量的一阶矩值;ωi为权重,权重的大小由交叉验证法进行多次实验得到。Q值越小,图像间的相似度越高。

检索系统被启动后,依据式(18)在稀土混合溶液历史图像库中选取相似度较强的溶液图像,求取最相似的前两张溶液图像对应元素组分含量的平均值,作为待检索图像稀土元素组分含量的检测结果。

5 实验与结果分析

5.1 实验对象

为了验证前文提出的基于时序特征的稀土萃取过程组分含量动态监测系统的有效性,以江西省某稀土公司的Pr/Nd萃取分离生产过程为研究对象,设计算法验证和现场测试两部分实验,前者是基于萃取分离现场的历史数据进行工况分类器的构建和图像检索系统性能评价,后者是对稀土元素组分含量动态监测系统进行现场有效性测试。数据采集过程如下:从Pr/Nd 萃取线混合槽体的监测级中不同时段不同工况下采集90 份样本溶液,每一个样本均分为两份,一份用于离线实验室化验获取样本溶液的元素组分含量,其中Nd元素组分含量分布在0.01%~99.965%;另一份采用实验室自行开发的基于机器视觉技术的稀土溶液图像信息采集装置获取混合溶液图像。

5.2 提取时序特征

为了用较少的综合指标表示出存在于不同变量中的各类信息,利用式(5)~(7)对两个颜色空间下的基本特征量进行PCA,如表1所示。

表1 各颜色空间下主成分贡献率Tab.1 Contribution rates of principal components in each color space

由表1 可知,选取的主成分越多,累计方差贡献率也就越高,当HSI、YUV和混合颜色空间下选取的主元个数都为1时,方差贡献率分别达到了92.94%,96.56%和92.98%,均大于工程上所要求的85%,表明前1 个主元既代表了原始数据信息,又减少了冗余,故取前1个主元作为建模变量。

5.3 分类器分类效果评价

时序特征提取之后,根据稀土萃取生产现场性能指标要求,最佳工况下某监测级的Nd组分含量区间要求是[84,94],则设置此区间为最佳工况类,组分含量位于最佳工况组分含量区间左侧的为偏低工况类,另一侧的为偏高工况类。实验设置训练样本个数为61,其余29个样本为测试样本。

通过将训练样本输入到WOA-LSSVM 分类器中,得到了最佳参数Cbest为26.378 5,σbest为0.016 1,将参数代入模型中得到分类结果。本文采用最小二乘曲线拟合、SVM、基于粒子群优化的最小二乘支持向量机(Particle Swarm Optimization-LSSVM,PSO-LSSVM)、WOA-LSSVM 四种算法进行同等条件下的10 次随机数据分类测试,并进行优劣性比较,四种对比实验的模型参数说明如表2 所示,对比实验的测试性能结果如表3 所示,其中准确率的定义为分类正确的测试样本数与总测试样本数的比值再乘以100%。

表2 模型参数说明Tab.2 Description of model parameters

表3 对比实验结果Tab.3 Comparison experimental results

表2 中列出的最小二乘曲线拟合方法的超参数是通过试凑法手工多次调试得到,当曲线拟合方程为4 阶时,残差的平方和最小,拟合的效果最佳;SVM方法中是利用人工经验设置Matlab 中的fitcecoc 分类函数的超参数;PSO-LSSVM 模型的超参数是通过粒子群算法来确定。

由表3 可以看出:1)基于混合空间综合特征的分类准确率基本高于单一特征;2)WOA-LSSVM 算法在混合特征下的分类准确率最高,同时其标准差的值也较小,说明稳定性较高。因此,使用WOA-LSSVM 算法来判断稀土萃取工况有一定的优势。

5.4 图像检索系统性能评价

为检验改进的HSV 颜色空间混合特征检索算法的预测精度,对5.1 节中的90 个样本溶液图像提取图像的颜色直方图特征,随机抽取80 个样本图像构建历史图像的特征数据库,剩余10 组图像作为测试图像。采用4.2 节的图像相似度度量方法,输出相似度由高到低排列的检索结果图像,取检索结果最相似的前两张图像计算对应组分含量的平均值,作为检索图像的稀土元素组分含量检测结果。改进的HSV 颜色空间混合特征检索算法对比传统的颜色直方图特征的检索结果与误差分析如表4所示。

表4 基于不同特征的检索结果与误差分析 单位:%Tab.4 Retrieval results and error analysis based on different features unit:%

由表4 的检索结果可知,改进的HSV 颜色空间混合特征检索算法效果优于传统的基于HSV 颜色直方图特征的图像检索算法,特别是后5 组数据,有明显的改进效果。对比可知,说明前者的检测结果满足组分含量在线检测的精度要求,并具有较高的检测精度。

5.5 基于时序特征的组分含量监测系统测试

现设计如下实验:利用实验室的稀土溶液图像信息在线采集装置,在江西某稀土公司镨/钕生产现场的萃取槽体监测级处,定时采集稀土溶液的时序图像,从8:00 开始采集,每隔1 h采集一次图像,直至17:00共采集10组图像。每采集一次图像,均通过基于时序特征的稀土元素组分含量动态监测系统进行测试,由于最佳工况条件下,萃取段监测级的组分含量区间为[84,94],系统测试结果与离线化验样本溶液的元素组分含量相比较,测试性能如表5所示。

由表5 的结果可以看出:1)对比第2 列和第3 列可知,该系统在实验阶段对萃取工况判断的准确率为100%;2)对比分析第4~5 列,采集的每一组图像数据进入基于时序特征的稀土元素组分含量动态监测系统后,均由图像时序特征经分类器分类判断萃取工况,只有萃取工况不在最佳状态时,才启动图像检索系统输出组分含量值;3)分析第6 列可知,稀土溶液图像检索系统输出的组分含量值相对误差较小,相对误差的绝对值均在5%以内。综上分析,本文开发的基于时序特征的稀土元素组分含量动态监测系统符合稀土萃取生产现场的应用要求,可以实现对稀土元素组分含量的动态监测。

表5 所提系统整体测试结果Tab.5 Overall test results of the proposed system

6 结语

针对稀土萃取过程元素组分含量在线监测难和现有组分含量检测方法存在耗时、耗内存的问题,构建了一个基于溶液图像时序特征的稀土元素组分含量动态监测系统。首先依据萃取生产现场指标要求,结合主成分分析法与多颜色空间特征融合方法得到判断工况的萃取溶液图像最佳时序特征,构造基于鲸鱼优化算法的最小二乘支持向量机分类器对工况状态进行判断,基于以上方法利用Matlab GUI 平台搭建了萃取工况判断系统;针对稀土生产工艺不在最佳工况的情况,开发了基于改进的HSV 颜色空间混合特征检索算法的图像检索平台。通过镨/钕萃取分离现场数据测试,结果表明本文开发的稀土元素组分含量动态监测系统不仅能够满足稀土萃取组分含量检测的快速性和准确性要求,且能根据工况判断是否输出组分含量值,可有效提高判断速度并节约计算成本,可为具有颜色特征的其他工业过程动态监测提供借鉴。

猜你喜欢
时序组分分量
顾及多种弛豫模型的GNSS坐标时序分析软件GTSA
近红外定标法分析黏/锦/氨三组分纤维含量
清明
基于GEE平台与Sentinel-NDVI时序数据江汉平原种植模式提取
稻米氨基酸含量和组分及其调控
你不能把整个春天都搬到冬天来
画里有话
煤的族组分基本特性研究
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤