多元线性回归提高激光诱导荧光辅助激光诱导击穿光谱技术的准确度

2022-03-14 02:02李创锴陈文骏黄妍鑫李嘉铭李祥友吕启涛张庆茂
光谱学与光谱分析 2022年3期
关键词:决定系数谱线线性

吴 杰,李创锴,陈文骏,黄妍鑫,赵 楠,李嘉铭,2*,杨 焕,李祥友,吕启涛,5,张庆茂,2,5

1.华南师范大学,广东省微纳光子功能材料与器件重点实验室,广东 广州 510006 2.华南师范大学,省部共建光信息物理与技术国家重点实验室,广东 广州 510006 3.深圳技术大学,中德智能制造学院,广东 深圳 518118 4.华中科技大学,武汉光电国家研究中心,湖北 武汉 430074 5.广东省工业超短脉冲激光技术企业重点实验室,广东 深圳 518055

引 言

分析材料的元素成分以及含量可以帮助判断材料的性能好坏,空气、水质的好坏也都可以通过元素的成分和含量进行判断。除此之外还能通过元素成分和含量判断设备的腐蚀情况、安全性和寿命。因此元素成分分析广泛应用在冶金[1]、核工业[2-3]、污染检测和环境检测[4]等领域,是一种必不可少的需求。目前常用的元素成分分析方法,有原子吸收光谱法(AAS)[5-6]、X射线荧光光谱法(XRF)[7-8]、质谱法(MS)[9-11]等。虽然这些技术有较高的灵敏度和精度,但需要进行复杂的预处理,效率往往较低并且容易受到环境以及各种元素的限制。激光诱导击穿光谱(laser-induced breakdown spectroscopy,LIBS)技术是一种原子发射光谱分析技术,可以在不做预处理的情况下,同时对物质的多种元素成分进行分析,具有快速检测的能力。但LIBS的检测灵敏度仍然不足,在实际应用中存在着较多限制。因此,光谱增强方法一直以来都是LIBS研究领域的热点。

常用的LIBS光谱增强方法有激光诱导荧光辅助激光诱导激光光谱(laser-induced breakdown spectroscopy-laser-induced fluorescence,LIBS-LIF)技术、共振增强激光诱导击穿光谱(resonance-enhanced laser-induced breakdown spectroscopy,RELIBS)技术和共振激光诱导击穿光谱(resonance laser-induced breakdown spectroscopy,RLIBS)中,LIBS-LIF是其中增强倍数最高的,可以有效的提高灵敏度和准确度。LIBS-LIF是由加拿大多伦多大学的Kwong[12]在1979年首次提出并初步验证,其原理是一束激光在待测样品表面烧蚀出等离子体,再用另一束特定波长的激光辐照等离子体,当该激光的单光子能量等于等离子体中待测元素原子上下能级之差时,处于下能级的原子发生受激吸收跃迁至上能级,上能级的原子再向下跃迁发射特征荧光信号,从而增强分析元素的谱线。近年来,LIBS-LIF已被应用于多个领域,Loudyi[13]等采用LIBS-LIF技术对水溶液中Pb和Fe进行检测,检测极限分别为39和65 ppb,比LIBS的检测极限分别低了490倍和570倍;Shen[14]等使用了LIBS-LIF技术在空气环境下对钢铁样品中的P进行了元素分析,在最佳条件下P的检测极限达到了0.7 ppm;Shen[15]等用LIBS-LIF技术检测了核废料玻璃中残留的铀元素,提出了等离子共振激发法。上述研究在实验方法的选择以及实验参数上进行了优化,但并没有考虑当基体原子与目标原子的特征谱线十分接近时,基体谱线会受到影响,将会导致一元定标准确度下降的问题。而一种元素往往有多个特征谱线。

利用待测元素和基体元素的多条特征谱线结合其他强度较高的谱线通过多元线性回归的方法解决以上出现的激发干扰问题。以钢铁中的Ni和Cr元素为例,对比了一元定标(Ni Ⅰ 301.26 nm和Cr Ⅰ 428.99 nm)和多元定标拟合模型的决定系数(adjusted R-Square,R2)、平均相对误差(average relative error,ARE)、交叉验证均方根误差(root mean square error of cross validation,RMSECV)的变化情况,深入研究了维度对拟合模型拟合效果的影响。

1 实验部分

1.1 仪器及参数

实验装置如图1所示。由Nd:YAG脉冲激光器(Quantel Bigsky Ultual 100,波长532 nm,脉冲宽度6 ns,重复频率10 Hz,平顶高斯光斑分布)发出的激光束经过反射镜反射与透镜聚焦后投射到钢铁样品表面,OPO激光器(OPOTEK Inc.,Vibrant HE 355 LD,波长范围225~2 400 nm,脉冲宽度10 ns,平顶高斯光斑分布,线宽20 cm-1,重复频率10 Hz)激光束通过透镜聚焦后照射在样品并激发等离子。激光激发的等离子光信息经多芯光纤收集后进入光谱仪(Andor Technology,Shamrock 500i,光栅2 400线·mm-1),ICCD(Andor Technology,iStart 320T)将光谱仪收集到的光信号转换为电信号,ICCD门宽设置为10 ns。两个激光器与ICCD通过数字延迟发生器(Stanford Research Systems,DG535)进行同步。每一幅光谱图收集100采样点信息,每个样品重复进行10次实验。为了便于描述,我们将OPO激光器发出的光称为“LIF激光”,采集含Ni样品光谱时,将LIF激光设置为234.56 nm,采集含Cr样品光谱时,将LIF激光设置为357.87 nm。

图1 LIBS-LIF 实验装置图Fig.1 Schematic diagram of LIBS-LIF experimental setup

1.2 样品

实验用22个微合金钢样品,其中7个购于中国钢铁研究总院、8个购于美国国家技术研究所、7个购于攀枝花钢铁研究院。22个微合金钢样品的铬和镍含量如表1所示。

表1 微合金钢样品中Ni与Cr元素含量对照表(Wt%)Table 1 Concentrations of Cr and Ni in micro alloyed steel samples(Wt%)

1.3 多元线性回归法

多元线性回归最终的表达式为y=w0x0+w1x1+…+wnxn,可简写成矩阵的形式Y=XW。其中Y为因变量,X为自变量(X的第一列全为1,作为偏置列),W为自变量的系数,自变量维度为N。

多元线性回归的目的是求出的W是最接近线性方程的解,或者是使得残差平方和最小。

残差公式

(1)

残差平方和

(2)

推导如式(3)—式(7)

ei~N(0,σ2)

(3)

(4)

(5)

(6)

(7)

得出

(8)

(9)

由式(8)和式(9)即可求得W,从而得出多元线性拟合表达式。

综上所述,在公路工程建设施工中,施工技术控制和管理与进度、质量、成本等很多方面都存在着联系,为了做好这项工作,应建立完善的管理体系,设置专门的管理部门,进一步加强技术管理力度,从而保障施工质量。

多元线性拟合在已知多种类型的多组自变量和所对应的单组因变量时,可以对他们之间的关系进行很好的拟合和预测,并降低了一元线性拟合出现过拟合的可能性。

2 结果与讨论

2.1 多元线性拟合提高元素含量拟合准确度

利用Ni Ⅰ 301.26 nm与Cr Ⅰ 428.99 nm两条特征谱线数据建立Ni元素与Cr元素光谱强度与元素浓度的关系,预测浓度和实际浓度的拟合结果如图2(a)和(b)所示,可见,在使用单一谱线进行拟合时,Ni元素与Cr元素一元线性拟合系数分别为0.960 1与0.992 0,拟合效果较好,但依旧具有提升空间。

图2 Ni元素(a)和Cr元素(b)的预测-真实一元线性拟合Fig.2 Results of Cr concentrations (a)and Ni concentrations (b)predicted by simple linear regression

为了进一步提高元素含量拟合准确度,我们将22个样品进行LIBS-LIF实验并在300~311 nm范围内分别收集8条Ni和Fe原子谱线对Ni进行多元线性拟合,在420~433 nm范围内选择10条Cr和Fe原子谱线对Cr元素进行多元线性拟合,其光谱如图3(a)和(b)所示。

图3 含Ni元素样品(a)含Cr元素样品(b)的LIBS光谱强度Fig.3 LIBS spectral intensities of Ni containing samples (a)and Cr containing samples (b)

其多元线性拟合系数如表2所示。

表2 Ni和Cr元素多元线性拟合系数Table 2 Regression coefficients of multiple linear regression

通过上述18条谱线数据建立Ni元素与Cr元素含量拟合模型,拟合结果如图4(a)和(b)所示。

由图4可见,在利用多元线性拟合处理后Ni元素拟合系数由0.960 1提高至0.992 9,Cr元素拟合系数由0.992 0提高至0.998 7,拟合系数都有进一步的提高。

2.2 定标曲线准确度与拟合维度数关系分析

为探究多元线性拟合模型中拟合维度数变化对准确度的影响,对不同拟合维度的平均相对误差ARE、交叉验证均方根误差RMSECV、决定系数R2随维度的变化情况进行分析,同时为了避免干扰,探究过程中不计入含量最低的两个样本数据。

将拟合系数按从小到大的顺序逐渐去除对应的谱线,并计算去除后的模型决定系数,以此建立拟合维度数与实验决定系数R2的关系图,结果如图5(a)和(b)。

图5 Ni元素(a)与Cr元素(b)决定系数-维度变化曲线Fig.5 The fitting coefficients of Ni(a)and Cr(b) with different dimensions

由图5可见,决定系数R2随着回归模型的维度增加而增大。通过多元线性拟合,Ni元素的线性回归模型决定系数由0.992 0增加至0.998 2,Cr元素的线性回归模型决定系数由0.960 1增加至0.992 9,说明随着变量个数的增加回归模型的预测效果变得更加准确。

2.2.2 拟合模型相对误差ARE随维度数量的变化

将拟合系数按小到大的顺序逐渐去除对应的谱线,并计算去除后的模型相对误差,以此建立拟合维度数与实验相对误差ARE的关系,结果如图6(a)和(b)。

从图6可见,随着拟合维度数的增加,Ni和Cr元素含量拟合模型的平均相对误差都有所降低;Ni元素含量的回归模型平均相对误差整体都能控制在15%以内,随着拟合维度的增加,平均相对误差不断减小。Cr元素回归模型的平均相对误差由50%降低至25%以内。当拟合维度在6个和8个以上时,线性回归模型的平均相对误差开始有一定的增大,初步判断可能是多个维度的加入减少了过拟合的影响,即降低单个维度独有的特征对拟合函数的影响。

从图6中可以看出Ni和Cr元素的多元线性拟合平均相对误差整体上随变量个数的增加而下降,维度数越多,就越能正确的估计元素含量。

图6 Ni元素(a)与Cr元素(b)平均相对误差-维度变化曲线Fig.6 ARE of Ni(a)and Cr(b)with different dimensions

2.2.3 拟合模型交叉验证均方根误差RMSECV随维度数的变化

交叉验证是一种统计学上将数据样本切割成较小子集的实用方法。在给定的建模样本中,拿出大部分样本进行建模,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。这个过程一直进行,直到所有的样本都被预报了一次而且仅被预报一次。本实验采用的则是去一交叉验证法,具体步骤为将20个样本中的19个样本作为训练集,剩下的1个样本作为测试集。每一个维度进行20次的交叉验证使之得出的结果与训练整个测试集的期望值最接近。通过式(10)

(10)

式(10)中,Yi为样品值,yi为预测值,n为样品数,计算结果如图7(a)和(b)所示。

由图7可见Ni元素的线性回归模型的RMSECV值在维度增加到两个后就已经趋近于一个较为稳定的数值,约2%左右;而Cr元素的线性回归模型的RMSECV值随着维度的增加,分别在第四个和第六个维度有着较为明显的降低,之后稳定在1.6%左右,保持在较好的水平。维度由小到大逐渐提升时,RMSECV的数值呈阶梯式下降,待测元素和集体元素的多条特征谱线的引入降低了过拟合的程度,不再会把某一个维度的特征当作趋势,可以一定程度的降低过拟合带来的误差。而两者拟合效果的变化差异主要在于各谱线的加入对拟合结果的影响不同,但由图7可以看出,两个元素的拟合模型效果基本在增加到六条谱线后能保持一个较好水平。

图7 Ni元素(a)与Cr元素(b)交叉验证均方根误差-维度变化曲线Fig.7 RESECV of Ni (a)and Cr (b)with different dimensions

Ni和Cr元素在维度变化时它们各项参数的变化趋势存在一定差距,其原因可以在多元线性拟合的系数中找到。Cr元素不论是误差还是R2普遍都在谱线增加到3~4条时才有较为明显的变好,可以看到Cr元素的多元线性拟合系数的前四项均十分接近。初步推断是由于这四条谱线的权重在拟合方程中十分接近,每增加一条谱线,拟合模型都要增加其相应谱线的特征,所以误差和决定系数不能很好的体现出模型的优化。而Ni元素其第一条谱线占比的权重最大,第二条谱线的加入对其影响会降低,推断其第二条谱线的特征与第一条的特征较为接近,所以在第二条谱线加入后RMSECV值降低较快,产生了一定的过拟合现象,也是ARE值变化不大原因。

由决定系数、评价相对误差、交叉验证均方根误差这三项指标可以看出,随着维度的增加,拟合模型越来越准确,误差也逐渐降低。引入了待测元素和集体元素的多条特征谱线后,降低了过拟合的程度。

3 结 论

通过待测元素和基体元素的多个特征谱线对Ni和Cr元素含量进行多元线性拟合分析,随着特征谱线的增加,Ni和Cr元素的线性拟合模型决定系数R2、平均相对误差ARE、交叉验证均方根误差RMSECV都随拟合维度的增加不断改善,最终实现LIBS-LIF分析准确度的提高:①Ni元素线性拟合系数提升至0.998 2,Cr元素拟合系数提升至0.992 9;②Ni元素线性拟合相对误差降低至15%以内,Cr元素线性拟合相对误差降低至25%以内;③Ni和Cr元素线性拟合交叉验证均方根误差控制在2%左右。

通过引入待测元素和基体元素的多个特征谱线对Ni和Cr元素含量进行多元线性拟合分析,提高了拟合模型的准确度。不再依赖待测元素的单条谱线,是解决激发干扰问题的可行方案。

猜你喜欢
决定系数谱线线性
“羲和号”首次获得三种太阳谱线轮廓
渐近线性Klein-Gordon-Maxwell系统正解的存在性
依据不同波段光谱诊断闪电回击通道温度*
线性回归方程的求解与应用
日本乌贼(Sepiella japonica)形态性状与体质量的相关性及通径分析
基于彩色CCD的棱镜摄谱实验数据处理
不同规格香港牡蛎壳形态性状对重量性状的影响
2种贝龄合浦珠母贝数量性状的相关与通径分析
二阶线性微分方程的解法