基于PDS算法的不同光照下模型传递研究

2017-04-12 00:55张文君唐红
湖北农业科学 2017年5期
关键词:近红外光谱糖度

张文君++唐红

摘要:针对在室外光照对样品使用近红外光谱检测带来误差的问题,提出基于模型传递来减少检测误差的方法。以圆黄梨为样品,分析样品在室内、室外阴影下的近红外光谱,建立室内光谱的PLS模型。采用分段直接校正(Piecewise Direct Standardization,PDS)算法,减小室内外光谱差距,使得室内PLS模型能预测室外光谱。结果表明,在室内建立的模型能预测经PDS算法传递后的室外光谱,预测决定系数(R2)和标准差(Root Mean Square Error of Prediction,RMSEP)分别为0.64和0.565 27,能有效地解决室外光照对光谱检测影响的问题。

关键词:近红外光谱;分段直接校正;光照影响;模型传递;糖度

中图分类号:O657.33 文献标识码:A 文章编号:0439-8114(2017)05-0969-04

DOI:10.14088/j.cnki.issn0439-8114.2017.05.046

Research on Model Transfer Based on the Piecewise Direct Standardization

at Different Illumination

ZHANG Wen-jun, TANG Hong

(College of Metrology Measurement Engineering, China Jiliang University, Hangzhou 310018,China)

Abstract: For an error problem caused by near infrared spectrometer was used to detect sample at outdoor, a method was proposed based on model transfer to reduce the measurement error. Using the Wonhuwang pears samples, which analysis near infrared spectrum of samples of indoor and outdoor shade by near infrared spectroscopy(NIRS) and using an indoor spectrum by establishing a partial least squares(PLS) model. This experimental was using the Piecewise Direct Standardization (PDS) algorithm to reduce the gap between the indoor and outdoor shade spectrum. The model could effectively predict the outdoor spectrum. The experimental results show that the coefficient of determination R-squared of the prediction set was 0.64 and the root mean of square error of prediction(RMSEP) of the prediction was 0.565 27, it could effectively solve the measurement error using near infrared spectrometer at outdoor.

Key words: NIRS; PDS; illumination; model transfer; sugar

中国是水果产量大国,但水果出口率仍然较低,而导致出口率低下的主要因素是对水果处理技术的不成熟,水果质量的管控没有得到很好的保障。目前,水果检测技术采用较多的是近红外光谱技术,该技术具有快速、绿色、无损等特点,但由于影响近红外光谱仪检测准确性的因素较多,更多的应用在室内恒定的条件下,在室外应用的结果不理想。在室外检测水果,太阳光的照射会改变入射光谱,使得水果漫反射光谱发生改变,从而影响检测结果。

为了解决室外的光照对光谱仪检测的影响,国内外学者做了很多研究。Saranwong等[1]使用便携式近红外光谱仪在果园对芒果进行了光谱检测及分析,发现黑色袋子能消除部分光照的影响,但该方法适用范围有限,且对实际应用带来不便。吴方龙等[2]在室内利用灯光来模拟室外光照对梨进行了光谱检测,用预处理方法消除了光照影响,但该试验不能很好地反应实际应用情况。

近年来,近红外光谱仪在使用中经常会遇到测量环境发生改变时,模型无法共用的问题。很多学者提出采用模型传递来解决这个问题。模型传递可以减少由于测试环境的变化需要重建模型的麻烦。如,林振兴等[3]将PDS算法用于检测不同温度下的喷漆燃料光谱,有效地解决了温度对喷漆燃料光谱检测带来的影响。

本研究以圆黄梨为样本,对其糖度進行了室内、外不同光照条件下的近红外光谱检测,采用PDS算法对室外光谱进行模型传递,使得室内模型能很好地预测室外光谱,以期为近红外光谱仪在室外的应用提供参考。

1 模型传递原理与PDS算法

随着化学计量学及光谱学的快速发展,近红外检测技术随之进入一个新的时代,它已成为一种快速和高效的分析技术,成功应用在食品[4]、药物[5]、工业[6]等行业。这种分析技术为多元校正方法,即对样品的自变量和因变量之间的建立函数关系(建立数学模型),该过程为校正。预测过程是通过自变量数据和已建模型来计算因变量数据[7,8]。该分析技术在光谱分析中也被称为模型传递(Model Transfer),基于光谱模型传递的校正过程有DS(Direct Standardization,直接校正)算法、PDS(Piecewise Direct Standardization,分段直接校正)算法和Shenks算法[9]。以下介绍PDS算法和传递模型稳健性的评价。

1.1 模型传递

模型传递是为了解决样品所建模型在不同仪器上不能共用的问题,即在某一仪器(称源机,Master)上建立一个多元校正模型,而该模型在另外一台与源机相同型号的仪器(称目标机,Slaves)上无法使用,或者结果产生较大的偏差,通过模型传递可以消除仪器之间的偏差。同理,在不同光照环境下,对光谱分析也可以采用模型传递来消除光照环境对样品检测的影响。首先,利用近红外光谱仪测量样品的光谱。即室内光谱采用主仪器光谱(Master),室外所测光谱采用从仪器光谱(Slaves)进行模型传递。然后,采用PDS算法来消除或减小主、从仪器间光谱的差距。

1.2 PDS算法

PDS算法是一种多元全光谱标准化方法[10]。它通过转移矩阵F将室内光谱矩阵Rm(主仪器光谱)转换成室外光谱矩阵Rs(从仪器光谱),减小Rm与Rs之间的差异,使二者匹配。其中矩阵F为室内、外光谱下的光谱响应差异。

PDS算法的具体步骤:

1)对应于Rms,i,在从仪器标样光谱矩阵Rss选取窗口为(j+k+1)大小的光谱段Rss,j+k+1,(from(i-j)th to (i+k)th wavelengths),组成矩阵Xs,i=[Rss,i-j,Rss,i-j+1,…,Rss,j+k-1,Rss,j+k],i代表波长点,j、k分别代表i波长点左右不同的窗口宽度。

2)将Rms,i与Xs、i进行关联,Rms,i=Xsbi,转换系数 可由PCR或PLS方法求出。

3)循环i,求出所有的bi,i=1,2,…,m。

4)对未知样品光谱rs,un经固定窗口分段,由转换系数bi循环得到rm,un相一致的光谱r ■■。对于rs,un两端,窗口大小的波长范围(i~j和m-k~m)不能转换,一般舍去,也可通过外推法获得。在本研究中,数据点两端通过样条插值获得。

1.3 KS(Kennard-Stone)算法

在模型传递效果中,为了克服测量环境不同而引起的误差,必须使转换集在主仪器和从仪器所测信号中包含足够多的信息;同时,在主仪器上选择转换集的效果最好。KS算法是由Kennard-Stone提出,选择标准样品的一种选取转换集的有效和广泛应用的方法,它是根据光谱主成分之间欧式距离d来决定的,从而在光谱特征中均匀地选取标准样品。

dij=■

式中,dij为样本i和样本j之间的欧式距离,p为样品光谱的波长个数。

1.4 模型传递的评价

为了比较建模效果质量的好坏,可以通过决定系数R2(相关系数R)、校正均方根误差(RMSEC)和预测均方根误差(RMSEP)等来判断。R2越大越接近1,均方根误差越小,越接近0建模效果越好。

R2=1-■

RMSEC=■

RMSEP=■

其中,n为校正集样品的数目,f为主成分数目,Ip为预测集样品的数目,yi为样品测量的实际值,y为样品的平均值,■为预测样品集的预测值。

2 材料与方法

2.1 材料与处理

试验样品均采自浙江省杭州市果园,选择大小、颜色相近的圆黄梨150个,样品按2∶1分为校正集和预测集。将样品擦拭干净并按序标记,在每个样品赤道处均匀取4个点作为测量位置,将样品保存在室内恒定温度下,直至样品表面温度与室内温度相同。表1是校正样本和预测样本的糖度值。从表1可知,样品的糖度校正集15.11 °Brix和预测集15.69 °Brix近似相等,样品预测值在正常的校正样品范围内。

2.2 试验仪器

MCS600型德国蔡司光谱仪,并携带90 °垂直积分球进行测量,光谱范围300~1 700 nm,分辨率为3 nm,光谱采集软件为仪器自带软件Aspect plus 2.0;理化值测定使用ATAGOPR-101α型数字式糖度计,测定范围为0~45 °Brix,误差为±0.1 °Brix;光照度计使用希玛AR823数字照度计,测量范围是1~200 klx,分辨率为1 klx;数据处理及建模软件为MATLAB2012b。

2.3 试验设计

将样品进行预处理后对样品进行不同光照条件下的光谱检测。为了减小温度、湿度等因素对检测的影响,先在室内保存24 h以上再进行检测。在室外检测时,为了避免太阳长时间照射改变样品表面温度,快速检测样品的近红外光谱。在室内恒定条件下对样品采用漫反射光谱检测,对每个样品采集点进行采集,取均值作为该样品的最终光谱;在室外光照条件下进行上述试验,作为该样品光照下的光谱。

3 光谱数据分析

3.1 样品参数的选择

对于PDS算法而言,参数的选择很重要,包括转移样品数和窗口宽度。在实际应用中,主要關注的是窗口的选择,窗口太小不能体现环境的差异,窗口的增大需要标样数的增大。若转移样品标样数太少会导致包含光谱转换信息不全,太多会导致使用不便。标样数的选择采用Kennard-Stone(KS)算法来选择,其结果的好坏由RMSEP来评价。

本研究以圆黄梨样品的室内光谱为主仪器光谱,室外光谱为从仪器光谱,进行光谱转移。首先对室内外光谱进行分段直接校正,选择窗口数为0、5、11,再用KS算法对转移后的样品进行选择,选择5、10、15、…、35、40个样品作为预测样品集,建立模型,并比较其RMSEP值,选择RMSEP值最小的参数作为最终结果,如图1所示。可以看出标样数的变化对均方根误差影响较大,而窗口数的变化带来的均方根变化就较为平缓。当窗口数变大时,选择标样数为5时,均方根误差一直都很小,但由于标样数太少会导致光谱包含信息太少,因此最终选择窗口宽度为7,标样数为10,此时的均方根误差为最小。

3.2 模型传递前后分析

太阳到达地表的光谱能量主要集中在可见光区域,而近红外区域相对较小,因此光照对光谱检测的影响应也在可见光区域较为明显,如图2所示为同一样品在室内外的光谱图,可以看出在可见光区域差异很明显。因此,对室内光谱建立PLS模型并预测室外光谱,其结果如表2所示,可见室内建立的模型根本无法预测室外光谱。

由表2可以看出,同一光照条件下的建模预测效果较好,即室内模型预测室内、室外弱光照模型预测室外弱光照、室外强光照预测室外强光照的效果较好,Rp分别为0.909、0.848和0.812,模型稳定;而不同光照条件下相互预测则效果不理想。室内模型不适合直接预测室外光谱,这是由于在室外,光照的照射,相当于增加了仪器可见光部分的入射光源,使漫反射光谱发生变化直接影响了圆黄梨光谱的检测,从而导致室外光谱与室内光谱存在很大差异。为了实现室内外模型的共享,对室外光谱采用模型传递的方法来减小室内外光谱的差异。

采用PDS算法对室外光谱进行修正,如图3所示,可以看出室内外光谱差异明显减小,用建立好的PLS模型预测转移后的室外光谱,决定系数R2为0.64,RMSEP为0.56。可见PDS算法确实能有效地减小光照对检测的影响。

为了减小均方根误差值,选择最小窗口宽度为7,标样数为10。同时采用PDS算法对室外光谱进行模型传递,其结果如图4所示。由图4可知,经PDS算法转移后的决定系数R2为0.64(R=0.8),预测偏差RMSEP为0.565 27、RMSEC为0.458 52,可以看出模型预测效果比经过PDS转移前的预测效果已经改善很多,有效地减小了室内外光谱之间的差异,减小了由于室外光照对检测所造成的影响,经过PDS算法传递后室内模型可以预测室外阴影下的光谱,有效地解决了光照对光谱检测及建模带来的影响。

4 小结

利用近红外光谱仪检测了室内外不同光照条件下圆黄梨的光谱,建立模型相互预测。结果表明,室内模型直接预测室外光谱的效果不好,但室外光谱经过PDS算法处理后,其预測结果的决定系数为0.64,RMSEP为0.565 27。PDS算法能有效地减小室内外光谱之间的差距,减小光照对光谱仪的检测影响,为室外使用便携式光谱仪提供理论依据。

参考文献:

[1] SARANWONG S,SORNSRIVICHAI J,KAWANO S. On-tree evaluation of harvesting quality of mango fruit using a hand-held NIR instrument[J].Spectroscopy and Spectral Analysis,2003, 11(4):283-293.

[2] 吴方龙,沈黄通,吴晨凯,等.基于近红外漫反射光谱无损检测梨可溶性固形物的光强影响探究[J].光谱学与光谱分析,2013, 33(10):2671-2674.

[3] 林振兴,邬蓓蕾,王 豪,等.PDS用于不同温度下的近红外光谱模型传递研究[J].分析测试学报,2008,27(12):1330-1333.

[4] 王小燕,王锡昌,刘 源,等.近红外光谱技术在食品掺伪检测应用中的研究进展[J].食品科学,2011,32(1):265-269.

[5] 孙露萍,王举涛.近红外在食品及药品农残检测中的应用研究进展[J].广州化工,2013,41(15):12-13,35.

[6] 薛 岗,宋文琦,李树超,等.基于近红外光谱技术的钢结构防火涂料品牌鉴别方法研究[J].光谱学与光谱分析,2015,35(1):104-107.

[7] 陆婉珍,袁洪福,徐广通.现代近红外光谱分析技术[M].北京:中国石化出版社,2000.

[8] 周林峰,吕 进,刘辉军,等.温度对果糖含量近红外光谱检测模型传递的影响[J].中国计量学院学报,2012,23(3):217-221.

[9] 张学博,冯艳春,胡昌勤.近红外多元校正模型传递的进展[J].药物分析杂志,2009,29(8):1390-1399.

[10] 诸小立,袁洪福,陆婉珍.光谱多元校正中的模型传递[J].光谱学与光谱分析,2001,21(6):881-885.

猜你喜欢
近红外光谱糖度
基于可见/近红外光谱的水蜜桃糖度无损检测方法优化研究
糖度高、类型多、瓜味足 “炫彩”系列小西瓜 亩产值3.5万元
甜菜块根糖度检测使用重复检测进行质量控制的方法
基于不同物候期苹果树叶片光谱特征预测果实糖度
利用油水稳定化和支持向量回归增强近红外光谱测定油中水分的方法
基于一元线性回归的近红外光谱模型传递研究
全国首条蜜橘糖度分选机落户南丰
初始含糖量和二氧化硫对冰红酒挥发酸的影响