食用油酸值与过氧化值近红外光谱模型转移研究

2020-10-10 07:07刘翠玲刘浩言孙晓荣吴静珠杨雨菲
农业机械学报 2020年9期
关键词:酸值过氧化食用油

刘翠玲 刘浩言 孙晓荣 吴静珠 杨雨菲

(1.北京工商大学计算机与信息工程学院, 北京 100048; 2.北京工商大学食品安全大数据技术北京市重点实验室, 北京 100048)

0 引言

酸值和过氧化值是检测食用油酸败的主要指标。通过检测酸值、过氧化值可以评价食用油品质的优劣,判断储藏期间食用油品质的变化情况[1-3]。近红外光谱法检测成本低、测试时间短、化学处理简单,甚至不需要对样本进行预处理,已被广泛应用于食品品质快速检测中[4-7]。由于仪器制造、测试环境的差异[8-9],仪器老化[10]、附件更换[9]等因素的影响,同一样本在不同仪器上的光谱响应不完全一致,使得主机所建立的校正模型用于从机时,预测结果达不到要求。模型转移为这类问题的解决提供了可行途径,其本质是克服样本在不同仪器间测量信号的不一致性,使得主机建立的校正模型可以用于其他仪器上,可以有效避免模型重建所消耗的时间与物质成本[11-14]。

近年来,国内外学者对模型转移技术在各个领域的应用进行了大量研究。文献[15]采用斜率/截距算法(Slope/bias,S/B)对猕猴桃可溶性固形物含量进行了模型转移研究,有效地提高了主机的预测性能。文献[16]采用分段直接标准化算法(Piecewise direct standardized algorithm,PDS)、S/B算法、正交投影算法实现了橄榄油脂肪、游离酸含量与含水率模型的转移。文献[17]使用直接标准化算法(Direct standardized,DS)进行了水稻土有机物含量、氮含量、pH值的模型转移研究。然而,目前针对食用油酸值与过氧化值近红外光谱模型在不同仪器之间的传递问题研究较少,文献[18]使用S/B算法进行了食用油酸值与过氧化值的模型传递研究,获得结果仍与理想效果存在一定差距。光谱空间转换算法(Spectral space transformation,SST)是一种利用标准光谱构造差异光谱投影空间的模型转移算法,具有参数简单、对转换集样本个数不敏感等优点[19]。本文采用SST算法建立转移模型,实现食用油酸值与过氧化值校正模型在不同仪器之间的转移,并与S/B算法、DS算法、PDS算法、TEAM(Extreme learning machine auto-encoder,TEAM)算法[20]进行对比研究,以期将近红外光谱检测更好地应用于食用油品质检测领域。

1 材料与方法

1.1 材料

本次实验所用食用油种类包括玉米油、芝麻香油、大豆油、橄榄油、小磨香油5种。样本来自于市售的不同等级和品牌,其中玉米油样本19个,芝麻香油样本25个,大豆油样本56个,橄榄油样本5个,小磨香油样本20个,共计125个样本。依照GB/T 5009.227—2016、GB/T 5530—2005测定所有样本的过氧化值与酸值。

1.2 实验仪器

实验使用布鲁克公司生产的VERTEX-70型傅里叶近红外光谱仪和MATRIX-F型在线过程分析傅里叶光谱仪,使用液体光纤探头,光程2 mm。

1.3 光谱数据的采集

VERTEX-70型傅里叶近红外光谱仪为主机,MATRIX-F型在线过程分析傅里叶光谱仪作为从机进行光谱采集。两台仪器的分辨率设置为8 cm-1,光谱采集范围为4 000~12 000 cm-1,每个样本重复扫描16次。5种食用油样本在主仪器上采集的光谱如图1所示,可以看出5种食用油近红外光谱较为相似,这是由于食用油主要由脂肪酸组成,不同种类食用油之间的光谱信息比较接近,产生波峰的位置差距很小[21]。4 310~4 360 cm-1间谱峰处不同种类食用油平均光谱如图2所示,可以看出不同种类食用油在同一波峰处吸光度存在一定差异。主从仪器所采集的5种食用油样本的平均光谱如图3所示。

图1 主仪器采集的5种食用油样本光谱Fig.1 Main instrument collects spectra of five edible oil samples

图2 5种食用油样本谱峰处平均光谱Fig.2 Average spectrum at peak of five edible oil samples

图3 主从仪器采集的样本平均光谱Fig.3 Average spectrum of samples collected by master and slave instruments

1.4 数据预处理

标准正态变量变换(Standard normal variate transformation,SNV)主要是用来消除固体颗粒大小、表面散射以及光程变化对近红外漫反射光谱的影响[22],对每个样本光谱x进行SNV变换获得变换后光谱xSNV,计算公式为

(1)

式中m——波长点总数

xk——样品光谱k波长点处吸光度

1.5 光谱空间转换法

设主、从仪器上采集的样品光谱矩阵分别为X1与X2,光谱矩阵的每一行代表同一样品的对应光谱。拼接X1与X2矩阵得到联合矩阵Xcomb,对联合矩阵进行主成分分析,即

(2)

式中T——得分矩阵

P1——主机载荷矩阵

P2——从机载荷矩阵

Xcomb的朗伯-比尔定律形式满足公式

(3)

式中C——样本目标值浓度矩阵

S1——主机测量条件下纯物质光谱

S2——从机测量条件下纯物质光谱

(4)

从机测得的验证集光谱矩阵Xtest与主机验证集光谱Xtrans之间的差异可以表示为

(5)

通过式(4)与式(5)可以得到从机测得的验证集光谱矩阵Xtest向主机验证集光谱进行转换的计算公式

(6)

式中上角标“+”表示Moore-Penrose广义逆。经过转换后的光谱Xtrans可以通过主机建立的多元校正模型进行目标成分浓度预测。光谱空间转换法通过在两个光谱空间之间进行转换来消除由仪器或测量条件的变化引起的光谱差异,光谱空间转换法对所研究的光谱无特殊要求,其可以适用于任何类型的光谱。

1.6 模型评价指标

使用校正集相关系数Rc、校正集均方根误差(RMSEC)、交互验证均方根误差(RMSECV)、预测相关系数Rv与预测均方根误差(RMSEP)对模型在校正集表现与验证集表现进行综合评价。

2 结果与分析

利用125个食用油样本在主从仪器上测得的平均光谱求出主从仪器之间的差谱,如图4所示,可以看出主从仪器光谱间存在明显的非线性差异。利用主机上测得的125个食用油样本,通过SPXY算法[23-24]选择100个样本作为校正集,25个样本作为验证集,使用SNV算法校正因散射引起的光谱误差,建立食用油酸值与过氧化值偏最小二乘多元校正模型。酸值与过氧化值建模结果如表1所示,其中通过五折交叉验证可以得到酸值模型的最佳因子数为17,过氧化值模型的最佳因子数为6。从表中可以看到食用油酸值模型与过氧化值模型预测集相关系数均大于0.95,且与校正集相关系数相差较小,所建模型较为成功。

图4 主机与从机样本平均光谱相减所得差谱图Fig.4 Subtracted spectrum for average spectrum collected by master and slave instruments

表1 主机酸值与过氧化值建模及预测结果Tab.1 Modeling and prediction results of acid and peroxide value of master instrument

利用主机所建立的酸值与过氧化值模型对主从机验证集进行预测,预测结果如表2所示,预测散点图如图5、6所示。对比表1、2可以发现,主机建模结果较好,酸值模型主机验证集Rv为0.975 9,主机验证集RMSEP为0.108 5 mg/g,过氧化值模型主机验证集Rv为0.958 1,主机验证集RMSEP为6.692 7 mmol/kg。而当使用从机测得的验证集光谱直接进行预测时酸值模型的验证集Rv下降为0.303 1,验证集RMSEP提高到0.583 6 mg/g,过氧化值模型的验证集预测相关系数下降到0.766 3,验证集RMSEP提高到15.801 0 mmol/kg。在浓度范围相同的前提下,预测相关系数Rv越接近1表示模型预测效果越好,RMSEP越小表明所建模型的预测能力越强。由图5、6可以看出,当从机验证集光谱直接应用于主机模型时,相较于主机验证集光谱存在较大的预测误差,其中从机酸值预测结果存在方向性误差。主机建立的酸值与过氧化值校正模型无法直接应用于从机扫描的光谱,需要进行模型转移改善预测效果。

表2 模型转移前从机样本预测结果Tab.2 Prediction results of slave samples before calibration

为评估SST算法的模型转移性能,采用S/B、DS、PDS和TEAM算法进行对比测试。S/B算法是一种目标值校正方法,通过建立主机与从机目标值间的数学关系对未知样本从机目标值进行校正。DS和PDS算法通过使用主机样本集光谱对从机光谱进行校正,使得校正后的从机光谱与主机光谱达到最大相似度进而利用主机模型对其进行目标浓度预测。TEAM算法将主机光谱作为学习目标,选择隐含层中权重与偏差正交的节点,利用极限学习机的快速逼近能力与泛化性能建立主从机光谱之间的关系,大大减少校准后的预测误差。

图5 模型转移前食用油酸值预测散点图Fig.5 Predicted scatter diagram of edible oleic acid value before calibration

图6 模型转移前食用油过氧化值预测散点图Fig.6 Predicted scatter diagram of edible oleic peroxide value before calibration

S/B、DS、PDS、TEAM与SST算法属于有标样算法,需要主机和从机的建模集中选出样本作为转换集,且转换集的数目对于模型传递的效果具有重要影响[25-26]。为了对比转换集样本数对不同模型转移方法的影响,使用SPXY算法从主机与从机的校正集样本中分别选取20、40、60、80、100个样本作为模型转移的转换集,然后使用5种算法通过转换集样本建立转移模型。最后使用校正模型来预测目标浓度并计算RMSEP以评估转移模型的性能,其中由于PDS算法的结果受到窗口尺寸W的影响,所以选择窗口尺寸W为1、3、5、7分别建模,建模结果如表3、4所示。

表3 不同模型转移方法下的酸值模型RMSEPTab.3 RMSEP results of acid value model by different calibration transfer methods mg/g

表4 不同模型转移方法下的过氧化值模型RMSEPTab.4 RMSEP results of peroxide value model by different calibration transfer methods mmol/kg

从表3可以明显看出在对食用油酸值进行模型转移的过程中,PDS、DS、TEAM与SST算法的性能随着转换集样本数的增加而呈现提高的趋势。对于食用油酸值模型PDS与S/B算法转移性能较差,DS、TEAM、SST算法能够明显提高预测精度,其中SST算法使验证集样本RMSEP下降最快,预测效果最好,RMSEP从未使用模型转移前的0.583 6 mg/g下降到了0.167 0 mg/g,表明SST算法可以有效应用于食用油酸值模型的转移。从表4中结果可以看出,在食用油过氧化值模型的传递过程中DS、TEAM、SST算法的性能随着转换集样本数的增多而提高,PDS算法与S/B算法结果并不理想,在转换集数量较少时SST算法的转移效果更好,在转换集数量只有40个时RMSEP已经下降到12.720 0 mmol/kg,当转换集数量达到100个时相较于未传递前的预测结果RMSEP从15.801 0 mmol/kg下降到了9.989 3 mmol/kg,效果优于TEAM与DS算法。在实际应用中,转换集样本的数量增多需要的分析时间与相关成本也随之增加,且有时由于条件限制难以获得充足的转换集样本,因此在转移效果相近时使用较少的转换集样本的方法更具有实际应用价值。另外,SST算法参数设置简单,只需设置主成分数,而与之效果相近的TEAM算法需要设置隐含层神经元数量、正则项系数等超参数且不同的激活函数也会对结果造成影响,在实际应用中较为繁琐且需要的训练样本较多。

3 结束语

针对食用油酸值与过氧化值模型采用SST算法进行模型转移,经过模型转移后,酸值模型RMSEP从0.583 6 mg/g下降到了0.167 0 mg/g,过氧化值模型RMSEP从15.801 0 mg/g下降到了9.989 3 mmol/kg。通过与PDS、S/B、DS、TEAM算法对比发现,SST算法仅需较少转换集样本就能得到较好结果,且所需参数较少、模型简单。实验结果表明,使用SST算法可以有效校正不同仪器测量光谱的系统误差,提高食用油酸值与过氧化值模型的预测结果,这对于光谱技术应用于食用油检测具有实际意义。

猜你喜欢
酸值过氧化食用油
脂质过氧化在慢性肾脏病、急性肾损伤、肾细胞癌中的作用
开封后的食用油应该怎么存放
优质橄榄油如何购买
婴儿奶粉过氧化值测定及储藏变化研究
坚果的过氧化值超标,这是怎么回事?
石油产品及原油酸值测定方法的探讨
解决#11机EH抗燃油酸值超标问题
烤肉制品的油脂提取方法的研究及其过氧化值的测定
自动电位滴定法测定烟用香精香料的酸值
巧存食用油不变质