双峰驼乳常规营养成分检测与NIR快速预测模型建立

2021-05-12 14:07
中国乳品工业 2021年4期
关键词:光谱仪牛乳乳糖

(内蒙古农业大学食品科学与工程学院,呼和浩特 010018)

0 引 言

双峰驼乳营养丰富,脂肪、乳糖和总干物质显著高于牛乳,尤其降血糖与辅助治疗糖尿病的功效被发现以来,越来越受关注并逐步得到产业化开发[1-4]。骆驼乳风味独特,但产量低、地域性强、所以供不应求,原料乳每千克价格在80~100元,远高于其他乳,从而极易受到掺假、造假和冒充侵害[5-7]。

驼乳品质和安全检测技术开发势在必行,目前尚无快速预测双峰驼乳常规营养素的近红外(NIR)光谱预测模型。NIR光谱预测食品常量多组分具有绿色、快速、无损的优点,其基本原理是用化学计量学软件将样品化学值与NIR光谱数据进行多变量线性拟合校正,通常采用偏最小二乘(PLS)或主成分线性回归(PCR)法建立预测模型,实现对未知样品常规组分的快速测定[8-10]。方雄武等[11]采用NIR透射光谱仪系统建立了牛奶的蛋白质、脂肪和乳糖定量分析模型。王明等[12]采用NIR漫反射光谱建立了牛乳中蛋白质与脂肪含量的快速检测模型,结果表明NIR光谱技术可以准确预测牛奶中蛋白质与脂肪的含量。祝义伟等[13]采用偏最小二乘回归(PLS)建立酸奶中非脂乳固体的NIR光谱定量分析模型,并对模型进行验证评估,预测结果较好。不同动乳营养成分及黏度等物性不同,NIR光谱特征也有差异[14],因此利用牛乳营养素的NIR模型预测其他动物乳营养素含量,尤其预测双峰驼和水牛乳等干物质远大于牛乳的特种乳成分,可能偏差较大[15-16]。因此有必要评价多种家畜乳营养成分的通用NIR预测模型或专用模型的性能。本文系统采集内蒙古双峰驼乳主产区代表性乳样,以及荷斯坦牛乳和水牛乳,严格检测乳样常规营养素化学值,建立3种动物的通用PLS模型和双峰驼乳的专用模型,进行比较评价;同时评价一款台式宽谱研究型傅里叶变换近红外光谱仪和一款国际主流品牌便捷式光栅近红外光谱仪建模的性能,以期为双峰驼乳营养质量快速预测提供数据参数和方法学参考,建立的模型也可在这两品牌设备上转移使用,服务企业和社会。

1 材料与方法

1.1 样本的采集

从内蒙古主要骆驼饲养地区采集双峰驼乳样品153份,来自乌海市、阿拉善左旗、呼伦贝尔鄂温克旗;同时作为相伴研究分别采集牛乳样品28份,来自苏尼特左旗、呼和浩特市、鄂尔多斯乌审旗、呼伦贝尔鄂温克旗;水牛乳40份,来自广西省南宁市。

1.2 常规营养素的测定

脂肪按GB5009.6-2016中的盖勃法测定;蛋白质按GB5009.5-2016中的凯氏定氮法测定;乳糖按照GB5413.5-2010中的莱茵-埃农氏法测定;水分与灰分,分别按照GB5009.3-2016和GB5009.4-2016测定。测定以上5种营养素时,实验的时间、地点和温度等因素都相同,确保了样品性质状态的一致性以减小误差。测定的化学值即为NIR光谱分析过程中的真值。

1.3 近红外光(NIR)光谱仪

PE傅立叶变换近红外(NIR)光谱仪,25℃控温条件,对样品进行漫透射光谱扫描,选用波长范围1 000~2 500 nm,分辨率为16 cm-1,采集信息点3 000个,每个样品不同时间扫描2次,每次平行扫描3次,即每个乳样有6个光谱数据。

VIAVO光栅型微型近红外(NIR)光谱仪,室温条件采集乳样漫反射光谱。扫描光谱波数范围为900~1 676 nm,检测器为S1-00723,采集信息点125个,每个样品2次平行,每次平行扫描3次,即每个乳样有6个光谱数据。

1.4 数据的处理与模型的建立

用Excel记录和整理乳样5种常规营养素化学化学值,用IBM-SPSSStatistics20进行正态性检验(即数据集质量的检验),并进行描述性统计和差异检验。将乳样化学值和NIR光谱数据对应导入化学计量学软件Unscrambler X 10.5,以7∶3的比例将样本集划分为校正集与验证集,使用导数(Derivative)、标准正态变量变换(SNV)和多元散射校正(MSC)对光谱信息进行预处理,然后将校正样本集的乳样5种营养素化学值分别与各种预处理后的NIR光谱进行偏最小二乘法(PLS)多元线性校正(Calibration),建立5种基础营养素的预测模型,并用验证集样本对预测模型进行验证。多次组合校正样本集和验证样本集,反复优化模型,模型评价参数见表1。

表1 乳常规营养素NIR光谱预测模型验证评价指标

2 结果与分析

2.1 营养素化学值质量检验

对3种家畜乳221个样品的脂肪、蛋白质、乳糖、水分和灰分检测结果进行了正态性检验,结果总样本5种营养素化学值符合正态分布。双峰驼乳5种常规营养素正态性检验结果见图1,驼乳脂肪、蛋白质、乳糖和水分符合正态分布,趋降p-p检验值在±0.05之间,数据质量很高,驼乳灰分趋降p-p检验值在±0.09之间,基本符合正态分布,数据质量也较高,可用于NIR光谱预测模型建立,获得的描述性统计参数可以预测我国双峰驼乳常规营养含量水平。

2.2 营养素化学值描述性统计

双峰驼乳及相伴研究荷斯坦牛和水牛乳样品化学值测定数据描述性统计见表2、表3和表4,数据分布范围见图2。双峰驼和水牛乳脂肪显著高于荷斯坦牛乳,均值分别是牛乳的1.6和2倍;两者蛋白质含量也显著高于牛乳,均值是牛乳的1.1(高出10%)和1.4倍;灰分含量也显著高于牛乳,均值是牛乳的1.3和1.2倍。双峰驼乳、水牛乳与荷斯坦牛乳的乳糖与水分含量无显著差异。

3种动物乳脂肪、蛋白和灰分含量数据分布范围见图2。考虑到数据离散范围(95%置信区间),3种动物乳指标波动范围很不同。提示用牛乳营养素或多种动物通用NIR模型预测特种家畜乳营养素可能不够准确,有必要建立不同家畜乳营养素的专用NIR预测模型。

图1 双峰驼乳5种常规营养素数据正态性检验

表2 双峰驼乳营养素化学值测定结果描述性统计表(N=153 g/100g)

表3 荷斯坦牛乳营养素化学值测定结果描述性统计表(N=28 g/100g)

表4 水牛乳营养素化学值测定结果描述性统计表(N=40 g/100g)

图2 3种家畜乳3种常规营养素数据箱式图

2.3 NIR模型建立和评价

2.3.1 主因子数的选择与异常样本的剔除

模型中的主因子个数会决定模型的稳定性,同时也对模型内部与外部验证参数的准确性起一定作用。如图3所示,当因子数越少时,RMSECV值越大,模型越不稳定,因子数越多,模型的拟合度越高,RMSECV值越低,模型的效果越好。当主因子数为10时模型的RMSECV值最低,模型的效果为最优。所以本实验选择主因子数10来进行模型后续的建立与优化。

图3 PLS模型主因子与RMSECV关系图

在实验过程中,由于人为操作的失误或系统误差,经常会产生许多异常值(异常乳样),异常值会对PLS回归校正产生一定的负面影响。所以剔除异常样品对模型的建立以及所建立模型的稳定性起到至关重要的作用。本实验主要根据模型的预测回归线与学生化残差剔除异常样本。但剔除“异常值”或“异常样本”更应该验证化学值是否测定准确,有必要进行重复测定验证。轻易剔除“异常样本”,模型图和参数可能会很理想,但模型在大量外部验证或实践应用中可能会发现不够稳健。

2.3.2 3种家畜乳的近红外通用乳模型

建立优化后的牛乳、水牛乳和双峰驼乳的通用乳模型参数见表5。通用乳模型中脂肪、乳糖、蛋白质、水分的最优前处理方式为一阶导数+二阶导数的结合使用,而灰分的最优前处理方式为SNV+MSC处理。

表5 3种家畜乳通用模型最优参数

5种常规营养素的通用乳模型评价系数R2全部大于0.9,除水分外,其余4种常规营养素模型的RMSECV均小于0.5,其中仅有脂肪与水分的RPD>2.4,表明这两种模型可做近似估计。乳糖、蛋白质和灰分的RPD<2.4,说明预测模型不理想,需要继续优化模型,但在优化模型的过程中主因子数也随之增多,5种常规营养素PLS模型主因子数已超过14个,主因子数的增多,使模型纳入了更多无效光谱信息,外部验证参数随之增高导致模型不稳定,故继续僵化地优化通用乳模型参数的意义不大。驼乳中干物质、蛋白质、脂肪及乳糖均高于牛乳,分别是牛乳的1.22倍、1.05倍、1.59倍和1.23倍,且较黏稠,牛乳与驼乳营养素含量的不同,导致其光谱信息有差异,所以建立双峰驼乳的常规营养素快速检测模型是有必要的。

2.3.3 双峰驼乳傅里叶变换NIR光谱仪快速预测模型

双峰驼乳常规营养素模型内部验证优化参数见表6。灰分的前处理方式为MSC+SNV的混合处理,主因子数为9,模型验证系数为0.93,RPD=3.1642,模型预测能力良好。脂肪与水分的前处理方式同为标准正态变量变换(SNV),脂肪的主因子数为9,模型验证系数R2=0.96,RPD>3,水分主因子数为10,R2=0.99,RPD高达12.86,说明模型可以完美预测未知样品。乳糖与蛋白质前处理方式分别为MSC与二阶导,R2均大于0.92,RPD大于3.35。证明以上方法建立了预测性能良好的双峰驼乳常规营养素快速检测模型。

表6 双峰驼乳台式近红外光谱仪模型内部验证参数

最优模型的验证集外部验证参数见表7。5种营养素外部验证相关系数R均大于0.9,RSD<10%,表明模型的预测能力良好。乳糖R小于0.9但大于0.8,RSD<10%,模型可进行预测。

2.3.4 双峰驼乳微型NIR光谱仪快速检测模型的建立

微型NIR光谱仪建立优化的驼乳常规营养素预测模型见表8。5种常规营养素的模型验证系数R2均大于0.9,RPD均大于2.4但小于3,可在现场或在线使用。微型NIR光谱仪采集的光谱信息点只有125个,而台式傅里叶变换NIR光谱仪为3 000个,模型再优化也显然不能超越傅里叶变换NIR光谱仪的效果。

表7 双峰驼乳台式近红外光谱仪模型外部预测参数

表8 双峰驼乳微型NIR光谱仪预测模型参数

3 讨 论

乳制品质量和安全性检测原理研究和技术开发一直是食品检测领域的热门。而近红外光谱技术自被发现以来,便以迅猛的速度在数据分析方面和各个领域之中得到应用。主要原因是近红外光谱技术结果的重复性与再现性优于传统的常规分析方法[17]。

水牛乳的脂肪含量显著高于双峰驼乳及牛乳,双峰驼乳的蛋白质、脂肪及乳糖含量都高于牛乳[18],营养素含量的差距,导致其红外光谱特征存在较大差异,直接影响近红外光谱模型的结果。虽然模型验证系数R2均大于0.9,但相对分析误差RPD只有脂肪与水分大于2.4且未达到3,表明模型的预测能力未达理想结果,因此有必要建立单一物种的常规营养素预测模型。对本次实验采集的153份双峰驼乳样品进行正态性检验,脂肪、乳糖、蛋白质及灰分p-p值均在±0.05之间,呈正态性分布,水分p-p值在±0.09之间,说明数据符合统计学规律。因此表明对双峰驼乳建立单一物种的近红外光谱快速预测模型具有可行性。

台式傅里叶NIR光谱仪扫描光谱波长范围1 000~2 500 nm,可采集3 000个数据点,仪器稳定。而微型NIR光谱仪扫描光谱波数范围为900~1676 nm,只采集125个数据点。结果表明傅里叶NIR光谱仪建立的快速预测模型,模型验证系数R2均大于0.92,RMSECV均小于0.2,RPD均大于3,外部验证参数都达到理想效果,可用傅里叶NIR光谱仪建立稳定可靠的近红外预测模型,这是微型NIR光谱仪所不具备的精准度。微型NIR光谱仪建立的模型,虽然R2都高于0.9,但RPD都未超过3,RMSECV均大于0.27(灰分除外),模型参数不理想。需要优化模型,在优化过程中发现,125个数据点不足以将模型优化到理想程度,但微型NIR光谱仪便携的优点是台式傅里叶NIR光谱仪不能达到的,增加采样量可将模型优化到理想程度,是以后的重点研究方向。

建立的模型可以对未知样品进行定量和定性的预测,越来越多食品分析检测过程中会利用采集到的数据构建模型,然后不断的采集新的检测数据,带入到已知模型中,对模型进行不断的优化和修正,使模型的准确度更高[8]。

4 结 论

从内蒙古主要骆驼饲养地区采集的153份双峰驼乳常规营养素值符合正态分布,可以估计双峰驼乳常规营养素的总体水平。采用NIR光谱建立和优化双峰驼乳5种常规营养素含量的NIR快速预测模型。而台式傅里叶NIR光谱仪建立的双峰驼乳快速预测模型的预测能力优于微型便携式NIR光谱仪建立的模型,但微型NIR光谱仪的便携与现场应用等优点是台式傅里叶NIR光谱仪所不具备的。

猜你喜欢
光谱仪牛乳乳糖
小儿乳糖不耐受咋回事
牛乳中脂肪掺假检测技术的研究进展
消毒鲜牛乳还要煮吗
水牛乳资源及其理化特性研究进展
号称能告别“乳糖不耐受”的牛奶靠谱吗?
中阶梯光栅光谱仪自动化波长提取算法
医用显微成像光谱仪的光谱定标技术
舒化奶“终结”不了乳糖不耐症
清华大学与麻省理工学院联合研发出微型光谱仪
双面镜结构成像光谱仪的改进及性能分析