基于近红外光谱技术的坛紫菜产地溯源研究

2021-04-30 05:57钱群丽姚春霞饶钦雄宋卫国
农产品质量与安全 2021年1期
关键词:紫菜产地正确率

刘 星 范 楷 钱群丽 姚春霞 饶钦雄 宋卫国

(上海市农业科学院农产品质量标准与检测技术研究所,上海 201403)

紫菜 (Pyropia/Porphyraspp.)是红藻门的一种海藻,其富含蛋白质 (占干重的25%~50%)[1]、碳水化合物 (多糖、膳食纤维)、不饱和脂肪酸、矿物元素、维生素等营养组分和藻胆蛋白、硫酸多糖等生物活性成分[2],具有抗氧化、抗增殖、抗凝血、抗肿瘤、抗病毒、抗过敏、抗炎、抗粘附活性、抗高脂血症、免疫调节、降血糖等作用[3~8],越来越受消费者的青睐,其产量也在逐年提升。根据 《中国渔业统计年鉴》,2018 年我国紫菜产量201 779 t,较 2017 年增加了 16.42%,是栽培海藻中增长最快的一种藻类,也是栽培海藻中经济产值最高的一种藻类。目前,紫菜的国内产量占前两位的省分别是福建省(74 628 t)和浙江省(54 016 t)[9]。

我国紫菜的主要养殖品种包括坛紫菜 (Porphyra haitanensis)和条斑紫菜 (Porphyra yezoensis)。坛紫菜主要分布于长江以南,主产于福建、浙江等省,坛紫菜产量约占国内紫菜总产量的75%左右; 条斑紫菜主要分布于长江以北,集中在江苏、山东等省[10]。随着紫菜的消费量逐渐上升,其质量安全问题也越来越吸引科研人员和消费者的关注。目前,科研人员已经开展了紫菜的营养组分测定和比较[2],风味物质识别[11],紫菜多糖和蛋白的提取条件优化、理化性质表征、生物活性评价、结构鉴定等方面研究[3,6,8,10,12~13]。这些研究为消费者正确了解紫菜的营养价值和功能价值提供依据,可使消费者避免被 “塑料紫菜” 这样的谣言所误导[2,14~15],研究结果也证实了不同产地紫菜营养组分和活性物质种类、含量等是存在差异的,为保证紫菜产地的真实性提出技术需求。

目前已报道的紫菜产地真实性溯源方法有信息溯源 (二维码、条形码等)和多元素溯源方法[16]。但是,信息溯源依赖于信息记录真实性,而多元素溯源中元素测定过程复杂,限制了这些技术在市场监管中的实际应用。近红外光谱技术(near infrared spectroscopy,NIRS)作为一种在食品产地溯源中广泛应用的技术[17],已在大米、茶叶、酒等农产品产地溯源中得到应用[18~20],它能综合反映不同产地紫菜中各营养组分和活性成分的含量、结构和功能团等特征的差异,且具有快速、无损、绿色的优点,更适合用于市场上紫菜产地的溯源。因此,本研究针对占国内紫菜市场份额75%的坛紫菜,以主产区福建和浙江两省的坛紫菜为研究对象,应用NIRS 结合化学计量学方法开展坛紫菜的产地溯源判别,以期为保证不同产地坛紫菜的真实性提供技术支持和基础数据支撑。

一、材料与方法

(一)材料与试剂2018 年在福建和浙江两省共采集坛紫菜干样品42 个。其中,福建省坛紫菜样品17 个,来自福建宁德市、泉州市、福州市3个紫菜主产区; 浙江省坛紫菜样品16 个,来自浙江台州市、温州市、宁波市3 个紫菜主产区; 未知产地坛紫菜干样品9 个,用于溯源模型预测能力的比较。

(二)仪器与设备IS50 红外光谱仪,配近红外积分球附件,美国Thermofisher 公司; HK-02A中药粉碎机,广州旭朗机械设备有限公司。

(三)方法

1.样品制备。将坛紫菜样品用粉碎机粉碎后,通过0.425 mm 标准筛,放在干燥皿中72 h 以平衡样品中的水分。

2.光谱采集。采用漫反射积分球模式采集近红外光谱,光谱扫描波数范围10 000~4 000 cm-1,扫描次数32 次,光谱分辨率8 cm-1,以内置背景为参照,数据变量共1 557 个,由仪器自带的OMNIC 软件以吸光度形式存储。每个样品平行实验3次,取其平均光谱作为最终样品光谱。整个实验过程保持室内温度约25 ℃。

(四)溯源模型建立由于常用的平滑、求导、多元散射校正等预处理方法不能很好地改善模型的溯源能力,本研究在坛紫菜样品光谱全波段范围内,应用无监督算法系统聚类分析(hierarchical clustering analysis,HCA)[21]、主成分分析(principal component analysis,PCA)[21~22]和有监督算法贝叶斯判别分析(Bayes discrimination analysis,BDA)[21]、偏最小二乘判别分析 (partial least squares discrimination analysis,PLS-DA)[23]方法开展坛紫菜的产地溯源判别。其中,HCA 和BDA 模型由R2009a Matlab 软件 (美国 Thermofisher 公司)完成,PCA和PLS-DA 模型由 SIMCA 14.1 软件 (瑞典Umetrics 公司)完成。

二、结果与分析

(一)坛紫菜的无监督算法产地溯源已知产地的坛紫菜原光谱见图1。由于福建、浙江两省的部分海域相近,坛紫菜主要营养组分和活性成分的结构和功能团相似,仅含量略有差别[2],使得福建、浙江两地坛紫菜的近红外光谱峰形相似,且部分光谱重叠。因此,单独通过近红外光谱图很难实现所有坛紫菜的产地溯源,需要应用化学计量学方法来实现。

图1 坛紫菜的原光谱图

HCA 是依据各样品间距离的不同,将距离最近的样品并为一类,并计算新类与其他类之间的距离,重复进行最近类别的合并,直到所有样品归为一类,形成聚类树形图,进而由树形图识别各类别样品。这里单个样品归类通过欧氏距离并类,类与类之间通过类平均法 (即样品对之间的平方距离的平均值)得到[21]。已知产地的坛紫菜样品聚类结果见图2,且由聚类的不一致系数确定最终类别为6。第①、②、③类中主要为福建样品,仅有1 个浙江样品; 第④类为浙江样品,而第⑤和第⑥类中,虽然在更小类中部分两地样品能各自聚在一起,但两地仍有很多样品混合聚在一起。可见,通过类之间的距离差异还不能实现不同产地坛紫菜的完全溯源,这主要由于两地坛紫菜各组分含量、结构等相接近,谱图之间的相关性明显。因此,选用主成分分析 (PCA)把光谱中的多个变量 (总变量数为1 557)转变为少数几个综合变量,即主成分,然后再进行坛紫菜的产地溯源,从而排除变量相关性的影响[21~22]。

坛紫菜的前两个主成分得分图见图3。前两个主成分对原变量解释能力累积为0.994 7,说明前两个主成分可以基本代表所有样品的信息。浙江坛紫菜样品中除了2 个 (图3 中箭头所指)样品在纵坐标轴的右侧外,其余样品均落在纵坐标轴的左侧,而福建坛紫菜有41.18%样品落在纵坐标的左侧,其余分散落在坐标轴的右侧。因此,通过PCA 进行坛紫菜产地溯源的正确率约为72.73%,这一正确率仍需进一步改善。由于上述两种无监督算法无法对组间差异不明显的样本进行准确判别,如图2 中第⑤和第⑥类,图3 中与浙江样品混合的福建坛紫菜样品,因此,再运用有监督算法BDA和PLS-DA 来进一步提高坛紫菜产地溯源正确率。

图2 坛紫菜聚类树形图

图3 坛紫菜的主成分得分图

(二)坛紫菜的有监督算法产地溯源贝叶斯判别分析(BDA)是将研究对象先通过一个先验概率来描述已有认知,再通过样本修正先验概率,得到后验概率,最后基于后验概率进行样本的判别[21]。BDA 对已知产地坛紫菜样品的溯源结果见表1。福建坛紫菜中有7 个样品被错判为浙江坛紫菜,溯源正确率为58.82%,浙江坛紫菜中有1 个样品被错判为福建坛紫菜,溯源正确率为93.75%,总判别正确率为75.26%,这一结果与PCA 类似。结果表明,BDA 可以很好地实现浙江坛紫菜的溯源,但是对福建坛紫菜的溯源准确率仍需继续改善。

表1 BDA 模型溯源结果

PLS-DA 是一种基于偏最小二乘的有监督算法,可以借助变量的权重来找出不同类别的差异,进而对不同类别样品进行有效区分[22~23]。坛紫菜的PLS-DA 模型主成分数、主成分数对原变量的解释能力(R2X)和产地溯源正确率见表2,其前两个主成分得分图见图4。前两个主成分对原变量的解释能力累积为0.994,所得坛紫菜溯源正确率为72.73%,其中有6 个福建坛紫菜样品被错判为浙江坛紫菜,3 个浙江样品被错判为福建坛紫菜。随着主成分数增多,R2X 值在逐渐增加,PLS-DA 模型的溯源正确率也在逐渐提高,当主成分数增加到12 时,溯源正确率达100%,说明最优PLS-DA 模型可以实现已知产地的福建和浙江坛紫菜产地溯源。

表2 PLS-DA 模型的溯源结果

图4 PLS-DA 前两个主成分得分图

图 5 HCA (a)、PCA (b)和 PLS-DA (c)对未知产地样品的预测

(三)未知产地坛紫菜的溯源将HCA、PCA、BDA 和PLS-DA 模型分别用于9 个未知产地的坛紫菜溯源,结果见图 5 和表 1。如图 5a 所示,HCA 模型将3 个未知产地坛紫菜与福建坛紫菜聚在一起,其余6 个样品与浙江坛紫菜聚类,说明可能有3 个未知产地样品是福建坛紫菜,有6 个未知产地样品为浙江坛紫菜。如图5b 所示,PCA 模型将1 个未知产地坛紫菜落到了纵坐标轴的右侧,其余8 个未知产地样品在纵坐标轴的左侧,说明纵坐标轴右侧的1 个样品更可能是福建坛紫菜,而纵坐标轴左侧的8 个样品更可能是浙江坛紫菜; 如表1所示,BDA 模型将1 个未知产地坛紫菜预测为福建坛紫菜,其余8 个未知产地样品被判为浙江坛紫菜,但是由于原 BDA 模型的溯源正确率仅为75.26%,所以对9 个未知产地坛紫菜预测的准确性有待进一步证实。如图5c 所示,PLS-DA 模型将9 个未知产地坛紫菜中的1 个判为福建坛紫菜,其余8 个样品判为浙江坛紫菜,但由于原最优PLS-DA 模型对福建和浙江坛紫菜的溯源正确率为100%,结合图 5b、5c 及表 1 的预测结果,可以确认9 个未知产地坛紫菜中有1 个为福建坛紫菜,其余8 个为浙江坛紫菜。这些结果证实了PLS-DA溯源模型在判别福建和浙江两省坛紫菜产地时具有很好的预测能力和稳健性。

三、结论

本研究基于不同产地坛紫菜中营养组分和活性成分含量的差异而使得其近红外光谱图有不同的峰特征,再将光谱数据与化学计量学方法结合,进行福建和浙江两省坛紫菜的产地溯源。由于福建和浙江两省部分养殖海域相近,所产坛紫菜的各组分综合特征在近红外光谱中的表现相似,使得谱图出现重叠、共线性等现象。因此,依据样品间距离进行分类的HCA 法很难将两省坛紫菜进行正确溯源;PCA 法可以解决样品信息重叠、相关的问题,但是由于PCA 属于无监督算法,对于组间差异不明显的样品很难进行准确的产地溯源,其溯源的正确率约为72.73%; BDA 作为一种有监督的算法,对于两省坛紫菜的溯源正确率为75.26%,略高于PCA,而 PLS-DA 当取前 12 个主成分时,对福建和浙江两省坛紫菜的溯源正确率可达100%。通过9 个未知产地坛紫菜来验证模型的预测能力和稳健性,结果显示,PCA、BDA 和 PLS-DA 模型的预测结果一致,9 个未知坛紫菜中只有1 个样品可能是福建坛紫菜,其余8 个样品可能为浙江坛紫菜,说明PCA、BDA 和PLS-DA 模型均具有良好的预测能力,也证明PLS-DA 模型具有更好的稳健性,可以用于福建和浙江两省坛紫菜的产地溯源,进而可以为保证坛紫菜产地的真实性提供技术参考。

猜你喜欢
紫菜产地正确率
个性化护理干预对提高住院患者留取痰标本正确率的影响
推动产地农产品追溯进入下游流通消费环节
紫菜蛋花汤
印尼燕窝产地探秘
紫菜云集
警惕“洗产地”暗礁
食物离产地越远越好
揭秘“塑料袋紫菜”
基于两种LSTM结构的文本情感分析
生意