融合光谱和图像特征信息的羊肉TVB-N含量无损检测

2021-12-17 03:59张志胜孙剑锋王文秀
中国食品学报 2021年11期
关键词:羊肉纹理灰度

张 凡,淑 英,张志胜,孙剑锋,王 颉,王文秀

(河北农业大学食品科技学院 河北保定071000)

羊肉是全球市场上很受欢迎的红肉之一,其富含蛋白质、脂肪和矿物质等,可为人体提供丰富的营养[1]。羊肉在运输、储存和销售过程中极易受微生物、酶等因素的影响而发生变质、腐败,从而危害消费者的身体健康。对羊肉新鲜度的检测具有非常重要的意义。根据国家标准GB 2707-2016《食品安全国家标准 鲜(冻)畜、禽产品》,挥发性盐基氮(TVB-N)是衡量羊肉新鲜度的重要参考指标[2]。传统检测肉类TVB-N含量的方法包括半微量定氮法、微量扩散法和自动凯式定氮仪法,然而,这些方法均存在检测速度慢,破坏样品及操作繁琐等弊端,无法满足快速、实时、无损检测的需要。

目前基于光学的快速检测技术在肉类品质及安全指标检测等方面发挥着至关重要的作用[3]。例如:王文秀等[4]基于二维相关可见-近红外光谱法优选了猪肉TVB-N 的特征变量并建立偏最小二乘回归模型,取得较好的预测效果。邹昊等[5]结合近红外光谱和不同预处理算法对羊肉TVB-N含量进行预测分析,最佳模型的预测集相关系数Rp为0.92。现有研究充分证实了近红外光谱技术应用于肉类TVB-N含量无损检测的巨大潜力。另外,机器视觉技术在肉类研究方面也有应用,如姜沛宏等[6]利用图像处理算法提取RGB 和HIS 色彩模型的特征分量,建立牛肉新鲜度等级识别模型。以上研究均基于单一光谱信息或图像信息建立模型,而羊肉新鲜度下降涉及内部化学成分和外部色泽、纹理等多方面的变化,单一检测技术在模型预测精度上有一定的局限性。高光谱技术是融合图像和光谱技术于一体的新型检测技术,可同时获取待测样品的空间信息和光谱信息,目前已在猪肉[7]、羊肉[8]、牛肉[9]、鸡肉[10]等肉品的TVB-N含量预测上有所应用。如:Li 等[11]利用高光谱成像技术检测猪肉TVB-N含量,最佳预测结果Rp达0.932。Cheng 等[12]利用高光谱成像技术对腌制和烹饪后的两种猪肉中TVB-N含量进行预测分析,Rp分别为0.887 和0.832。上述研究表明多源信息的利用能从多角度描述目标特征,有效提高了预测模型的精度和可靠性。然而,高光谱技术尚存在设备昂贵、成本高、数据冗余等不足,限制了其在实际生产在线检测上的应用。将近红外光谱技术和机器视觉技术相结合,建立肉品TVB-N含量的快速检测方法具有重要的应用价值。目前该思路已在牛肉新鲜度分级[13]上应用,而用于羊肉TVBN含量检测鲜有研究报道。不同于猪牛肉,羊肉中脂肪和肌肉组织分布不均匀、边界模糊,为光谱和图像特征信息的提取增加了难度。有必要探究基于图谱融合技术的羊肉TVB-N 特征信息提取和解析方法。

本研究以不同冷藏时间的羊肉为对象,采集可见-近红外光谱和图像信息,测定其在1~15 d冷藏期间的TVB-N含量。结合多元统计分析方法提取光谱特征和图像特征,通过特征层融合方法对二者进行融合。建立羊肉样品TVB-N含量的快速预测模型,将其与单一光谱及图像建模结果进行对比,比较所建模型性能的差异,为客观、准确评价羊肉新鲜度提供理论依据。

1 材料与方法

1.1 样品制备

采集宰后冷却排酸24 h 的新鲜羊肉,部位为背最长肌,购于保定农大科技市场。将其置于蓄冷装置中立即运回河北农业大学食品科技学院肉品加工与检测实验室。用无菌刀剔除多余的脂肪及结缔组织,并分割成75 个体积约70 mm×40 mm×25 mm 的羊肉块。随后,包装每个样品于密封袋内并标号,置4 ℃冰箱保存备用。期间,每天随机选取5 个样品进行光谱、图像采集和TVB-N含量测定。持续15 d。

1.2 可见-近红外光谱和图像信息采集

本试验用图谱信息采集系统见图1,由可见-近红外光谱信息采集系统和图像信息采集系统两大部分组成。其中,光谱采集系统主要包括光谱仪(波长范围320~1 100 nm)、卤钨灯光源、光纤、计算机等。图像采集系统由CCD 相机(分辨率为1 600×1 200 像素)、图像采集卡、LED 光源、计算机等组成。试验前,将仪器打开预热30 min,保证其在较为稳定的状态运行,同时将样品从冰箱中取出,恢复至室温。依次采集参比光谱和暗背景光谱后,将样品置载物台上进行反射光谱信息采集。每个样品采集3 个位置的光谱,取其平均值,用于后续数据处理分析。然后,采集图像信息,根据镜头焦距调节镜头距底板的最适高度,保证羊肉样品成像清晰、真实,图片以JPEG 格式保存。上述采集过程均在暗箱中进行,以避免周围环境光线带来的干扰。

图1 可见-近红外光谱和图像采集系统示意图Fig.1 Schematic diagram of visible/near infrared spectroscopy and image acquisition system

1.3 TVB-N含量的测定

图谱信息采集完成后,参照王文秀等[4]的方法测定TVB-N含量。首先,将羊肉样品绞碎,混匀,准确称取10 g 肉糜放入锥形瓶中,加入100 mL蒸馏水振荡,使样品在水中分散均匀,浸渍30 min,备用。将其过滤得到样品滤液,准确量取10 mL 样品滤液和10 mL 10 g/L 氧化镁溶液一同加入消化管中蒸馏。5 min 后以盐酸标准溶液(0.01 mol/L)滴定硼酸吸收液,滴定终点由颜色判断,根据消耗的盐酸体积计算TVB-N含量(式1)。该试验3 个平行,取其平均值。

式中,X——试样中TVB-N含量,mg/100 g;V1——试液消耗盐酸的体积,mL;V2——空白消耗盐酸的体积,mL;c——盐酸标准滴定溶液浓度,mol/L;m——样品质量,g;V——样品滤液体积,mL;V0——样液总体积,mL。

1.4 数据处理

1.4.1 异常样品剔除及光谱预处理 异常样品的存在会降低谱图与化学值之间的相关性[14],导致模型的预测精度降低,因此需将其予以剔除,以增加模型的鲁棒性[15]。本研究采用马氏距离法对校正集中异常样品进行剔除。首先,对光谱数据进行主成分分析以实现数据降维,消除大量信息中的重叠部分。然后,利用得分矩阵计算样品之间的马氏距离,通过对比分析将马氏距离较大的异常样品选出并剔除,剩余的样品用于建立模型。

此外,由于光谱采集过程中会受到环境、仪器、样品等多种因素的影响而导致模型的预测能力降低,因此对原始光谱数据进行预处理是必要的。本研究利用标准正态变量变换(Standard normal variate transformation,SNV)和一阶导数对数据进行处理。SNV 处理能减少由不良散射效应引起的变异性,提高模型的预测精度,而一阶导数处理可有效减小光谱中的加性和乘性效应带来的影响[16]。本试验采用无预处理、SNV、SNV+一阶导数、一阶导数+SNV 4 种方法对光谱进行预处理,比较建模预测结果,确定最佳预处理方法。

1.4.2 光谱特征信息提取 近红外光谱具有谱峰重叠、解析困难的特点,光谱数据之间存在共线性关系,易产生数据冗余。部分光谱区域样品的信息很弱,与待测组分相关程度不高,存在大量无用信息。本研究采用竞争性自适应加权算法(Competitive adaptive reweighted sampling,CARS)从高维数据中提取与TVB-N含量有关的特征变量。该算法将蒙特卡洛采样法与偏最小二乘法相结合,通过筛选模型中回归系数绝对值大的波长点,优选出与待测组分密切相关的最优波长组合[17],从而有效提取光谱的特征信息。

1.4.3 图像特征信息的提取 羊肉腐败变质过程涉及色泽和纹理的变化。本研究重点提取样品图像的颜色和纹理特征信息。由于图像采集过程会受到背景噪音、表面水分等影响,因此在提取特征参数前,需对原始图像进行预处理,以消除无关信息的干扰。首先,对样品图像进行背景分割,去除羊肉以外的干扰信息。然后,由于羊肉样品表面水分和脂肪组织会影响后续特征参数的提取,因此采用迭代阈值法对灰度图像进行图像分割,去除高光和脂肪区域。最后,以此图像为掩膜,将其与背景分割后的羊肉图像进行对应位置的逐像素相乘运算,得到目标区域图像,并基于此提取颜色及纹理特征。

1)颜色特征的提取 为充分挖掘羊肉图像中的颜色目标信息,本研究利用颜色矩和颜色直方图进行颜色特征提取。颜色矩是以数字方法为基础,通过计算矩来描述颜色的分布,其颜色分布信息主要集中在低阶矩。本研究计算了羊肉图像RGB 各分量的一阶、二阶矩来体现图像的颜色分布,其中一阶矩表征图像颜色的平均强度,二阶矩反映图像颜色分布的不均匀性。颜色直方图描述的是不同色彩在整幅图像中所占比例,反映图像颜色分布的统计特性。本研究将RGB 颜色空间的色彩信息映射到HSV 颜色空间内,获取羊肉图像HSV 各个分量的颜色直方图,以此弥补RGB 颜色空间不均匀的缺点[18]。

2)纹理特征的提取 图像纹理特征能反映物体的质地,如粗糙度、光滑度、颗粒度、随机性和规范性等。灰度共生矩阵是一种被广泛用于纹理识别的方法,它通过计算图像中一定距离和一定方向的两点灰度之间的相关性,来反映图像在方向、间隔、变化幅度及快慢上的综合信息[19]。当距离和角度的取值不同时,得到的灰度共生矩阵也不同。本研究选定距离不变,求取4 个角度(0°,45°,90°和135°)的灰度共生矩阵。同时,以对比度、相关性、熵、均匀性和能量作为表征灰度共生矩阵的特征标量,从而更加直观地描述图像的纹理状况。其中,对比度为图像强度差异,图像灰度值差异越大,对比度越大。相关性代表图像纹理的一致性,纹理越均一,相关性越大[20]。熵值代表图像的灰度值散乱度,且灰度值分布随机度与熵值成正比。均匀度主要度量图像纹理的粗糙度,其值越大图像纹理越粗糙。能量反映图像灰度分布均匀程度和纹理粗细度。

1.4.4 模型建立 分别以光谱特征信息、图像特征信息和融合信息为自变量,以TVB-N含量为因变量,建立羊肉样品中TVB-N含量的最小二乘支持向量机(Least squares support vector machines,LSSVM)预测模型。其中,融合信息采用特征层融合方法对光谱和图像特征信息进行融合。整个数据分析流程如图2所示。

图2 基于融合图谱特征信息的LSSVM 模型建立流程图Fig.2 Flow chart of LSSVM modeling based on fused spectra and image features

模型建立后,以校正集相关系数(Correlation coefficient in the calibration set,Rc)、验证集相关系数(Correlation coefficient in the prediction set,Rp)、校正集标准分析误差(Standard error of calibration,SEC)、验证集标准分析误差(Standard error of prediction,SEP)及相对分析偏差(Relative percent deviation,RPD)作为模型预测性能的评价指标。其中,RPD 为标准差与均方根误差的比值[21],当RPD>2.5 时,模型的预测精度较高。上述分析过程均在Matlab2012a 中完成。

2 结果与分析

2.1 TVB-N含量统计结果分析

首先,利用Kennard-stone 算法将75 个样品按照3∶1 的比例分为校正集和验证集,56 个样品用于模型建立,19 个样品用于模型验证。采用主成分分析结合马氏距离法对校正集中的异常样品进行剔除,共有2 个异常样品被剔除,剩余的54 个样品用于模型建立。校正集和验证集中样品的TVB-N含量统计信息见表1。验证集样品的TVB-N含量完全包含在校正集范围,表明该验证集样品能够用来检验校正模型的适用性。此外,样品集中TVB-N含量范围涵盖国标规定的鲜(冻)畜肉的TVB-N含量所允许的最大值(15 mg/100 g),表明样品包括了新鲜度不同的羊肉,数据具有一定代表性。

表1 羊肉样品TVB-N含量的测定结果Table 1 Statistical results of total volatile basic nitrogen in mutton samples

2.2 基于光谱信息的TVB-N 建模结果分析

2.2.1 基于全波段光谱建模结果分析 73 个羊肉样品的原始光谱曲线如图3所示,全部样品的原始光谱曲线具有相似的变化趋势。其中,430 nm 和574 nm 附近的吸收峰主要与羊肉中所含血红蛋白有关[22]。在490 nm 和980 nm 附近处出现波峰和波谷,分别与O-H 键伸缩振动的一级倍频和振动组合频有关[23]。分别基于原始光谱和经SNV、SNV+一阶导数、一阶导数+SNV 预处理的光谱建立TVB-N 的预测模型,结果见表2。基于预处理后光谱数据的建模结果优于原始光谱,且利用SNV+一阶导数处理后光谱数据建立的模型具有最佳的预测能力,其Rp为0.845,SEP 为3.053 mg/100 g,RPD 为1.895。此时,RPD 值介于1.5~2.5间,表明所建模型预测能力一般,预测精度有待提高。

表2 基于不同预处理方法的LSSVM 建模结果Table 2 The LSSVM modeling results based on different spectral pretreatment methods

图3 羊肉样品的原始光谱图像Fig.3 Raw NIR spectra of mutton samples

2.2.2 基于特征光谱信息的建模结果分析 基于SNV+一阶导数预处理后的光谱数据,采用CARS优选与TVB-N 有关的特征信息。设置蒙特卡罗采样次数为1 000,通过反复迭代,利用变量子集建立多个偏最小二乘回归模型。计算各模型的交叉验证均方根误差,以误差最小时对应的子集为最优变量子集。图4a 代表选取变量数与重采样次数之间的关系,该过程经先“粗选”后“精选”的过程,指数衰减函数的引入大大提高了筛选变量的效率[24]。图4b 反映交叉验证均方根误差随重采样次数的变化趋势,可以看出随着迭代次数的增加,误差值逐渐减小,这与无关变量的剔除提高了模型的预测性能有关。继续增大重采样次数,误差值反而呈增加趋势,这与部分关键变量被予以剔除有关。图4c 展示回归系数在筛选变量过程中的变化趋势,部分变量的回归系数逐渐增大,成为建模中的关键变量。重采样次数为340 时误差值最小,此时所对应的光谱变量集为优选出的特征变量。

图4 基于CARS 筛选特征波长的过程Fig.4 The process of selecting characteristic wavelengths based on CARS

基于优选出的特征波长处的光谱数据建立LSSVM 模型,校正集及验证集中实测值和预测值的散点图见图5。相较于全光谱建模,基于特征变量建模结果有所提高,Rp由0.845 升至0.909,SEP由3.053 mg/100 g 减至2.066 mg/100 g,且RPD 由1.895 提至2.389。以上结果显示校正集及验证集的相关系数均增大,且标准分析误差显著降低。这表明利用CARS 能优选与TVB-N 有关的光谱特征变量,从而建立可靠、稳健的预测模型,有利于提高模型的预测能力。

图5 基于特征光谱信息的建模结果Fig.5 Modeling results based on feature spectra information

2.3 基于特征图像信息的建模结果分析

2.3.1 图像预处理 为保证图像特征信息提取的有效性,需对图像进行预处理,以消除无关信息的干扰。首先,对图像进行背景分割,将羊肉样品与背景分割开来。由于黑色背景颜色较暗,羊肉样品区域较亮,且不同样品图像灰度有差异,因此采用自适应阈值分割方法实现背景分割。获取的原始彩色图像具有RGB 3 个通道,而阈值分割通常对灰度图像进行处理,可采用加权平均算法将其转换为灰度图像。阈值分割后得到羊肉样品的二值化图像,此时黑色区域对应低灰度值的背景区域,白色区域对应高灰度值的羊肉样品区域。以此图像为掩膜,与原始图像进行逐像素乘法运算,得到去除背景的羊肉图像(图6a)。可以看出,样品表面存在高亮区域和脂肪组织,采用迭代阈值法消除该部分的影响,得到的二值化图像如图6b所示。最后,以此二值化图像为掩膜,将其与图6a 的背景分割图像进行逐像素乘法计算,得到去除高光和脂肪组织的目标区域图像(图6c),从而有利于下步颜色和纹理特征的提取。

图6 图像预处理结果Fig.6 Image preprocessing results

2.3.2 图像特征信息提取结果分析

1)图像颜色特征信息提取R、G、B三分量的一阶、二阶矩统计信息如表3所示。由于数据量大,对每天试验的5 个样品颜色矩信息进行平均。随着贮藏时间的延长,不同样品R、G、B一、二阶矩存在差异,这为基于图像颜色特征信息的羊肉新鲜度判别提供重要的依据。其中,一阶矩总体呈下降趋势,二阶矩总体呈上升趋势,这可能是由于羊肉样品的腐败区域越大,图像颜色的平均强度越小,颜色分布越不均匀所致。由于新鲜与腐败样品的个别分量值区间存在重叠,导致预测准确率较低,因此进一步提取颜色直方图信息获得新鲜度判别所需的必要补充数据。由于RGB 颜色空间不符合人对颜色的感知心理,因此将其转换为面向视觉感知的HSV 空间计算直方图,并对信息进行量化。H、S、V分量的灰度均值见表3。随贮藏时间增加,羊肉的饱和度S和亮度V整体呈下降趋势,而色调H差异较小,表明不同腐败程度的羊肉图像在色调上的变化较小。

表3 提取的图像颜色特征信息Table 3 The extracted image feature information of color

2)图像纹理特征信息提取 采用灰度共生矩阵描述图像纹理特征,求取的特征量包括对比度、相关性、熵、均匀性和能量。不同贮藏时间5 个样品的平均纹理特征信息见表4。可以看出,随着贮藏时间的延长,羊肉样品的腐败程度加大,能量总体呈增大的趋势。所有图像的能量值较大,表明新鲜程度较低的样品具有更加均一和规则变化的纹理模式。同时均匀性值偏小,表明不同新鲜程度的羊肉样品的纹理均偏细。相关性变化较小,表明不同腐败程度的羊肉样品图像纹理均匀性较为相似。熵值代表灰度值散乱度,所有样品的熵值较小,表明羊肉图像的灰度值分布较整齐。同时,不同贮藏时间的图像对比度差异较大,表明其灰度值差异较大,这可能与羊肉腐败区域大小不同有关。综上,羊肉样品图像的对比度和能量信息与腐败程度相关性最大,可作为图像有效纹理信息。将提取到的颜色及纹理特征信息作为自变量,建立LSSVM 预测模型,验证集预测相关系数Rp为0.780,误差为3.620 mg/100 g,RPD 为1.536。这表明仅利用羊肉颜色和纹理特征定量分析贮藏期间羊肉TVB-N含量的效果一般,模型预测性能有待提高。

表4 提取的图像纹理特征信息Table 4 The extracted image features information of texture

2.4 基于融合图谱特征信息的建模结果分析

由以上研究可知,基于单一光谱特征或图像特征的LSSVM 模型预测能力有待提高,说明单一特征的输入并不能达到预测效果。而将提取的光谱特征信息和图像特征参数经特征层融合,形成总特征参数,建立羊肉TVB-N 定量预测模型。表5 对比了基于3 种特征参数的建模结果,其中基于图谱融合信息的模型预测性能最好,Rc为0.967,SEC 为1.365 mg/100 g,Rp为0.930,SEP 为1.873 mg/100 g,RPD 为2.635。其相关系数高于0.95,且RPD>2.5,表明模型的预测能力显著提高。以上建模结果充分证明利用光谱和图像融合信息定量预测羊肉TVB-N含量是可行的,其结果优于单一特征信息,这可能是融合数据综合羊肉内外部的特征,能全面反映羊肉在冷藏期间TVBN含量的变化。模型预测精度较单一技术模型有所优化,表明合理增加有效特征信息,能够提高模型的预测能力。

表5 基于不同特征信息的LSSVM 模型结果Table 5 LSSVM modeling results based on different feature information

3 结论

本研究基于可见-近红外光谱技术和机器视觉技术,利用光谱和图像融合信息定量分析羊肉中TVB-N含量。分别以光谱信息、图像信息及融合信息作为特征参数建立LSSVM 预测模型,结果表明,单一的特征信息反映样品的性状不全面,不能较好地实现样品的定量分析。利用特征层融合技术可有效融合样品的光谱和图像信息,实现内部与外部信息的综合利用,有效改善模型的预测性能。建立的LSSVM 模型预测结果最佳,Rp为0.930,SEP 为1.873 mg/100 g,RPD 为2.635。本研究为快速、定量预测羊肉中TVB-N含量提供一个新方法。该方法在使用图像信息时仅利用图像纹理及颜色特征,未使用形状和空间关系特征。

猜你喜欢
羊肉纹理灰度
“扒羊肉”
采用改进导重法的拓扑结构灰度单元过滤技术
基于BM3D的复杂纹理区域图像去噪
开春食羊肉,滋补健体
冬补一宝 羊肉
使用纹理叠加添加艺术画特效
TEXTURE ON TEXTURE质地上的纹理
基于最大加权投影求解的彩色图像灰度化对比度保留算法
羊肉宴引发的惨败
基于灰度线性建模的亚像素图像抖动量计算