基于IGS-SVM模型的牛肉生理成熟度预测方法

2019-08-30 06:12季方芳吴明清陈坤杰
食品科学 2019年15期
关键词:特征参数肌纤维月龄

季方芳,吴明清,赵 阳,陈坤杰*

(南京农业大学工学院,江苏 南京 210031)

生理成熟度是牛肉质量等级评定中的一个重要指标[1]。在传统的牛肉品质评定中,通常使用牛龄来表示牛肉的生理成熟度。牛龄一般通过牛的永久门齿数量进行人工判断,也可以通过对牛肉的生产供应链进行追溯的方法来判断,这需要每头牛从出生到进入加工生产线的信息都被完整记录;但由于我国牛肉的生产、加工市场尚未发展完善,大多数中小型肉类加工企业都未完善此项功能,所以这种方法在国内并不适用[2]。李岩等[2]研究牛的脊椎骨末端软骨图像,利用神经网络提取软骨的内角方差、凹凸度等图像特征,作为牛的生理成熟度评判标准。潘超等[3]通过对不同生理成熟度牛的脊椎骨质化程度进行研究,认为牛脊椎骨质化程度可以作为预测牛肉生理成熟度的主要指标。李春保[4]利用化学实验的方法,研究了不同生理成熟度的中国黄牛脊椎棘突的化学组成与牛龄的关系,认为随着牛龄的增长,荐椎和腰椎棘突中灰分和钙含量有所增加。目前,国外部分先进国家已经利用机器视觉技术实现了牛肉质量等级的自动判定[5-6],我国也在基于机器视觉技术进行牛肉质量等级自动判定方面取得了一定的研究成果[7-9]。但是如何实现牛肉生理成熟度的自动判定,目前还是一个尚未解决的技术难题。有文献指出,随着牛龄的增长,牛肉肌纤维的微观结构(包括肌纤维直径和单根肌纤维面积)会发生变化,牛龄与肌纤维微观结构参数之间存在一定的关系[10-13],因此,通过对肌纤维微观结构参数的测定,可以实现对牛龄的预测和判定。

支持向量机(support vector machine,SVM)因其具有处理小样本数据集的优点,成为一种流行的分类以及回归模型建立方法[14]。刘木华等[15]利用SVM结合牛肉的大理石花纹特征对大理石花纹进行等级评定。吴一全等[16]利用图像处理技术采集牛肉大理石花纹图像的不变矩和灰度共生矩阵特征,结合混沌蜂群参数优化算法建立牛肉大理石花纹评级模型,不同等级的大理石花纹评级正确率最低可达93.3%。魏丽冉等[17]采用基于核函数的SVM多分类方法,通过采集不同病害植物叶片的图像特征,作为分类模型的输入,以病害类别作为输出,建立了4 种植物叶部病害的识别模型,识别率最低可达70%。上述研究结果显示,SVM是一种适合小样本分类建模的有效方法。

本研究以不同月龄的东北沃金黑牛为实验材料,利用机器视觉技术获取不同月龄牛肉的显微图像,提取牛肉肌纤维的周长、直径和密度特征参数,并在传统网格搜索(grid search,GS)算法的基础上,提出一种改进的网格搜索(improved grid search,IGS)算法,对SVM模型的约束参数C以及核函数参数g进行优化,建立基于牛肉肌纤维特征的IGS-SVM牛龄分类预测模型,并进行实验验证。

1 材料与方法

1.1 材料与试剂

沃金黑牛肉由吉林省长春皓月清真肉业股份有限公司提供。

液氮 南京龙盛特种气体有限公司;苏木精-伊红染色液(包括核染液以及浆染液) 南京建成生物工程研究所。

1.2 仪器与设备

CM1990冷冻切片机 德国Leica公司;Scope.A1正置荧光显微镜 德国Carl Zeiss公司;M30-H2圆形钻孔取样器(直径1.5 cm) 哈尔滨量具刃具集团有限公司。

1.3 方法

1.3.1 实验样本获取

分别选择18、36、54、72 月龄的育肥公牛各25 头,共100 头,在长春皓月屠宰场经过宰杀,放血,去除四肢、内脏以及牛皮,劈半,冲洗,经72 h排酸处理以及胴体分割之后,选取每头牛背最长肌部位的牛肉3 kg,经过-30 ℃速冻之后运到实验室,置于-18 ℃冰柜中保存。

1.3.2 肌纤维图像采集

将实验肉样置于常温下解冻之后,沿着肌纤维的生长方向取0.5 cm×0.5 cm×0.5 cm的肉块作为样品,之后使用冷冻切片机进行横向切片,切片厚度为8 μm,最后进行苏木精-伊红染色处理。每块背最长肌肉样取3 个样品,每个样品取3 个切片,单个切片在相同的显微镜距离下放大200 倍拍摄3 幅照片。采集的样品肌纤维的显微图像如图1所示。

图1 牛肉肌纤维显微图像Fig. 1 Micrographs of beef muscle fibers

1.3.3 图像预处理

由于在实验操作过程中会存在一些误差,所以在获取肌纤维相关特征和测量前,先运用Image-Pro Plus软件对采集到的牛肉肌纤维显微图像进行预处理,具体操作如下。1)选色分割:染色之后的肌纤维与背景在颜色上具有较大差异,因此,利用Image-Pro Plus软件的选色工具将肌纤维与背景分割开;2)图像二值化:经过二值化处理后的图像有利于肌纤维特征参数的准确测量以及Filter工具的修饰处理;3)修饰:肌纤维之间还存在一些细小的黏连,若直接进行参数测量会导致较大的误差,因此利用Filter工具对肌纤维的形状进行修饰,并使用close工具对图像作腐蚀膨胀处理以去除图像中的大尺度噪声,使得肌纤维之间界限分明;4)计数:利用软件的计数工具对需要测量的区域计数并标记,每个被标记的待测量红色区域称为一个感兴趣区域。图像的预处理过程及结果如图2所示。

图2 牛肉肌纤维显微图像预处理Fig. 2 Preprocessing of micrographs of beef muscle fibers

1.3.4 肌纤维特征获取

对预处理过的牛肉肌纤维图像进行分析后,使用Image-Pro Plus软件的测量工具测量与牛肉生理成熟度相关的3 个特征参数即肌纤维的直径、周长和密度。

1.3.4.1 肌纤维直径的获取

从牛肉肌纤维图片可以看出,肌纤维截面大多是不规则的多边形或近似圆形,因此,利用Image-Pro Plus软件的多边图形的直径测量工具测量肌纤维的直径参数,测量原理如图3所示。从多边形区域的中心出发,每隔2°向测量区域的边缘绘制线段,统计每条线段的长度,取所有线段长度的平均值,作为该肌纤维的直径。

图3 肌纤维直径测量原理示意图Fig. 3 Schematic diagram for the measurement of muscle fiber diameter

1.3.4.2 肌纤维周长的获取

利用Image-Pro Plus软件通过统计多边形图形的边界像素点个数即图4中多边形计数区域的轮廓长度,计算肌纤维的轮廓长度,从而得到一根肌纤维的周长。

图4 肌纤维周长测量原理图Fig. 4 Schematic diagram for the measurement of muscle fiber perimeter

1.3.4.3 肌纤维密度的获取

肌纤维的密度指单位面积内轮廓完整的肌纤维根数,由于本实验中显微镜的视野面积相同,都是1.23 mm2,本实验将显微镜视野内完整肌纤维的数量设为肌纤维的密度。

1.3.5 基于SVM的牛龄预测模型

由于牛的育肥速度通常较为缓慢,相邻月龄的牛肉品质差别不大,所以牛龄预测问题可以看作是分类问题,建立牛龄预测模型即建立多分类模型。基于课题组已有研究[18-19],本实验选取牛肉肌纤维直径、肌纤维周长以及肌纤维密度这3 个与肉牛生长周期有关联的特征量作为模型输入,牛龄作为模型输出,建立不同牛龄的预测模型。

SVM是一种流行的机器学习算法,主要思想是通过核函数将样本数据映射到一个高维空间,建立一个满足约束条件的最优分类超平面,满足公式(1)、(2)。

式中:xi和yi是第i个样本的特征值和类别标签;ω是分类超平面法向量;b是超平面偏置;C是惩罚因子,控制对样本错分的惩罚程度;ξi是松弛变量。

最终最优分类函数如式(3)所示。

式中:ai是二次规划问题中求解的拉格朗日乘子;K(xi,x)表示核函数。本实验运用的是目前应用最广泛的径向基核函数,其表达式如式(4)所示。

式中:g是核函数的参数,表示影响分类算法的复杂程度[20]。

1.3.6 IGS参数寻优算法

SVM分类模型的分类精度和泛化性取决于惩罚参数C和核函数参数g,若这两个模型参数选取不合适,会导致模型运行时间较长,模型预测精度较低[21-24]。

SVM的参数选取通常有多种方法,其中GS最为简单且易于操作。GS的原理是在一定范围内针对惩罚因子C和核函数参数g分别取M个和N个值,用M×N个(C,g)参数组合对SVM分类器进行训练,再在交叉验证(cross validation,CV)思想下得到各组(C,g)参数组合下训练集的分类准确率,取最高的分类准确率对应的C、g参数作为最优参数[25]。传统网格搜索法一般采用大范围、小步距的搜索策略,由于在运算的时候,要遍历网格中的每个(C,g)参数组合,所以GS计算量大,分类效率较低。

针对这个问题,本实验采用了一种IGS算法。首先,在较大范围内用GS算法以大步距进行粗略搜索,搜索出的第一组使得局部分类准确率最高的(C,g)组合作为局部最优参数解。得到局部最优解参数组合之后,在这组参数附近的小区间依旧使用GS算法以小步距进行二次搜索,寻找最终的最优解。小区间的范围一般通过观察第一次粗略搜索的结果结合经验进行选择。

1.4 数据处理与分析

采用SPSS Statistics 20软件进行单因素方差分析,采用Excel 2016软件作图;牛龄预测模型的开发环境为:Intel双核处理器、2.53 GHz、4 GB内存、64 位操作系统、Windows 7系统。在Matlab R2010a实验仿真环境下,采用LibSVM工具包编程完成对数据的分类和建模。

2 结果与分析

2.1 数据归一化

由于测量得到的牛肉3 种特征参数肌纤维直径、周长和密度数值分布范围相差较大且数量级不相同,如果直接采用原始实验数据来建立牛龄预测模型以及进行参数优化,可能会影响预测模型的准确性。因此,需要对原始实验数据进行归一化预处理,采用式(5)的归一化映射f[26]。

式中:x表示某个原始实验数据;xmin和xmax分别是数据集的最小值和最大值;y是归一化后的数据。归一化后的原始实验数据规整到[0,1]范围内。数据归一化过程通过Matlab 2010a软件实现。

2.2 不同牛龄牛肉肌纤维特征的统计分析

对采集到的不同牛龄的特征参数数据进行统计和方差分析,结果如表1所示。

表1 不同牛龄牛肉肌纤维特征参数统计及方差分析Table 1 Statistical characteristics and analysis of variance of beef muscle fiber diameters at different slaughter ages

为了更直观地反映肌纤维特征参数的分布规律,作出不同牛龄牛肉肌纤维特征参数的箱形图,如图5所示。结合表1以及图5可知,除18 月龄与36 月龄以及36 月龄与54 月龄之间,其余每两组月龄的牛肉肌纤维直径之间均有显著差异(P<0.05);除36 月龄与54 月龄的牛肉肌纤维周长差异性不显著,其余每两组月龄的肌纤维周长差异均显著(P<0.05),且牛龄差距越大,差异显著性越高;但对于肌纤维密度,则只有18 月龄与54 月龄以及72 月龄的牛肉肌纤维密度之间差异性显著(P<0.05),其余各两组牛龄的牛肉肌纤维密度之间差异性均不显著。

图5 牛肉肌纤维特征参数箱形图Fig. 5 Box figures of muscle fiber characteristic values

为了进一步研究牛肉肌纤维各个特征参数与牛龄之间的关系,对肌纤维特征参数平均值和牛龄之间的关系进行线性拟合,以牛龄参数作为纵坐标,肌纤维特征参数作为横坐标,拟合结果如图6所示。

图6 牛肉肌纤维特征参数均值与牛龄线性拟合Fig. 6 Linear regression fitting between mean values of muscle fiber characteristic parameters and slaughter age

由图6A可以看出,随着牛龄的增长,肌纤维直径显著增大,该结果与文献[1]的结论完全一致。进一步的回归分析表明,肌纤维直径与牛龄之间存在显著的线性关系(P<0.05);图6B显示,随着牛龄的增加,牛肉肌纤维周长呈递增趋势,肌纤维周长与牛龄之间的线性关系极显著(P<0.01);由图6C可知,随着牛龄的增加,肌纤维密度有所降低,这与文献[27]的研究结果基本一致,回归分析结果显示,肌纤维密度与牛龄之间存在显著的线性关系(P<0.05)。

2.3 牛龄预测模型结果与分析

将100 个实验样本随机分成两组,其中的76 个样本作为训练集用于建模。将实验数据通过Excel 2016软件数据功能中的“宏”插件Format Data Libsvm转换成LibSVM所需的数据格式。IGS算法优化SVM参数C和g的具体步骤如下:1)初次粗略搜索时,设置参数C和g的范围以及搜索步距。C和g的初始搜索范围均设置为[2-10,210],搜索步距设置为1。2)在CV思想下,检测步骤1中(C,g)组合训练模型的性能。由于本实验数据量较少,故采用留一交叉验证法(leave-one-out CV,LOO-CV)进行参数优化选择[28],从而得到局部最优参数。3)根据步骤2中得到的局部最优参数,在该最优参数组合附近重新选择几组不同的参数组合区间进行二次精细搜索,步距设置为0.1,比较不同区间的搜索范围对分类准确率以及运行时间的影响,选择使得分类准确率达标且运行时间较合适的区间,训练结果显示:bestC=2.394 5、bestg=27.613 9。

为了测试模型的预测效果,剩余24 个样本用作独立测试集,测试集数据具体如表2所示。

表2 测试样本数据Table 2 Basic data of test samples

将上述测试集数据中的牛肉肌纤维特征参数输入到训练好的参数最佳的IGS-SVM分类模型中,模型预测结果与实际测试数据的类别对比结果如图7所示,纵坐标类别标签的2、4、6、8分别代表18、36、54、72 月龄的样本,横坐标代表样本序号。将不同牛龄的样本测试数据具体分类情况及分类准确率进行统计,结果如表3所示。

图7 IGS-SVM模型测试集分类结果Fig. 7 Classification results from IGS-SVM prediction model

表3 IGS-SVM牛龄预测模型分类结果Table 3 Classification results from IGS-SVM prediction model for slaughter age

由图7可以看出,序号为3的测试样本,其实际月龄18被错分为36;序号为12的测试样本,实际月龄为36被错分为54,其余月龄的测试样本均分类正确。

2.4 模型比较

为了比较IGS与GS在牛肉生理成熟度预测方面性能的优劣,以训练时间和测试集的分类准确率作为评价指标,将运用GS算法和IGS算法进行参数优化后的SVM模型测试结果进行对比。传统GS算法中,将惩罚因子C和核函数参数g的搜索范围均设置为[2-10,210],步距设置为0.1,直接以小步距搜索。图8为GS-SVM模型对测试集牛肉样本生理成熟度的预测结果。两种算法优化后的参数以及模型预测结果对比如表4所示。

图8 GS-SVM模型测试集分类结果Fig. 8 Classification results from GS-SVM prediction model

表4 GS与IGS算法优化结果比较Table 4 Comparison of results from GS and IGS algorithms

从表4可以看出,在测试集分类准确率上,IGS算法相比较于GS算法使得牛肉生理成熟度SVM预测模型在实际测试集分类准确率上降低了4.16%,模型训练时间上却缩短了1 755.41 s,可见IGS-SVM模型虽然分类准确率有所降低,但大幅缩短了分类时间,提高了分类效率,这与文献[29]的结果一致。同时两种模型的分类准确率均达到了90%以上,表明这两种算法优化参数的SVM模型针对牛肉生理成熟度预测功能的实现具有良好的适用性。

3 结 论

本研究运用机器视觉和图像处理方法采集并提取了4 种不同月龄牛肉肌纤维的直径、周长以及密度3 个方面的特征参数,运用SVM分类算法建立了一种牛肉生理成熟度的预测模型。针对SVM参数优化方面,在GS算法的基础上运用IGS算法,在得到最佳的参数的同时,计算量减少,程序运算复杂度降低。进一步选取具有代表性的实验数据作为测试集对模型性能进行测试,结果表明牛龄预测模型的预测准确率可达91.67%,研究表明基于IGS-SVM的分类预测模型对于牛肉生理成熟度的预测研究是适用的。本实验运用了Image-Pro Plus软件对牛肉肌纤维显微图像进行处理,并对特征参数进行提取,下一步工作可从图像处理过程入手,研究采用误差更小的图像处理方法获取肌纤维特征参数以及寻找更多与牛龄相关的图像特征,提高预测模型的精度。

猜你喜欢
特征参数肌纤维月龄
乳腺炎性肌纤维母细胞瘤影像学表现1例
婴儿颅骨肌纤维瘤/肌纤维瘤病2例
顶骨炎性肌纤维母细胞瘤一例
冕洞特征参数与地磁暴强度及发生时间统计
小于胎龄儿0~24月龄体格生长状况分析
湖州33月龄男童不慎9楼坠落上海九院对接“空中120”成功救治
基于交通特征参数预测的高速公路新型车检器布设方案研究
武定鸡肌纤维特性形成规律研究
基于PSO-VMD的齿轮特征参数提取方法研究
引入河曲马改良建昌马杂交效果