基于高光谱成像的核桃仁品质检测与分类方法

2020-12-25 02:53马文强张漫李源李民赞杨莉玲朱占江崔宽波
分析化学 2020年12期
关键词:核桃仁无损检测分类

马文强 张漫 李源 李民赞 杨莉玲 朱占江 崔宽波

摘 要 采用光谱与图像相结合,实现了核桃仁蛋白质和脂肪含量预测及基于完整度和色泽的核桃仁外观品质分级。选用新疆“温185”核桃仁,采集了862.9~1704.02 nm和382.19~1026.66 nm范围高光谱图像。采用多元散射校正(MSE)和标准正态化(SNV)方法进行预处理后,通过竞争性自适应重加权采样算法与相关系数法,对核桃仁样品的蛋白质含量、脂肪含量、总色差3个参数进行了特征波段筛选。通过偏最小二乘回归(PLSR)算法建立了全光谱波段与特征光谱波段的蛋白质和脂肪含量预测模型,与全光谱波段相比,蛋白质含量特征波段预测模型的验证集决定系数(R2)由0.66增长到0.91,均方根误差(RMSEP)由1.37%下降到0.78%; 脂肪含量特征波段预测模型的验证集R2由0.83增长到0.93, RMSEP由0.98%下降到0.47%。在外观品质方面,采用全光谱波段、RGB光谱波段、总色差特征光谱波段为输入,采用决策树、K近邻和支持向量机算法建立了核桃仁外观品质分类模型。通过对比发现,采用总色差特征波段建模,可大幅减低冗余信息的干扰,同时分类准确率也高于RGB波段; 在光谱信息的基础上加入图像统计特征参数信息,能够进一步提升分类的准确率,当采用决策数算法建立的色泽分类模型时,模型具有最高的分类准确率(98.6%); 分类算法方面,当输入变量数目较少时,决策树算法在分类准确率和速度方面都具有明显的优势。利用高光谱技术可以实现核桃仁内部品质检测与外观分级,为核桃仁品质无损检测的提供了新的理论依据。

关键词 核桃仁; 高光谱图像; 无损检测; 分类; 特征波段

1 引 言

核桃是一种老幼皆宜的坚果食品和重要的木本油料作物,我国核桃种植面积及产量均居世界首位[1]。核桃仁品质检测与分级是核桃生产加工的重要环节。按照国家相关标准[2-3]的规定,核桃仁外观品质指标包括完整度和表皮色泽,内部品质指标包含脂肪含量和蛋白质含量。实际生产中核桃仁分级主要依靠外形和色泽进行人工挑选,生产成本高,分级随意性大,难以对内部品质进行分辨。传统的化学检测对样品具有破环性,检测时间也较长,难以适应现代化生产要求。

机器视觉和近红外光谱是农产品品质研究中采用较多的技术手段。在采用机器视觉进行核桃仁分级方面,申爱敏等[4]以统计出的灰度图像核桃仁的面积为依据,采用阈值法自动识别核桃仁等级,分级正确率大于90%。蔡建等[5]提取了核桃仁图像在HSV颜色空间的颜色直方图、饱和度与明度的一、二阶距、最小外接矩形长宽比、轮廓面积与最小外接圆面积比等色泽与外观参数,采用决策树(Decision tree, DT)算法进行核桃仁分级预测建模,总体正确率达到92%。周军等[6]在此基础上进一步加入了颜色距、图像几何不变距等颜色和外观特征,并采用最大相关最小冗余算法对特征变量进行筛选,通过朴素贝叶斯(Native Bayesian, NB)分类算法对核桃仁等级进行建模预测,分级正确率达到97.33%。在采用近红外光谱进行核桃仁内部品质检测方面,郝中诚等[7]采用了标准正态化预处理和偏最小二乘回归(Partial least squares regression, PLSR)算法建立了核桃壳、仁近红外光谱与含水率的预测模型,模型平均偏差达到了0.35%。本研究组前期采用近红外光谱技术开展了核桃仁品种分类及蛋白质含量预测研究,采用主成分分析(Principal component analysis, PCA)与支持向量机(Support vector machine, SVM)相结合的方法对4个不同品种的核桃仁样品近红外光谱进行分类,总体正确识别率达到 96%; 进一步采用间隔偏最小二乘(Interval partial least squares, IPLS)算法对核桃仁蛋白质含量特征波段进行筛选,并建立了核桃仁蛋白质含量偏PLS预测模型, 针对验证集的均方根误差和相关系数分别为0.021和0.913[8,9]。核桃仁品质检测中需要对核桃仁内外部品质做出整体评价,但两种技术都无法同时反映被测样品的外观与内部品质信息。

高光谱成像同时包含了图像和光谱两种技术方法,其原理是采用高光谱成像设备对拍摄对象的反射光在光谱范围内进行细分,然后采集每个对应光谱波段的图像信息,最终获得具有三维数据的高光谱图像信息。高光谱图像不仅可以获得图像中每个点的光谱信息,而且可以获得任意光谱波段的图像,可以直观地显示出被拍摄对象的外观特征、光谱特征、颜色特征、纹理特征等丰富的信息,因此,在农产品品质检测方面的研究日益广泛[10~14],目前已应用于油料[15]、肉类[16]、水果[17]、种子[18]、饮料[19]等农产品的无损检测及分类方面。但是,由于成分、形状的不同,以上成果无法直接用于核桃仁内外部品质检测及分类。目前,采用高光谱技术进行核桃品质检测的研究主要集中于核桃壳仁分类[20],针对核桃仁品质的研究尚未见相关报道。

基于以上分析,为了探索同时实现核桃仁内部品质检测和外观等级分类的方法,本研究采用高光谱成像技术开展了核桃仁脂肪含量、蛋白质含量及色泽的特征光谱筛选,筛选出了品质指标的相关特征波段,进一步建立了核桃仁脂肪含量和蛋白质含量PLS预测模型,并采用DT算法建立了基于完整度和表皮色泽的核桃仁外观等级分类模型,取得了较好的预测和分类效果,以期为核桃仁品质无损检测的应用提供參考。

2 实验部分

2.1 实验样本及其处理

实验样品选用新疆“温185”核桃,含水量为7%,实验前于4℃储藏约5个月。手工破壳取仁,选取核桃仁样品60枚,包含半仁、1/4仁和碎仁3个完整度等级和浅黄色、浅琥珀色、琥珀色3个色泽等级,核桃仁样本不同外观等级示例如图1所示,样品外观等级分布情况如表1所示。通过高光谱成像设备采集高光谱图像后,使用色差仪采集每个核桃仁样品5个不同位置的总色差,计算其平均值ΔE,并将核桃仁样品的色泽类型按照测量计算出的总色差ΔE进行划分,其中: 浅黄色仁ΔE≥68,浅琥珀色仁60≤ΔE<68,琥珀色仁ΔE<60。按照食品安全国家标准GB5009.5-2016和GB 5009.6-2016要求,采用Foss全自动凯氏定氮仪测量每个样品的蛋白质含量,采用索氏提取器测量脂肪含量。

2.2 高光谱图像采集

高光谱图像采集设备为北京卓立汉光公司生产的Gaia Sorter高光谱成像仪,仪器结构如图2所示,主要由成像光谱仪(V10E)、镜头(OL23)、CCD(LT365)、均匀光源(2套溴钨灯)、电控移动平台、计算机及软件控制系统组成。开机后首先进行预热,以消除基线漂移造成的影响; 预热后进行镜头调焦并调试平台移动速度以避免图像失真。采用图像采集软件Spectra View采集核桃仁成像信息,分别在863~1704 nm和382~1027 nm光谱范围采集核桃仁样品高光谱图像,两个光谱范围内的光谱分辨率分别为3.2和0.84 nm。

为了消除光照不均匀、周围环境以及仪器暗电流造成的噪声影响,需要在采集样本高光谱图像前,分别利用标准白板和镜头盖采集白背景信息(Iw)和黑背景信息(Ib),然后按照公式(1)对采集的样本原始高光谱图像(I0)进行黑白校正,得到校正后的图像信息(I)。

其中,I为校正后的图像信息; I0为原始高光谱图像; Iw为白背景信息; Ib为黑背景信息。

2.3 光谱数据预处理与特征波段筛选

采用ENVI5.1软件对核桃仁样品高光谱图像进行感兴趣区域(Region of interesting, ROI)提取,计算出感兴趣区域光谱平均值作为样品光谱信息,然后使用Matlab R2015a软件进行后续处理。原始光谱中含有较多的环境背景噪声信息,因此进一步采用多元散射校正(Multivariate scatter correction, MSE)和标准正态化(Standard normalized variate, SNV)的组合方法对原始光谱信息进行预处理。

全光谱波段数据中包含较多与感兴趣参数相关度较低的无关信息及冗余数据,因此需要进一步进行特征波段筛选,以提高光谱数据信噪比,降低计算数据量。竞争性自适应重加权算法(Competitive adaptive reweighted sampling, CARS)是近年应用较多的一种新型特征波段筛选算法,可以快速有效剔除全光谱波段内的无关数据,但CARS算法获得的特征波段中仍存在冗余信息。本研究针对核桃仁蛋白质含量、脂肪含量和总色差3个参数,采用CARS算法与相关系数法(Correlation coefficient method, CCM)相结合的方法在对应的全光谱波段范围内进行了特征波段筛选,步骤如下: (1)去除了前段和后段受系统噪声影响较大个波段点后,采用CARS算法针对感兴趣的预测参数进行特征波段筛选; (2)计算筛选出的特征波段中所有波段两两组合的相关系数绝对值; (3)设定相关系数绝对值阈值为0.9,统计任一波段与其它波段相关系数绝对值≥0.9的数目; (4)剔除与其它波段相关系数≥0.9数目最多的波段,并返回步骤(2)重新统计; (5)当所有波段两两组合的相关系數绝对值都小于0.9时, 结束优选。

2.4 核桃仁品质检测方法

2.4.1 核桃仁内部品质检测方法 为了减小光谱获取及品质参数化学检测中测量误差的影响,采用马氏距离((Mahalanobis distance, MD)法对测量值异常的样品信息进行剔除。具体方法是: 分别计算每个样本光谱信息和化学测量值到样本集中心的MD,然后统计样本集MD的均值μ和均方差σ,以μ+3σ为阈值,将MD大于阈值的样本作为异常样本剔除。剔除异常样品信息后,通过随机抽样法按2∶1的比例将样本划分为校正集和验证集。针对蛋白质含量和脂肪含量,分别建立全光谱波段和特征光谱波段的PLSR模型,采用决定系数R2和均方误差(Root mean square error, RMSE) 对模型进行评估。

2.4.2 核桃仁外观等级鉴别方法 核桃仁表皮色泽和完整度等级是进行核桃仁外观等级鉴别的关键因素。首先,在核桃仁表皮色泽等级识别方面,由于总色差是反映核桃仁表皮色泽的直接参数,而总色差特征波段与总色差参数具有很高的相关性,因此提取了总色差特征波段的灰度图像,用于进一步图像处理。同时为了比较与RGB(475、550和650 nm)图像在核桃仁色泽鉴别中的差异,也提取了RGB图像用于对比处理。不同色泽等级的样品在图像灰度分布统计量和灰度共生矩阵统计量存在差异,也可以用于不同色泽等级样品的分类。本研究通过计算总色差特征波段平均灰度图像和RGB灰度图像的灰度分布统计量(均值、标准差、平滑度、一致性、熵、三阶矩)和灰度共生矩阵统计量(对比度、相关性、能量、熵)共10个作为图像统计特征参数,用于核桃仁色泽等级分类。以全光谱波段信息、RGB光谱波段信息、总色差特征光谱波段信息以及光谱信息与图像统计特征参数的组合为输入变量,以样品色泽等级标签为输出变量,建立了DT算法、K近邻(k-Nearest neighbor, KNN)算法和SVM3种色泽分类模型,其中,KNN算法中K=4,SVM采用线性核函数。建立模型时,通过随机抽样法按2∶1的比例划分训练集和验证集,以10次随机抽样划分的验证集分类准确率平均值作为模型分类平均准确率由于对分类模型进行评估。在核桃仁外观完整度等级分类方面,本研究对总色差特征波段灰度图像进行otsu阈值分割和先膨胀后腐蚀处理后,根据核桃仁的外形特点,选取高、宽、高宽比、面积、矩形度、圆形度6个外观参数用于核桃仁完整度等级的分类。

以382~1027 nm范围的全光谱信息、RGB波段光谱信息、特征波段光谱信息、图像统计特征参数和图像外形特征参数为输入,以样品完整度等级和色泽等级为输出,采用DT、KNN和SVM进行外观品质鉴别分类建模。采用10次抽样的验证集平均分类准确率对分类模型进行评估。最终按照相关行业标准[2]的规定, 将样本外观依据完整度与色泽分为7个等级。

3 结果与讨论

3.1 基于光谱信息的核桃仁内部品质指标检测

核桃仁样品在近红外区域(863~1704 nm)的平均光谱信息及预处理后的光谱信息如图3所示.样品原始光谱信息总体特征基本一致,除了水分的吸收峰外,其它成分的吸收峰并不明显,需要对光谱进行进一步处理。通过MSE和SNV组合的预处理方法,去除了部分背景噪声的影响,使样品光谱信息更平滑。同时,进一步增强了光谱信息的一致性,突出了光谱峰谷,使光谱特征得到了强化。

采用CARS和CCM算法相结合对样本蛋白质含量测量值和脂肪含量测量值进行特征波段筛选。图3B中红色虚线标记为与样本蛋白质含量相关的特征波段,蓝色虚线标记为与样本脂肪含量相关的特征波段。最终筛选出与样本蛋白质含量相关的6个特征波段,与样本脂肪含量相关的7个特征波段,其中,1269 nm为与蛋白质和脂肪含量共同相关的特征波段,筛选出的特征波段共计12个,具体对应的波长见表2。

采用MD法进行异常样品信息剔除。样本光谱信息、蛋白质含量测量值和脂肪含量测量值的MD分布如图4所示,红色实线是阈值为μ+3σ的判别线,下方为正常样本,红线上方为测量信息异常的样本。剔除了光谱信息测量异常样品1例,蛋白质含量测量异常样品2例,脂肪含量测量异常样品2例,共计剔除异常样品5例。

剔除异常样本后,将剩余的样本按2∶1的比例随机抽样划分为校正集和验证集。针对样本蛋白质含量和脂肪含量分别建立全光谱波段和特征光谱波段的PLSR预测模型,其中模型主成分数为5,模型预测效果如表3所示,图5为采用特征波段建立的蛋白质和脂肪含量预测模型的预测结果分布图。由图5和表3可见,与全光谱信息相比,采用特征波段建模,模型的决定系数(R2)和RMSE都有了明显的改善,蛋白质含量预测模型的验证集R2由0.66增长到0.91,RMSEP由1.37下降到0.78; 脂肪含量预测模型的验证集R2由0.83增长到0.93,RMSEP由0.98下降到0.47。说明采用CARS算法与相关系数法结合,筛选出的特征波段有效的降低了全光谱信息的复杂度,提高了建模质量。

3.2 基于光谱信息与图像特征的核桃仁外观等级分类

图6为3种色泽核桃仁样品在可见光和短波近红外区域(382~1027 nm)的平均光谱曲线,由于光谱前后段噪声影响较大,因此去除了前段和后段各20个波段点。由图6可见,在原始光谱中,3种色泽核桃仁样品的光谱曲线在可见光范围内光谱反射率随着色泽由浅到深呈现明显的下降趋势,在近红外范围内光谱较杂乱。经过MSC和SNV组合方法预处理后的光谱信息,光谱反射率呈现出一定的规律性和一致性,有助于后续的光谱处理。

对样本全光谱信息进行了特征波段筛选,筛选出的总色差特征波段为402.5和689.2 nm,位置分布如图6B中虚线位置所示。提取的总色差特征波段图像与RGB图像的图像统计特征参数后,以光谱信息与图像统计特征参数的组合为输入变量,采用决策树算法、K近鄰算法和支持向量机3种分类算法建立色泽分类模型,模型分类平均准确率如表4所示。

由表4可知,当采用图像统计特征参数与总色差特征波段光谱信息的组合为输入变量时,采用DT算法建立的色泽分类模型具有最高的分类准确率(98.6%)。在输入变量方面,由于全光谱波段中包含大量无关的冗余信息,参与建模时降低了模型准确率。采用总色差特征波段建模,大幅减低了冗余信息的干扰,提高了建模效率,同时,采用总色差特征波段建模的分类准确率也高于RGB波段。图像统计特征参数反映了样本图像的色泽和纹理变化,属于有效的分类信息,因此,在总色差特征波段光谱信息与RGB波段光谱信息的基础上加入图像统计特征参数,能够进一步提升分类模型的准确率。在输入变量方面,当采用全波段光谱信息为输入时,输入变量数目较多,采用SVM算法的分类模型准确率高于决策树和KNN算法; 当输入变量数目为总色差特征波段及总色差特征波段与图像信息的组合时,输入变量数目大幅减少,此时DT算法在模型分类准确率和分类计算速度方面都具有明显的优势。

对总色差特征波段平均灰度图像进行otsu阈值分割二值化、先膨胀后腐蚀处理,以浅黄色、浅琥珀色和琥珀色3种核桃整仁图像为例,处理结果如图7所示,处理后的图像可以完整地将核桃仁与背景完全分割,有利于进一步在此基础上提取核桃仁图像的外观参数。提取核桃仁外观参数后,以外观参数为输入,样本完整度等级为输出,采用DT算法建立核桃仁完整度分类模型。进一步按照文献[2]规定,结合核桃仁样本表皮色泽分类结果,将样本外观按完整度与色泽分为7个等级,分类结果见表5。由表5可知,建立的分类模型对核桃仁外观等级分类效果较好,平均分类准确率达到了98.4%。

4 结 论

采用高光谱成像技术,开展了核桃仁内外部品质检测方法研究,通过光谱与图像信息相结合的方法实现了核桃仁蛋白质和脂肪含量预测以及基于完整度和色泽的核桃仁外观品质分级。结果表明,采用CARS算法与相关系数法相结合的方式,有效的去除了全光谱波段中的无关信息和冗余信息。与全光谱波段相比,特征波段预测模型蛋白质含量的验证集R2由0.66增长到0.91,RMSEP由1.37%下降到0.78%; 脂肪含量的验证集R2由0.83增长到0.93,RMSEP由0.98%下降到0.47%,表明筛选出的特征波段有效降低了模型的复杂度,提高了模型预测能力。将色差特征光谱与图像统计特征参数相结合,采用高光谱图像提取了总色差特征波段光谱,能够大幅降低冗余信息的干扰,提高建模效率。通过总色差特征波段光谱与图像统计特征参数相结合的方法,与RGB波段相比进一步提升分类的准确率,当采用DT算法建立的色泽分类模型时,模型具有最高的分类准确率(98.6%)。采用高光谱图像同时实现了核桃仁内部品质参数(蛋白质含量、脂肪含量)的检测和外观品质(完整度、色泽)的分类,为核桃仁品质无损检测提供了新的解决方案。

References

1 CAO Ya-Long, JIE Bo, WANG Lei, MENG Hai-Jun, WU Guo-Liang. J. Fruit Sci.,  2018, 35(9): 1128-1140

曹亚龙, 揭 波, 王 磊, 孟海军, 吴国良. 果树学报, 2018,  35(9): 1128-1140

2 LYT 1922-2010, Walnut Kernel. Forestry Industry Standards of the People's Republic of China

核桃仁. 中华人民共和国林业行业标准. LYT 1922-2010

3 GB/T 20398-2006, Walnut Quality Grade. National Standards of the People's Republic of China

核桃坚果质量等级. 中华人民共和国国家标准. GB/T 20398-2006

4 SHEN Ai-Min, HUO Xiao-Jing, WANG Wen-Di, WANG Hong-Xia. Jiangsu Agric. Sci.,   2016,  44(9): 383-385

申爱敏, 霍晓静, 王文娣, 王红霞. 江苏农业科学, 2016,  44(9): 383-385

5 CAI Jian, ZHOU Jun, SHI Jian-Xin, WANG Yong, GUO Zheng, LIU Hang. Jiangsu Agric. Sci.,   2018,  46(5): 158-161

蔡 建, 周軍, 史建新, 王 勇, 郭 政, 刘 航. 江苏农业科学, 2018,  46(5): 158-161

6 ZHOU Jun, CAI Jian, GUO Jun-Xian, ZHANG Jing, SHI Jian-Xin, ALI Hasmu, JIANG Yan-Wu. Jiangsu Agric. Sci.,   2018,  46(11): 175-179

周 军, 蔡 建, 郭俊先, 张 静, 史建新, 艾力·哈斯木, 姜彦武. 江苏农业科学,  2018,  46(11): 175-179

7 HAO Zhong-Cheng, PENG Yun-Fa, ZHANG Hong, ZHANG Rui, ZHANG Rui-Li. J. Anhui Agric. Sci.,   2014,  42(21): 7191-7193,7233

郝中诚, 彭云发, 张 宏, 张 锐, 张锐利. 安徽农业科学,  2014,  42(21): 7191-7193,7233

8 MA Wen-Qiang, ZHANG Man, LI Zhong-Xin. Transact. Chin. Soc. Agric. Machin.,   2015,  46(S1): 128-133

马文强, 张 漫, 李忠新. 农业机械学报,  2015,  46(S1): 128-133

9 MA Wen-Qiang, ZHANG Man, LI Zhong-Xin, YANG Li-Ling. Transacte. Chin. Soc. Agric. Machin.,   2017,  48(S1): 407-411

马文强, 张 漫, 李忠新, 杨莉玲. 农业机械学报 , 2017,  48(S1): 407-411

10 Kandpal L M, Park E, Tewari J, Cho B. J. Biosyst. Engineer.,   2015,  40(2): 124-136

11 Kandpal L M, Cho B. J. Biosyst. Engineer.,   2014,  39(3): 215-226

12 Mishra P, Nordon A, Asaari M S M, Lian G P, Redfern S. J. Food Engineer.,  2019,  249(5): 40-47

13 Su W H, Bakalis S, Sun D W. Biosyst. Engineer.,   2019,  180(4): 70-86

14 LI Xiao-Yu, XU Sen-Miao, FENG Yao-Ze, HUANG Tao, DING Chong-Yi. Transact. Chin. Soc. Agric. Machin.,  2016,  47(1): 221-226

李小昱, 徐森淼, 冯耀泽, 黄 涛, 丁崇毅. 农业机械学报, 2016,  47(1): 221-226

15 Cheng J H, Jin H L, Xu Z Y, Zheng F P. Anal. Methods,   2017,  43(9): 6148-6154

16 Wei Y Z, Wu F Y, Xu J,Sha J J, Zhao Z F, He Y, Li X L. J. Food Engineer.,  2019,  248: 98-96

17 Zhao H T, Feng Y Z, Chen W, Jia G F. Meat Sci.,   2019,  151: 75-81

18 Fan S X, Li C Y, Huang W Q, Chen L P. Sensors,  2018,  18(12): 1-19

19 ZHANG Hang, YAO Chuan-An, JIANG Meng-Meng, JI Yu-Hang, LI Hua-Jie. J. Triticeae Crops,   2019,  39(1): 96-104

张 航, 姚传安, 蒋梦梦, 姬豫航, 李华杰. 麦类作物学报,  2019,  39(1): 96-104

20 CHEN Cai-Hong, ZHANG Shu-Juan, SUN Hai-Xia, LI Cheng-Ji, XING Shu-Hai. J. Shanxi Univ. (Nat. Sci. Edit.),   2018,  38(11): 27-32

陈彩虹, 张淑娟, 孙海霞, 李成吉, 邢书海. 山西农业大学学报(自然科学版),  2018,  38(11): 27-32

Detection and Grading Method of Walnut Kernel Quality Based on

Hyperspectral Image

MA Wen-Qiang1,2, ZHANG Man*1, LI Yuan3, LI Min-Zan1,

YANG Li-Ling2, ZHU Zhan-Jiang2, CUI Kuan-Bo2

1(Key Laboratory of Modern Precision Agriculture System Integration Research, Ministry of Education,

College of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China)

2(Agricultural Mechanization Institute, Xinjiang Academy of Agricultural Sciences, Urumqi 830091, China)

3(Soil Fertilizer and Agricultural Water Saving Research Institute,

Xinjiang Academy of Agricultural Sciences, Urumqi 830091, China)

Abstract Hyperspectral imaging technology enables rapid non-destructive inspection and grading of various agricultural products. In this work, the research on the quality detection method of walnut kernel based on hyperspectral image was carried out. The combination of spectrum and image information was used to realize the prediction of protein and fat content and the classification of the integrity and color of walnut kernel. The “Wen 185” walnuts, which were produced from Xinjiang, were shelled and prepared by different grades of integrity and color. Then the hyperspectral image of each sample was measured in the range of 862.9-1704.02 nm and 382.19-1026.66 nm by Gaia hyperspectral imager. After that, the color difference, fat content and protein content of samples were measured. Multivariate scatter correction and standard normalized variate were used to pre-processing the original spectral information. And the feature bands were screened by the method, which combined competitive adaptive re-weighting sampling (CARS) and correlation coefficient method (CCM ) algorithm, for the three parameters of protein content, fat content and total color difference of walnut kernel samples. Six feature bands related to protein content and 7 feature bands related to fat content were screened out. The internal quality parameter prediction model of the full spectrum band and the characteristic spectrum band were established by partial least squares regression (PLSR) algorithm. Compared with the full-spectrum band, the verification set coefficient (R2) of the feature band protein content prediction model increased from 0.66 to 0.91, and the mean square error (RMSEP) decreased from 1.37% to 0.78%. The verification set coefficient (R2) of the feature band fat content prediction model increased from 0.83 to 0.93, and the RMSEP decreased from 0.98% to 0.47%. It showed that the selected characteristic bands effectively reduced the complexity of the full spectrum information and improved the quality of modeling. In terms of appearance quality, the feature bands associating with the color difference were selected to be 402.5 and 689.2 nm. The full-spectral spectrum, RGB spectrum, characteristic spectrum and the combination of spectral and image information were used to establish the walnut appearance quality classification model by decision tree, K-nearest neighbor and support vector machine algorithm. It showed that the feature bands modeling greatly reduced the interference of redundant information, improved the modeling efficiency, and the classification accuracy were also significantly higher than the RGB bands by comparison. The adding image statistical feature parameter to the feature bands and RGB bands could further improve the accuracy of classification model which had the highest classification accuracy rate reached to 98.6% by decision tree algorithm. In terms of classification algorithm, the decision tree algorithm had obvious advantages in classification accuracy and calculation speed when the number of input variables was less. The used of hyperspectral technology could realize the internal quality detection and appearance classification of walnut kernels, which provided a new theoretical basis for the application of non-destructive testing of walnut kernel quality.

Keywords Walnut kernel; Hyperspectral image; Nondestructive testing; Classification; Feature band

(Received 16 August 2019; accepted 14 October 2020)

This work was supported by the Project of Renovation Capacity Building for the Young Sci-Tech Talents Sponsored by Xinjiang Academy of Agricultural Sciences (No. xjnkq-2019007), the National Natural Science Foundation of China (No.31701319) and the Science and Technology Innovation Key Cultivation Special Project of Xinjiang Academy of Agricultural Sciences (No.xjkcpy-004).

2019-08-16收稿; 2020-10-14接受

本文系新疆農业科学院青年科技骨干创新能力培养项目(No. xjnkq-2019007)、国家自然科学基金项目(No.31701319)和新疆农业科学院科技创新重点培育专项(No.xjkcpy-004)资助

* E-mail: cauzm@cau.edu.cn

猜你喜欢
核桃仁无损检测分类
威风凛凛的东北虎
按需分类
教你一招:数的分类
说说分类那些事
应力波反射法测锚索长度的数据处理软件设计与实现
中子照相技术及其在考古中的应用
给塑料分分类吧
醋泡核桃仁可减肥
琥珀桃仁的制作方法