基于高光谱成像的肥城桃品质可视化分析与成熟度检测

2020-08-27 08:23邵园园王永贤玄冠涛王凯丽高宗梅
农业机械学报 2020年8期
关键词:成熟度波长桃子

邵园园 王永贤 玄冠涛,2 高 冲 王凯丽 高宗梅

(1.山东农业大学机械与电子工程学院, 泰安 271018; 2.山东省农业装备智能化工程实验室, 泰安 271018;3.华盛顿州立大学精细与自动化农业研究中心, 普罗瑟 99350)

0 引言

肥城桃因产于山东省肥城市而得名,以个大味美、营养丰富享誉中外[1]。肥城桃属于典型呼吸跃变型果实,鲜桃采摘后转色快、果肉易发生褐变,进而导致软化与腐烂[2-3]。鲜食和短期贮藏肥城桃,宜在成熟度90%左右时采摘,若远途运输销售和长期贮藏,最好在成熟度70%时收获。寻求快速、高效的检测方法,对肥城桃进行品质检测与成熟度鉴别,可以提高果品质量,实现优果优价。

高光谱成像技术将光谱与传统图像相结合,可以同时获取目标的空间和光谱信息,具有简便、快速、无损、准确等优点,已成功用于水果成熟度检测和果品分析[4-7]。文献[8]利用高光谱成像技术对不同成熟度樱桃进行分类,建立了樱桃果实pH值和可溶性固形物含量预测模型,从而实现了樱桃品质可视化。文献[9]应用高光谱成像技术,结合特征波长对冬枣成熟度进行可视化判别,采用多种方法选择特征波长,建立的PLS-DA模型判别精度可达90%以上。文献[10]采用高光谱成像技术,结合多个数据集的支持向量机分类模型,对草莓成熟度进行了评价。此外,高光谱成像技术结合化学计量学方法在蓝莓、柿子、香蕉等水果成熟度分析及品质评价方面也取得了较好效果[11-13]。但关于肥城桃品质与成熟度高光谱成像检测的研究鲜有报道。

本文以肥城桃为研究对象,采集两种成熟度(70%和90%)鲜桃的高光谱信息,建立光谱信息与可溶性固形物含量(Soluble solids content,SSC)、硬度回归模型,进行果品可视化分析与成熟度检测。

1 材料与方法

1.1 肥城桃样本

不同成熟度肥城桃如图1所示,成熟度70%(青熟期):桃子表面绿色逐渐褪减,整个果实表面少量着色,果实基本发育成型,质地较硬,耐贮藏。成熟度90%(转色期):果实表面大都着色,极少部分区域呈淡黄色,果实稍有弹性,少量区域变软,香味浓郁。“金秋婉蜜”肥城桃种植于山东省肥城市刘台肥桃合作社果园,采摘时间为2019年9月14日上午,在有经验的果农指导下,随机采摘两种成熟度肥城桃并用水果泡沫网套包裹放入保鲜盒,运回实验室。选取形状大小均匀,无斑点、无疤痕的肥城桃作为实验样本,获得两种成熟度肥城桃样本各80个,对选取的样本进行编号,成熟度70%样本编号1~80,成熟度90%样本编号81~160,按照编号顺序进行光谱数据的采集和理化性质的测定。

图1 桃子样本Fig.1 Peach samples

1.2 高光谱图像采集

1.2.1高光谱成像系统

GaiaField型便携式高光谱系统(四川双利合谱科技有限公司)组成如图2所示,主要包括GaiaField-V10E型高光谱成像仪、1 392像素×1 040像素HSIA-OL23型成像镜头、4组HSIA-LS-T-200W型对称分布专用光源、HSIA-TP-S型三脚架以及配有高光谱数据采集软件SpecView的专用计算机等。光谱范围为400~1 000 nm,光谱分辨率2.8 nm,有效狭缝长度9.8 mm,入射狭缝宽30 μm,视场角22°。通过创建400~1 000 nm的三维光谱立方体,研究所选像素特征,分析不同波长图像,进行果品检测与成熟度鉴别。

图2 高光谱成像系统Fig.2 Hyperspectral imaging system1.高光谱仪 2.镜头 3.光源 4.肥城桃样本 5.计算机

1.2.2图像采集和校准

从保鲜盒取出桃子,待其恢复常温(20℃)后,采集光谱数据。为了得到清晰图像,将样本与镜头距离设置为300 mm,相机曝光时间设置为15.2 ms。对高光谱成像系统进行黑白校正[14],以消除光照及相机暗电流等对图像影响。全黑标定图像Idark、全白标定图像Iwhite分别通过遮盖镜头、扫描标准白板获得,校正图像Ic为

(1)

式中Iraw——原始图像

利用软件ENVI 4.6(美国Exelis VIS公司)提取440像素×440像素感兴趣区域(Region of interst,RoI)高光谱数据,将RoI内所有光谱信息的平均值作为对应反射光谱值。

1.3 理化指标测定

肥城桃硬度测定使用GY-1型指针式水果硬度计(浙江托普云农科技股份有限公司),测头直径3.5 mm,下压深度10 mm,测试速度0.5 mm/s,选取RoI区域上、中、下3个位置进行测量,每个位置去除1 cm2左右果皮后进行测定,取3个位置平均值为硬度测定值。使用PAL-1型数显折射仪(日本爱拓公司)进行SSC测定,3个位置上的测量平均值为肥城桃SSC测定值。

1.4 数据处理

1.4.1异常值剔除

肥城桃光谱数据采集及SSC和硬度测定时,由于仪器、环境和人为操作等因素产生数据误差,影响模型准确性,应对异常值进行剔除。蒙特卡罗偏最小二乘(Monte Carlo-partial least squares, MCPLS)法以蒙特卡罗交互验证为基础,能够同时检测光谱异常值和理化性质异常值,根据交叉验证均方根误差(Root mean square error of cross validation, RMSECV)最小原则确定最佳主成分数,通过计算样本预测误差均值和标准差,具有较高均值和标准差的样本为异常样本[15-16]。

1.4.2样本集划分

采用光谱-理化值共生距离(Samples set partitioning based on joint X-Y distances, SPXY)[17]对经过样本剔除操作的SSC、硬度按2∶1比例进行建模集和预测集划分。通过计算建模集和预测集样本的最大值、最小值、平均值和标准偏差来评估样本划分是否合理。

1.4.3特征波长选取

由于全光谱含有256个波长变量,大量共线性波长会导致信息冗余,从而增加计算量降低建模效率。采用竞争性自适应权重采样(Competitive adaptive reweighted sampling, CARS)算法、连续投影(Successive projections algorithm, SPA)算法和顺序前向选择(Sequential forward selection, SFS)算法进行特征波长选取。

CARS算法是一种基于适者生存和回归系数进行波长选择的有效方法,先利用PLS(偏最小二乘)模型筛选回归系数大的波长,再通过十折交叉验证优选出均方根误差最小的波长子集[18]。SPA算法是一种前向循环的特征变量筛选方法,能够滤除无效信息,大大降低数据间的共线性影响[19]。SFS算法作为机器学习中的启发式搜索方法,从一个空的特征子集开始自上而下搜索,每次将一个未选特征加入特征子集,使特征函数达到最优[20]。

1.4.4回归和分类模型的建立与评价

多元线性回归(Multiple linear regression, MLR)是一种常用的建模方法,能够建立多个自变量与因变量的关系模型[19]。而MLR适用于变量数少于样本数的情况,所以本研究只对CARS和SPA算法提取的波长建立MLR模型。

人工神经网络(Artificial neural network, ANN)是模拟人的大脑结构而产生的,由大量的神经元联接构成,具有很强的非线性函数逼近能力,拥有强大的容错性[6]。本研究采用ANN对SFS算法提取的特征波长建立成熟度分类模型。

2 结果与分析

2.1 肥城桃光谱特征

去掉首尾噪声,对400~1 000 nm内256个波段进行光谱特征分析,获得肥城桃全部样本光谱曲线和平均光谱曲线如图3所示。由图3可以看出,不同成熟度肥城桃的平均光谱曲线变化趋势基本一致,450~650 nm间两光谱曲线差距较大,说明不同成熟度肥城桃成分含量存在差异。其中,420 nm和680 nm附近光谱吸收峰主要由肥城桃中类胡萝卜素和叶绿素吸收光谱引起[23-24],成熟度70%肥城桃由于含有更多的叶绿素,在680 nm处有较大吸收峰。740 nm和980 nm附近吸收峰与桃子内部水分有关,分别为O—H三级和二级倍频特征吸收峰[25-26]。830 nm附近吸收峰反映了肥城桃含糖量[18]。

图3 肥城桃光谱曲线Fig.3 Spectral curves of Feicheng peach

2.2 异常样本剔除

图4 SSC蒙特卡罗偏最小二乘法检测结果Fig.4 SSC Monte Carlo-partial least squares for removing outliers from peach samples

2.3 样本集划分

采用SPXY对剔除异常值的SSC和未进行剔除异常值的硬度分别结合光谱值进行数据集划分,结果如表1所示。由表1可以看出,建模集包含SSC和硬度的最大值和最小值,且分布范围较广,样本集划分合理。

表1 肥城桃SSC和硬度Tab.1 SSC and firmness values of Feicheng peach

2.4 特征波段选取

为了提高运行速度,挑选共线性最小、冗余最少的波长,采用CARS和SPA算法提取特征波长用来建立回归模型。图5a为CARS算法选择SSC特征波长过程,运行次数为72时,选取波长数为42个,占波长总量16.4%。图5b为CARS算法选择硬度特征波长过程,运行次数为52时,选取波长数为40个,占波长总量15.6%。

图5 CARS挑选特征波长过程Fig.5 Effective wavelength selected by CARS

图6a为SPA算法优选SSC特征波长分布,指定波长数N=5~30,共优选出11个光谱波长,占波长总量4.3%;图6b为SPA算法优选硬度特征波长分布,指定波长数N=10~30,共优选出11个光谱波长,同样占波长总量4.3%。

2.5 MLR模型建立

相应地,以特定波长处光谱反射率X(下角标数字表示波长,单位nm)为自变量,建立预测SSC、硬度的CARS-MLR 模型

图6 SPA优选波长分布Fig.6 Distributions of wavelengths selected by SPA

表2 基于不同波长选择方法的SSC和硬度MLR模型的性能Tab.2 Performance of MLR models of SSC and firmness based on different wavelength selection methods

图7 SSC和硬度实测值与预测值散点图Fig.7 Scatter plots of measured versus predicted values of SSC and firmness

Yssc=14.527-14.517X406-2.364X440+57.001X471- 29.217X506+15.690X565-44.734X617+218.637X667- 298.141X692+147.576X728-126.725X766+ 73.790X805+84.811X880-70.015X933-8.60X981

(2)

YF=6.436-51.386X411-41.118X423+44.069X457+ 85.159X493-78.627X540+38.268X570-18.434X627+ 46.731X687-101.082X703+282.756X769-4.736X800- 258.614X862-0.653X920+90.416X957-41.789X989

(3)

2.6 SSC和硬度可视化检测

利用CARS-MLR模型估算肥城桃每个像素点SSC和硬度,运用伪彩图处理技术生成SSC和硬度分布图,不同颜色和深浅程度代表不同成熟度肥城桃SSC和硬度,结果如图8所示。图8a中,成熟度90%桃子主要呈深黄色,SSC集中在12~15°Brix,成熟度70%桃子主要呈浅黄色,SSC集中在10~13°Brix,成熟度90%桃子SSC高于成熟度70%桃子。图8b中,成熟度90%桃子主要呈浅绿色,硬度集中在3~8 kg/cm2,成熟度70%桃子主要呈浅黄色和绿色,硬度集中在6~12 kg/cm2,成熟度70%桃子硬度高于成熟度90%桃子。SSC图中桃子外蓝色区域及硬度图中桃子外紫色区域为采集背景。利用SSC和硬度可视化分布图有助于在线检测桃子品质。

图8 不同成熟度肥城桃SSC和硬度分布图Fig.8 SSC and firmness distribution map of peach in different maturities

2.7 成熟度预测

为了快速准确预测肥城桃成熟度,采用SFS算法进行特征波长提取。搜索过程中,SFS算法分别以14.120、13.432和12.613的标准值挑选出3个特征波长493、530、720 nm,如图9所示。以SFS特征波长为输入,建立ANN预测模型。对虚拟等级值分别为0、1的成熟度70%、成熟度90%肥城桃样本按5∶3划分建模集和预测集,参数设置为:最大训练次数100、学习速率0.1、目标误差0.1。通过混淆矩阵图10可以看出,肥城桃成熟度预测总准确率为98.3%,结果较为理想。

3 结论

图9 SFS挑选特征波长Fig.9 Feature wavelengths selected by using SFS

图10 混淆矩阵Fig.10 Confusion matrix

(2)利用CARS-MLR预测模型计算不同成熟度肥城桃每个像素点的SSC和硬度,生成可视化分布图,实现不同成熟度肥城桃SSC和硬度的无损评价,有助于肥城桃品质在线检测。

(3)基于SFS特征波长建立ANN模型,对采后肥城桃进行成熟度预测,获得98.3%的总识别准确率,说明高光谱成像技术能够实现肥城桃成熟度的检测。

猜你喜欢
成熟度波长桃子
一种波长间隔可调谐的四波长光纤激光器
杯中“日出”
产品制造成熟度在型号批生产风险管理中的应用
整机产品成熟度模型研究与建立
桃子
桃子
给定置信水平下信息系统体系成熟度的灰色聚类方法
刚好够吃6天的香蕉
等我回来再骗你
送你一箱桃子