基于多模型融合的干燥过程中毛豆含水率、颜色高光谱图像无损检测

2015-03-24 07:05赵伟彦朱启兵
食品工业科技 2015年5期
关键词:毛豆含水率光谱

赵伟彦,黄 敏,朱启兵

(江南大学 轻工过程先进控制教育部重点实验室,江苏无锡 214122)



基于多模型融合的干燥过程中毛豆含水率、颜色高光谱图像无损检测

赵伟彦,黄 敏*,朱启兵

(江南大学 轻工过程先进控制教育部重点实验室,江苏无锡 214122)

毛豆的颜色和含水率是反映毛豆品质的两个重要参数,本文报道了一种利用多模型融合方法提高干燥过程中毛豆颜色和含水率高光谱图像无损检测精度的方法。该方法利用平均值,熵,相对散度,标准差等特征实现对高光谱图像的特征提取;并分别利用这四类特征建立毛豆颜色、含水率的偏最小二乘预测子模型;最终通过对各预测子模型的加权融合获得最终的预测结果,达到提高干燥过程中毛豆颜色和含水率无损检测精度的目的。相比于单特征模型,多模型融合后的颜色预测均方根误差RMSEP降低了4.3%;含水率的预测均方根误差RMSEP降低了7.7%。T统计检验表明:融合模型性能显著地优于单一特征模型。

干燥毛豆,多模型融合,高光谱图像技术,干燥过程

毛豆又名菜用大豆、枝豆,是以幼嫩荚果和豆粒作为蔬菜食用的一种大豆,由于其兼具营养与保健双重功能[1-2],深受国内外消费者的青睐。为了提高毛豆的经济价值和延长毛豆的储藏期和货架期,生产厂家常通过干燥的方式将毛豆脱水预处理或制成具有独特风味的休闲食品。毛豆的颜色和含水率是反映干燥后毛豆品质的两个重要参数,也是判断干燥工艺参数设定合理性与否的重要标准[3]。传统的毛豆颜色检测方法是用测色色差计进行接触式测量,其测量精度受色差计与测试样本的接触面积等因素的较大影响,为了减少测量误差,通常需要进行对同一测试样本的多次重复测量[4-5]。含水率的测量通常采用烘箱烘干或者费舍尔滴定的破坏性测量方法,无法实现全样本测量[6]。由于上述测量方法无法实现颜色和含水率参数的同时测量,存在着费时费力的缺点。近年来,利用近红外光谱技术、高光谱图像技术等进行农产品颜色、水分等内部品质指标的快速无损检测方法被广泛的研究和报道[7-9]。

高光谱图像技术是一种结合了图像和光谱两种技术优势为一体的无损检测新方法,其在农产品品质无损检测技术中的应用得到了广泛的研究报道[10-14]。利用高光谱图像进行农产品无损检测时,其检测精度依赖于高光谱图像的特征提取和检测模型的设计。目前常用的方法是通过对不同特征的建模精度进行比较,从而选择具有较好建模精度的子特征集合作为预测模型的输入特征,并建立其与对应品质的无损检测模型。由于受样本收集范围的限制,这一方法往往导致预测模型的泛化能力难以保证。信息融合方法是提高预测(分类)模型性能的一种有效方法,其基本思想是利用计算机技术将来自多传感器或多源的观测信息进行分析、综合处理,从而得到被测目标的决策和估计值。相比于单一传感器或者单源信息,信息融合方法通过对信息多级别、多方面组合导出更多有用信息,从而提高了对被测目标的决策和估计精度[15]。由于信息融合的诸多优点使其在农产品无损检测方面得到越来越广泛的应用,国内外学者对此做了大量的研究并取得了很多成果[16-18]。本文以干燥过程中毛豆颜色、含水率的高精度无损检测为目标,比较了不同高光谱图像特征条件下,毛豆颜色、含水率检测模型的精度;在此基础上,引入多模型融合思想,达到提高干燥过程中毛豆颜色和含水率多指标同步高精度无损检测的目的。

1 材料和方法

1.1 材料与仪器

本实验所用毛豆样本采购于浙江省慈溪市海通食品有限公司的毛豆种植基地,毛豆的品种是75-3,成熟度为8.5至9成之间。新鲜毛豆经过清洗、去皮、漂烫后,放入温度4℃、湿度为95%的冷藏库内保存,以备下一步实验使用,保存时间不超过3d。漂烫方式采用电磁炉加热。采用脉冲喷动微波真空干燥(PSMVD)设备对毛豆进行干燥,该实验装置脉冲喷动系统带有一套空气处理装置及空气流量调节与分配装置,空气处理量为1m3/min。热量供给系统由微波提供热量,微波的输出功率能够在0~0.8kW连续调整。真空系统采用水环式真空泵,冷却器温度范围在-15~10℃。干燥仓内压力可以在3.5~100kPa内调节[19]。

在本实验中,脉冲喷动的频率设置为喷动间隔时间为1s,每次喷动时间维持3s。干燥仓内真空压力波动范围设定在(9±1)kPa,功率为516W,每次干燥毛豆样本质量为(200±0.5)g,干燥时间分别为10、20、30、40、50、60、70和80min,每个干燥时间实验重复3次。

1.2 高光谱反射图像采集系统

实验中使用高光谱反射图像采集系统如图1所示。该系统主要包括高光谱成像单元,光源系统、样本输送平台和装有图像采集卡的PC机组成。其中高光谱成像单元由CCD摄像机(pixelfly QE IC*285AL,Cooke,USA)和图像光谱仪(1003A-10140 HyperspcTM VNIR C-Series,Headwall Photonics Inc.,USA)两部分组成;光源系统为150W的直流卤素灯(3250K,Techniquip,USA),为了在图像不失真的前提下获得最佳的图像采集效果,在图像采集之前需要对高光谱成像系统进行校正和调试,确定出最佳系统参数如下:图像采集的曝光时间为250ms,物距25cm,线扫描步长80μm,扫描宽度50mm,binning为10,即实际波段间隔为6.44nm,在400~1000nm波长范围内共获得94个波段。采集结束时得到大小为1392×625×94的图像立方体。图像采集时将干燥毛豆样本每10个为一组按两排排放到20cm×20cm的黑色载物板上,垂直放到高光谱扫描单元的下方,为了减弱外部光源的干扰整个采集过程在密闭黑箱中进行。每6组样本测量后,采集1次白板和暗电流图像,以用于图像校正。

图1 高光谱反射图像采集系统Fig.1 Schematic of the hyperspectral reflectance imaging system

1.3 标准值测量

在本实验研究中,毛豆颜色采用CR-400色差计(Konica Minolta Sensing,Inc.,Japan)进行测量[20],用色差(ΔE)来描述干燥过程中的样本颜色的变化,其计算公式如(1)所示。

式(1)

含水率测量采用国标(GB/T8858-88)的烘箱方法[21]。将样本放置在105℃的烘箱(Binder FED,Berlin,Germany)干燥到恒定质量(大约7~8h)后,利用精度为0.0001g分析天平(汉平FA1104,上海,中国)获得干燥前后的质量,按照公式(2)计算得到毛豆的含水量MC。

式(2)

式中;mt为烘箱干燥前的毛豆质量;md为烘箱干燥后的干物质质量。

在本实验中,共得到234个毛豆颜色样本(0~80min共9类干燥时间,每类26个样本左右)和272个毛豆含水率样本(0~80min共9类干燥时间,每类30个样本左右)。

1.4 数据分析

1.4.1 高光谱图像数据预处理 为了减少光源波动和噪声的影响,原始毛豆高光谱图像通过公式(3)校正:

式(3)

其TR为校正后的干燥毛豆的相对反射图像,TA、TG、TD分别是样本的反射图像、白板图像和CCD检测器的暗电流图像。后期所有的分析都在校正后的图像TR的基础上进行。

1.4.2 毛豆豆粒的高光谱图像特征提取 首先在718.2nm波段下利用自适应阈值法[22]提取干燥后毛豆轮廓,并进行必要的膨胀、腐蚀、开、闭运算以减少微小的裂纹。在此之后,将718.2nm波段下提取到的毛豆轮廓投射到其它波段,作为对应波段下毛豆的轮廓图像,分别在400~1000nm共94个波段下提取毛豆轮廓范围内的平均值(Mean Value,MV),熵值(Entropy Value,EV),相对散度(Relative Divergence,RD)以及标准差(Standard Deviation,SD)四类特征。这四类特征中平均值和标准差主要用于提取图像的光谱信息,而熵值和相对散度主要反映了图像的纹理特征信息。我们的先期研究表明,上述四类特征的综合使用,可基本保证高光谱图像信息的充分挖掘,为后续的预测模型构建提供充分的信息保证。各特征的表达式分别如式(4)~式(7)所示。

平均值计算公式:

式(4)

熵值计算公式:

式(5)

标准差计算公式:

式(6)

相对散度计算公式:

式(7)

1.4.3 用于毛豆颜色和含水率预测的多模型融合方法 传统的农产品品质无损检测主要采用单一模型的建模方法,单一模型方法的模型精度严重依赖于模型输入特征变量的选择。为了获得高的预测精度,通常需要利用各种算法对各类特征的建模性能比较选择,这一过程繁琐费时。更为严重的是,这些选择方法多是依赖于对已有建模样本精度评价的基础,当测试样本发生变化时,容易导致模型预测能力的下降。

式(8)

其中:Yi是指第i个PLS子模型的预测输出;是指第i个PLS子模型的训练集的相关系数。

图2 多模型融合示意图Fig.2 Schematic of multiple model fusion

1.4.4 训练、测试样本划分及模型性能评价 在建立预测模型之前,需要将总体样本(232个毛豆颜色样本和272个毛豆含水率样本)划分为训练和测试样本集合。其中训练集合用于建立标准值的预测模型,测试集用于检验模型。本文对每种干燥时间条件下(0~80min,步长为10min,共9类干燥时间的含水率和颜色)的样本进行随机取样,抽取3/4样本组成训练集,剩余样本构成测试集。在建立PLS模型时,模型的潜在变量个数采用留一法交叉验证误差确定。采用测试集样本的均方根误差RMSEP和相关系数Rp作为评价模型性能的指标。RMSEP越小,Rp越高,模型的性能越好。考虑到模型的性能会随着训练集、测试集样本的变化而变化,为了更好地评价模型性能,上述随机取样、建模过程被重复10次。取10次的RMSEP、Rp平均值作为最终的指标。同时为了更好地比较不同模型的性能,成对T检验也被用于对不同建模方法的性能比较。

2 结果与分析

2.1 四种特征的特征曲线

图3~图6给出了不同干燥时间情况下的平均值、相对散度、熵值和标准差四种特征的样本平均曲线。由四个特征曲线图可知在430nm和660nm附近形成吸收峰,这是由于叶绿素a和叶绿素b的吸收造成的。除了熵值特征曲线,其它三类特征都在970nm左右出现水分吸收峰。

表1 干燥后毛豆颜色预测结果Table 1 The prediction results of dried soybean’s color

图3 光谱平均值特征曲线Fig.3 The profile of mean spectra

图4 相对散度的特征曲线Fig.4 The profile of relative divergence

图5 熵的特征曲线Fig.5 The profile of entropy value

图6 标准差的特征曲线Fig.6 The profile of standard deviation

注:带A表示该模型对单一特征模型有显著性,表2同。2.2 干燥后毛豆颜色预测结果

表1给出了利用单特征PLS模型、多特征集成PLS模型(不同类型的特征串联作为PLS模型的输入)和多模型融合方法得到的干燥后毛豆颜色预测结果。从表中可以看出:利用单一特征进行建模,平均值特征取得测试集均方根误差RMSEP 0.987的最佳精度;而熵值特征的精度最差,其RMSEP为1.087。当采用多特征集成方式时,MV、EV、RD和SD四个特征的集成获得的精度最高,其RMSEP为0.989。当采用多模型融合方法时,采用MV、EV、RD和SD四个特征构成的多模型得到了最佳的精度。对10次随机的预测集样本均方根误差的成对检验表明:相比于单特征PLS模型,采用多特征集成的PLS模型对毛豆颜色的预测性能并无显著性提高;而采用4个特征的PLS子模型融合的方法要显著地优于单一特征和多特征集成模型。与前期文献[9](Rp=0.862,RMSEP=1.04)相比,多模型的预测结果均有所改善和提高。这是由于通过对信息多级别、多方面融合挖掘出更多有用信息,提高预测效果。

2.3 干燥后毛豆含水率预测结果

表2给出了利用单特征PLS模型、多特征集成PLS模型(不同类型的特征串联作为PLS模型的输入)和多模型融合方法得到的干燥后毛豆含水率预测结果。从表中可以看出:利用单一特征进行建模,标准差特征取得测试集均方根误差RMSEP 3.837%的最佳精度;

表2 干燥后毛豆含水率预测结果Table 2 The prediction results of dried soybean’s moisture content

而熵值特征的精度最差,其RMSEP为6.363%。当采用多特征集成方式时,MV、EV、RD和SD四个特征的集成获得的精度最高,其RMSEP为3.547%。当采用多模型融合方法时,采用MV和SD两个特征构成的多模型得到了RMSEP=3.509%,Rp=0.985的最佳精度。对10次随机的预测集样本均方根误差的成对检验表明:相比于单特征PLS模型,采用4个特征集成的PLS模型对毛豆含水率的预测性能有显著性提高;同时采用多模型融合的方法要显著地优于单一特征模型。与前期文献[9](Rp=0.973,RMSEP=4.6%)相比,多模型也可提高含水率的无损检测精度。

图7和图8给出了干燥后毛豆颜色和含水率的预测散点图,从图中可以看出真实值和预测值有着良好的相关性,说明利用多模型思想结合高光谱技术进行干燥后毛豆颜色和含水率无损检测是可行的。

图7 颜色的散点图Fig.7 The scatter diagram of color

图8 含水率的散点图Fig.8 The scatter diagram of moisture content

3 结论

本文利用一种多模型融合方法提高了干燥过程中毛豆颜色和含水率高光谱图像无损检测精度。相比于单特征模型,多模型融合后的颜色预测均方根误差Rmsep降低了4.3%;含水率的预测均方根误差Rmsep降低了7.7%。T统计检验表明:融合模型性能显著地优于单一特征模型。说明利用多模型融合的方法提高了高光谱图像无损检测精度是可行的。

[1]Song J Y,An G H,Kim C J. Color,texture,nutrient contents,and sensory values of vegetable soybeans[Glycine max(L.)Merrill]as affected by blanching[J].Food Chemistry,2003,83(1):69-74.

[2]顾卫红,郑洪建,张燕,等. 菜用大豆的国际需求及科研生产动态(综述)[J].上海农业学报,2002,18(2):45-48.

[3]李爱勤,张绪坤,徐刚,等. 颜色检测系统及其在果蔬干燥中的应用[J]. 江西科学,2009,27(1):127-131.

[4]Aguilera J M. Drying and dried products under the microscope[J].Food Science and Technology International,2003,9(3):137-143.

[5]Hu Q,Zhang M,Mujumdar AS,et al. Drying of edamame by hot air and vacuum microwave combination[J]. Journal of Food Engineering,2006,77(4):977-982.

[6]Hu Q,Zhang M,Mujumdar A S,et al. Performance evaluation of vacuum microwave drying of edamame in deep-bed drying[J]. Drying Technology,2007,25(4):731-736.

[7]孙俊,武小红,张晓东,等. 基于高光谱图像的生菜叶片水分预测研究[J]. 光谱学与光谱分析,2013,33(2):522-526.

[8]周燕,黄传旭,陈斌. 用近红外光谱仪器快速检测小麦水分[J]. 现代科学仪器,2002(6):50-52.

[9]Huang M,Wang Q,Zhang M,et al. Prediction of color and moisture content for vegetable soybean during drying using hyperspectral imaging technology[J]. Journal of Food Engineering,2014,128:24-30.

[10]Huang M,Lu R. Apple mealiness detection using hyperspectral scattering technique[J]. Postharvest Biology and Technology,2010,58(3):168-175.

[11]张伟,潘磊庆,屠康. 利用高光谱透射图像检测鸡种蛋早期孵化[J]. 农业工程学报,2012,28(21):149-155.

[12]黄培贤,姚志湘,粟晖,等. 高光谱图像技术在食品无损检测中的研究进展[J].食品工业科技,2012,33(15):412-417.

[13]赵杰文,刘剑华,陈全胜,等. 利用高光谱图像技术检测水果轻微损伤[J].农业机械学报,2008,39(1):106-110.

[14]黄敏,万相梅,朱启兵,等. 基于高光谱图像技术的菜用大豆厚度检测[J].食品与生物技术学报,2012,31(11):1142-1147.

[15]Khaleghi B,Khamis A,Karray F O,et al. Multi-sensor data fusion:a review of the state of the art[J]. Information Fusion,2013,14(1):28-44.

[16]Natale C D,Paolesse R,Macagnano A,et al. Electronic nose and electronic tongue integration for improved classification of clinical and food samples[J]. Sensors and Actuators B:Chemical,2000,64(1):15-21.

[17]陈全胜,赵杰文,蔡健荣,等.基于近红外光谱和机器视觉的多信息融合技术评判茶叶品质[J].农业工程学报,2008,24(3):5-10.

[18]展慧,李小昱,周竹,等. 基于近红外光谱和机器视觉融合技术的板栗缺陷检测[J]. 农业工程学报,2011,27(2):345-349.

[19]王玉川. 莴苣颗粒负压微波高效节能均匀干燥机理及工艺研究[D]无锡:江南大学食品学院,2013.

[20]Wang Y,Zhang M,Mujumdar A S,et al. Study of drying uniformity in pulsed spouted microwave-vacuum drying of stem lettuce slices with regard to product quality[J].Drying Technology,2013,31(1):91-101.

[21]GB/5009.3 - 2010,食品安全国家标准-食品中水分的测定[S].

[22]杨晖. 图像分割的阈值法研究[J]. 辽宁大学学报:自然科学版,2006,33(2):135-137.

Prediction of moisture content and color for vegetable soybeanduring drying process based on multiple model fusion

ZHAO Wei-yan,HUANG Min*,ZHU Qi-bing

(Key Laboratory of Advanced Process Control for Light Industry,Ministryof Education,Jiangnan University,Wuxi 214122,China)

Color and moisture content of vegetable soybean are two important parameters in determining quality of vegetable soybean. In this paper,a multiple model fusion method were proposed to improve the prediction accuracies for color and moisture content of soybean during the drying process. Four feature extraction methods,namely,mean value,entropy value,relative divergence and standard deviation features,were used for extracting features from hyperspectral image,and then four partial least squares regression(PLSR)sub-models for color and moisture content prediction were developed using each feature alone,the multiple models fusion method,which was weighted average over the prediction results from the four sub-models,finally was obtained to improve the prediction accuracies. Compared to PLSR sub-models,the multiple model fusion method achieved consistently better results,with improvements of 4.3% and 7.7% for color and moisture content prediction,respectively. The paired t-test for root-mean-square error of prediction at 5% level of significance showed that the multiple model fusion method was superior over the PLSR sub-models. Hence,this multiple model fusion method provided a simple and robust means for improving color and moisture content prediction of soybean during drying process.

dried soybean;multiple models fusion;Hyperspectral imaging technology;drying process

2014-05-27

赵伟彦(1986-),男,硕士研究生,研究方向:高光谱图像技术。

国家自然科学基金项目(61275155,61271384);江苏省自然科学基金项目(BK2011148)。

TS207.3

A

1002-0306(2015)05-0267-06

10.13386/j.issn1002-0306.2015.05.048

*通讯作者:黄敏(1974-), 女,博士,教授,研究方向:农产品无损检测。

猜你喜欢
毛豆含水率光谱
基于三维Saab变换的高光谱图像压缩方法
630MW机组石膏高含水率原因分析及处理
昆明森林可燃物燃烧机理研究
毛豆飘香秋来到
毛豆姐姐的信
弱膨胀土增湿变形量试验及路堤填筑分析
我和我唯一的毛豆
原油含水率在线测量技术研究
毛豆称象
星载近红外高光谱CO2遥感进展