小波去噪在基于近红外光谱的砂糖橘水分检测的应用

2011-11-20 09:24
湖南科技学院学报 2011年8期
关键词:砂糖小波校正

代 芬 李 岩 冯 栋

(华南农业大学 工程学院,广州 510642)

小波去噪在基于近红外光谱的砂糖橘水分检测的应用

代 芬 李 岩 冯 栋

(华南农业大学 工程学院,广州 510642)

水分含量是衡量砂糖橘营养品质的重要指标之一,其快速无损检测显得越来越重要。本文基于小波变换的方法,对砂糖橘的500-2500nm区间的漫反射光谱,利用正交小波函数DBn(n=2,3,…10)分别进行2-6五个水平分解和消噪,并比较了不同小波函数和不同分解水平的消噪效果。结果表明,小波消噪有利于消除导数光谱中的噪声,提高建模精度,基于小波函数DB3(分解尺度为3)消噪后的导数光谱建立的PLS模型的预测相关系数为0.8725,预测均方根误差为0.6767。

砂糖橘;红外光谱;含水量;小波消噪

0 引言

砂糖橘(Citrus reticulate Blanco,Shatangju)又名十月橘,原产广东省四会市。其果肉爽脆、口味清甜、色泽鲜艳、皮薄易剥,是柑橘类的名优品种。砂糖桔果皮薄,在贮藏或者加工过程中易发生变质。在评定砂糖桔品质,选择贮藏条件和加工方式时,含水率是重要的指标之一。现有砂糖橘水分检测主要采用传统的烘干法,这种方法需破坏样品,且检测时间较长。研究一种快速无损检测砂糖橘含水率的技术,实现大批量、规模化生产的在线检测,对于减少砂糖橘采后损失,提高产业经济效益具有重要的意义。

随着计算机技术的迅速发展以及化学计量学方法研究的日益深入, 近红外光谱技术在农畜产品品质检测领域得到较快发展。近红外光NIR( Near Infrared) 是介于可见光谱区和中红外光谱区之间的电磁波, 其波长范围约为 780 nm-2526nm, 波数范围约为12820-3959cm-1。近红外光谱检测属于非破坏性检测,可保留农产品完整外表而得其内在品质,测试简单,无繁琐的前处理和化学反应过程,测试速度快,测试周期短。近红外吸收光谱包含了待测农产品的所有成分吸收信息,可同时检测多种内部成分,对测试人员无专业化要求,测试过程无污染,检测成本低。而且随着研究的深入,随着模型中优秀数据的积累,模型不断优化,测试精度不断提高,应用范围可以不断拓展(雷松泽,2009)。

本文采用Field Spec 3光谱仪采集的200个砂糖橘样本近红外光谱为基础,通过学生化残差图剔除异常样本,然后利用小波对原始光谱数据和一阶导数光谱数据进行除噪,比较在不同分解尺度下的小波消噪效果。

1 实验材料与方法

1.1 砂糖橘样本

从市场上分批购买产自广东省四会市的砂糖橘共 193个样本,将样本贴上标签备用。

1.2 样本光谱采集

实验使用美国 ASD(analytical spectral device)公司的FieldSpec 3光谱仪,如图1所示。测量光谱范围350-2500nm,采样间隔为1.4nm@350-1000nm和2nm@1000-2500nm,光谱分辨率为3nm@350-1000nm和10nm@1000-2500nm,扫描次数10次,数据间隔1nm,并配有自带光源的接触式反射探头。光源是与光谱仪配套的14.5 V卤素灯。分析软件为unscrambler9.8和Matlab7.8.0。

图1 FieldSpec3 便携式地物波谱仪

经分析研究表明,相对于较远的距离,近距离的测量而得到的定量分析模型效果较好[7]。因此本研究采用接触式测量方式,在每个砂糖橘样本的赤道部位取3点进行测量,每个点相隔120,使用反射探头采集样本的漫反射光谱。每个点扫描30次,将30个光谱数据进行平均作为这一点的光谱。然后将 3个点的光谱平均作为整个砂糖橘样本的漫反射光谱。在采集光谱之前,实现要进行光谱仪预热,优化和白板校正。在采集过程中,每隔15-20分钟要重新进行白板校正。200个砂糖桔的光谱数据如图2所示。

图2 200个砂糖橘样品的原始光谱图

1.3 砂糖橘水分含量测定

根据国家标准(GB/T 8858-1988)[8],采用烘干法测量砂糖橘水分含量。具体操作步骤:首先用精密天平测量铝盒重量m1,然后采用四分法将砂糖橘样品分成4份,每份约9-10g,将其装入铝盒,用精密天平测量铝盒和样品重量m2。将果肉用剪刀捣碎,将装有样品的铝盒放入恒温风干箱中风干,温度设置为70℃。经过9小时后,测量铝盒和烘干后砂糖橘果肉的重量m3。烘干标准以前后半小时重量差小于0.001g为准。砂糖橘水分含量则可按下式计算:

每个样本取2份进行含水量测量,最后取平均作为该样本的含水量。

1.4 小波去噪的原理

小波(wavelet),即小区域的波,是一种特殊的长度有限、平均值为0 的波形。它有两个特点:一是“小”,即在时域都具有紧支集或近似紧支集;二是正负交替的“波动性”,也即直流分量为零(飞思科技产品研发中心,2003)。小波变换的定义是把某一被称为基本小波(也叫母小波mother wavelet)的函数 做位移 后,再在不同尺度a下与待分析的信号X(t)做內积:频率之比)恒定的特点,a越大相当于频率越低。适当的选择基小波,使 在时域上为有限支撑, 在频域也比较集中,就可以使WT在时、频域都具有表征信号局部特征的能力,因此有利于检测信号的瞬态或奇异点。

2 结果与讨论

在近红外无损检测技术中,从光谱的测定和预处理、异常样本点的剔除、校正集和预测集样本的选择到模型的优化整个过程中,每一个环节都可能影响模型的预测性能[9,10]。因此,在建立光谱校正模型前,需对光谱样本进行异常样本剔除、对光谱数据进行必要的预处理和样品集的有效划分,以便增强光谱的有效信息和消除各种不确定因素的影响,获得预测性能高的数学模型。

2.1 光谱数据预处理

导数光谱可以消除基线漂移和平缓背景干扰的影响,也可以提供比原光谱更高的分辨率和更清晰的光谱轮廓变化,但原始光谱经导数处理后,会放大噪声,降低原光谱的信噪比(严衍禄,2005)。对于导数光谱,尝试用dbN小波消噪方法消除噪声,提高信号的信噪比。将砂糖橘光谱首先转化成一阶导数光谱,然后分别选择小波函数db2-db10,进行2,3,4,5,6共 5层分解,不同小波函数不同层次分解消噪后的建模效果如表1所示。

表1 基于db小波消噪的导数光谱建模效果比较

小波变换有以下特点:有多分辨率(multi-resolution),也叫多尺度(multi-scale)的特点,可以由粗及细地逐步观察信号。可以看成用基本频率特性为 的带通滤波器在不同尺度a下对信号做滤波。由傅立叶变换的尺度特性可以知这组滤波器具有品质因数恒定,即相对宽度(带宽与中心

小波类型 分解层数 Rc RMSEC Rv RMSECV 2 0.9265 0.5436 0.8586 0.7433 3 0.9202 0.5655 0.8709 0.7113 Db 64 0.9336 0.5176 0.8919 0.6541 5 0.9310 0.5273 0.8812 0.6855 6 0.9060 0.6116 0.8462 0.7752 2 0.9255 0.5473 0.8565 0.7483 3 0.9316 0.5252 0.8708 0.7135 Db 74 0.9332 0.5191 0.8886 0.6635 5 0.9370 0.5048 0.8799 0.6900 6 0.8969 0.6388 0.8404 0.7876 2 0.9248 0.5497 0.8538 0.7552 3 0.9356 0.5100 0.8734 0.7068 Db 84 0.9354 0.5107 0.8877 0.6663 5 0.9298 0.5318 0.8778 0.6944 6 0.9128 0.5900 0.8593 0.7443 2 0.9254 0.5475 0.8564 0.7489 3 0.9368 0.5056 0.8806 0.6874 Db 94 0.9348 0.5130 0.8944 0.6472 5 0.9279 0.5385 0.8764 0.6984 6 0.9096 0.6001 0.8456 0.7777 2 0.9240 0.5526 0.8543 0.7538 3 0.9335 0.5180 0.8735 0.7062 Db 104 0.9304 0.5296 0.8838 0.6775 5 0.9183 0.5719 0.8707 0.7128 6 0.9024 0.6226 0.8495 0.7665

由表1可知,原始光谱求一阶导数过程中放大了噪声,光谱出现尖峰干扰,如图 3(a)所示,因此模型的稳定性下降所致。因此有必要对其进行小波消噪。通过小波消噪后,Rv有不同程度上升,RMSECV有不同水平下降,证明不同小波以及不同分解层次均有不同程度的消噪效果。

不同的小波函数,消噪效果不同。以4层分解水平为例,以相关系数越大越好,均方根误差越小越好,校正集数据与验证相应集数据越接近越好这三条原则为判断依据,其消噪效果由好到差依次是db6-> db3-> db9-> db7-> db8-> db5->db2-> db4。

同一种小波,分解层次不同消噪的效果也不同。以db3小波为例,以第一个样本为例,对其导数光谱进行2,3,4,5,6层分解消噪,比较不同层次的消噪效果,如图3所示。可见分解的层次越多,原始光谱与消噪光谱之间的差值越大。分解层次不够,光谱中的噪声消除不充分,会影响建模效果;反之,分解层次过多,在消除噪声的同时,将有用信息也进行了消除,反而会降低建模精度。结合表1可见,以db3小波消噪时,分解层次从适合到不适合依次是 4-> 3->5-> 2-> 6。

综合比较发现,经过db6小波4层分解消噪后,Rc从原来的0.9305提高到0.9336,Rv从原来的0.8451提高到0.8944;经过Db3小波3层分解消噪后,Rc从原来的0.9305提高到0.9386,Rv从原来的0.8451提高到0.8926,RMSEC和RMSECV相应减小且更加接近,模型的精确度和稳定性得到提高。可见一阶导数光谱经过db6小波3层分解和db3小波3层分解消噪后的建模效果最好。

图3 db 3小波不同层次分解时的消噪效果比较

2.3 预处理效果验证

利用随机划分法将193个样本划分为145个校正集和48个预测集,校正集用于建立PLS模型,预测集用于预测所建模型的准确性和可靠性。划分校正集和预测集后的统计结果如表2所示。

表2 校正集和预测集的统计结果

校正集的最大值大于预测集的最大值,校正集的最小值小于预测集的最小值,校正集的标准偏差大于预测集的标准偏差,预测集水分含量范围小于校正集水分含量范围。用校正集中145样本建模,并对预测集中的48个样本进行预测,验证结果如表3所示,其中预测效果最好的模型D的预测回归图如图4所示。

表3 经最佳预处理后的PLS模型预测效果

说明基于导数光谱可以消除基线漂移和平缓背景干扰的影响,对提高建模精度有帮助。如果通过恰当的小波分解则可以在很大程度上消除引入的噪声,其效果往往比基于原始光谱和导数光谱建立的模型效果要好。

图4 模型D的预测回归图

3 结论

探讨了基于导数光谱的 dbN小波消噪,求一阶导数过程中放大了噪声,光谱出现尖峰干扰,因此基于导光谱的模型的稳定性会下降。通过dbN小波消噪后,Rv有不同程度上升,RMSECV有不同水平下降,证明所有dbN小波在恰当的分解层次上均有不同程度的消噪效果。综合比较发现,基于小波函数DB3(分解尺度为3)消噪后的导数光谱最优,预测相关系数为0.8725,预测均方根误差为0.6767。

[1]严衍禄,赵龙莲,韩东海.近红外光谱分析基础与应用[M].京:中国轻工业出版社,2005.

[2]何东健,前川孝昭,森岛博.水果内部品质在线近红外分光检测装置及试验[J].农业工程学报, 2001, 17 (1):146-148.[3]袁雷,刘辉军,余桂英,等.柑橘品质的近红外光谱无损检测[J].光谱实验室,2006,23(4):820-822.

[4]陆辉山,傅霞萍,谢丽娟,等.可见/近红外光估测完整柑橘水果可溶性固形物含量的研究[J].光谱学与光谱分析,2007,27(9):1727-1730.

[5]夏俊芳,李小昱,李培武,等.基于小波变换的柑橘维生素 C含量近红外光谱无损检测方法[J].农业工程学报,2007,23(6):170-174.

[6]刘燕德,陈兴苗,孙旭东.可见/近红外漫反射光谱无损检测南丰蜜橘维生素 C[J].光谱学与光谱分析,2008,28(10):2318-2320.

[7]Slaughter D C,Thompson J F,Tan E S.Nondestructive determination of total and soluble solids in fresh prune using near infrared spectroscopy[J].Postharvest Biology and Technology. 2003, (28): 437-444.

[8]GB/T8858-1988,水果、蔬菜产品中干物质和水分含量的测定方法[s].1988.

[9]Seasholtz M B,Kowalski B R. The parsimony principle applied to multivariate calibration[J].Analytica Chimica Acta,1993,277(2):165-177.

[10]史波林,赵镭,刘文,等.苹果内部品质近红外光谱检测的异常样本分析[J].农业机械学报,2010,41(2):132-137.

[11]林萍,陈永明,何勇.基于可见近红外光谱的糖类别快速鉴别研究[J].光谱与光谱学分析,2009,29(2):382-385.

Analysis of the Near Infrared Spectroscopy Based on Wavelet De-noising

DAI Fen, LI Yan, FENG Dong
(College of Engineering, South China Agricultural University, Guangzhou, 510642, China)

water content is one of the most important nutrition material in shatangju oranges. The fast and nondestructive examination of water content in sugar oranges is more and more important. Firstly, the spectra of Shatangju samples within 500-2500nm were decomposed in level 2-6 using the orthogonal wavelet functions DBn(n=2,3,…10). And then the de-noise results of different wavelet functions and different decomposing levels were compared. Wavelet de-noise (WD) was examined to be the optimal spectrum preprocessing method. The PLS model based on derivative spectra with DB3 wavelet de-noise (in decomposition level 3)produced best result (RMSEP=0.6767, Rp=0.8725 ).

Shatangju; Near infrared (NIR) spectrometry; Water content; Wavelet de-noising

A

1673-2219(2011)08-0036-04

2011-04-18

国家现代农业(柑橘)产业技术体系建设专项资金资助项目(农科教发【2007】14号,【2011】3号);华南农业大学校长基金资助项目(4500-K09173)。

代芬(1978-),女,湖北天门人,博士,讲师,研究方向为农产品品质无损检测。

(责任编校:刘志壮)

猜你喜欢
砂糖小波校正
砂糖
构造Daubechies小波的一些注记
劉光第《南旋記》校正
基于MATLAB的小波降噪研究
砂糖变硬 三招解决
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
在Lightroom中校正镜头与透视畸变
机内校正
生化黄腐酸对砂糖橘黄化病的治疗作用
燃烧吧,砂糖!