光谱优化处理结合多层次支持向量机的混合染液浓度检测方法

2017-07-21 05:01张建新张银露胡旭东
纺织学报 2017年7期
关键词:染液波长预处理

张建新,张银露,胡旭东

(浙江理工大学 机械与自动控制学院,浙江 杭州 310018)



光谱优化处理结合多层次支持向量机的混合染液浓度检测方法

张建新,张银露,胡旭东

(浙江理工大学 机械与自动控制学院,浙江 杭州 310018)

为提高印染生产过程中多组分混合染液浓度的检测精度,提出一种利用吸收光谱对三组分染液浓度进行同时测定的方法。利用波长范围在339.22~1 000 nm的微型光纤光谱仪,采集多组分混合染液的吸收光谱数据;采用Savitzky-Golay(SG)卷积平滑法对原始有效吸收光谱数据进行平滑去噪;利用基于X-Y距离结合的样本划分方法(SPXY)法将80种混合染液划分成75个训练组和5个测试组;使用连续投影算法筛选出染液光谱的最佳特征波长数为22;采用多层次多支持向量机子集结构实现多组分混合染液浓度的同时检测。结果表明,三组分混合染液浓度检测的相对误差可控制在10%以内,同时分类模型的训练时间和预测时间缩短近一半,为后期实现多组分混合染液在线浓度检测提供了参考。

连续投影算法;多层次支持向量机;特征波长;多组分染液;浓度检测

我国现已成为全球印染生产、消费和贸易第一大国,生产高质量的纺织品是我国在全球贸易竞争中继续保持印染行业重要地位的关键。纺织品的质量易受染液质量浓度、pH值、温度、助剂等参数影响,其中最主要的因素是染液质量浓度[1]。目前常用的染液质量浓度测量方法是光学分析法,其中运用最多的是分光光度法[2],但其对多组分混合染液质量浓度的分析并不精准,且较大程度上受温度、助剂等因素的影响。

随着量子化学方法的发展和计算机技术的进步,利用染液吸收光谱结合算法模型预测其浓度成为可能。吸收光谱技术因其具有检测速度快、效率高、稳定性好等优点[3],目前已成为农业、食品、化工等领域经济有效且最具有发展前景的分析技术之一[4-5],但由于吸收光谱数据易受样品、检测环境等多方面的影响,浓度模型预测准确率较低,因此,对吸收光谱数据进行预处理,消除其中的噪声等对光谱的干扰是必不可少的步骤,且光谱预处理的好坏很大程度上决定后期浓度模型的预测精度[6-7]。目前染液质量浓度检测的研究日渐成熟,但受设备、检测时间等限制,基本只能采用离线的检测方式或不使用任何质量浓度检测控制设备。USB2000+微型光纤光谱仪具有体积小、分辨率高等优点,采集快速,为染液质量浓度的在线检测提供了可能。

本文在对原始光谱进行Savitzky-Golay(SG)卷积平滑预处理和基于X-Y距离结合的样本划分方法(SPXY)划分训练集和测试集的基础上,利用连续投影算法(SPA)筛选染液光谱的特征波长,对原始光谱进行有效压缩,剔除冗余信息,提取出的22个特征波长信息作为支持向量机(SVM)的输入,大大缩短检测时间,采用多层次多SVM子集结构实现三组分混合染液质量浓度检测模型。

1 多层次多SVM子集结构

多层次多SVM子集[8]结构的基本工作模式及处理流程为:将获得的包含混合染液组分质量浓度和组分种类信息的一部分光谱数据对SVM校正模型进行训练;再用另一部分混合染液的光谱数据对SVM校正模型进行检验;根据检验误差改变模型参数,直至检验满足误差要求,SVM校正模型的参数被最终确定下来。

对于本文的三组分混合染液,可采用如图1所示的多层次多SVM子集结构实现SVM预测模型。对于三组分染液要训练3个SVM模型,根据每个组分的检验误差选择每个模型的最佳参数,最后将3个SVM校正模型的分析结果输出,即得到三组分混合染液的分类结果。

图1 一种多层次多SVM子集结构Fig.1 Multi-level multi-SVM subset structure

2 实验部分

2.1 仪器设备

采用USB2000+可见光微型光纤光谱仪(美国海洋光学公司),波长范围为339.22~1 000 nm,分辨率为4 cm-1。利用配套的SpectraSuite软件获取混合染液光谱数据,再利用MatLab2012b平台对原始光谱数据进行分析处理。配制实验样品时,主要仪器为FA1204B型电子天平(上海精科天美科学仪器有限公司),精度为0.1 mg。

2.2 材料和样品

采用江苏高邮市恒达化工有限公司的弱酸性染料[9],用基础三原色弱酸性深蓝5R、弱酸性艳红10B、弱酸性嫩黄G配制成三组分混合弱酸性染液。综合考虑实际染液的检测需求以及装置的理论浓度测试范围,确定质量浓度测试范围在1 000 mg/L以内,再以印染常用配比加入助剂结晶元明粉(缓染剂)[7]、醋酸(促染剂)和拉开粉Bx(匀染剂),最终配制成80种不同配比的三组分混合弱酸性染液。

3 结果与讨论

3.1 原始混合染液光谱数据获取

利用可见光微型光纤光谱仪采集三组分混合染液的吸收光谱数据,最终得到的原始光谱是扫描次数为20、平滑度为5的平均光谱。原始光谱曲线存在噪声干扰,且每条曲线的2 048个原始波长点并非都是有效信息,根据经验和印染过程的实际需求,从原始光谱中选取346.82~700 nm波段数据作为原始有效光谱,每条光谱共有985个波长点,80组样品的原始有效光谱图如图2所示。

图2 80组样品的原始有效光谱图Fig.2 Original effective spectra of 80 groups of samples

3.2 原始有效光谱数据预处理

由于材料不纯和配制过程中不可避免的操作不当,标准染液很可能含有杂质,同时由光谱仪得到的有效光谱信息中也叠加了随机误差,使得光谱数据曲线存在噪声干扰,因此,在进行染液光谱分类前必须对光谱数据进行预处理。常用的预处理方法有标准化、SG卷积平滑、小波变换等[10]。标准化方法是对光谱进行均值中心化处理后,再除以标准偏差光谱;SG卷积平滑法是通过对移动窗口内的数据进行最小二乘拟合;小波变换是利用伸缩平移运算对数据进行逐步细化。分别用以上3种预处理方法对原始有效光谱进行预处理,随机取混合染液的75个样本作为训练集样本,剩余5个样本作为测试集样本,预处理后的样本作为SVM输入进行训练预测。对比预测效果,3种预处理方法对应的测试集平均相对误差如表1所示。

表1 预处理方法对应的测试集平均相对误差Tab.1 Average relative error of test set based on various pretreatment methods

由表1可知,采用SG卷积平滑法对原始光谱有效数据进行预处理时平均相对误差较小。SG卷积平滑法[11]通过多项式对移动窗口内的数据进行多项式最小二乘拟合,是一种加权平均法,更强调中心点的中心作用,可有效减少光谱数据中的随机噪声。通过实验对比,SG卷积的2个参数移动窗口大小和多项式次数的最优值为21和2。

3.3 训练集和测试集划分

训练集和测试集的合理划分决定着模型的预测性能。2类数据需具有一定的代表性,并且要保证数量的合理分配。常见的样本集划分方法主要包括随机法(RS)、Kennard-Stone(KS)法和SPXY法。分别采用以上3种划分方法选取80个样本集中的75个样本作为训练集,5个作为测试集,利用SVM进行训练建模和测试。3种样本划分法的测试集平均相对误差如表2所示。

表2 3种样本划分法的测试集平均相对误差Tab.2 Average relative error of test set based on three sample division methods

由表2可知,利用SPXY法选择训练集和测试集时平均相对误差较小。SPXY法[12]是一种基于变量之间的欧氏距离在特征空间中均匀选取样本的方法,不仅考虑样本集吸光度值之间的欧氏距离,同时也考虑各样本质量浓度之间的欧氏距离,使划分的训练集和测试集更有代表性。

3.4 特征波长筛选

通过光谱仪得到的每种混合染液都有985个原始有效光谱数据,但并不是每个数据样本都能代表该光谱的特征,因此为提高识别和分类精度,同时缩短分类时间,需提取光谱特征波长。常用的特征波长筛选方法有吉洪诺夫(Tikhonov)正则化算法、以相关系数之和最小为准则的逐步筛选(SMCC)算法和SPA算法。Tikhonov正则化算法的前提是符合朗伯比尔定律,不适用于本文的预测模型;SMCC算法以样品光谱间相关系数之和最小为准则,使得类间与类内欧氏距离和的比值增大,但计算相对复杂;SPA算法[13-14]是一种前向循环波长选取方法,从任意选择一个波长开始,每次循环都计算其在未选入波长上的投影,将投影向量最大的波长引入到波长组合中,即与前一个波长线性关系最小。此方法可有效消除波长变量之间的共线性影响,同时降低样品光谱数据维数,减少计算量,已在多成分多光谱的复杂分析中得到广泛应用。

本文利用SPA筛选染液光谱数据的特征波长,并用最小均方根误差(RMSE)准则确定最优特征波长的个数。图3示出筛选不同个数波长的RMSE趋势图。由图可知,特征波长的最优值为22,对应的最小均方根误差为0.021 514。

图3 筛选不同个数波长的RMSE趋势图Fig.3 RMSE trend by screening different numbers of wavelength

3.5 SVM模型验证

为体现本文SG卷积平滑法、SPXY法和SPA法优化组合的优势,对经过组合处理的光谱数据进行浓度检测,混合三组分染液测试集的相对误差[15]如表3所示,SVM训练时间和预测时间对比如表4所示。

表3 混合三组分染液测试集的相对误差Tab.3 Relative error of test set of three-components dyes

表4 SVM训练时间与预测时间对比Tab.4 SVM training time and prediction time contrast s

通过计算平均均方误差和平均平方相关系数进一步验证模型的效果。均方误差(XMSE)的计算公式为

式中:p为染液组分质量浓度预测值;t为染液组分真实值;l为预测总组数。平方相关系数(XSCC)的计算公式为

本文SVM模型验证实验共选取了5个三组分混合染液测试组,平均均方误差即5个测试组均方误差的平均值,平均平方相关系数即5个测试组平方相关系数的平均值。

由表3可知,经过优化组合处理的原始有效混合光谱数据的测试集相对误差可控制在10%以内,平均相对误差为5.99%,平均均方误差为0.000 540 466,平均平方相关系数为0.99。目前浓度检测的相对误差仍有改进的空间,后期将从控制染液配制、光谱采集以及环境因素等入手,实现更高精度的浓度检测。

由表4可知,经过优化组合处理的光谱数据的SVM训练和测试时间比原始光谱数据所花时间平均缩短一半以上,最佳训练时间可达0.008 770 s,最佳预测时间可达0.006 016 s。

4 结 论

本文提出的优化处理方案可尽量减少噪声对原光谱数据的干扰,根据染液的性质和特征合理划分样本集,并通过筛选有价值的特征波长减少冗余信息,结合多层次多SVM子集结构模型,可同时有效地对三组分混合染液进行浓度测定,混合染液浓度检测的相对误差可控制在10%左右,同时分类模型的训练时间和预测时间缩短近一半,该研究方案可为后期实现混合多组分染液在线浓度检测研究提供参考。

FZXB

[1] 房文杰, 屠天民, 张骞, 等. 染液浓度的在线监测初探[J]. 印染, 2011, 37(7): 12-16. FANG Wenjie, TU Tianmin, ZHANG Qian, et al. On-line monitoring of dye concentration[J]. China Dyeing & Finishing, 2011, 37(7): 12-16.

[2] 贺永林, 李永贵, 葛明桥. 有机溶剂对回收涤纶碱减量废渣中苯二甲酸的影响[J]. 纺织学报, 2013, 34(12):12-15. HE Yonglin, LI Yonggui, GE Mingqiao. Effect of organic solvent on phthalic acid in waste residue of polyester[J]. Journal of Textile Research, 2013, 34(12):12-15.

[3] 胡志华, 陈丽灿, 何肖,等. 天然绿色棉色素绿色组分的分离及其紫外可见光吸收光谱特性[J]. 纺织学报, 2015, 36(11):87-91. HU Zhihua, CHEN Lican, HE Xiao, et al. Separation of green components of natural green cotton pigment and its UV - Vis absorption spectra[J]. Journal of Textile Research, 2015, 36(11):87-91.

[4] 何俊峰, 阚瑞峰, 许振宇, 等. 可调谐二极管激光吸收光谱氧气测量中的导数光谱处理与浓度反演算法研究[J]. 光学学报, 2014, 34(4): 290-295. HE Junfeng, KAN Ruifeng, XU Zhenyu, et al. Derivative spectral processing and concentration inversion algorithm for oxygen measurement of tunable diode laser absorption spectra[J]. Chinese Journal of Optics, 2014, 34(4): 290-295.

[5] 张志荣, 夏滑, 董凤忠, 等. 利用可调谐半导体激光吸收光谱法同时在线监测多组分气体浓度[J]. 光学精密工程, 2013, 21(11): 2771-2777. ZHANG Zhirong, XIA Hua, DONG Fengzhong, et al. Simultaneous on-line monitoring of multicomponent gas concentration using tunable semiconductor laser absorption spectroscopy[J]. Optics and Precision Engineering, 2013, 21(11): 2771-2777.

[6] 陈添兵, 刘木华, 黄林, 等. 不同光谱预处理对激光诱导击穿光谱检测猪肉中铅含量的影响[J]. 分析学, 2016, 44(7): 1029-1034. CHEN Tianbing, LIU Muhua, HUANG Lin, et al. Effect of different spectral pretreatment on Pb content in pork by laser induced breakdown spectroscopy[J]. Analysis, 2016, 44(7): 1029-1034.

[7] 郭小云, 刘志辉, 徐倩, 等. 基于多种光谱预处理的融雪期积雪深度定量模型研究[J]. 中国农村水利水电, 2016(5): 105-108. GUO Xiaoyun, LIU Zhihui, XU Qian, et al. Study on quantitative model of snow depth based on multi-spectral pretreatment in snow melting period[J]. China Rural Water and Hydropower, 2016(5): 105-108.

[8] 白鹏, 谢文俊, 刘君华. 层次式SVM子集含烃类混合气体光谱分析方法[J]. 光谱学与光谱分析, 2008, 28(2): 299-302. BAI Peng, XIE Wenjun, LIU Junhua. Spectral analysis of hydrocarbon-contained gas mixtures in a hierarchical SVM subset[J]. Spectroscopy and Spectral Analysis, 2008, 28(2): 299-302.

[9] 李疆川, 江松森, 赵军. 元明粉在弱酸性染料上染丝光羊毛中的作用[J]. 染整技术, 2004, 26(6): 15-17. LI Jiangchuan, JIANG Songsen, ZHAO Jun. Effect of sodium sulfate powder on dyeing wool with weak acidic dye[J]. Dyeing and Finishing Technology, 2004, 26(6): 15-17.

[10] 余娜. 基于小波变换在图像处理中的应用[J]. 价值工程, 2016, 35(21): 226-229. YU Na. The application of wavelet transform in image processing[J]. Value Engineering, 2016, 35(21): 226-229.

[11] ZHAO A N, TANG X J, ZHANG Z H. Optimizing Savitzky-Golay paremeters and its smoothing pretreatment for FTIR gas spactra[J]. Spectroscopy and Spectral Analysis, 2016, 36(5): 1340-1344.

[12] MAO X D, SUN L J, HAO G, et al. Optimization of wheat protein near-infrared calibration model based on SPXY[J]. Advanced Materials Research, 2013, 803:122-126.

[13] LUO X, HONG T S, LUO K, et al. Application of wavelet transform and successive projections algorithm in the non-destructive mesurement of total acid content of pitaya[J]. Spectroscopy and Spectral Analysis, 2016, 36(5): 1345-1351.

[14] 袁莹, 王伟, 褚璇, 等. 光谱特征波长的SPA选取和基于SVM的玉米颗粒霉变程度定性判别[J]. 光谱学与光谱分析, 2016, 36(1): 226-230. YUAN Ying, WANG Wei, ZHU Xuan, et al. The SPA selection of spectral characteristic wavelengths and the qualitative judgment of the degree of moldiness of corn grain based on SVM[J]. Spectroscopy and Spectral Analysis, 2016, 36(1): 226-230.

[15] 张建新, 徐文杰, 许珺. 双波长分光光度法染液吸光度在线检测装置[J]. 纺织学报, 2014,35(9): 149-154. ZHANG Jianxin, XU Wenjie, XU Jun. Development of on-line detection device of dyebath absorbance based on dual wavelength spectrophotometry[J]. Journal of Textile Research, 2014, 35(9): 149-154.

Method of mixed dye liquor concentration detection based on spectral optimization and multi-level support vector machine

ZHANG Jianxin, ZHANG Yinlu, HU Xudong

(FacultyofMechanicalEngineering&Automation,ZhejiangSci-TechUniversity,Hangzhou,Zhejiang310018,China)

In order to improve the detection accuracy of multi-components mixed dye liquor concentration during printing & dyeing process, a method was proposed for simultaneous determination of three components dye liquor concentration by absorption spectroscopy. The absorption spectra of the multi-components mixed dye liquor was collected by microfiber spectrometer with wavelength range of 339.22-1 000 nm. The original effective absorption spectra were smoothed by Savitzky-Golay(SG) convolution smoothing. 80 mixed dye liquors were divided into 75 training groups and 5 test groups according to sample set partitioning based on jointX-Ydistance (SPXY) method. The optimal characteristic wavelengths of the successive projections algorithm are 22. The multi-component concentration of the dye solution was detected by using the multi-level multi support vector machine model. The experimental results show that the relative error of the three-components mixed dye liquor concentration can be controlled within 10%, and the training time and prediction time of the classification model are shortened by about a half, which provides a reference to realize on-line concentration detection of multi-component dye in the later stage.

successive projections algorithm; multi-level support vector; characteristic wavelength; multi-component dye solution; concentration detection

10.13475/j.fzxb.20161003405

2016-10-13

2017-03-31

国家自然科学基金联合基金资助项目(U1609205);浙江省科技厅公益计划项目资助(2017C33074);浙江理工大学研究生创新研究项目资助(YCX15022)

张建新(1972—),男,教授。主要研究方向为纺织测试技术及仪器。E-mail: zjx@zstu.edu.cn。

TS 193.21

A

猜你喜欢
染液波长预处理
HPLC-PDA双波长法同时测定四季草片中没食子酸和槲皮苷的含量
基于机器视觉的单组分染液浓度快速检测方法
苏木红/栀子黄/靛蓝染色天丝水刺非织造布初探
基于预处理MUSIC算法的分布式阵列DOA估计
双波长激光治疗慢性牙周炎的疗效观察
日本研发出可完全覆盖可见光波长的LED光源
浅谈PLC在预处理生产线自动化改造中的应用
络合萃取法预处理H酸废水
便携式多用途光波波长测量仪
基于自适应预处理的改进CPF-GMRES算法