基于短波近红外光谱盐酸氟桂利嗪粉末药品质量比的估算方法

2014-09-06 10:31朱明超
吉林大学学报(理学版) 2014年6期
关键词:氟桂利嗪波段盐酸

曲 楠, 朱明超, 窦 森

(1.吉林农业大学 资源与环境学院, 长春 130118; 2.中国科学院 长春光学精密机械与物理研究所, 长春 130033)

基于短波近红外光谱盐酸氟桂利嗪粉末药品质量比的估算方法

曲 楠1, 朱明超2, 窦 森1

(1.吉林农业大学 资源与环境学院, 长春 130118; 2.中国科学院 长春光学精密机械与物理研究所, 长春 130033)

基于短波近红外(SW-NIR)漫反射光谱, 提出一种非破坏定量预测盐酸氟桂利嗪粉末药品质量比的新方法.以高效液相色谱法(HPLC)分析值为参考值, 将遗传算法(GA)和神经网络相结合, 建立盐酸氟桂利嗪粉末药品的光谱特性与质量比间的定量分析模型.应用GA自动构建神经网络拓扑结构, 选择最优的网络参数和光谱波段; 讨论不同光谱预处理方法对神经网络预报能力的影响, 并对测试集样品质量比进行预测.结果表明, 一阶导数数据预处理方法为最优预处理建模方法, 其测试集的均方根误差RMSE=0.198 7%, 相关系数R=0.986 3.

短波近红外光谱; 漫反射; 神经网络; 遗传算法; 盐酸氟桂利嗪

近红外光谱(800~2 500 nm, NIR)分析技术具有非破坏和无污染等特点, 在食品、化工和医药等领域应用广泛[1-4].目前, 近红外光谱技术应用使用的光谱范围多为1 100~2 500 nm的长波, 短波近红外光谱(800~1 100 nm, SW-NIR)分析技术与传统的化学分析方法相比, 具有不需要试剂和溶液、非破坏分析和操作简单等优点.由于SW-NIR区域的吸收峰强度较弱, 各组分的SW-NIR相互重叠严重, 因此不易定量分析, 将短波近红外漫反射光谱法与化学计量学技术结合可有效解决该问题[5].目前, 在药物的SW-NIR分析中, 最常用的化学计量学方法为主成分回归(PCR)和偏最小二乘(PLS)法[6-7], 这两种方法均属于多元线性回归方法.由于药物SW-NIR组分间的谱峰重叠严重, 且吸收复杂, 因此, 应用多元线性回归方法对药物的SW-NIR数据进行定量分析不易得到较好结果[8].

利用人工神经网络的通用逼近属性可建立药物有效成分的光谱数据和被测样品特征的映射关系[9].径向基函数(RBF)网络是一种前馈人工神经网络, 具有逼近能力强、网络结构简单、学习时间短和可避免陷入局部极值点等优点, 在模式识别、信号处理、系统建模和控制等领域应用广泛[10-12].由于RBF网络具有局限性, 其网络拓扑结构和系统参数的选择及实验数据和实验条件的选取均需凭经验, 因此不易得到最优的网络结构.本文将SW-NIR分析技术与遗传算法(GA)优化的RBF网络相结合, 通过GA对RBF网络拓扑结构和光谱波段进行自动优化, 实现了对盐酸氟桂利嗪粉末药品有效成分快速无损的定量预测.

1 实 验

1.1仪器与试剂

UV-3101型紫外-可见近红外分光光度计, 配有ISR-3101型积分球漫反射检测器(日本岛津公司); 兼容TM-810C/E型微机通过接口与分光光度计连接, 自动采集、传输和处理光谱数据.

实验所用试剂均符合中国药典标准[13].

1.2实验过程

1.2.1 样品制备与测定 将盐酸氟桂利嗪粉末药品90批, 随机分成3组, 分别为训练集(60个)、监控集(20个)和测试集(10个).以药品中盐酸氟桂利嗪(C26H26F2N2·2HCl)为有效成分, 按照中国药典标准[13], 用HPLC法测定各药品中该组分的质量比, 测定值作为参考值.

1.2.2 NIR光谱采集与数据处理 将盐酸氟桂利嗪粉末药品置于积分球的样品池中, 用玻璃柱将槽内待测样品粉末填平、压实.样品的波长测量范围为801~1 100 nm, 每隔1 nm采集一个数据点, 光谱带宽12 nm, 中速扫描.以固体硫酸钡为参比, 每个样品扫描10次, 取平均值作为该样品的光谱.在90个样本光谱数据中, 训练集用于在训练过程中为构成每代种群的不同网络结构提供候选中心和计算输出权值; 监控集可对训练过程中产生的每代RBF网络进行评估, 防止训练数据过拟合; 测试集不参与训练过程, 仅作为一个独立数据集用于计算最终的预测误差.

采用如下误差性能参数作为网络输出效果的评价指标:

2 结果与讨论

2.1SW-NIR漫反射光谱

图1为不同质量比盐酸氟桂利嗪粉末药品的SW-NIR漫反射光谱.由图1可见, 其SW-NIR漫反射光谱重叠严重, 不易定量分析.为从光谱测量数据中提取有效信息, 减少对校正模型可靠性和未知样品预测结果准确性的影响, 需对光谱信号进行预处理.本文主要研究标准归一化(SNV)、多元散射校正(MSC)、一阶导数和二阶导数预处理方法, 以此消除基线偏移和漂移、解决测量光程变化及光散射等因素的影响.

2.2RBF网络建模与评价准则

RBF网络为3层前馈神经网络, 由输入层、隐含层和输出层组成.一个n维输入m维输出k个隐含层节点的RBF网络可描述为y=(wij)m×kφ(x), 其中:x为n维输入;y为m维输出; (wij)m×k为权值矩阵;φ(x)=(φ1(x),φ2(x),…,φk(x))T为隐含层输出.隐含层基函数为Gauss函数φj(x)=exp{-‖x-cj‖2/(2σ2)}(j=1,2,…,k), 其中:cj为第j个基函数中心向量;σ为基函数宽度.

为得到最优的网络拓扑结构, 本文提出一种基于GA的RBF网络两级训练算法, 如图2所示.由图2可见, 顶层GA基于底层p个RBF网络的目标函数f训练网络参数和光谱波段区域.为减小搜索空间, 最优基函数中心从训练数据中选择, 宽度参数约束为σ∈(0,σmax].

图1 盐酸氟桂利嗪训练集短波近红外漫反射原始光谱Fig.1 SW-NIR reflectance spectra for all flunarizine hydrochloride samples in training set

图2 RBF网络两级训练方案Fig.2 Two-level training scheme for RBF network

个体的适应度采用RMSE准则评价, 为避免训练集过拟合提高预测性能, 采用训练集和监控集的并集计算RMSE作为评价网络的适应度函数.对网络种群进行选择、交叉和变异等遗传操作, 经过多代进化, 种群的适应度逐代提高, 得到最优的RBF网络参数和光谱波段.

2.3一阶导数光谱的RBF网络模型

先使用一阶导数光谱数据构建RBF网络模型区分光谱的特征及分析盐酸氟桂利嗪粉末样品有效成分的质量比.在建立一阶导数优化的RBF网络模型时, 为提高运算速度、减小计算工作量并提高网络模型的预测精度, 采用遗传算法对光谱波段进行挑选.RBF网络的输入变量取决于遗传算法选择的波段区域.因为实验以样品中盐酸氟桂利嗪的质量比为模型测试的输出结果, 所以网络仅有一个输出节点.

实验中应用遗传算法自动构建RBF网络.为缩减计算时间, 对算法的搜索空间进行限制.把801~1 100 nm共300个数据点均匀分割为60个光谱波段, 训练数据作为基函数的候选中心, 基函数最大宽度σmax=25.依据染色体的编码方案, 使用60位二进制串可完全描述region参数, region的等位基因为0和1, 代表由5个数据点组成的一个波段范围: 若region的等位基因为0, 则表示相应的光谱波段在RBF网络的建模过程被屏蔽; 若region的等位基因为1, 则表示相应的光谱波段在RBF网络的建模过程被应用.center子串的每个等位基因对应一个训练集数据, 共应用60位二进制串编码: 若center的等位基因为0, 则表示相应的训练数据不作为基函数中心; 若center的等位基因为1, 则表示相应的训练数据被选择作为基函数中心.为保证width参数适中的分辨率, 应用8位二进制串对其编码.实验中种群规模设为40, 进化代数选择400, 选择比率设为0.8, 交叉概率设为0.85.为保证算法的渐近收敛, 采用变异概率自适应变化的策略, 即根据每代种群的目标函数平均值动态调整变异概率.

采用训练集与监控集并集的RMSE评价个体网络的目标函数可有效防止训练数据的过拟合.在算法运行过程中, 根据目标函数自动搜索RBF网络参数和最优的光谱波段区域.图3为RMSE值的进化过程.由图3可见, 经过400次迭代后算法收敛, 目标函数的最小值和平均值均趋于稳定, 其训练集和监控集的RMSE分别为0.199 5%和0.197 7%.隐含层节点数和宽度参数的进化过程分别如图4和图5所示.由图4和图5可见: GA搜索到的最优RBF网络由44个隐含层节点组成, 基函数宽度为23.339 8; 最优个体的region参数为101010111000000001000001100101111001110110000101010100100001, 其中等位基因为1的个数为25, 表示有25个光谱波段参与建模, 合并相邻的光谱波段可得16个光谱波段区域: 1 096~1 100,1 086~1 090,1 076~1 080,1 056~1 070,1 011~1 015,976~985,961~965,936~955,911~925,896~905,871~875,861~865,851~855,841~845,826~830,801~805 nm.

图3 一阶导数光谱的GA-RBF模型基于训练集和监控集的RMSE进化过程Fig.3 Evolution of RMSE based on the training set and the monitoring set for the GA-RBF model of first-derivative spectra

图4 一阶导数光谱GA-RBF模型隐含层节点数的进化过程Fig.4 Evolution of number of hidden nodes for the GA-RBF model of first-derivative spectra

2.4其他光谱的RBF网络模型

类似于一阶导数光谱的建模程序, 分别构建原始光谱、二阶导数光谱、SNV光谱和MSC光谱的RBF网络模型, 最优光谱区域和RBF网络参数列于表1, 各种光谱RBF网络模型的RMSE和相关系数R列于表2.由表1和表2可见, 使用一阶导数光谱建立的RBF网络模型有最大的相关系数R和最小的RMSE值, 表明一阶导数光谱比原始光谱、二阶导数光谱、SNV光谱和MSC光谱更适宜构建网络模型.

图5 一阶导数光谱GA-RBF模型宽度参数的进化过程Fig.5 Evolution of width parameter for the GA-RBF model of first-derivative spectra

图6 一阶导数光谱的GA-RBF模型测试集预测质量比与参考质量比的线性关系Fig.6 Plot of predicted mass ratio based on the GA-RBF model of first-derivative spectra vs standard reference mass ratio

2.5RBF网络模型的可靠性评价

采用GA搜索到的最优光谱波段区域和RBF网络参数建立用于预报未知样本定量信息的RBF网络模型, 应用测试集样本的预报结果考核建立RBF网络模型的准确性.一阶导数光谱的RBF网络模型测试集样品的预测质量比和参考质量比的线性关系如图6所示.由图6和表2可见, 经GA优化的RBF网络预测盐酸氟桂利嗪粉末药品中有效成分的质量比精度较高.

表1 构建GA-RBF网络的最优光谱范围和网络参数Table 1 Optimal wavelength regions and network parameters used for construction of RBF networks

表2 不同GA-RBF模型的线性回归参数和误差Table 2 Linear regression parameters and errors based on different GA-RBF models

综上所述, 本文将遗传算法优化的RBF网络与短波近红外漫反射光谱相结合, 对盐酸氟桂利嗪粉末药品进行无损非破坏定量分析.该方法与常规方法相比, 具有无需预处理、快速、简便等优点.应用遗传算法优化RBF网络拓扑参数和参与建模的SW-NIR波段可提高神经网络对盐酸氟桂利嗪粉末药品光谱数据与有效成分间复杂非线性关系的逼近能力, 较全面地反映了光谱数据和质量比间的规律, 模型参数能够自动调整和学习, 具有较高的实用价值.

[1]NI Yongnian, MEI Minghua, Kokot S.Analysis of Complex, Processed Substances with the Use of NIR Spectroscopy and Chemometrics: Classification and Prediction of Properties: The Potato Crisps Example [J].Chem Intell Lab Syst, 2011, 105(2): 147-156.

[2]Macho S, Larrechi M S.Near-Infrared Spectroscopy and Multivariate Calibration for the Quantitative Determination of Certain Properties in the Petrochemical Industry [J].Trends Anal Chem, 2002, 21(12): 799-806.

[3]左平, 李映红, 韩笑, 等.人工神经网络-红外光谱法对人体血糖的无创监测分析 [J].吉林大学学报: 理学版, 2008, 46(6): 1131-1136.(ZUO Ping, LI Yinghong, HAN Xiao, et al.Analysis of Noninvasive Measurement of Human Blood Glucose with ANN-NIR Spectroscopy [J].Journal of Jilin University: Science Edition, 2008, 46(6): 1131-1136.)

[4]郭伟良, 王羚瑶, 李伟伟, 等.用近红外光谱法实时监测蛹虫草发酵中胞内多糖的质量浓度 [J].吉林大学学报: 理学版, 2010, 48(5): 855-859.(GUO Weiliang, WANG Lingyao, LI Weiwei, et al.Near Infrared Spectroscopy Real-Time Monitoring of Intracellular Polysaccharide Concentration during Fermentation ofCordycepsmilitaris[J].Journal of Jilin University: Science Edition, 2010, 48(5): 855-859.)

[5]ZHAO Lingzhi, DOU Ying, GUO Ye, et al.Artificial Neural Networks for Non-destructive Determination of Acetylspiramycin Powder by Short-Wavelength NIR Spectroscopy [J].Vibrational Spectroscopy, 2008, 47(1): 21-25.

[6]逯家辉, 滕利荣, 蒋富明, 等.短波近红外光谱法分析酒中乙醇含量 [J].吉林大学学报: 理学版, 2002, 41(2): 245-247.(LU Jiahui, TENG Lirong, JIANG Fuming, et al.Rapid Determination of Ethanol in Wine by Short-Wavelength Near-Infrared Spectroscopy [J].Journal of Jilin University: Science Edition, 2002, 41(2): 245-247.)

[7]FENG Xudong, SU Rui, XU Nan, et al.Portable Analyzer for Rapid Analysis of Total Protein, Fat and Lactose Contents in Raw Milk Measured by Non-dispersive Short-Wave Near-Infrared Spectrometry [J].Chem Res Chinese Universities, 2013, 29(1): 15-19.

[8]QU Nan, LI Xuesong, DOU Ying, et al.Nondestructive Quantitative Analysis of Erythromycin Ethylsuccinate Powder Drug via Short-Wave Near-Infrared Combined with Radial Basis Function Neural Networks [J].Eur J Pharm Sci, 2007, 31(3/4): 156-164.

[9]ZHAO Lingzhi, GUO Ye, DOU Ying, et al.Application of Artificial Neural Networks to the Nondestructive Determination of Ciprofloxacin Hydrochloride in Powder by Short-Wavelength NIR Spectroscopy [J].J Anal Chem, 2007, 62(12): 1156-1162.

[10]Loukas Y L.Radial Basis Function Networks in Host-Guest Interactions: Instant and Accurate Formation Constant Calculations [J].Anal Chim Acta, 2000, 417(2): 221-229.

[11]GAO Daqi, WANG Shuyan, JI Yan.An Electronic Nose and Modular Radial Basis Function Network Classifiers for Recognizing Multiple Fragrant Materials [J].Sensors Actuators B: Chemical, 2004, 97(2/3): 391-401.

[12]ZHANG Zhuoyong, WANG Dan, Harrington P B, de, et al.Forward Selection Radial Basis Function Networks Applied to Bacterial Classification Based on MALDI-TOF-MS [J].Talanta, 2004, 63(3): 527-532.

[13]中华人民共和国卫生部药典委员会.中华人民共和国药典 [M].北京: 中国医药科技出版社, 2010: 749.(The Pharmacopoeia Committee of the Ministry of Health of the People’s Republic of China.Pharma Copoeia of the People’s Republic of China [M].Beijing: China Medical Science Press, 2010: 749.)

MassRatioDeterminationofCompoundFlunarizineHydrochloridePowderDrugBaseedonShort-WaveNear-InfraredDiffuseReflectanceSpectralData

QU Nan1, ZHU Mingchao2, DOU Sen1
(1.CollegeofResourcesandEnvironmentalSciences,JilinAgriculturalUniversity,Changchun130118,China; 2.ChangchunInstituteofOptics,FineMechanicsandPhysics,ChineseAcademyofSciences,Changchun130033,China)

A new method for the nondestructive quantitative prediction of flunarizine hydrochloride powder drug based on short-wave near-infrared (SW-NIR) diffuse reflectance spectral data.With the analytical data of high performance liquid chromatography (HPLC) taken as the reference value, a quantitative analysis model for describing the relationship between the spectral characteristic and component was established via combining genetic algorithm (GA) with neural networks.The neural network topological framework was constructed automatically by means of GA.The optimal network parameters and spectral region were selected.Moreover, the influences of different spectral preprocessing methods to the prediction ability of neural network were discussed.The mass ratio of the test sample was predicted.The results of the experiment show that the first-derivative spectrum is the optimal pretreatment method of modeling, by which the root-mean-square-errors (RMSE) for test set was 0.198 7%, and the correlation coefficientsRfor test set was 0.986 3.

short-wave near-infrared spectroscopy; diffuse reflectance; neural networks; genetic algorithm; flunarizine hydrochloride

2014-01-17.

曲 楠(1980—), 女, 汉族, 博士, 讲师, 从事化学计量学的研究, E-mail: qunan.jlau@gmail.com.

国家自然科学基金(批准号: 41171188).

O655

A

1671-5489(2014)06-1325-06

10.13413/j.cnki.jdxblxb.2014.06.42

单 凝)

猜你喜欢
氟桂利嗪波段盐酸
盐酸泄漏
盐酸氟桂利嗪联合尼莫地平治疗老年偏头痛的临床疗效观察
盐酸氨溴索在慢阻肺合并肺部感染的临床应用
氟桂利嗪联合丹参多酚酸盐治疗急性偏头痛的疗效研究
M87的多波段辐射过程及其能谱拟合
合成盐酸芬戈莫德的工艺改进
盐酸氟桂利嗪联合布洛芬缓释胶囊治疗成人偏头痛的临床观察
日常维护对L 波段雷达的重要性
盐酸氟桂利嗪联合阿司匹林治疗偏头痛的效果及其对血清hs-CRP水平的影响
基于SPOT影像的最佳波段组合选取研究