支持向量回归在人体血红蛋白无创检测中的应用

2017-10-16 08:50袁境泽卢启鹏王静丽丁海泉高洪智吴春阳李晚侠
分析化学 2017年9期
关键词:近红外光谱

袁境泽 卢启鹏 王静丽 丁海泉 高洪智 吴春阳 李晚侠

摘要采用线性渐变滤光片(Linear variable filter, LVF),优化设计高性能、便携式的人体血液成分近红外检测设备,研究了支持向量回归(Support vector regression, SVR)模型对人体血红蛋白(Hemoglobin, Hb)的预测能力及稳定性,以实现贫血疾病的无创诊断。无创采集100位志愿者食指前端光谱信息并划分定标集、验证集1和2。应用网格搜索方法优选惩罚参数与核函数参数c=5.28, g=0.33,用以建立稳健的SVR模型。随后,分别对验证集1和2中Hb水平进行定量分析。实验结果表明: 预测标准偏差(RMSEP) 分别为10.20 g/L和10.85 g/L,相对预测标准偏差(RRMSEP) 为6.85%和7.48%,测量精度较高且SVR模型对不同样品的适应性较强,基本满足临床检测要求。基于SVR算法自行设计的LVF型近红外光谱检测设备在贫血症的无创诊断中有着良好的应用前景。

关键词无创检测; 人血红蛋白; 近红外光谱; 支持向量回归; 便携式仪器

1引 言

人血红蛋白(Hemoglobin, Hb)水平是临床上用于贫血、失血等疾病诊断和分类的重要指标[1~3]。全球约有15亿人患有不同程度贫血,每年因患贫血引发各类疾病而导致死亡的人数过千万,贫血症已成为全球性的公共卫生问题[4]。在贫血症患者中,孕妇贫血会导致免疫力下降、产后感染风险增大;易造成胎儿慢性缺氧,引发早产、死胎等严重后果。妊娠期间,新生儿无法从贫血母体中获取足够的生血物质是新生儿罹患贫血症的主要原因。贫血症将严重影响新生儿全身器官、骨骼的发育,引发智力发育迟缓、免疫力低下等问题。因此,对于孕妇及新生儿的早期贫血症的及时诊断及预防十分必要。

目前,常规Hb检测方法存在诸多缺点,如需抽血,有创伤,尤其对于新生儿患者,血管细窄、血液含量低,抽血方法不便操作且可能加重病情;检测周期长,需要专业人员的操作。因此,传统检测方法不利于开展家庭或社区内的Hb检测工作,增加了贫血疾病早期诊断和预防的难度。而无创Hb检测方法可以避免上述问题,相关研究具有重要的理论及实际应用价值[5]。

Jbsis[6]在1977年首次报道了Hb在近红外光区的吸收特性。近红外光谱分析技术(Near infrared spectroscopy, NIRS)因其具有无损、快速、无需试剂、可多组分同时分析等优势,已成为无创Hb检测研究领域关注的热点之一[7~11]。Kumar等[12]应用近红外分光光度法,通过优选最佳波长测量动脉血中血红蛋白浓度,标准偏差低于12%; Frasca等[13] 通过应用Pulse COOximeter设备,实现对重症监护病人Hb含量的无创检测及实时监测。目前出现了商品化的专用型血液成分近红外检测仪器,美国Masimo公司生产的Radical7 和Pronto7全血血红蛋白监测仪可实现Hb浓度的无创连续监测,检测误差在10%左右[14,15],但仪器价格较为昂贵,且测量精度有待提高。

为提高人体Hb无创检测精度,同时提高近红外光谱检测仪器的临床实用性,本研究组构建了以线性渐变滤光片(Linear variable filter, LVF)与16像元阵列式探测器为基础的高性能、便携式近红外光谱检测设备。LVF的通带中心波长在特定方向随着位置线性变化的滤光片,能够将入射复色光分成与滤光片位置相关的光谱。其结构简单、体积小巧、可靠性高,可有效简化仪器结构,制备便携式仪器。LVF分光光谱线性变化特性与线阵列式探测器匹配良好[16]。

作为间接分析方法, NIRS通过对人体光谱数据与标准方法测得的Hb化学指标建立特定的函数关系,即定标模型,实现对未知样品中Hb含量的预测。因此,定标模型的预测能力与稳定性,是决定NIRS分析精度的关键因素之一。支持向量回归方法(Support vector regression, SVR)用于近红外光谱分析,可提高定量分析的精密度[17]。 本研究将SVR用于近红外光谱无创检测人体血红蛋白,考察其在提高检测精度方面的作用。应用自行设计搭建的LVF型近红外光谱检测设备开展在体实验,无创采集志愿者右手食指前端光谱信号并划分为3组样品集, 即定标集、验证集1和2。应用基于交叉验证理论的网格搜索方法优选惩罚参数与核函数参数,用以建立稳健的SVR模型;通过对比分析SVR模型对两组验证集样品Hb含量的预测精度,验证便携式仪器与定标模型的适用性与稳定性。

2检测原理与实验

2.1支持向量回归方法的基本原理

SVR主要运算过程[18~20]如下:

y=w1x1+w2x2+…+wNxN(1)

将模型(1)简记为下面的回归预测模型:

f(x)=wTx+b(2)

SVR以结构风险最小为原则,可有效简化模型,其优化目标函数为:

minw,b1[]2[SX)]‖w‖2(3)

s.t.|yi-wTxi-b|≤ε, i=1,2,…,N

其中ε为不敏感参数,在SVR中线性约束预测误差在±ε内。为消除可能存在的奇异值数据对SVR模型性能的影响,引入松弛变量ξ,则公式(3)转化为:

minw,b1[]2[SX)]‖w‖2+c∑Ni=1(ξi+ξ*i)(4)

s.t.yi-wTxi-b|≤ε+ξi

wTxi+b-yi≤ε+ξiξi, ξi≥0

分 析 化 学第45卷

第9期袁境泽等: 支持向量回归在人体血红蛋白无创检测中的应用

其中, c為惩罚参数,c取值越大表明SVR回归模型适应性较差;c取值小将导致ε灵敏度降低,加大训练误差。惩罚参数c对SVR模型的复杂程度和适应性起平衡折衷作用,在应用中需要人为设置。此时的目标函数是一个凸二次规划问题,可以应用拉格朗日对偶性变换到对偶变量的优化问题求解。目标函数变为:endprint

minw,bmaxαi,α*i, βi,β*iLP=1[]2[SX)]‖w‖2+c∑Ni=1αi(ε+ξi-yi+wTxi+b)-

∑Ni=1αi(ε+ξi+yi-wTxi-b)-∑Ni=1(βιξi+βiξi)(5)

其中αi,α*i, βi,β*i≥0,i=1,2,…N为拉格朗日乘子。由于满足KKT条件,上述minw,bmaxαi,α*i, βi,β*iLP原始问题可以转化为对偶问题maxαi,α*i, βi,β*iminw,bLD更容易求解。因此目标函数转换为:

maxαi,αi LD=-12Ni=1Nj=1(αi-α*i)(αj-αj)-εNi=1(αi+α*i)+Ni=1yi(αi-α*i)

s.t.Ni=1(αi-α*i)i=0, 0≤αi,αi≤c, (6)

求得相应的回归估计函数:

f(x)=Ni=1(αi-αi)+b(7)

在寻优目标函数中,采用适当的内积函数K(xi,xj)=<φ(xi)·φ(xj)>可以实现某一非线性变换后的线性回归,非线性情况下目标函数如下:

f(x)=Ni=1(αi-αi)K(xi,xj)+b

w=Ni=1(αi-αi)φ(xi)(8)

SVR是一种以核思想为基础的模型训练方法,其性能在很大程度上由核函数与相关超参数(c和g)的选择所决定。常用的核函数类型有线性(Linear)、多项式型(Polynomial)、径向基函数(Radial basis function,RBF)和Sigmoid。而且不同类型的核函数都有与之密切相关的参数,以RBF为例,(xi,xj)=exp(

Symbolm@@ ‖xi-xj‖2/σ2)=exp(

Symbolm@@ g‖xi-xj‖2), 核函数参数为g,可表征参与训练的样本数据的分布特征,确定局部范围内相邻区域间隔。

本研究综合考虑非线性因素并降低模型复杂度,选择非线性函数RBF作为核函数。相比Sigmoid、多项式核函数等多参数情况,RBF核函数参数仅有一项。此时,需要优选的相关超参数为惩罚参数c和核函数参数g。目前较常使用的参数寻优方法为网格搜索(Grid search,GS)。

2.2实验仪器

本课题组自行设计搭建的LVF型人体血液成分近红外光谱检测设备结构如图1所示,包括光源系统、手指固定装置、分光系统、探测系统等结构。光谱采集波段范围650~1000 nm,采集速率50幅/s, 信噪比>15000∶1。

2.2.1光源系统Hb在600~1000 nm有较强的吸收谱带[21],为此,设置系统采集波段为可见近红外区650~1000 nm谱区。优选该范围内9个不同中心波长的LED耦合成650~1000 nm宽波段测量光源,并以3×3矩阵形式紧密排列。组合光源能够克服单LED的窄带宽限制,满足宽谱区测量要求,且能够有效减少温度变化对测量精度的影响。此外,为使阵列式LED组合光源在检测位置处形成各中心波长能量均匀分布、直径<8 mm的圆形汇聚光斑,于光源前方设计加装透镜系统。

2.2.2手指固定装置由柔性材料制成的具有独特结构的装置可将人体右手食指固定在有效检测位置(即光源汇聚光斑处)。通过施加适当压力,确保食指前端的平稳状态,从而有效避免测量过程中因不自主抖动造成的检测位置偏移,提高光谱采集稳定性。

2.2.3探测器选型由于心脏搏动、血液循环等生理活动,人体血流容积随时间产生周期性变化,这将导致在不同时刻、同一位置所测血液成分信息对应不同光程,进而影响分析结果。为此,本研究选择日本HAMAMATSU公司16象元阵列式Si探测器(S411116R),以实现同一时刻获取全部光谱信息,有效避免血管容积随时间变化引起的光程差异问题。此外,线阵列式探测器与LVF分光光谱线性变化特性匹配,配合使用可有效提升仪器性能、精简仪器结构,独立像元也可有效避免信号串扰问题。

2.2.4分光元件优化设计线性渐变滤光片基本尺寸与膜系结构,采用的滤光片参数如下:有效区域长度 12.8 mm;有效波段 620~1080 nm;分辨率(即半峰宽)<1.5%中心波长;峰值透过率>60%;截止深度<0.1%;线性渐变系数为(35.9±5.0) nm/mm。LVF紧靠线阵列式探测器安装,可有效缩短光路,在精简仪器结构的同时,降低了光束传播中的能量损失。

2.3实验方法

2.3.1数据采集实验测量对象为参加医院常规体检的100位志愿者(年龄范围27~79岁;男女比例约1∶1.3,志愿者知情同意参与测试)。

光谱检测设备无创采集每位志愿者手指前端光谱信号。开始测量前,受检者需静坐10 s,状态平稳后将右手食指放入仪器固定装置,要求受检者手指前端轻压并完全覆盖通光孔。随后,开始光谱信号采集,采集时间约为20 s, 环境温度保持在20~22℃。光谱信号采集完成后,即刻抽取志愿者静脉血样,经理化方法分析,获得对应的Hb检测值,作为真实值。图2为采集的人体食指指端近红外光谱吸光度特性。

2.3.2样品集划分为建立稳健的定标模型,将100组样品划分为3个样品集:定标集和验证集1和2(表1)。应用定标集样品建立校正模型后,分别对验证集1和2中样品Hb含量进行定量分析,综合分析定标模型Hb预测精度与对不同样品的适应能力。样品集划分过程中,依据浓度范围均匀分布的原则,将100组样品按照真实值递增顺序排列, 等间隔梯度选取52份样品作为定标集,剩余样品随机平分成两组验证集。定标集和两组验证集样品数量比值约为2∶1∶1。

3结果与讨论

近年来,SVR因兼具全局最优性和較好的泛化能力,被广泛应用于化学计量学中的定量分析研究 中[18~20] 。本研究应用SVR算法建立人体光谱吸光度数据与Hb生化检测指标之间的回归关系,即定标模型,优选RBF作为核函数。此时,需要优选的相关参数为惩罚参数c和核函数参数g。为提升SVR模型稳健性,使用网格搜索方法,在[

Symbolm@@ 28,28](即[

Symbolm@@ 256,256])区间内寻找最优c,g参数组合。网格搜索方法基于交叉验证(CV)理论,以定标集交叉验证标准偏差为评价标准。 应用Matlab软件进行寻优计算,优选参数结果如图3所示,此时交叉验证标准偏差最小。

以网格搜索方法优选的参数组合c=5.28, g=0.33为基础,建立SVR定标模型,并分别对验证集1和2中样品的Hb浓度定量分析,预测结果如图4所示:预测相关系数(Prediction correlation coefficient, Rp) 分别为0.77和0.70,预测标准偏差(Root mean squared error of prediction, RMSEP)分别为10.20 g/L和10.85 g/L,相对预测标准偏差(Relative root mean squared error of prediction, RRMSEP) 分半为6.85%和7.48%。

實验结果表明,以SVR为基础,针对人体血红蛋白含量的无创检测精度较高,基本接近临床检测方法的检测精度,可望用于贫血症早期诊断。同时,SVR模型对不同预测样品的适应性较强,泛化能力较好,具有较强的稳定性。应用NISR无创检测人体血液成分时,实际测量的近红外吸收光谱数据与样品化学测量值之间会存在一定的非线性因素影响,如由血液、皮肤组织光散射作用导致的光谱吸收峰漂移;待测成份浓度过低或过高;待测成分与其它组分间的相互作用; 以及仪器噪声、基线漂移等。SVR在解决线性、非线性回归问题方面均具有较为突出的优势。尤其针对光谱数据与样品化学测量值间存在的非线影响因素, SVR可以转化为凸二次规划问题求解,成功引入内积形式,从而可通过适当选用核函数有效解决非线性回归问题;且转化为凸二次规划问题后, SVR理论上可得到全局最优解,从而有效提升对血红蛋白的定量分析精度;此外SVR由于引入松弛变量ξ,有效提升模型对异常值以及噪音的容忍性,进一步加强SVR定标模型对不同检测个体的适应性及对血红蛋白成分的预测稳定性。因此,SVR适用于光谱信号较为复杂的人体血红蛋白无创检测。

4结 论

本研究以LVF与16像元阵线阵列式探测器为基础,设计搭建高性能、小型化便携式血液成分分析设备,开展人体Hb在体测量。采用网格搜索方法优选相关参数,以优选的参数组合c=5.28, g=0.33为基础,建立SVR定标模型并分别对验证集1和2中Hb水平进行定量分析。本法预测精度较高,SVR模型对不同预测样品的适应性较强,泛化能力较好,具有较强的稳定性。结合SVR算法,线性渐变滤光片型近红外光谱检测设备在贫血症诊断领域有着良好的应用前景。

References

1Zhou Y, Zheng C, Cao H, Li X, Sha J. Biochem. Biophys. Res. Commun., 2012, 420(1): 205-209

2Timm U, Leen G, Lewis E, Mcgrath D, Kraitl J, Ewald H. Procedia Engineering., 2010, 5(6): 488-491

3LI Qiang, MA Wei, YU BuWei .Shanghai Medical Journal, 2013, 36(2): 98-101

李 强, 马 伟, 于布为. 上海医学, 2013, 36(2): 98-101

4Worldwide Prevalence on Anaemia 19932005”, http://www.who. int/vmnis/database/anaemia/anaemia_status_summary/en/index.html

5Christian P, Shahid F, Rizvi A, Klemm R D, Bhutta Z A. Am. J. Clin. Nutr., 2009, 89(3): 853-861

6Jbsis F F. Science, 1977, 198(4323): 1264

7LIU YanDe, ZHOU YanRui, PAN YuanYuan. Optics and Precision Engineering, 2014, 22(2): 281-288

刘燕德, 周延睿, 潘圆媛.光学精密工程, 2014, 22(2): 281-288

8Pincella F, Isozaki K, Miki K. LightSci. Appl., 2014, 3(1): 110-118

9Heise H M. Handbook of Vibrational Spectroscopy. John Wiley & Sons, Ltd., 2006

10Yamakoshi K, Yamakoshi Y. J. Biomed. Opt., 2006, 11(5): 054028

11LIANG JingQiu, LIANG ZhongZhu, LYU JinGuang, QIN YuXin, TIAN Chao, WANG WeiBiao. Chinese Optics., 2015, (2): 277-298

梁静秋, 梁中翥, 吕金光, 秦余欣, 田 超, 王维彪. 中国光学, 2015, (2): 277-298

12Kumar G, Schmitt J M. Proceedings of the Society of PhotoOptical Instrumentation Engineer S (SPIE), Bellingham, SpieInt Soc Optical Engineering, 1996, 2678: 442-453endprint

13Frasca D, DahyotFizelier C, Catherine K, Levrat Q, Debaene B, Mimoz O. Critical Care Med., 2011, 39(10): 2277-2282

14Park Y H, Lee J H, Song H G, Byon H J, Kim H S, Kim J T. Anesth. Analg., 2012, 115(6): 1302

15Bruells C S, Menon A K, Rossaint R, Goetzenich A, Czaplik M, Zoremba N. J. Cardiothorac. Surg., 2013, 8(1): 1-6

16BarNoam A S, Farah N, Shoham S. LightSci. Appl., 2016, 5, e16007

17LI Lin, XU Shuo, An Xin, ZHANG LuDa. Spectroscopy and Spectral Analysis, 2011, 31(10): 2702-2705

李 林, 徐 碩, 安 欣, 张录达. 光谱学与光谱分析, 2011, 31(10): 2702-705

18Thissen U, Pepers M, stün B, Melssen W J, Buydens L M C. Chemometr. Intell. Lab, 2004, 73(2): 169-179

19Balabin R M, Lomakina E I. Analyst, 2011, 136(8): 1703

20Cristianini N, ShaweTaylor J. An Introduction to Support Vector Machines: and Other KernelBased Learning Method. United Kingdom at the University Press, 2000

21Urpalainen K. Espoo: Aalto University, 2011

Support Vector Regression for Noninvasive Detection of

Human Hemoglobin

YUAN JingZe1,2, LU QiPeng*1, WANG JingLi3, DING HaiQuan1, GAO HongZhi1, WU ChunYang1,2, LI WanXia1,2

1(State Key Laboratory of Applied Optics, Changchun Institute of Optics, Fine Mechanics, and Physics,

Chinese Academy of Sciences, Changchun130033, China)

2(University of Chinese Academy of Sciences, Beijing 100049, China)

3(Cancer Center, The First Hospital of Jinlin University, Changchun 130021, China)

AbstractTo facilitate noninvasive diagnosis of anemia, highperformance and portable near infrared (NIR) spectrometer for human blood constituents was designed and fabricated based on linear variable filter (LVF). Meanwhile, the performance of support vector regression (SVR) model for quantitative analysis of human hemoglobin (Hb) was investigated. Spectral data were collected noninvasively from 100 volunteers by selfdesigned LVFNIR spectrometer, then divided into calibration set, validation set 1 and 2. To establish a robust SVR model, grid search method was applied to optimize the penalty parameter and kernel function parameter c=5.28, g=0.33. Then, Hb levels in the validation 1 and 2 sets were quantitatively analyzed. The results showed that the root mean square error of prediction (RMSEP) were 10.20 g/L and 10.85 g/L, respectively, and the relative RMSEP (RRMSEP) were 6.85% and 7.48%, respectively. The results indicated that the SVR model had high prediction accuracy to Hb level and adaptability to different samples, and could satisfy the requirements of clinical measurement. Based on the SVR algorithm, the selfdesigned LVFNIR spectrometer has a wide application prospect in the field of noninvasive anemia diagnosis.

KeywordsNoninvasive detection; Hemoglobin; Nearinfrared spectroscopy; Support vector regression; Portable device

(Received 16 February 2017; accepted 10 August 2017)

This work was supported by the National High Technology Research and Development Program of China (No.2012AA022602) and the National Natural Science Foundation of China (Nos. 61308067, 61475155).endprint

猜你喜欢
近红外光谱
基于支持向量机及粒子群算法的腊肉品质等级检测
基于近红外光谱和LabVIEW技术的番茄抗灰霉病检测系统
麦芽炒制过程中近红外在线监测模型的建立及“炒香”终点判断研究
基于近红外光谱法的藜麦脂肪含量快速检测
近红外光谱法青皮药材真伪鉴别研究
利用油水稳定化和支持向量回归增强近红外光谱测定油中水分的方法
基于一元线性回归的近红外光谱模型传递研究
AOTF近红外光谱技术在淫羊藿提取过程在线检测中的应用