主成分分析方法在食管癌患者血清代谢物研究中的应用

2010-07-31 02:17杨永霞梁敏锋陈阿丽丘翠环吴怀选
中国医药导报 2010年23期
关键词:模式识别代谢物组学

杨永霞 ,梁敏锋 ,陈阿丽 ,丘翠环 *,张 磊 ,吴怀选

(1.广东药学院基础学院,广东广州 510006;2.南方医科大学南方医院感染内科,广东广州 510515;3.广东药学院中山校区实验中心,广东中山 528458)

核磁共振(nuclear magnetic resonance,NMR)技术作为一种无侵入、高效的分析手段已经成为代谢组学研究的重要实验方法[1-3],但生物样品(体液、组织)组成复杂,通常高分辨一维1H谱就包含成百上千个的共振峰,即使是经验丰富的波谱学家也很难从复杂的NMR谱中获得全部的有用信息。因此,结合模式识别来分析NMR的实验数据是非常有益的。主成分分析(principal component analysis,PCA)是一种在保持数据信息损失最少的原则下,对高维变量空间进行降维处理的线性映射方法[4]。本文应用高分辨核磁共振1H谱并结合主成分分析方法研究食管癌(esophageal carcinoma,EC)患者血清的代谢组特征,找出与癌变有关的标志性代谢物。

1 仪器与试药

于南方医科大学南方医院收集健康人血清10例和食管癌患者血清 20例(2008年 8月~2009年 2月),取 400 μl上层血清加至5 mm NMR测试管中,后加入100 μl 0.2 mol/L磷酸缓冲溶液(pH=7.4)和 50 μl双重水,振荡混匀。

2 方法与结果

2.1 NMR实验

利用BRUKER 500 MHz超导核磁共振波谱仪对每一个样品采集 1D NOESYPR1D 和 CPMG(relaxation delay-90-(τ-180-τ)n-acquisition)氢谱。在 NOESYPR1D 实验中,混合时间 tm为 100 ms,t1延迟为 3 μs。CPMG 回波实验中,回波时间为100 ms,延迟时间3 s,64 k数据点,采集次数为128。化学位移定标为乳酸甲基双重峰δ1.33。

2.2 数据预处理

对所有1HCPMG谱进行自动积分(TOPSPIN 2.0),积分区间δ0.5~9.0,积分间隔Δδ=0.02。为了消除压水后残余水峰的影响,δ4.6~5.2的积分值设为零。主成分分析前对每一个谱的积分值进行归一化处理,后将归一化值导入软件Simca-P 10.0(Umetrics,Sweden)中进行主成分分析。

2.3 结果

2.3.1 不同脉冲序列1HNMR谱 对本文中每一个血清样本均作了NOESYPR1D和CPMG谱(图1)。在NOESYPR1D谱中,脂信号如 δ 0.89、1.3、1.59、2.02和 2.25比较明显,且与其他小分子信号有重叠。在CPMG谱中,由于T2滤波,脂信号强度降低。由于CPMG抑制了脂类等大分子信号峰,突出了小分子代谢物,CPMG谱的基线较NOESYPR1D谱平滑,这也减小了谱峰重叠带来的分析误差。

2.3.2 PCA分析 图2给出对健康人(○)和食管癌患者(■)血清1HCPMG 谱的主成分分析结果(PC1vs PC2,R2=78.4%),分析结果以得分图(score plot)和负载图(loading plot)给出。通过图2(a)可以看到,健康人和食管癌患者血清样本在PC1维可以区分开。图2(b)给出了两类样本中主要的代谢物变化,可以看到食管癌患者血清中脂和乳酸的含量是升高的,而胆碱和葡萄糖是降低的。

3 讨论

代谢组学得到的是大量、多维的信息,需要应用一系列化学计量学方法进行数据分析才能充分挖掘所获得的数据中的潜在信息。主成分分析(PCA)是一种无监督模式识别方法,可以直观地在多维空间上描述样品间的差异,它是一种在保持数据信息损失最少的原则下,对高维变量空间进行降维处理的线性映射方法,由于PCA分析操作的简便和变量的可解释性,它已经成为代谢组学研究的常用方法[5-6]。

原始NMR谱往往由于数据量过大、数据点的高度相关性以及溶剂峰、溶剂峰压制后的残余峰和基线等带来的影响而不能直接拿来作模式识别分析,因此,通常需要对NMR谱进行预处理。此外,为了消除pH值等引起的化学位移的微小变化,还需要对NMR谱进行分段积分。积分区间一般为Δδ=0.04或 Δδ=0.02,在500MHz谱仪上对应于 20Hz或 10 Hz。这样,积分区间的平均化学位移和积分强度组成了一个新的低分辨率NMR谱,用于模式识别分析。

通过1HCPMG谱可以明显观察到异亮氨酸、缬氨酸、乳酸、丙氨酸、乙酸盐、丙酮酸、肌酸、胆碱、三甲胺、葡萄糖、酪氨酸、苯丙氨酸和组氨酸等信号峰,且与NOESYPR1D1H谱比较,分辨率得到提高,谱峰重叠减小。所以为了重点研究小分子信号的代谢变化,主成分分析主要针对1HCPMG谱数据进行。通过PCA分析得到:食管癌患者血清中脂和乳酸的含量是升高的,而胆碱和葡萄糖是降低的。

乳酸含量升高和葡萄糖含量降低可能与血清中增强的无氧糖酵解过程有关。肿瘤细胞生长繁殖加快,需要更多的能量来维持,而快速生长和缺血坏死使癌细胞处于缺氧状态,这就促进了葡萄糖的糖酵解过程,产生大量乳酸,造成癌细胞内的乳酸堆积[7]。因此,乳酸常被看成是肿瘤恶性程度的标志性代谢物。

总之,基于核磁共振和主成分分析的代谢组学方法能够给出食管癌患者血清代谢差异,为食管癌诊断提供可靠的分子水平上的代谢证据。

[1]杨永霞,杨生义,梁敏锋,等.基于核磁共振波谱的乙肝患者血清代谢组研究[J].第二军医大学学报,2010,31(3):288-291.

[2]高岗,杨根金,娄子洋.肾虚证大鼠尿液的核磁共振谱代谢组学研究[J].第二军医大学学报,2009,30(5):565-568.

[3]Lehnhardt FG,Bock C,Rohn G,et al.Metabolic differences between primary and recurrent human brain tumors:a1HNMR spectroscopic investigation[J].NMR Biomed,2005,18(6):371-382.

[4]Siedlecki W,Siedlecka K,Sklansky J.An overview of mapping techniques for ecploratory pattern analysis[J].J Pattern Recogn,1998,21(5):411-429.

[5]Waters NJ,Holmes E,Williams A,et al.NMR and pattern recognition studies on the time-related metabolic effects of 2-Naphthylisothiocyanate on liver,urine and plasma in the rat:an integrative metabonomic approach[J].Chem Res Toxicol,2001,14(10):1401-1412.

[6]Wang YL,Bollard ME,Keun H,et al.Spectral editing and pattern recognition methods applied to high-resolution magic-angle spinning1H nuclear magnetic resonance spectroscopy of liver tissues[J].Anal Biochem,2003,323(1):26-32.

[7]Fowler A,Rappas A,Holder J,et al.Differentiation of human prostate cancer from benign hypertrophy by in vitro1HNMR[J].Magn Reson Med,1992,25(1):140-147.

猜你喜欢
模式识别代谢物组学
阿尔茨海默病血清代谢物的核磁共振氢谱技术分析
口腔代谢组学研究
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
浅谈模式识别在图像识别中的应用
第四届亚洲模式识别会议
柱前衍生化结合LC-MSn分析人尿中茶碱及其代谢物
代谢组学在多囊卵巢综合征中的应用
HPLC-MS/MS法分析乙酰甲喹在海参中的主要代谢物
第3届亚洲模式识别会议
电气设备的故障诊断与模式识别