质谱成像数据图像重构软件

2011-01-30 02:15熊行创欧阳证黄泽健邓玉林张玉奎
质谱学报 2011年3期
关键词:数据类型数据文件个数

熊行创,方 向,欧阳证,江 游,黄泽健,邓玉林,张玉奎

(1.北京理工大学生命科学与技术学院,北京 100081;2.中国计量科学研究院,北京 100013;3.美国普渡大学韦尔登生物医学工程学院,西拉法叶美国 47907)

质谱成像(imaging mass spectrometry,简称IMS)能够同时获取样品的化学成分信息和样品表面化学成分空间分布信息,并以图像的形式直观地反映被测物的物质与空间分布情况。IMS的应用从半导体表面污染物分析到生物组织上的蛋白分析,以及药物分析、法证鉴定、字画鉴定等[1-2]。常用的质谱成像技术MALDI(matrix-assisted laser desorption/ionization)、SIMS(secondary ion mass spectrometry)需要在真空环境下进行,在一定程度上限制质谱成像的应用范围。近年来,随着DESI(desorption electrospray ionization)[3]、L TP(low temperature plasma)[4]、L EDI(electrospray-assisted laser desorption/ionization)[5]等新型敞开式常压离子源与众多大气压接口质谱仪的结合,实现多样的质谱成像分析正在不断地扩大 IMS的应用范围[6]。将众多大气压接口质谱仪获取的原始数据重构为质谱图像数据是实现成像分析的必须处理过程,需要专用的软件工具。Clerens等[7]实现了Bruker公司的 Reflex and Ultraflex质谱仪数据格式转换;Jardin-Mathé等[8]开发的MITICS软件对Applied BioSystems和 Bruker Daltonics公司质谱数据进行图像重构,但是对其他公司的质谱数据却无能为力,同时缺乏各种参数设定的专用化功能和方便用户使用的向导式界面。为此,本工作开发出一种向导式、专用的质谱数据图像重构imgGenegate软件,能将原始质谱数据重构为Analyze 7.5格式,可以通过免费的BioMap软件(http://www.maldi-msi.org)、IMSview 软件(http://msimaging.net)和Matlab开发工具处理。

1 实验方法

1.1 质谱成像实验的数据特点

不论是大气压环境还是真空环境下的质谱成像分析,通常在固定离子源和质谱接口的位置,通过移动样品台实现对样品的扫描分析。扫描的方式往往采用单方向模式,即每一行扫描都是平行的、方向都是一样的。样品台的移动与质谱数据的采集同步,样品台开始移动时,质谱开始采集数据,该行扫描结束时,质谱停止采集数据。每扫描一行质谱数据,保存到一个数据文件中。每一个质谱采样点对应图像中的一个像素,每一行采样点的个数代表图像中该行水平像素的个数。整个扫描过程中的行数(即文件个数),代表图像的垂直像素个数。

1.2 ImgGenerate软件

ImgGenerate软件是向导式、功能全面、专用的将质谱数据重构为图像数据的工具,有英文和中文两个版本。软件的向导分为6步,流程示于图1,每一步的功能都单一,能一步步引导用户实现数据的转化。

图1 数据重构流程图Fig.1 Flow of reconstituting MSI data

(1)选择质谱数据文件类型

两种文件类型可供选择:.raw数据类型(Thermo Scientific)和.d数据类型(Agilent Technologies)。

(2)导入质谱数据文件

导入需要重构的原始质谱数据文件,编辑或调整文件顺序,剔除不合适的文件。

(3)预览与确认质谱数据成像布局

对导入的质谱数据文件进行成像布局预览,界面示于图2。获取图像的水平和垂直像素个数,标明水平像素个数最少的行号及所对应的质谱文件,水平像素个数最多的行号及所对应的质谱文件。依据此图像预览情况,可退回(2),剔除不合适的文件。

(4)选择目标文件数据类型

Analyze 7.5数据格式是一种科学图像数据格式,应用广泛。用户可以按需求定义所保存数据的类型,有short型(16个字节)、int型(32个字节)、float类型(32个字节)或double类型(64个字节)。

BioMap软件选定的数据类型是 short类型,限定了每个质谱峰的强度值不超过32 768,每幅质谱图的数据点数不能多于32 768,如果质谱峰值或质谱数据点数大于32 768,需要做相应的数据归一化处理,否则会出错。

IMSview软件对4种类型都适用。

图2 质谱数据成像布局预览界面Fig.2 Interface of previewing MSI data layout

(5)编辑质谱数据成像参数

在实际导入数据的基础上,编辑目标图像的水平像素个数、垂直像素个数,起始 m/z的大小、终止 m/z的大小,m/z的间隔宽度,并选择信号的类型(质谱峰值还是质谱峰面积),界面示于图3。

图3 编辑质谱数据图像参数界面Fig.3 Interface of editing parameter of MSI data

信号的幅度是否选择为归一化模式:如果选定归一化模式,则以最大值为基准,做相对值转换;如果没有选定归一化模式,当最大值没有超出数据类型所规定的最大值时,按原始值表示,若超出则自动按归一化模式处理。

(6)生成img成像数据

生成的数据文件有 3种:①图像文件(.img)保存图像中像素的原始数据;②头文件(.hdr)保存图像的长、宽、高、维数,以及定义数据的类型;③针对质谱数据往往附加文件(.t2m)保存质谱(float类型)。其中前2个是标准Analyze 7.5数据格式所必须的。

生成后的数据可以通过BioMap软件处理,也可以通过IMSview软件和MATLAb开发工具处理。

2 结果与讨论

应用imgGenerate软件对由美国普度大学Cooks教授课题组提供的大鼠小脑切片质谱成像数据进行图像重构,该质谱数据在L TQ仪器(Thermo Scientific)结合DESI离子源的质谱成像装置上获得(负离子模式)。质谱数据的初始条件:75个数据文件,每个数据文件含有104个数据点,每个数据点的 m/z范围是150~1 100,m/z数据间隔是0.1,数据文件所占空间347 MB。图像重构的设定条件是:数据类型选择short型,垂直像素个数 75个,水平像素个数104个,每个像素的质谱数据质量范围为150~1 100,m/z数据间隔是1,信号类型为峰面积值,非归一化处理。重构后的数据所占空间14 MB,可以应用Biomap软件显示,示于图4。

图4 BioMap显示大鼠小脑切片在 m/z889(硫鞘脂)的离子图Fig.4 A rat brain section imaging atm/z889(sulfatide sphingolipid)on BioMap

应用imgGenerate软件,对油性笔所书字迹质谱成像数据进行图像重构。该质谱数据在QTOF6520仪器(Agilent Technologies)结合DESI离子源的质谱成像装置上获得(正离子模式)。数据的初始条件:22个数据文件,数据文件含有82~85个数据点,每个数据点的 m/z范围是50~700,m/z数据间隔是0.001,数据文件所占空间342 MB。图像重构的设定条件是:数据类型选择short型,垂直像素个数22个,水平像素个数50个,质量范围100~600,m/z数据间隔是0.1,信号类型为峰值,归一化处理。重构后的数据所占空间10.5 MB,可以应用 IMS-view软件显示,示于图5。

图5 IMSview显示“MS”字迹在 m/z292.1离子图Fig.5 “MS”imaging atm/z292.1 on IMSview

3 结论

应用测试表明,imgGenerate软件能够有效地对单向扫描模式、一行扫描对应一个数据文件的质谱成像数据进行图像重构。在该软件的后续版本中,将进一步开发扩展功能,适用于双向扫描模式和更多公司质谱数据的图像重构。

[1]HEEREN R,SMITH D F,STAUBER J,et al.Imaging mass spectrometry:Hype or hope?[J].Journal of the American Society for Mass Spectrometry,2009,20(6):1 006-1 014.

[2]MCDONNELL L A,HEEREN R M A.Imaging mass spectrometry[J].Mass Spectrometry Reviews,2007,26:606-643.

[3]COOKS R G,OU YANG Z,TAKATS Z,et al.Ambient mass spectrometry[J].Science,2006,311(5 767):1 566-1 570.

[4]HARPER J D,CHARIPAR N A,MULLIGAN C C,et al.Low-temperature plasma probe for ambient desorption ionization[J].Analytical Chemistry,2008,80(23):9 097-9 104.

[5]SHIEA J,HUANG M Z,HSU H J,et al.Electrospray-assisted laser desorption/ionization mass spectrometry for direct ambient analysis of solids[J].Rapid Communications in Mass Spectrometry,2005,19(24):3 701-3 704.

[6]WISEMAN J M,IFA D R,ZHU Y X,et al.Desorption electrospray ionization mass spectrometry:Imaging drugs and metabolites in tissues[J].Proceedings of the National Academy of Sciences of the United States of America,2008,105(47):18 120-18 125.

[7]CL ERENS S,CEUPPENS R,ARCKENS L.Create target and analyze this:New software assisting imaging mass spectrometry on Bruker Reflex IV and Ultraflex II instruments[J].Rapid Communications in Mass Spectrometry,2006,20(20):3 061-3 066.

[8]JARDIN-MATHE O,BONNEL D,FRANCK J,et al.MITICS(MALDI imaging team imaging computing system):A new open source mass spectrometry imaging software[J].Journal of Proteomics,2008,71(3):332-345.

猜你喜欢
数据类型数据文件个数
怎样数出小正方体的个数
如何理解数据结构中的抽象数据类型
等腰三角形个数探索
怎样数出小木块的个数
怎样数出小正方体的个数
基于表空间和数据文件探讨MIS中数据库架构设计
数据文件安全管控技术的研究与实现
基于SeisBase模型的地震勘探成果数据管理系统设计
线上众筹产品的特征分析与研究
相似度计算及其在数据挖掘中的应用