转录组学测序技术应用与市场分析

2017-09-29 02:05王跃毛开云王恒哲马征远
合成生物学 2017年5期
关键词:高通量组学测序

王跃,毛开云,王恒哲,马征远

中国科学院上海生命科学信息中心,上海 200031

技术与市场

转录组学测序技术应用与市场分析

王跃,毛开云,王恒哲,马征远

中国科学院上海生命科学信息中心,上海 200031

转录组学是功能基因组学研究的重要组成部分,是一门在整体水平研究基因功能以及基因结构,揭示基因转录、转录调控规律以及疾病发生过程中的分子机理的学科。随着分子生物学技术、高通量技术的高速发展,转录组学测序技术已逐渐成为转录组学研究中不可或缺的研究手段。从应用和市场两个角度,对转录组学的现状和未来趋势进行调研,为我国转录组学测序技术产业的发展及相关政策的制定提供参考。

转录组学;高通量测序;RNA-seq;市场分析

广义上,转录组(transcriptome)是指特定的组织或细胞在某一生长阶段或功能状态下所转录出来的RNA总和,包括编码蛋白质的mRNA和各种非编码RNA(ncRNA),如rRNA、tRNA、snoRNA、snRNA、microRNA,以及其他非编码RNA等[1]。狭义上,通常仅以mRNA作为研究对象。

随着人类基因组计划的完成,研究人员逐渐认识到对基因结构序列的研究仅仅是基因组学研究的一部分,并不能揭示所有的生命奥秘,所以生物医学研究已从结构基因组学过渡到功能基因组学。随着后基因组时代的到来,转录组学、蛋白质组学、代谢组学等各种组学技术相继出现,其中转录组学是率先发展起来以及应用最广泛的技术[2]。

转录组学(transcriptomics)是功能基因组学研究的重要组成部分,是一门在整体水平研究基因功能以及基因结构,揭示基因转录、转录调控规律以及疾病发生过程中的分子机理的学科[3]。最近十几年,随着分子生物学技术以及高通量技术等的快速发展,使得真正意义上的转录组学的研究成为可能。尤其是随着下一代测序(next-generation sequencing,NGS)平台的市场化,转录组学测序技术已经彻底改变了转录组学的思维方式。目前,成熟的转录组学测序技术以其整体性、系统性、个体组织差异性、时间独立性等优势,更好地推动转录组学研究。本文从技术应用和市场两个角度,梳理了目前转录组学测序技术的发展现状,并对其未来发展趋势进行了分析。

1 转录组学测序技术的发展和应用前景

1.1 测序技术的发展进程

一般来说,任何一种DNA测序技术均可用于转录组学测序。整体而言,随着测序技术的不断发展,目前主要有三代测序技术划分(图1)。

测序技术最早可追溯到20世纪50年代由P. R. Whitfeld发明的多聚核糖核苷酸测序技术。随着F. Sanger在20世纪70年代发明了DNA末端终止法测序技术,以及随后A. M. Maxam和W. Gilbert发明的化学降解法测序技术,标志着第一代测序技术的产生和建立。第一代测序技术的优点是准确度高,但同时由于其测序通量低、成本高昂、速度慢等技术缺陷,限制了其在商业上的应用。

随着人类基因组计划的完成,人类进入了后基因组时代,传统的测序方法已经不能满足深度测序和重复测序等大规模基因组测序的需求,促使了新一代测序技术的诞生。第二代测序技术是利用一系列高通量测序技术(highthroughput sequencing)进行大规模的基因组DNA或RNA测序,能够快速准确地获得基因组编码序列,满足极短时间内对基因组进行高分辨率检测的要求[5]。第二代测序技术的主要特征是高通量和边合成边测序,因此大规模、测序速度快是其相对于第一代测序技术的主要优势,而劣势是较短的序列读长和需要模板扩增过程。

图 1 测序技术发展时间表[4]

第三代测序技术是指在单个细胞、单分子水平上对基因组进行测序的一项新技术,主要包括Helicos Biosciences单分子测序技术、Paci fi c Biosciences单分子实时(single molecule real time,SMRT)测序技术和Oxford Nanopore纳米孔单分子测序技术3种[4]。第三代测序技术具有测序速度快、测序序列长等优势,但也存在着测序准确度不高的问题,大大限制了其商业化的应用。因此,目前测序市场仍以第二代高通量测序技术为主。

1.2 转录组学测序技术应用前景

近几年,随着精准医疗、个性化医疗等大计划的提出,促使以转录组学研究为代表的功能基因组学日益成为研究热点。转录组学测序技术能有效帮助科学家在转录层面找到疾病的直接或者间接的病因,了解疾病的发生、发展机制,从而制定个体化的精准医疗方案,以期达到治疗效果的最大化和副作用的最小化。

同时,随着第二代测序技术高通量、高准确率、低成本等优点的实现,转录组学测序技术也随之得到了更广泛的应用。由于测序深度的优势,基于NGS的转录组学测序技术更能全面地揭示生物个体在特定时刻和特定组织的全局基因表达情况,具有更好的整体性、系统性、个体组织差异性以及时间独立性等优势。目前,转录组学测序技术已广泛应用于生物学研究、临床研究、相关疾病研究和药物开发等[6]。据Illumina的预估,未来全球测序服务市场容量将达到200亿美元,其中肿瘤学市场约占60%,达到120亿美元左右;生命科学市场约占25%,规模约50亿美元,具体包括生命科学工具、复杂病症、农业基因以及影响因子和宏基因组等;生育和基因健康市场约20亿美元,占比10%,具体业务包含孕妇和新生儿童的监测,以及基因健康等;其他应用市场约10亿美元[7]。

2 转录组学测序技术应用发展的现状与趋势

2.1 转录组学测序技术的主要分类

目前,转录组学测序技术包括表达序列标签技术(expressed sequence tags,EST)、基因表达系列分析技术(serial analysis of gene expression,SAGE)、大规模平行测序技术(massively parallel signature sequencing,MPSS),以及RNA测序技术(RNA sequencing,RNA-seq)[8]。其中,EST是较早发展起来的先驱技术,SAGE、MPSS和RNA-seq是高通量测序条件下实现的转录组学研究方法(图2),RNA-seq更是基于NGS技术发展的测序技术,具有测序通量高、速度快、价格低、信噪比高等优势,已超越上述其他方法,成为转录组学分析的主要手段。

图2 主要转录组学测序技术工作流程比较

2.2 目前主要的转录组学测序技术

EST技术虽然可以直接检测cDNA序列,但其检测量较低、价格昂贵且很难达到定量分析的目的。相比之下,SAGE和MASS技术是基于EST技术的升级,克服了EST技术的缺点,采用了数字化信号技术,具有高通量、精确性高等特点。但是,上述两种技术仍是基于Sanger测序技术,其测序成本昂贵,且短的标签序列的有效部分不能特异性地匹配到参照物基因组上[3]。

RNA-seq,又称为高通量RNA测序,是利用深度测序技术进行转录组分析的技术,其基本原理是将RNA先反转录成cDNA,再对cDNA全部进行测序。RNA-seq是第二代测序技术的一个重要应用领域,与其他转录组学技术相比,具有数字化信号、高灵敏度、任意物种的全基因组分析、更广的检测范围等诸多独特优势(表1),目前已成为转录组学研究中定量基因表达和进行转录组测序、分析的主流工具[9]。此外,RNA-seq具有重复性好、无需技术重复、起始样品少等优势。该技术能够在单核苷酸水平对任意物种的整体转录活动进行检测,在分析转录本的结构和表达水平的同时,还能发现未知转录本和稀有转录本,精确地识别可变剪切位点以及编码序列单核苷酸多态性(cSNP),提供更为全面的转录信息[9]。

2.3 转录组测序主要应用平台

从测序技术的原理来说,所有的高通量测序技术均可用于转录组测序。自2005年以来,以Roche公司的454技术、Illumina公司的Solexa技术以及ABI公司(后与Invitrogen公司合并为Life Technologies公司,Life Technologies公司于2013年被Thermo Fisher Scienti fi c公司收购)的SOLiD技术为代表的第二代测序技术逐渐成熟,并迅速成为目前市场上转录组测序的主流应用平台[10]。相对于传统的Sanger测序技术,新一代测序技术的主要特点是测序通量高,测序周期和成本显著下降。目前,全球的转录组学测序业务几乎被上述三大巨头所垄断(图3)。

2.3.1 Roche公司454 Genome Sequencer

454公司在2003年推出了具有革命性意义的基于焦磷酸测序法(pyrosequencing)的超高通量基因组测序系统,是边合成边测序(sequencing by synthesis,SBS)技术发明的先驱。随后,454公司被Roche公司收购,推出了第二代测序系统Genome Sequencer FLX System,该技术的核心在于 微 乳 滴PCR(emulsion PCR,emPCR)和并行焦磷酸测序法(parallelized pyrosequencing),避免了传统测序进行荧光标记以及跑胶等繁琐步骤,同时利用乳胶系统对DNA分子进行扩增,实现了大规模并行测序[12]。

表1 主要转录组学测序技术比较

图3 2013年全球转录组测序市场份额[11]

2.3.2 Illumina公司Solexa Genome Analyzer

相对于454测序,Solexa测序出现较晚,是合成技术的进一步发展和延伸,由基因测序公司Solexa开发。2007年,Illumina公司以6亿美元收购Solexa公司,并推出了成熟的商业产品Genome Analyzer[13]。该技术核心是“DNA簇(DNA clusters)”和“可逆性末端终结(reversible terminator)”,同样采用边合成边测序的原理,同时借助高密度的DNA单分子阵列,使测序成本和效率均有了较大改善。虽然片段长度较短仍是Solexa技术的瓶颈,但与454技术相比,Solexa测序拥有更高的通量,更低的成本,使其成为第二代测序平台的首选[14]。目前Illumina公司具有涵盖了低、中、高端不同层次的测序产品,2011年年底推出的MiSeq以其性价比高、操作界面友好、数据产出易于分析等特点迅速打入全球市场。其中,Genome Analyzer IIx被称为是全球应用最广、性价比最高、产出最多的测序仪。

2.3.3 ABI公司SOLiD System似,SOLiD系统同样采用了emPCR技术和SBS技术。同时,该系统的创新之处在于应用双碱基编码,因此大大减少了测序带来的错误率,同时可以方便地区分SNP和测序错误[15]。具有较高的序列读取精度和数据输出量是SOLiD系统的主要优势所在,因此相同数据量的测序价格略低于Solexa测序的价格。然而从目前应用来看,SOLiD系统的测序应用范围不及454技术和Solexa技术广泛,主要原因是SOLiD系统没有明显的优势,其读长不及Solexa技术,更比不上454技术,而数据产出也远无法和Solexa技术竞争。

总之,虽然3种技术各具优缺点,但它们都使用了反应信号的实时阅读,即边合成边测序,省去了第一代基因测序中所需要的利用电泳将序列片段分离后观察结果的步骤,降低了测序所需时间和成本(表2)[3]。

2007年,美国ABI公司研发出基于连接测序法(sequencing by ligation) 的SOLid(sequencing by oligonucleotide ligation and detection)测序技术。与454技术类

2.4 转录组学测序技术的发展趋势

高通量测序技术的发展使得以转录组学为代表的功能基因组学得到了前所未有的机遇和发展。以RNA-seq为代表的转录组学测序技术已经显示出了较其他转录组学研究技术巨大的优势,如为物种提供单碱基分辨率的转录组注释、提供全基因组范围的“数字化”基因表达谱、成本比芯片和Sanger测序更低等[16]。但是,不可否认的是,转录组测序技术仍有很多方面有待进一步完善。一是,测序技术的改进和测序费用的进一步降低。前述的三大平台测序过程中仍存在一定的错误率,且读长普遍较短,进行数据拼接时会遇到麻烦。而以单分子测序和纳米孔测序为标志的第三代测序技术将有望改善上述缺陷。第三代测序技术在具有超高通量的同时,也将保证测序片段更长和出错率更低,并将进一步降低测序的成本[17]。因此,基于第三代高通量测序技术的转录组学技术将是未来发展的趋势。二是,测序上游的样品准备。目前的高通量测序技术大多需要较多的样品起始量,同时样品的准备步骤繁琐,需经过加接头、反转、扩增、割胶等多重步骤,这使得有限的生物样品分析受到限制且成本巨大,因此如何对少量样本甚至单细胞进行测序亟待解决[3]。三是,生物信息学分析软件的再开发。转录组学测序技术带来了海量的数据,如何将海量的数据转化为有用的数据也将是转录组学研究的一个重要挑战[18]。

表2 主要高通量测序平台比较[3]

3 转录组学测序技术市场发展的现状与趋势

3.1 转录组学测序技术市场潜力巨大

美国市场研究公司Grand View Research发布的报告显示[19],2014年全球转录组学技术市场(包括微阵列技术市场、PCR技术市场、基因调控技术市场以及下一代测序技术市场)为22亿美元,预计到2022年,这一数字将达到69.8亿美元。报告还揭示,推动该市场发展的主导因素包括药物制造商与用户对个性化药物的追求以及对精准医学的追求等。如美国Cofactor Genomics公司的首席执行官J. Glasscock表示,公司约80%的工作是与大型制药企业合作,利用转录组学技术开发药物靶标、疾病生物标志物以及确定药物的不良反应等[20]。

同时,Grand View Research的报告还揭示[19],个性化医疗以及基因检测等需求的增长、个人及政府对药物研究投资的增加也是促进转录组学市场发展的重要因素。此外,致癌物质以及遗传变异等因素导致慢性疾病(肝炎、糖尿病、癌症等)发病率的上升,也是另一个推动转录组学市场增长的因素。

3.2 基于NGS的转录组测序技术将成为市场驱动力

2017年,全球第二大市场研究咨询机构MarketsandMarkets™发布的最新报告显示[21],预计到2020年,全球以RNA-seq为代表的转录组学测序市场将从2017年的10.5亿美元达到26.5亿美元,年复合增长率预计在20.2%左右。RNA-seq产品相比于微阵列技术的技术优势、功能基因组学研究活动数量的增加以及个性化医药快速增长的市场需求是促进转录组学市场增长的关键因素。另一方面,该报告还指出,诊断测试中技术专业人员的缺乏以及RNA-seq技术的标准化问题是限制该市场增长的瓶颈。

3.3 北美地区仍是目前全球最大的转录组测序市场

2016年,北美地区转录组测序市场占全球主导份额,其次是欧洲地区。促进北美市场发展的主要驱动力是政府在基因组研究方面提供的大量资金支持、RNA-seq产品的技术进步、目标疾病流行率的增加、癌症和遗传性稀有疾病的研究,以及有大量的转录组测序主要参与者[19]。如报告指出[21],以RNA-seq为例,全球该市场前十位的参与者中,有一半是位于美国的公司,如Illumina、Thermo Fisher Scienti fi c、Paci fi c Biosciences、PerkinElmer和Agilent Technologies,其余公司包括QIAGEN N. V.(德国)、华大基因(BGI,中国)、Oxford Nanopore (英国)、GATC Biotech AG(德国)以及Roche(瑞士)。

此外,报告还指出,亚太地区预计在2017~2022年将会成为转录组测序发展增长最快的市场[19]。与其他地区相比,亚太地区人口众多,来自中国、印度等新兴市场的研发活动日益增强,同时RNA-seq应用范围的扩大,以及测序技术成本整体的降低,巨大的人口基数和不断递增的医疗需求,均是促进亚太地区转录组测序市场快速发展的重要因素。

3.4 转录组学测序技术市场竞争激烈

整体而言,目前转录组测序市场的特点是竞争激烈,以及创新产品世代更迭快。如自2005年以来,Roche、Illumina、Life Tech(现已归属Thermo Fisher Scientific公司)等公司相继推出或改良第二代测序的新技术、新仪器和新平台(图4)[11]。除了第二代测序技术的不断更新与发展外,新一代和第三代测序技术与产品也在不断被发明和完善中。Helicos Biosciences的HeliScope单分子测序技术、Pacific Biosciences的SMRT测序技术和Oxford Nanopore的纳米孔单分子测序技术等正逐渐进入商业应用领域。2014年6月,Roche公司收购了Genia Technologies公司,以增强其使用纳米孔技术的测序平台功能[19]。2016年12月,Oxford Nanopore公司向少数研究人员推出了直接的RNA测序试剂盒。目前,新的测序技术还在不断被发明,每项技术都有超过前代产品的特色。而低成本、低耗时、高通量是未来的发展趋势,随着序列技术的发展,其用途也将更加广泛。

图 4 第二代测序平台的发展

[1] WANG Z,GERSTEIN M,SNYDER M. RNA-Seq:a revolutionary tool for transcriptomics[J]. Nature Reviews Genetics,2009,10(1):57-63.

[2] LOCKHART D J,WINZELER E A. Genomics,gene expression and DNA arrays[J]. Nature,2000,405(6788):827-836.

[3] 祁云霞,刘永斌,荣威恒. 转录组研究新技术:RNA-Seq及其应用[J]. 遗传,2011,33(11):1191-1202.

[4] 上海证券研究所. 基因测序技术:精准医疗之基石[R]. 上海:上海证券研究所,2016.

[5] 解增言,林俊华,谭军,等. DNA测序技术的发展历史与最新进展[J]. 生物技术通报,2010,8:64-70.

[6] 东吴证券研究所. 基因测序行业分析——“这里的黎明静悄悄”[R]. 苏州:东吴证券研究所,2015.

[7] 长城证券. 基因测序龙头,解读生命密码[R]. 深圳:长城证券,2017.

[8] 罗辉,叶华,肖世俊,等. 转录组学技术在水产动物研究中的运用[J]. 水产学报,2015,39(4):598-607.

[9] 王曦,汪小我,王立坤,等. 新一代高通量RNA测序数据的处理与分析[J]. 生物化学与生物物理进展,2010,37(8):834-846.

[10] 周晓光,任鲁风,李运涛,等. 下一代测序技术:技术回顾与展望[J]. 中国科学:生命科学,2010,40(1):23-37.

[11] 中银国际证券有限责任公司. 二代测序技术——精准医疗先行者[R]. 上海:中银国际证券有限责任公司,2015.

[12] RONAGHI M,KARAMOHAMED S,PETTERSSON B,et al. Real-time DNA sequencing using detection of pyrophosphate release[J]. Analytical Biochemistry,1996,242(1):84-89.

[13] 田李,张颖,赵云峰. 新一代测序技术的发展和应用[J]. 生物技术通报,2015,31(11):1-8.

[14] 杨晓玲,施苏华,唐恬. 新一代测序技术的发展及应用前景[J]. 生物技术通报,2010,10:76-81.

[15] 何彪,涂长春. 下一代测序技术的应用及展望[C]// 中国畜牧兽医学会家畜传染病学分会全国会员代表大会暨第十五次学术研讨会,2013.

[16] 洪奇阳,毕行建,王大宁,等. 转录组测序技术研究进展[J]. 中国生化药物杂志,2017,37(6):443-448.

[17] 李小白,向林,罗洁,等. 转录组测序(RNA-seq)策略及其数据在分子标记开发上的应用[J]. 中国细胞生物学学报,2013,35(5):720-726,740.

[18] 张春兰,秦孜娟,王桂芝,等. 转录组与RNA-Seq技术[J]. 生物技术通报,2012,12:51-56.

[19] Grand View Research,Inc. Transcriptomics technologies market analysis by technology(microarray,PCR,gene regulation,next generation sequencing),by application(clinical diagnostics,drug discovery & research,bioinformatics,comparative transcriptomics)and segment forecasts to 2022[R]. San Francisco,CA:Grand View Research,Inc.,2015.

[20] TACHIBANA C. Transcriptomics today:microarrays,RNA-seq,and more[J]. Science,2015,349(6247):544-546.

[21] MarketsandMarkets Research Private Ltd. NGS-based RNA-seq market by products & services(sample preparation,consumables,bioinformatics),technology(SBS,SMRT),application(de novo,transcriptome epigenetics,small RNA),end user(research centers,biopharma companies)- global forecast to 2022[R]. Pune:MarketsandMarkets Research Private Ltd.,2017.

Application and market analysis of transcriptomic sequencing technologies

WANG Yue,MAO Kaiyun,WANG Hengzhe,MA Zhengyuan
Shanghai Information Center for Life Sciences, CAS, Shanghai 200031, China

Transcriptomics is one of the important part of functional genomics, which is the study of the transcriptome—the complete set of RNA transcripts that are produced by the genome, under specificcircumstances or in a specific cell—using high-throughput methods. With the development of modern molecular technologies and high-throughput technologies, sequencing technologies such as RNA-seq have become increasingly important and indispensable in transcriptomic research. This paper made a research on the development of application, the market size and trends of transcriptomic sequencing technologies. We expect this paper provides an information and perspective of future development for related research and policy-making.

transcriptomics; high throughput sequencing; RNA-seq; market analysis

10.3969/j.issn.1674-0319.2017.05.002

王跃,硕士,助理馆员。主要从事生物医药、生物技术、生物制造等生物产业各子领域的产业与技术情报研究。E-mail:wangyue2016@sibs.ac.cn

猜你喜欢
高通量组学测序
影像组学在肾上腺肿瘤中的研究进展
东莨菪碱中毒大鼠的代谢组学
外显子组测序助力产前诊断胎儿骨骼发育不良
高通量血液透析临床研究进展
Ka频段高通量卫星在铁路通信中的应用探讨
中草药DNA条形码高通量基因测序一体机验收会在京召开
基因测序技术研究进展
外显子组测序助力产前诊断胎儿骨骼发育不良
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
中国通信卫星开启高通量时代