抓住大数据时代生命科学“会聚研究”机遇

2018-03-07 20:09潘锋
中国医药导报 2018年2期
关键词:生物医学赵国生物学

潘锋

2017年11月2日,中国科学院科技戰略咨询研究院等单位在北京举办“研究前沿:合成生物学专题论坛”,论坛邀请中国科学院院士、中国科学院上海生命科学研究院赵国屏研究员做了题为《合成生物学——工程化的科学研究,“会聚”的创新范式》的主题报告。赵国屏研究员在接受记者采访时表示,合成生物学是一门新兴的交叉学科,其颠覆性的技术创新和工程化研究的概念,不仅让人类“可以像组装机器一样装配新型生命系统”的理想变为可能和现实,更因生命科学研究进入“大数据”时代数据密集型范式的机遇,形成了“会聚研究”的革命态势,为人类追求自身、环境乃至社会健康发展拓展了能力提升的广阔空间。

生命科学的三次革命

赵国屏研究员说,从宇宙的角度看,生物和生命活动所涉及的空间和时间尺度都是那么的“微不足道”;然而从人类的角度看,自然界与自身息息相关的那部分都是“有生命”的,这就是生物学最基本的研究对象。从生物学领域向微观延伸,便是化学所要研究的分子、原子以及物理学所要研究的基本粒子;向宏观延伸,则涵盖了天文学和地学两大学科。与各门学科一样,生物学起步于观测和描述。由于生命现象自身的复杂性,20世纪之前虽然人们在对细胞的形态观察、对遗传的规律认识、对生物进化的概念理解上有所突破,但生物学整体上未能实现向研究其普遍的构成本质及运动规律的“生命科学”的飞跃。20世纪以来,微观层面的生物化学、细胞遗传学、细胞生物学和发育生物学,以及宏观层面的生态学和进化生物学等相继得到发展,推动了生物学从以分类描述为特征的传统科学,向以机制研究为核心的现代生命科学的转变。以此为基础,20世纪中叶以来,生命科学研究在技术、认知和能力方面爆发了三次革命。

赵国屏研究员介绍,生命科学的第一次革命是分子生物学。1953年DNA双螺旋结构的解析,不仅在分子水平上明确了遗传物质,而且迅速确定了DNA自我复制传承遗传信息,和“从DNA到mRNA到蛋白质”的这一遗传“中心法则”。同时,一系列可用于精准操控核酸的酶与载体的发现及其相关转化技术的发明和应用,最终促成了以遗传的中心法则以及DNA重组技术为标志的分子生物学革命,由此极大地推动了人类对生命运动规律的认识。20世纪70年代起,结合对基因表达调控的认识,实现了在一定程度上对生命过程的模拟或改造,形成了以分子生物学技术为基础的新一代生物工程。

生命科学的第二次革命是基因组学。鉴于肯尼迪“向肿瘤宣战”计划的失败,Renato Dulbecco于1986年发表具有历史意义的《肿瘤研究的转折点:人类基因组测序》一文,提出“如果我们想更多地了解肿瘤,从现在起必须关注细胞的基因组”的科学假说,以及“从对人类细胞基因组测序入手”的研究策略,由此启动的人类基因组计划及其成功实施,标志着生命科学第二次革命的到来。这次革命的直接成果是对生命本质的认识从单个基因或单个分子功能层面,上升到了对整个生命体或生命过程整体认知的基因组层面;而对生命科学的研究体系而言,则是引入了除“实验-分析”之外的“数据”,以及与获取数据、分析数据和利用数据相关的一系列“生物信息技术”,并由此形成生物信息学、计算生物学乃至理论生物学等新兴学科。特别值得一提的是,20世纪90年代形成了综合(干)与实验(湿)两类数据,在系统科学“自上而下”分析理念指引下研究生物体和生命运动规律的系统生物学。

生命科学的第三次革命是会聚研究。世纪之交,利用基因元件,在工程学“自下而上”理念指导下,设计并构建基因线路(生物开关、振荡子以及自动调节的负反馈线路)获得成功,标志着工程科学与生命科学的融合,产生了合成生物学。2011年,美国麻省理工大学发布《第三次革命:生命科学、物理科学和工程学的会聚》;2014年,美国国家科学院发布《会聚:促进生命科学、自然科学、工程等领域的跨学科整合》报告。与前两次革命聚焦于技术与知识的颠覆性突破不同,“会聚”革命的核心,则是能力的提升,是人类自身智力、体力乃至整个社会能力的提升。以著名的NBIC来表述:如果认知科学家(Cogno)能够想到它,纳米科学家(Nano)就能够制造它,生物科学家(Bio)就能够使用它,信息科学家(Info)就能够监视和控制它。

赵国屏研究员简要回顾了中国科学家在生命科学发展史的三次革命中曾经作出的贡献。1956年举行的青岛遗传学会议为中国科学家日后迎接分子生物学革命奠定了基础。1958~1965年,中国科学院上海生化所和有机所以及北京大学的生物化学家与有机化学家,共同完成牛胰岛素全人工合成。这不仅是中国科学家在合成科学领域完成的一件领先全球的成果,对分子生物学革命的直接贡献,也体现了中国生命科学家有组织大科学计划的决心和能力。改革开放之后,我国于1992年启动水稻基因组工作。1993年,在谈家桢和吴旻先生支持下,国家自然科学基金委启动“中华民族基因组中若干位点基因结构与功能的研究”,该项目由强伯勤先生和和陈竺先生主持,标志着中国人类基因组研究的起步。中国人类基因组计划的启动不仅有力支撑了中国科学家及时参与了由发达国家启动的大科学计划,同时还保证了中国在生命科学的第二次革命中从“跟跑”步入了“并跑”的地位。

合成生物学带来全新思维和方法

赵国屏研究员说,对合成生物学内涵的理解至今依然是“见仁见智”,但是其核心应该是工程化的生命科学研究,即以创建新生命体系目标为导向的、“自下而上”的在工程学研究理念指导下的生命科学与生物技术研究;以及生命科学研究的工程化,即在生命科学研究中实施基于系统科学的计算与设计,基于合成科学的基因组与生物分子操作,基于计量科学的对生命元件到体系的检测与测试三位一体循环,提升优化的研究模式。

合成生物学以构建“工程化的生命”为目的,为生命科学研究带来了全新的思维、战略和方法,是相对于传统的“格物致知”方法学的一场革命。生命起源、生物进化(演化)、生物体复杂的结构-功能等生命科学前沿问题,有望在“建物致知”理念的引导下取得突破。合成生物学在“生命的工程化”理念指导下,正在颠覆传统的生物工程和代谢工程。在标准化元件模块的基础上,人工设计复杂系统并在人工底盘上实现可重复、可定量、可调控的合成构建。利用“建物致用”理念指引下发展起来的合成生物学技术,有望用于应对人类社会面临的各种挑战,并在医学、制药、化工、能源、材料、农业等领域都有着广阔的应用前景。endprint

赵国屏研究员说,合成生物学的发展,离不开使能技术创新及工程化“工具包”的优化共享。这类颠覆性技术创新和工程平台创新不仅包括对基因组操作及合成构建的“编/写”能力,还包括从生物元件的标准化到从头创制非天然生物分子;当然,更离不开基于系统生物学知识的从元件到通路,从模块到网络,从调控到底盘优化的设计、合成及测试。可见,是工程学与生命科学的融合催生了合成生物学,而合成生物学的发展又促进了物理学、化学、纳米科学、信息科学等一系列学科与生命科学的融合乃至它们之间的相互融合。这种“融合”已超越了原先意义上“学科交叉”的范畴,而是科学、技术、工程乃至自然科学与社会科学的“会聚”。

大数据时代的

生命科学“会聚研究”

赵国屏研究员说,“会聚研究”革命是科学史上源于学科交叉、高于学科交叉,真正以研究能力提升为导向的突破。这一革命得以出现的科学技术前提,除了以合成化学为代表的合成科学外,最主要的是在分子生物学和基因组学两次革命基础上建立起来的使能技术和检测技术(包括大规模测序技术)的突破,以及系统生物学知识的极大丰富。从本质上说,首先是基因组学革命成功地在生命科学的研究体系中引入了“数据”这一重要的组分,进一步会聚物理、化学、信息、计量、计算等科学及相关工程技术的创新,生命科学数据便迅速地提升到了大数据层级,即EB级(如果结合医学,则正在向ZB级发展)。这也意味着生命科学研究正在从传统的实验科学范式,迅速跨越尚欠成熟的“理论科学”和“计算科学”阶段,进入到了“数据密集型科学”的“第四范式”。

赵国屏研究员说,在高技术转化成工程化平台服务和大数据的开源共享两大推手的助力下,“会聚”所提升的人类研究能力可能形成生命科学研究民主化的趋势,其雏形从现在已经比较常见的“众包”场景中已可窥见一斑。可以预见的是,在不远的将来,越来越多的青年科学工作者虽然拥有的资源不多,但只要具有一定科学基础的创新思想火花,都有可能在公益性的技术和信息共享的平台上验证思路并进一步开展研究和转化成果。

同时,转化型研究将成为生命科学研究一个最主要的平台。转化型研究不仅仅是传统意义上的科研成果的产业化,还体现于医学与生命科学的紧密结合,因此也常被称之为“转化医学”,它强调的是以人为研究的直接对象,将临床问题转化为实验室课题,将实验室研究成果及时在临床验证或应用的实践。转化医学为在“组学”基础上形成的系统生物医学研究体系搭建起了与临床结合的平台,它将大批生命科学家的眼光从“象牙塔式”的实验室转向临床需求,同时也让医学“无缝”对接科学,培养出一批研究型医生。利用转化医学平台可以有效提高生物医学大数据的获取、共享及挖掘分析能力,使研究人员有可能在临床实践中随时随地把转化医学的成果直接服务于患者,实现“精准医疗”。在大数据时代,人们已经有可能更迅捷、更精准地把生物医学的数据提取成信息,把信息转化为知识,再把知识转化为医生的智慧和健康医疗机构的工程,开辟了以4P(个体化personalized、干预preemptive、预测predictive、参与participitory)为特征的转化医学实践。

夯实生物医学大数据基础

赵国屏研究员认为,生物医学大数据超越了传统意义上大数据的四V特征(速度Velocity、体量Volume、种类Variety、真性Veracity),不仅速度更快、体量更大,其“状态”的复杂性远超物理、天地乃至工程等各种非人文学科,从根本上说是由生物医学研究对象在时空轴上定位的高度复杂性所决定的。

一方面,这种多层次的时空范畴,各有其特征性的运动规律,尚不能用统一的数学模型利用计算科学的方法加以确切的描述;另一方面,即便在同一时空层次上,由于生命活动的特殊性,物质与物质运动的规律依然呈现多维转换的复杂性和交错混合的非结构性。所幸的是,生命科学研究数据,无论是基础科研的实验数据还是组学和系统合成生物学的研究数据,一般都是在设计的试验下形成的,大多经过重复验证或/和互相旁证,因而具有较好的结构性且内涵丰富,可以与多层次的数据在一定标准下交互使用;而以动物实验为基础的比较医学和以队列研究、流行病学研究、药物临床研究和循证医学研究等为基础的转化医学研究,也大多是经过设计,有对照、有质控的高质量结构化数据,这些数据组成了生物医学大数据的质量“脊柱”。

生物医学大数据的“真态”即保证数据的可信性也有其特殊性,特别是对于来自临床和自然人群的数据,即所谓的“真实世界(real-world)”数据,不仅数量巨大,而且基本上是人自身的数据。虽然人是生物医学研究很好的研究对象和最终的服务对象,但是来自人“自述”的数据往往带有人文乃至社会学科的特征,因此,必须做好数据采集的规范化和数据本身的标准化,尽可能保证其真实性或采用适当的技术,排除不真实有偏见的数据。由此可见,为了真正发挥生物医学大数据的作用,必须克服现时数据无汇交机制,存储碎片化;管理分散,无安全保障;无标准化质控,难有效共享;资源无规模,难形成有效知识等局限。因此,有必要并且急需建立统一的、有规模、有权威的国家生物医学大数据基础设施,集中精力做好安全、优质、高效整合与公平共享的服务工作。

赵国屏研究员介绍,经过20多年的努力,与人类基因组研究并行,我国在生命科学和生物技术平台建设方面已经奠定了相当的基础,其中一个典型的成功范例就是上海张江高科技园区。该园区规划于20世纪80年代,始建于1992年7月。25年来,坚守发展信息技术(IT)和生物技术(BT)的“初心”,已建起了一批产生生物医学大数据的、从人类基因组等生命“组学”到药物研发及临床转化的研发机构。今天的张江,已经具备了建设生物医学大数据基础设施的一切条件;而这一设施的建设,也必定是保证将张江建成国家自主创新示范区,支撑上海建设具有全球影响力的科技创新中心的决定性部署。

赵国屏研究员认为,抓住大数据时代生命科学“会聚研究”第三次革命的机遇,及时建立国家生物医学大数据基础设施及相应的数据服务体系,扎扎实实承担起符合大数据时代形势的数据积累、数据提升的基础性工作,实现数据的安全、优质、高效整合与公平共享,是我国在生物医学领域实施“弯道超车”战略的一大机遇,机不可失,时不再来,必须团结起来,积极行动起来,以优异的创新成果为人类健康科学事业做出新的贡献。

专家简介

赵国屏,中国科学院院士、中科院上海植物生理生态研究所研究员,分子微生物学家。现任中科院上海生科院生物医学大数据中心首席科学家,中国科学院合成生物学重点实验室专家委員会主任,国家人类基因组南方研究中心上海市疾病与健康基因组重点实验室主任,复旦大学生命科学学院微生物学和微生物工程系主任;兼任中国生物工程学会理事,上海生物工程学会理事长。曾任中国微生物学会理事长、名誉理事长。近年来积极开拓系统合成生物学研究领域,在微生物代谢调控研究方面做出了开创性工作;参与组建和/或领导了一系列生物技术企业、中科院研究院所、国家及上海研究中心和工程研究中心,不断探索科技体系运行模式、科研机构体制机制、科研成果转化和科技企业建设等方面的改革创新。endprint

猜你喜欢
生物医学赵国生物学
刍议“生物医学作为文化”的研究进路——兼论《作为文化的生物医学》
灵长类生物医学前沿探索中的伦理思考
希望在肩上
谷稗的生物学特性和栽培技术
初中生物学纠错本的建立与使用
初中生物学纠错本的建立与使用
国外生物医学文献获取的技术工具:述评与启示
师与书·赵国华
古法奇观
LED光源在生物医学中的应用分析