易珏
大数据将提升基因产业化水平,然后产业化还受政策、法规、准入标准、大众认知等多种因素的影响。
行行都谈大数据已经不是什么稀奇事。当下,全球已进入了大数据、物联网和云计算时代。《大数据》一书的作者涂子沛曾经告诉《中国经济信息》记者:“大数据时代是从信息社会迈向知识社会、智能社会的时代。机器和互联网将更了解个体。”而这样的趋势便是凯文?凯利所谓的“量化你自己”。
大数据将提升决策的智能化水平,并为社会管理和民生服务创造显著的社会效应。而当生命科学遇到大数据,是否同样在人类健康产业产生革命性的成果?
“基因本身就是大数据、大科学、大产业。每个人体内所携带的基因信息,比全世界数据的总和还多。当下的世界,出生缺陷,肿瘤,心脑血管病影响着80%人类的健康和生死,如果我们将基因技术与大数据技术相结合,推进生物医药跨越发展,就能真正地造福人类。”华大基因董事长汪建在7月举行的生态文明贵阳国际论坛年会上表示。
华大基因旗下有科技、健康、农业、信息等四大块资产。在年初放出华大基因旗下的科技和健康版块可能上市募资的消息,从全国各地慕名而来的投行不下百家,而汪建的强势同样让投行们唏嘘不已。汪建的强势或许是性格使然,但更多来自于他对基因产业化路径的坚持。
“兴义模式”
《中国经济信息》:以往华大基因见诸报端的多是在东部省份,这次进入贵州的是什么项目?为何考虑进入贵州?
汪建:是以基因组研究为基础的民生及生物经济项目。贵州黔西南州具有独特的地理优势及丰富的自然资源,独特的气候资源利于健康产业发展;区域的生物及民族多样性,是疾病研究的资源宝库;保护好山水资源,走全新的生物资源开发模式,对黔西南未来发展具有特殊意义;以华大基因逐步建立的基因组大数据为基础,借助以基因技术为平台的大科学(发现并坚定致病基因)手段,发展大健康产业,建设医学健康服务业集聚区,创新驱动进一步建设民生服务集聚区,这有可能成为黔西南实现生物经济跨越发展的重要路径。华大将尽最大努力把贵州兴义做成华大基因在全国经济欠发达地区快速发展的典范,做出兴义模式,最大程度彰显以基因组研究为基础的生物经济在经济社会发展中的推动力。
《中国经济信息》:2014年,华大基因计划开展了一系列针对罕见病的“科技公益”项目,这些项目的初衷是什么?
汪建:“基因科技造福人类”是华大基因的愿景。为了将更多的基因组学科研成果应用于医学检测领域,让市民进一步了解基因和健康的关系,提高社会对罕见病患者群体的关注,真正实现用科技造福罕见病患者。华大基因开展了一系列针对罕见病的“科技公益”项目。
华大基因一直致力用基因技术造福人类,其基因技术已被证实可以用于遗传疾病的检测,对预防出生缺陷有重要意义。华大基因现在已经可以通过单基因遗传病检测技术,检测10大系统中的336种基因遗传病,包括650种疾病亚型,1000多个基因,贯穿生命孕育、出生、成长、衰老等全过程。
最近,国家食品药品监督管理总局(CFDA)首次批准第二代基因测序诊断产品上市,华大基因成为CFDA批准的首个高通量测序诊断产品提供机构。基于此,华大基因计划开展了一系列针对罕见病的“科技公益”项目,包括面向粘多糖病患者的“子琪计划”,面向地中海贫血的“春叔计划”和面向鱼鳞病的“晓明计划”等。
基因产业提速
《中国经济信息》:大数据在生物基因领域的运用主要有哪些?
汪建:大数据时代,数据已经渗入各行各业,颠覆了科学界的传统研究模式,促使“低效率、假设性”的传统研究终将向“大数据驱动的高效研究”转变。目前,大数据在生物基因领域的运用主要有:医学(个体化医疗)、农业(计算机育种)等。
首先,在医学(个体化医疗)领域,个体化医疗就像摩尔定律改变了计算机并进而影响整个人类社会的生活一样,基组学也将彻底改变医学。低效率、实验性的医学将很快发展成为由遗传数据驱动的医学。诊断、预后、治疗,以及更为重要的预防都将根据个体的遗传及表型信息而改变。比如,癌症的个体化治疗。如果一位病人得了肿瘤,进入化疗、放疗环节,我们要做的是找到癌症基因和药物敏感的相关性。那么就要迅速地检测出癌症的基因,再采用计算机进行快速分析。
其次,农业(计算机育种)领域,通过计算机对数以百万的基因突变进行信息处理,找到与优良性状相关的靶向基因,去掉不利突变,加强有利突变,实现快速、高效分子育种。这不仅有利于优良性状的筛选,同时也大大缩短了育种周期,有利于解决全球粮食危机难题。
华大基因在5月份公布了3000株水稻的全基因组数据,这是植物学上有史以来最大的数据。每个水稻品种不一样,口感、产量、品质也不一样,他们跟基因的关系是什么?要选择哪一种水稻作为生产水稻?要想回答这两个问题,就要通过大型的计算来比较。然而,这3000株水稻的对比是一个海量、天量的计算,目前世界上还没有哪个国家做过这样大型的计算。
《中国经济信息》:华大基因对外一直在说自己有全球领先的数据分析能力,这种能力的保障来源是什么?
汪建:能力保障来源于超级计算机、华大基因数据处理中心及华大基因核心的生物信息分析团队。
以数据为驱动力的研究正引发现代生命科学领域的巨大变革。华大基因对海量生物信息数据的处理、分析和解读能力,是其跻身国际基因组领域一流研究机构的关键要素,这种优势使其越来越难以复制和替代。全球顶尖科研机构和企业都通过与华大基因的合作来强化自身在组学领域的能力,加速自身的研发进度,以便将相关科学发现、新技术更快地推向产业化。
《中国经济信息》:下一步华大基因如何在业务领域推进大数据?
汪建:华大基因下一步将加强与国家超算中心的合作及积极开展百万基因组计划等推进大数据。
华大基因次此前分别与国家超级计算天津中心、广州中心签订战略合作协议,依托国家超级计算中心共同打造国际领先的基因数据计算及研发基地;广州超算先导系统从当日起开始运行,计算能力达到每秒340万亿次,预计2015年后,广州斥资24亿元研发的“天河二号”完成后,其计算能力将达到每秒10亿亿次。
市场化掣肘
《中国经济信息》:华大基因一直在提生命科学的产业化模式,目前来看,华大基因的产业化发展到哪一步了?
汪建:华大基因发展四部曲,科研服务、科技服务、医学服务、人人服务。华大基因走到第二步,第三步正在加速。
《中国经济信息》:2010年您曾经在接受采访时提出,要在2013年实现1000美元的基因测序服务,目前看来并没有普遍推向市场。其中的原因是什么?障碍有哪些?
汪建:目前一个人的全基因组测序成本已经可以做到1000美元,但是进行大规模应用及普遍推向市场化还受多种因素的影响,例如政策、法规、准入标准、大众认知等,还需要一段时间。