基因编辑技术的研究进展

2018-01-04 10:29邵任
中国科技纵横 2017年22期
关键词:核酸酶锌指外源

邵任

摘 要:传统以同源重组为技术基础的基因打靶技术的效率很低,基因编辑技术能对基因组进行定点的精确改造, ZFN、TALENs、CRISPR/Cas 9三项基因编辑技术的发展,使得基因编辑的使用成本降低,应用范围更广。

关键词:基因编辑;ZFN;TALEN;CRISPR/Cas 9

中图分类号:Q819 文献标识码:A 文章编号:1671-2064(2017)22-0217-03

现在基因编辑技术主要是通过能特异性识别DNA序列的核酸酶对DNA进行切割,产生DSB(double-strand break),接着通过非同源末端链接机制(non-homologous end joining,NHEJ)或者同源重组修复机制(homology-directed repair,HDR)来修复断裂的DNA位点。如图1所示,当存在外源的同源DNA时,HDR会导致单个或者多个转基因的引入来矫正或者替换已经存在的基因,不存在外源同源序列时,基因组的修复过程仍然会产生突变。当不存在外源的同源基因时,NHEJ介导的修复在目的基因处会产生小的插入或者缺失突变,当有外源模板存在时,外源DNA能借此插入到断裂序列中最长可达14Kb。

1 ZFN技術

1983年在非洲爪蟾中第一次发现转录因子TFⅢA。锌指结构是一个必须依赖Zn+存在的四面体结构,该四面体是由多个Cys或者是His与锌离子鳌合组成。1993年Desjarlaris和Berg等得到能够识别特定DNA位点的锌指蛋白。1996年Kin和Cha等的研究表明,将锌指蛋白与内切酶Fox Ⅰ中的无特异性DNA清楚结构域连接,可以组合成锌指嵌合核酸酶。其后通过无数科学家对ZFN的特异性DNA切割功能进行优化和效率提升,使得ZFN在基因编辑中占有重要作用。锌指蛋白锌指核糖核酸酶(ZFN)包含两个结构单元,一个是具有特异性识别DNA序列的DNA识别域,另一个是非特异性识别的核酸内切酶的DNA切割域。DNA识别域是有一系列锌指蛋白motif组成,一个ZFN包含的锌指蛋白motif的个数一般是3~6个,其中每个锌指蛋白特异性地识别并且结合一个三联体碱基。每个锌指蛋白motif由30左右个氨基酸组成,其中保守的氨基酸残基是和锌离子结合的氨基酸残基,它们是4Cys-或者是2Cys2His-。如图2所示。

每个锌指蛋白motif是由一个α螺旋和两个反向的β折叠结构组成,根据每个锌指蛋白motif中α螺旋的第1、3、6位氨基酸残基的不同特异性地识别DNA中三个连续的碱基。所以一个锌指结构单元(通常包含3~6个锌指蛋白)能够特异性得识别18~36bp的双链DNA序列。而具有核酸内切酶功能的DNA切割域来源于ⅡS型核酸内切酶Fox Ⅰ,ⅡS型核酸内切酶具有识别和切割核酸的功能,但是每项功能由不同的结构域来执行,利用该酶的这一特点进行人工改造,保留非特异性的内切酶的功能,将它与人工合成的DNA特异性识别结构域如锌指结构域相连,就产生了具有针对特定的DNA序列进行识别并切割的人工核酸酶ZFN。

ZFN的基因编辑效率相对于传统的同源同组效率来讲有所提高,但也只停留在30%左右。而且由于上下文依赖(即ZFN的各个锌指结构单位单位并不是完全独立的而是存在相互影响)脱靶效应很严重,对细胞而言会产生很大的毒性。加之掌握ZFN关键技术只有少数公司,所以新的一代基因编辑技术应运而生。

2 TALEN技术

Transcription activator-like effectors(TALE)TALEs是自然界本来存在的,1989年第一次发现是在一种植物致病菌黄单胞杆菌属Xanthomonas中。2007年,发现TALE能特异性结合DNA序列。2009年,TALE氨基酸序列与核算靶序列的对应关系被破译。TALE包含的DNA结合结构域由一系列的33到35个氨基酸组成的重复的结构组成,每个结构可以识别一个bp的核酸。TALE能特异性识别DNA能力是有两个高度可变的氨基酸残基决定的,这两个氨基酸被称为RVDs(the repeat-variable diresidues),TALE的DNA结合域的氨基酸序列与其结合的DNA序列之间有着相对恒定的对应关系。

如图3所示,TALE蛋白的第12、13位氨基酸残基的不同的排列组合对应识别不同的核苷酸,NN识别G或者A,HD识别C,NG识别T,NI识别A。和锌指蛋白一样,TALE蛋白可以被连接起来识别连续的DNA序列。然而,与锌指蛋白不一样的是,在构建长的TALAs模块排列时,TALE在理论上具备定位到基因组上的单一位点,无需对模块之间的连接进行改造。而且TALE能对DNA上的单位点进行识别,与锌指蛋白识别DNA上的三联体碱基相比,在设计DNA识别区域是有更大的灵活性。将一系列的TALE蛋白进行组装在一起,在与FolⅠ核酸内切酶进行连接就可以形成具有特异性识别剪切DNA片段的TALEN(Transcription Activation Like Effector Nuclease)。FolⅠ核酸内切酶只有在形成二聚体时才会具有活性。如图3所示,两个TALEN分别位于正反义链上靶标位点,FolⅠ形成二聚体,在spacer处切割DNA。

TALENs技术相对于ZFN提高了基因编辑的效率,且成功率高,设计周期短。但与此同时另外一种更加方便简单的基因编辑技术也正在迅速发展。

3 CRISPR技术

1987年日本学者在大肠杆菌中发现了一些重复序列,这些重复序列被一些序列类似但不同的片段隔开,但当时并不清楚这些序列的意义。到2007年,研究才发现CRISPR/Cas与细菌的获得性免疫有关,而且这种获得性免疫在细菌和古细菌很常见。随后发现CRISPR/Cas系统的组成包含必要的三个部分—trancrRNA,CrRNA和Cas9核酸酶。接下来Jiang等的研究展示了,CRISPR/Cas 9系统发挥作用的具体过程。

CRISPR/Cas 9系统:CPISPR是多个成簇的,规律间隔的短回文重复序列,在细菌和古细菌中提供获得性免疫。CRISPR依赖于crRNA和tracrRNA来进行序列特异性的插入外源基因来进行基因沉默。CRISPR/Cas有三种系统存在,在第Ⅱ种系统中,Cas9作为一种有RNA指导的DNA内切酶来切除DNA。

如图4所示,CRISPR/Cas 9系统工作的原理是,外源的病毒或者质粒侵入细菌中被宿主体内的核酸酶消化成短的DNA片段,部分消化之后的片段被整合到宿主的基因组中,形成了CRISPR基因座中的spacer,spacer之间被序列保守的repeat间隔,附近的cas genes为CRISPR相关基因,CRISPR-Cas表达期,CRISPR阵列转录出crRNA前体以及tracrRNA前体以及cas genes转录翻译产生Cas蛋白。crRNA前体以及tracrRNA前体以部分碱基互补配对的方式形成部分双链RNA而结合在一起,其茎环结构被识别后与Cas9蛋白结合,在RNA酶的作用下,crRNA前体以及tracrRNA前体被切割形成成熟的crRNA和tracrRNA,成熟的crRNA和tracrRNA作为guide RNA与Cas9蛋白作为复合物识别切割外源基因,该复合物寻找PAM位点并识别,Cas9启动其解旋功能,同时guide RNA与目的基因片段互补,Cas9启动切割功能,由Cas9蛋白的N端RuvC核酸酶结构域以及肽链中间的HNH核酸酶结构域共同识别双链DNA并切割。识别在识别外源基因的过程中PAM(proto spacer adjacent motif)序列发挥重要作用,cas9识别的特异性PAM序列为5端的NGG,PAM序列作为细菌识别外源基因的异己标志,是大部分噬菌体基因中带有的序列,通过分子生物学手段了解到,绝大多数人类基因的附近都有GG序列,因此Cas9能识别人类的大多数基因。CRISPR/Cas 9操纵子虽然也有与gRNA配对的序列,但配对序列附近缺乏PAM序列因此能逃脱被CRISPR/Cas 9切割。

根据CRISPR/Cas 9系统的作用机制,可以将CRISPR/Cas 9系统的基本元件导入到真核细胞中,完成对真核细胞中特定基因的双链DNA的切割,激活细胞内的DNA修复机制,造成非3的倍数的碱基的缺失即可敲掉该基因。CRISPR/Cas 9系统的基本元件包括gRNA、Cas9蛋白。人为设计出sgRNA(single guide RNA)替代crRNA-trancrRNA复合体的gRNA, sgRNA是将crRNA、trancrRNA的DNA连接在一起转录出来,转录出来的sgRNA能发生自身碱基配对形成与crRNA-trancrRNA复合体结构相同的部分RNA双链以及茎环结构。sgRNA能结合Cas9蛋白并能结合特定的DNA序列。研究表明,人工设计的sgRNA位于PAM位点上游13的碱基以内不能发生突变,否则切割位点无法识别。Cas9蛋白上的HNH和RuvC两个内切酶同源的结构域,中,HNH结构域特异性切割与CrRNA互补的核酸序列,RuvC结构域则是切割非互补序列,在应用过程中会产生脱靶效应。通过突变RuvC结构域形成只有HNH活性的切割酶,其脱靶率大大降低且切割的效率增加。

目前已经能成功地应用CRISPR/Cas 9系统对斑马鱼、老鼠、线虫、水稻、拟南芥、果蝇、体外培养的人体细胞等进行定点的基因敲除。其敲除方法为,构建可以转录出gRNA的质粒以及可以表达Cas9蛋白的质粒,通过一系列的方法比如转染,注射等导入到细胞体内,对目的基因进行DNA双链切割,切割之后体内的修复机制被启动,根据修复的机制不同以及是否提供DNA供体来对基因进行定点的编辑以及敲除。此外有研究针对Cas9蛋白的两个结构域HNH和RuvC进行相关的点突变,得到dCas9,这种失活的突变体能够结合sgRNA从而识别靶基因,但失去了内切酶的功能,不能对双链DNA进行酶切。dCas9可应用在基因表达调控上,例如设计能特异识别编码区上游的sgRNA,引导dCas9蛋白结合到目的DNA序列上,由于蛋白的空间位阻效应,相关转录调控蛋白无法结合,从而敲低特定的基因。

4 基因编辑的应用前景

基因编辑作为一项迅猛发展的技术,在各个领域都有广阔的应用前景。在基因功能研究、基因治疗上都有很好的应用。基因敲除是实验室研究基因功能的一个常规手段,ZFN已经能在大鼠、果蝇、斑马鱼等模式生物中已经成功地实现了内源基因的定点突变而且或者了稳定遗传的突变体。TALENs技术已经能在斑马鱼、大鼠、水稻、斑马鱼等模式生物中进行了定点突变、置换、删除等操作。已经有研究成功运用TALENs技术定点突变水稻感病基因,提高了水稻的抗病能力以及运用TALENs于酵母以及哺乳动物细胞中。Hockemeyer等用TALENs技术把转基因盒成功插入iPSC的靶位点上。CRISPR/Cas 9技术已经成功得对线虫、果蝇、斑马鱼进行了遗传学改造,获取了表型改变明显的突变体,表明了CRISPR/Cas 9技术在动物基因改造的巨大潜能。在基因治疗方面,运用ZFN技术在成肌细胞中对基因进行移码突变研究杜氏肌营养不良症,在小鼠肝脏细胞中通过敲除基因对乙型肝炎进行研究,在iPSC细胞中对基因进行替换研究帕金森症等等;运用TALEN技术,在iPSC中进行Lys342Glu的点突变来研究代谢性肝病等;运用CRISPR/Cas 9技术在CD4+T中对HIV的LTR区域进行破坏来研究艾滋病等表明基因编辑技术在基因治疗方面有远大的前景。

参考文献

[1]C Wyman,R Kanaar. DNA double-strand break repair: alls well that ends well[J]. Annual Review of Genetics,2006,40(1):363.

[2]D Carroll.Genome engineering with zinc-finger nucleases[J]. Genetics,2011,188:773-782.

[3]MJ Moscou,AJ Bogdanove.A simple cipher governs DNA recognition by TAL Effectors[J].Science,2009,326(5959):1501.

[4]M Christian,T Cermak,EL Doyle,C Schmidt,F Zhang,等.Targeting DNA double-strand breaks with TAL effector nucleases[J].Genetics,2010,186(2):757-761.

[5]F Zhang,L Cong,S Lodato,S Kosuri,GM Church,等.Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription[J].Nature Biotechnology,2011,29(2):149-153.

[6]D Reyon,SQ Tsai,C Khayter,JA Foden,JD Sander,等.FLASH assembly of TALENs for high-throughput genome editing[J].Nature Biotechnology,2012,30(5):460-465.

[7]朱玉昌,鄭小江,胡一兵.基因编辑技术的方法,原理及应用 Methods, Principles and Application of Gene Editing[J].Hans Journal of Biomedicine,2015,5(03):32.

猜你喜欢
核酸酶锌指外源
粘质沙雷氏菌全能核酸酶的研究进展
具有外源输入的船舶横摇运动NARX神经网络预测
锌指蛋白与肝细胞癌的研究进展
C2H2型锌指蛋白在肿瘤基因调控中的研究进展
含季铵盐的芳酰腙配体的铜 (Ⅱ)配合物的合成和表征:体外DNA键合和核酸酶活性
多种Cas12a蛋白变体能识别不同的PAM序列(2020.4.27 Plant Biotechnology Journal)
外源铅胁迫对青稞生长及铅积累的影响
外源钙对干旱胁迫下火棘种子萌发的影响
外源添加皂苷对斑玉蕈生长发育的影响
用megaTAL 核酸酶对原代人T 细胞CCR5 基因座进行有效修饰可建立HIV-1 抵抗力