小麦基因组学研究进展

2018-03-18 21:44刘淑娟张晓军郭慧娟畅志坚乔麟轶
山西农业科学 2018年3期
关键词:多倍体四倍体基因组学

刘淑娟 ,朱 艳 ,张晓军 ,李 欣 ,郭慧娟 ,畅志坚 ,乔麟轶

(1.山西大学生物工程学院,山西太原 030006;2.山西省农业科学院作物科学研究所,作物遗传与分子改良山西省重点实验室,农业部黄土高原作物基因资源与种质创制重点实验室,山西太原 030031)

谷类作物提供了人体每天所需20%的热量和25%的蛋白(www.fao.org/faostat)。其中,小麦是最为重要的粮食作物。异源六倍体小麦的全基因组是由来自3个不同祖先、亲缘关系较近的基因组组成,因此,存在大量同源的3个等位基因(大于85%)。与模式植物拟南芥(基因组大小130~140 Mb)和禾谷类模式植物水稻(基因组大小400 Mb)相比,小麦的基因组较大,为17 Gb。除了在模式体系中需要较小基因组外,基因发现策略的一个重要组成部分依赖于植物的转化效率,这2点使得其在基因组学的研究远落后于水稻和玉米等二倍体作物[1]。随着近年来测序技术和功能基因组学的飞速发展,以及基因组学研究方法的不断改进和完善,为小麦基因组研究创造了机会,因而,小麦基因组学迎来了新的时代。

1 小麦基因组测序进展

多倍体小麦主要有2种类型:四倍体栽培小麦(硬粒小麦,Triticum durum,AABB)和六倍体面包小麦(Triticum aestivum,AABBDD),二者祖先均为四倍体野生二粒小麦。早期野生二粒小麦经驯化成为四倍体栽培小麦,与二倍体粗山羊草(Aegilops tauschii)杂交形成普通小麦[2]。鉴于小麦多倍体物种的同源性,存在于四倍体和六倍体小麦中的基因大部分呈现2~3个功能拷贝,称为“同源”,编码序列间的相似性高达97%。

缺乏完整的参考基因组一直限制着小麦测序的研究进展[3]。最初致力于用long-insert法构建个体染色体BAC文库。随着第2代测序技术的出现,可以对全基因组或单染色体臂进行鸟枪法测序。尽管这是个阶段性成果,但数百万个contigs仍是高度片段化的。自2017年起,公共和私人领域的组装技术有了质的飞跃[4-5],使六倍体小麦“中国春”的参考基因组组装到了其21条染色体上。

小麦的研究领域已进入“后中国春”时代,即实现了对不同小麦品种进行快速且低成本的完整测序和组装。该技术已经用于小麦祖先品种和栽培品种中,已新公布了5个小麦品种:Robigus,Paragon,Claire,Cadenza和Kronos。尽管与中国春相比,这些品种数据库的组装序列较少,但包含了大量的编码蛋白质序列,可对其进行详细的功能分析。2017年小麦基因组研究领域从拥有一个高度片段化的单一参考基因组到拥有一个麦族泛基因组,包括了大麦、小麦和多个祖先种的全基因组数据以及15个四倍体和六倍体小麦品种的重测序数据。

2 小麦基因组功能注释进展

随着小麦参考基因组序列的不断改进,可以对这些序列进行额外的注释,在已测序完成的几个小麦品种中,最初的基因注释侧重于描述小麦启动子区DNA的甲基化模式。这些模式在同源群间大都是保守的,只有少部分存在基因组特异性[6]。RNA测序分析结果也显示,整体上不存在单个基因组优势,尽管在某种细胞类型或某个特异阶段确实观察到一定程度的基因组特异现象。最近发布了一套基于PacBio cDNA reads技术改进的编码蛋白和长非编码RNA的基因注释[4],这将有利于鉴定出那些具有重要农艺性状的完整基因家族。另外,这些注释已被用于比对400多个公共RNA-seq样本数据,从而完善小麦的基因表达图谱[7-8]。

此外,改进的基因组和基因注释[9]为研究选择压力在不同倍性水平下对同源基因的作用提供了可能。这将更好的理解编码和非编码序列(如启动子)的进化过程、表观遗传变化[6]和开放染色质结构[10],进而了解多倍体是如何将各自同源基因组的信息整合后呈现最终的表型。

中国春物理图谱和多个品种重测序数据也为小麦育种提供了新的研究方法。例如,小麦科研人员和育种家已经普遍将单核苷酸多态性标记(SNP)芯片技术用于研究[11],但这些SNP只是基于拼接不完全的短序列开发,并被粗略地定位在很大的基因区域中[12]。而新的物理图谱和多品种重测序数据将使得建立长序列的单倍型成为可能[13]。利用大规模的SNP数据,可以鉴定出与重测序结果一致的基因组区段,而不一致的位点则可以用来预测新的单倍型。例如,2005—2018年英国推广了118个小麦品种,其中69%的品种来源于1个亲本,这个亲本与已经重测序的Cadenza,Robigus和Claire具有相关性。这类结果对于关联分析[14]、图位克隆、基因丢失和结构重排诊断等研究都有很好的促进作用,此外还能确定基因的拷贝数变异,这对于一些重要调节基因(如 VRN-A1,Ppd-B1,CBF等)的功能变异是非常关键的。更重要的是,通过鉴定出目前优良品种中的单倍型,可以据此有针对性的从小麦祖先种和地方种中发掘变异类型。这使得对那些在驯化过程中或20世纪小麦育种早期丢失的单倍型进行选择和评估成为可能[15]。

3 基于NGS的遗传学进展

在模式作物中,已经可以用测序作图的方法对控制质量性状或数量性状的基因进行克隆[16]。而在多倍体小麦中,庞大基因组的测序费用高昂导致近几年一直缺乏一个完整的参考基因组图谱,使得在该领域落后于模式作物。而大部分精力都集中在简化基因组上,研究对象就是那些基于RNA-seq[17-18],DNA捕获[19-20]或测序分型得到的特定序列。这些方法最初被用于自然变异定位,最近则扩展到诱变突变群体中的多态性鉴定。这些基于构建突变群体的方法被统称为“突变基因组学”[21],为在小麦等庞大复杂的基因组中发现变异类型提供了一个新的思路。例如,最早为抗病基因[21-22]开发的外显子捕获平台(主要是抗病基因)已被用于对大量突变体中的DNA进行捕获和测序,从而诊断出目标基因的隐性等位基因。而为了避免那些无法预测的新基因类型还开发了基于染色体的研究方法。这些方法已经在多倍体小麦被证实对那些由单基因控制的功能缺失表型非常有价值,但是对于大部分复杂性状,NGS遗传学可能不具有很高的效率。

4 小麦功能基因组学进展

与二倍体模式物种相比,小麦中一直缺乏反向遗传中用于验证基因功能的材料。这是由于小麦同源群之间序列的高度相似性,隐性等位基因的效应被其他同源群的等位变异所掩盖,缓冲了小麦中正常的自然变异。当然,这种掩盖效应也使小麦获得了比二倍体物种更耐受高突变密度的能力[2]。然而,这种冗余也提供给多倍体小麦一种与二倍体物种相比的高突变密度的持续耐受力。高兰英等[23-24]最近开发了一套用于小麦功能基因组学分析的新材料。他们对2 735份EMS诱导的四倍体小麦(Kronos)突变体和六倍体小麦(Cadenza)突变体材料进行DNA外显子捕获测序,从编码区鉴定出1 000多万个高度可信(P>0.99)的突变位点,平均每个四倍体和六倍体小麦中分别有2 705,5 351个突变位点,然后将66%的突变位点进行了定位。进一步研究发现,大约有3%的突变造成了读码框提前终止或转录本错误剪接,而有38%的突变为错义突变。

除了突变群体以外,基因编辑技术的进步同样为多倍体小麦中基因的缺失验证提供了新途径。WANG等[25]利用类转录激活因子效应核酶技术(Transcription activator-like effector nucleases,TALENs)首次同时下调了小麦MLO的3个同源拷贝,从而使植株表现出对白粉病的抗性。随后,他们又运用最新的CRISPR/Cas9技术实现了同样的实验结果。此外,病毒诱导基因沉默技术(virus induced gene silencing,VIGS)[26]和 RNA 干涉技术(RNA-interference,RNAi)也被充分应用在小麦的功能验证中。

5 展望

毫无疑问,目前取得的进展将在未来几年内大大促进小麦研究。目前人们已经可以分离出定位图谱区间内的所有基因序列,并能通过分析数百个RNA-seq样本来验证这些序列的表达模式,还能比对基因在不同品种间的序列差异来确定单倍型,甚至可以在几天内通过筛选突变体库来验证功能。这些进展有助于快速、准确地检测小麦品种资源所携带的基因,并将用于抗病、优质小麦品种和遗传材料的选育,可大大加快育种步伐[11]。面对不断更新的基因组数据和资源,需要科研人员和育种家加强学科交流,有效地将基因组学与大田育种相结合,从而更快更好的将小麦科研的最新成果尽快转化为农民和消费者需要的优良小麦品种。

[1]代君丽,李振岐.小麦的比较基因组学和功能基因组学[J].西北植物学报,2004,24(5):949-953.

[2] DUBCOVSKY J,DVORAK J.Genome plasticity a key factor in the success of polyploid wheat under domestication [J].Science,2007,316:1862-1866.

[3]凌宏清.小麦及其近缘种基因组测序研究进展与发展趋势[J].麦类作物学报,2016,36(4):397-403.

[4]CLAVIJO B J,VENTURINI L,SCHUDOMA C,et al.An improved assembly and annotation of the allohexaploid wheat genome identifies complete families of agronomic genes and provides genomic evidence for chromosomal translocations [J].Genome Research,2017,27(5):885.

[5]POZNIAK C.IWGSC whole genome shotgun sequencing of Chinese Spring:towards a reference sequence of wheat[C]//Plant and animal genome XXIV.San Diego:The International Wheat Genome SequencingConsortium,2016.

[6]GARDINER L J,QUINTON M,OLOHAN L,et al.A genome-wide survey of DNA methylation in hexaploid wheat[J].Genome Biol,2015,16:273.

[7] BORRILL P,RAMIREZ R,UAUY C.expVIP:a customizable RNA-seq data analysis and visualisation platform[J].Plant Physiol,2016,170:2172-2186.

[8] PEARCE S,VAZQUEZ H,HERIN S Y,et al.WheatExp:an RNA-seq expression database for polyploid wheat[J].BMC Plant Biol,2015,15:299.

[9]王长彪,韩斌,刘江,等.小麦相关功能基因的全基因组电子定位及基因注释[J].山西农业科学,2016,44(7):894-899.

[10] RODGERS E,VERA D L,BASS H W,et al.Open chromatin reveals the functional maize genome[J].Proc Natl Acad Sci USA,2016,113:3177-3184.

[11]韩斌,王长彪,任永康,等.小麦分子育种研究进展IV.小麦相关分子标记[J].山西农业科学,2015,43(4):489-492.

[12] MASCHER M,MUEHLBAUER G J,ROKHSAR D S,et al.Anchoring and ordering NGS contig assemblies by population sequencing(POPSEQ)[J].Plant J,2013,76:718-727.

[13] JORDAN K W,WANG S,LUN Y,et al.A haplotype map of allohexaploid wheat reveals distinct patterns of selection on homoeologous genomes[J].Genome Biol,2015,16:48.

[14]HUANG X,HAN B.Natural variations and genome-wide association studies in crop plants[J].Annu Rev Plant Biol,2014,65:531-551.

[15]UAUY C,DISTELFELD A,FAHIMA T,et al.A NAC gene regulating senescence improves grain protein,zinc,andiron content in wheat[J].Science,2006,314:1298-1301.

[16]SCHNEEBERGER K.Using next-generation sequencing to isolate mutant genes from forward genetic screens[J].Nat Rev Genet,2014,15:662-676.

[17] RAMIREZ R H,SEGOVIA V,BIRD N,et al.RNA-Seq bulked segregant analysis enables the identification of high-resolution genetic markers for breedingin hexaploid wheat[J].Plant Biotechnol J,2015,13:613-624.

[18]TRICKM,ADAMSKI NM,MUGFORDSG,et al.CombiningSNP discoveryfromnext-generation sequencingdata with bulked segregant analysis(BSA)tofine-map genes in polyploid wheat[J].BMC Plant Biol,2012,12:14.

[19] GARDINERLJ,BANSEPTP,OLOHANL,etal.Map-ping-by-sequencing in complex polyploid genomes using genic sequence capture:a case study to map yellow rust resistance in hexaploid wheat[J].Plant J,2016,87:403-419.

[20]KING R,BIRD N,RAMIREZ R,et al.Mutation scanning in wheat by exon capture and next-generation sequencing[J].PLoS One,2015,10:e0137549.

[21] STEUERNAGEL B,PERIYANNAN S K,HERNANDEZ I,et al.Rapid cloning of disease-resistance genes in plants using mutagenesis and sequence capture [J].Nat Biotechnol,2016,34:652-655.

[22] JUPE F,WITEK K,VERWEIJ W,et al.Resistance gene enrichment sequencing(RenSeq)enables reannotation of the NB-LRR gene family from sequenced plant genomes and rapid mapping of resistance loci in segregating populations[J].Plant J,2013,76:530-544.

[23]高兰英,马庆.诱发突变技术在小麦育种研究中的应用[J].山西农业科学,2009,37(6):7-12.

[24] KRASILEVA KV,VASQUEZ H,HOWELL T,et al.Uncovering hidden variation in polyploid wheat[J].Proc Natl Acad Sci USA,2017,114:912-913.

[25]WANGY,CHENGX,SHANQ,et al.Simultaneous editingofthree homoeoalleles in hexaploid bread wheat confers heritable resistance topowderymildew[J].Nat Biotechnol,2014,32:947-951.

[26]张鹏钰,袁珍,王国瑞,等.普通小麦Trx59基因的克隆及功能验证[J].华北农学报,2017,32(5):1-6.

猜你喜欢
多倍体四倍体基因组学
小果型西瓜四倍体诱变及其鉴定分析
“富硒多倍体蒲公英新品系”在太谷区试种成功
山西在谷子功能基因组学研究领域取得重大突破
肝细胞多倍体发生机制及其与肝细胞癌形成的相关性研究进展
新疆和西藏少数民族的群体基因组学研究
系统基因组学解码反刍动物的演化
四倍体泡桐育苗高效管理技术综述
多倍体巨细胞产生新的肿瘤细胞:肿瘤化疗拮抗及复发的关键因素
四倍体巴戟天根的结构与其蒽醌类化合物的关系
华法林出血并发症相关药物基因组学研究进展