百合属5种植物的比较转录组分析

2021-04-19 08:36赵雪艳李思锋柏国清李为民
植物研究 2021年4期
关键词:细叶野百合同源

赵雪艳 李思锋 柏国清 李为民

(陕西省西安植物园,陕西省植物研究所,陕西省植物资源保护与利用工程技术研究中心,西安 710061)

百合属(Lilium)是百合科(Liliaceae)百合族(Lilieae)中一个具有重要经济价值和系统发育研究意义的属。百合是多年生的球根类草本植物,许多百合种和品种花姿百态、芳香怡人、花色丰富,是世界上十大切花之一,也是盆栽、园林绿化和点缀庭院的名贵花卉[1],有关花发育相关基因的研究具有重要的意义。另外,百合中含有丰富的营养物质,如蛋白质、淀粉、葡甘露聚糖和膳食纤维等,同时也含有多种生物活性化合物,可食用有的种亦可药用,具有较好的开发利用价值和发开前景[2]。

全球百合属植物大约有110种,我国野生百合资源最为丰富,是百合属植物的分布中心之一,约有55 种18 变种,其中35 种15 变种为我国特有种。细叶百合(L.pumilium)又名山丹,其花下垂,花被片反卷,无斑点或有少数,花朵娇艳,是著名的野生药用植物,并具极高的观赏价值,是重要的观赏性花卉。细叶百合在寒冷的条件下可以越冬,是百合抗性育种的重要亲本[3]。中国药典规定药材百合的来源为百合科百合属植物百合(L. brownii var.viridulum)或细叶百合的肉质鳞叶。具有养阴润肺,清心安神的功效。主治阴虚燥咳,劳嗽咳血,阴虚有热之失眠心悸及百合病心肺阴虚内热证[4]。然而,张卫等通过系统的本草考证研究认为百合科植物野百合(L.brownie)及其变种百合为中国古代药用百合的正品[5]。卷丹(L.lancifolium)是我国药食兼用百合品种,具有适应性强、抗病和耐寒等优势,可在百合病害高发地区推广种植[6]。川百合(L. davidii)花色艳丽,橙黄色且有紫黑色斑点,花被片极度反卷,其鳞茎可食用,具有优良的观赏价值和较好的食用价值,并且其抗病性强,是良好的抗性育种材料[7]。野百合是我国特有种,花型大而美丽,较好的抗逆性与观赏利用价值。本团队前期采用高通量测序技术平台对野百合进行转录组测序,经过组装共获得47 605个unigenes。

不同物种之间的比较转录组研究可以用于快速进化基因以及适应性相关基因的研究。Ai等对11 种报春苣苔属植物进行比较转录组学分析,研究了11 种报春苣苔属植物的系统进化、亲缘关系及适应性相关基因[8]。并且对牛耳朵和黄花牛耳朵的比较转录组分析,研究两个物种在岩溶环境中的分子适应机制,寻找出与岩溶环境适应有关的19 对功能基因[9]。赵建花通过对地黄属5 个种的转录组数据分析研究地黄属植物5 个物种间的系统亲缘关系,发现二倍体裂叶地黄处在地黄属的基部,二倍体天目地黄和湖北地黄构成姐妹类群,四倍体地黄和茄叶地黄聚成姐妹类群[10]。目前,对百合属植物的研究主要集中在品种培育、繁殖技术、栽培、化学成分以及资源保护方面。目前只有少数关于百合遗传结构和系统进化方面的研究[11~13]。传统的分类学研究方法很难解决百合属物种间的系统发育问题,揭示百合属物种在进化过程中基因组结构是否发生变化、种间基因流的变化规律、潜在的选择作用等需要基因组层面的研究。本文通过对秦岭地区的百合属4个物种(细叶百合、川百合、卷丹和百合)的花进行转录组测序,分析花发育相关基因。并结合本团队前期的野百合转录组数据,分析筛选5种百合属植物的直系同源基因及正选择压力相关基因,并利用获取的直系同源基因构建百合属物种的进化关系,为进一步研究百合花的发育和调控以及百合属植物进化提供依据。

1 实验方法

1.1 实验材料

在陕西朱雀国家森林公园采集4种百合属(细叶百合L.pumilum;川百合L.davidii;卷丹L.lanci⁃folium;百合L. brownii var. viridulum)健康植株的花。迅速放入液氮中速冻,随后放在-80℃冰箱中保存。

1.2 RNA提取和转录组测序

采用Trizol 法提取细叶百合、川百合、卷丹和百合花中的总RNA。经质量检测合格后,用带有Oligo(dT)的磁珠富集mRNA。然后将mRNA 分裂成短片段,并反转录合成第一链cDNA,随后合成另一条链,从而纯化得到的双链cDNA。进而修复双链cDNA 的末端并在其末端加上poly(A)尾巴并连接Illumina 测序接头。制备测序文库。委托广州基迪奥生物技术公司采用Illumina 双端测序平台对4 种百合属植物的花器官进行测序。将获得的原始数据过滤后得到高质量的读序,用Trinity和TGICL 按照默认参数对得到的高质量读序进行从头组装,得到unigene。

1.3 百合属5种植物的unigenes的功能注释和花发育相关基因的鉴定

为获得4 种百合属植物花的unigene 功能信息,将测序得到的unigene 与公共数据库(Nr、Swiss-Prot、KOG、GO、KEGG)进行相似性比对以获得其基因功能。随后结合野百合的转录组数据对百合属5 种植物(野百合、细叶百合、川百合、卷丹和百合)unigene的功能注释结果进行比较,并且分析花发育相关基因。

1.4 直系同源基因的筛选和分析

首先使用transdecoder 软件预测各物种Unige⁃ne 中的CDS 区域,然后利用OrthoMCL 对预测所得的5 种百合属植物的CDS 序列进行直系同源基因搜索,从中筛选出一对一的直系同源基因[14]。然后用paml-codeml 计算直系同源基因的非同义替换(Ka),同义替换率(Ks)值,并计算Ka/Ks 值[15],进而筛选出受正选择作用的基因。

1.5 正选择基因的富集分析

利用GOseq[16]的GO 基因富集方法对受到正选择的直系同源基因(Ka/Ks>1)进行基因分类富集。另外,对受到正向选择的直系同源基因进行Pathway 富集分析[17],寻找受到正向选择的直系同源基因相对于所有注释的基因显著富集的pathway。

2 结果与分析

2.1 百合属4种植物的转录组数据组装分析

采用Illumina HiSeq 2500测序技术对百合属4种植物(细叶百合L.pumilum;川百合L.davidii;卷丹L. lancifolium;百合L. brownii var. viridulum)的花进行转录组测序。获得的转录组原始数据已上传到NCBI数据库(SRA编号:SRP253797)。

使用Trinity 软件对所有reads 进行组装,其中,在细叶百合中共获得44 565个unigene,序列平均长度为701 bp;在川百合中共获得51 413 个unigene,序列平均长度为719 bp;在卷丹中共获得41 638个unigene,序列平均长度为688 bp;在百合中共获得44 716个unigene,序列平均长度为737 bp(见表1)。细叶百合、川百合、卷丹、百合组装的unigene的N50长度分别为1 066、1 149、1 017和1 183 bp。

2.2 百合属5种植物unigene的功能注释

为了获得本研究中4 种百合属植物花的基因功能信息,分别将4 个物种获得unigene 序列与公共数据库(GO、Nr、Swiss-Prot、KOG、KEGG)进行比对(E 值<1E-5)以及基因的功能注释。5 种植物的unigene在上述公共数据库进行注释结果显示细叶百合、川百合、卷丹和百合中能够得到注释的基因的百分比为分别为55.23%、61.54%、56.96% 和48.93%(见表2)。没有匹配到的基因比较多,这可能是由于目前百合属植物没有基因组信息。

表1 百合属4种植物的测序结果统计信息Table 1 Statistical information for transcriptome sequencing of four species of Lilium

表2 百合属5种植物转录组注释信息Table 2 Annotation information of five species of Lilium

GO 注释结果显示细叶百合、川百合、卷丹和百合分别有6 785、7 398、6 475以及7 360条unige⁃ne序列得到注释结果。GO注释的结果主要分为3大类:生物过程、细胞组分和分子功能。结果显示4种植物转录组的GO注释结果相似。在生物过程功能类别中代谢过程和细胞过程组分中注释的基因数目最多;在细胞组分类别中,注释最多的基因归类到细胞和细胞组分类别中;而在分子功能类别中,注释最多的功能类别是催化活性和结合(见图1)。这和前期关于野百合的基因的GO 注释结果相似。

将本实验4种百合属物种得到的unigene 序列分别与KOG 数据库进行比对进而预测其功能,并和野百合的KOG 注释比较分析。结果显示,在25个功能类别中,“一般功能预测”类别中的unigene在5种百合属植物都是最多,其次是“翻译后修饰,蛋白质转运和分子伴侣”“信号转导和机制”以及“RNA的处理和修饰”。在5个物种均是只有少数unigene序列注释到“细胞运动”这一类别中(见图2)。

2.3 花发育相关基因

百合属植物是重要的观花植物,花是百合重要的经济性状。通过对百合属植物花转录组数据的注释和分析,共鉴别到13个花发育相关基因,包括MADS-box 基因、AGL 类基因和LIM 类基因等(见表3)。

2.4 百合属5种植物的进化分析以及直系同源基因的筛选

利用保守的单拷贝同源基因序列比对后,采用MEGA 构建NJ 树,其中野百合和细叶百合聚为一类,卷丹和百合聚为一类,而川百合单独为一类(见图3)。本研究中得到的直系同源基因序列可以用于开发SSR 位点,为百合属的遗传标记开发提供资源。

表3 鉴别的花发育相关的基因Table 3 Identified genes involved in the development of flower

通过orthomcl analysis 分析,在5 种百合属植物中共得到9440 对单拷贝直系同源基因,计算这些直系同源基因的非同义替换(Ka)、同义替换率(Ks)、Ka/Ks。且数据经过严格过滤后,共有8 247对直系同源基因被确定,其中32 对直系同源基因的Ka/Ks>1,表明这些基因受到了强烈的正向选择;355 对直系同源基因的0.5

2.5 正选择基因的GO和KEGG富集分析

对5 种百合属植物的正选择基因进行GO 基因功能富集分析发现正向选择的基因功能在生物过程(Biological process)分类中主要集中在代谢过程(Metabolic process)上,在细胞组分(Cellular component)分类中主要集中在细胞器(organelle)、细胞(Cell)、细胞部分(Cell part),而在分子功能(Molecular function)分类中则主要集中在结合活性(Binding)、催化活性(Catalytic activity)上。强烈正选择基因的KEGG 富集的结果发现,在5种百合属植物中,代谢途径、萜类骨架的生物合成、苯基丙酸类生物合成以及植物-病原体的相互作用等通路相关的基因受到了比较强的正选择作用(见表4)。

3 讨论

3.1 百合属4种植物花的转录组测序和注释

目前Illumina 二代测序技术已经成为获取无参考基因组的物种基因数据的一种有效方法,广泛应用于抗性和活性成分基因的挖掘以及分子标记的开发应用[18]。不同近缘物种的转录组测序分析可以预测物种的选择作用以及适应性进化。本研究通过二代转录组测序比较分析百合属4 种植物花的转录组数据。通过组装分别在细叶百合、川百合、卷丹以及百合的花朵中获得44 565、51 413、41 638 和44 716 个unigene 序列。本研究获得的转录组数据将为未来这4 种植物的研究提供有用的数据和资源。

表4 强烈正向选择的基因的KEGG通路Table 4 The enriched KEGG pathways of strongly positive selection unigenes

将获得的基因序列在Nr、Swiss-Prot、GO、KOG和KEGG 等公共数据库中注释,4 个物种中一半左右的基因在五大数据库中有注释信息,但是几乎一半的基因没有注释信息,这可能是由于4种植物目前都没有参考基因组信息,这些基因可能是百合属特有的一些基因,这和前期关于野百合的注释信息类似,都是大约50%的基因能匹配到注释信息。通过比较本实验的4 种百合属植物以及野百合中基因的GO 和KOG 注释结果,发现5种百合属植物花的转录本归属的分类条目类似,说明5种植物在百合属内亲缘关系较近。

3.2 花发育相关基因的分析

百合是多年生的宿根花卉植物,有球根“花卉之王”的美誉,花的形成和花器官的发育研究极其重要。本研究通过转录组数据共鉴别了13个花发育相关的基因,控制植物花器官发育的基因大多数含有一个保守的MADS 结构域。其中,MADS2基因参与胚珠的发育[19],并且Tzeng 等在麝香百合中克隆到了MADS2 基因,MADS2 基因仅在胚珠中表达,在花的其他部位中不表达[20]。除此之外,目前在麝香百合中还克隆出了MADS1、MADS3 和MADS4基因,它们分别参与雄蕊和花瓣的发育[21]。在本研究中鉴别到的MADS6基因参与调控花分生组织的分化和开花时间[22~23],MADS14 基因调控开花时间[22]。Wang 等研究表明过表达MADS-box 转录因子BpPI 可以延迟开花[24]。MADS16 基因参与花被和雄蕊的发育[25~26]。在桦树中,研究发现BpAP1 可以促进其雄花序的形成[27]。在AGL 基因家族中,AGL104 基因和AGL3 基因参与花粉的成熟与花粉管的生长[28],AGL8 基因参与花分生组织的分化[29]。AGL19 基因可以响应春化作用,促进开花,而AGL15 基因参与开花的负调控[30]。另外,本研究中鉴别到的SOC1 基因和EJ2 基因分别调控开花时间以及花的发育和形成[31]。LIM 类基因LIM15 是与减数分裂相关基因,在染色体的配对和重组起重要作用[32]。Mori等在百合中克隆到了与花粉发育相关的GlsA基因,其仅仅在花粉的发育过程中表达[33]。本研究中鉴别的花发育相关基因可以为进一步研究百合花器官发育和调控提供基础。

3.3 百合属5种植物的直系同源基因以及正选择基因

Ka/Ks 值常用来验证蛋白质编码基因是否经历选择作用。正选择作用是物种对环境因素的适应手段之一。本研究共检测到32对强烈的正向选择基因(Ka/Ks>1)以及355 对弱的正向选择基因(0.5

在植物病原体的相互作用途径中,发现了正选择基因疾病抗性蛋白RPM1 基因,RPM1 基因是NBS-LRR 基因中的一员,RPM1 基因通过一系列的信号传导使植物体产生过敏反应,加强植株的抗病性,造成病原菌感染区域及周围组织细胞程序性凋亡,使病原菌不会扩散到健康的组织器官中,从而达到抗病目的。对大豆灰斑病表现出正向调控的抗性[34]。过氧化物酶57基因参与苯丙烷类化合物木质素的生物合成。苯丙烷类化合物作为植物抗逆保护因子及特定环境下的次生代谢产物对植物的生长发育及应答逆境胁迫具有重要作用,特异性调控苯丙烷代谢途径相关基因的表达可以增强植物对环境胁迫的抗性[35]。一些研究表明正选择直系同源基因常常与生物和非生物胁迫、生物合成、代谢过程和酶相关[9,35~37]。本研究也发现了抗性以及参与代谢相关的正向选择基因。

猜你喜欢
细叶野百合同源
山西恩予:打造药食同源新业态
以同源词看《诗经》的训释三则
紫芸英
贾玲:野百合也会有春天
咏柳
同源宾语的三大类型与七项注意
阳光中的野百合
野百合
红毛柳
公益电影《野百合女孩》在湖南新邵开机