单叶铁线莲叶绿体基因组的序列特征与系统发育分析

2022-06-17 00:39韦海忠潘丽芹田盛野汤紫依何海叶张慧娟
中草药 2022年12期
关键词:叶绿体核苷酸拷贝

韦海忠,潘丽芹,田盛野,汤紫依,何海叶,张慧娟,蒋 明*

1.台州科技职业学院,浙江 黄岩 318020

2.台州学院生命科学学院,浙江 椒江 318000

铁线莲属ClematisL.为毛茛科(Ranunculaceae)多年生木质或草质藤本植物,少数为直立灌木或草本,全世界约有300种,主要产于热带、亚热带和寒带地区,我国有100多种,全国各地均有分布[1]。铁线莲属植物的不少种类具有较好的药用价值,《中国药典》2020年版记载,小木通C.armandiiFranch.、绣球藤C.montanaBuch.-Ham.ex DC.、威灵仙C.chinensisOsbeck、棉团铁线莲C.hexapetalaPall.和东北铁线莲C.manshuricaRupr.等植物的干燥藤茎、根或根茎可供药用[2];《中国民族药辞典》则记录了40余种铁线莲属药用植物,如女萎C.apoofoliaDC.、甘青铁线莲C.tangutica(Maxim.) Korsh.、西藏铁线莲C.tenuifoliaRoyle和单叶铁线莲C.henryiOliv.等[3-4]。铁线莲属植物富含皂苷类、黄酮类、木脂素类、萜类和酚类化合物,具有抗肿瘤、抗炎、镇痛、抗氧化和抗菌等作用,用于治疗风湿痹痛、口舌生疮和筋脉拘挛等[5-6]。

单叶铁线莲又名地雷根、雪里开、拐子药等,为木质藤本植物,根部膨大、单叶对生、花萼白色或淡黄色(图1)。单叶铁线莲在我国的分布范围较广,长江流域各省均有,生长在溪边、山谷、林下、路旁和灌丛等,是一种民间十分常用的中草药[1]。单叶铁线莲的根和叶可供药用,含熊果酸、胡萝卜苷、甘露醇和皂苷等,具有行气活血、清热解毒和消肿止痛等功效[7-9]。目前,有关单叶铁线莲的研究集中在化学成分、组织培养、资源调查和药理作用等方面,而该植物叶绿体基因组相关的研究未见报道[7-10]。叶绿体基因的数量较少,但它们在光合作用及氨基酸、激素、维生素和次生代谢物生物合成中起中重要作用,而叶绿体基因组在解析植物系统发育地位、物种鉴定、进化分析等方面有着重要意义[11]。近年来,已有部分铁线莲属植物的叶绿体完成了组装,如绣球藤、灌木铁线莲C.fruticosaTurcz.、牯牛铁线莲C.guniuensisW.Y.Ni, R.B.Wang et S.B.Zhou等,明确了它们的基因组结构、序列特征、基因组成及系统发育关系等[11-13]。本研究拟在高通量测序的基础上组装单叶铁线莲的叶绿体基因组,以明确其序列特征、基因组成及系统发育关系,为该药用植物的遗传结构和遗传多样性研究奠定基础。

图1 单叶铁线莲Fig.1 C.henryi Oliv.

1 材料与仪器

1.1 材料

单叶铁线莲的叶片采自浙江省台州市黄岩区茅畲乡山卡村,台州学院蒋明教授鉴定为单叶铁线莲C.henryiOliv.,伴生植物有雀梅藤Sageretia thea(Osbeck) Johnst.、鸡腿堇菜Viola acuminateLedeb.、短尾柯Lithocarpus brevicaudatus(Skan) Hayata、黄檀Dalbergia hupeanaHance和秀丽野海棠Bredia amoenaCogn.等。采集时间为2020年12月,将健康叶片放入取样袋,带回实验室后先用大量的自来水冲洗,再用无菌水清洗3~4次,晾干后置于−80 ℃冰箱备用。

1.2 仪器

移液枪(德国艾本德公司);高速冷冻离心机(美国贝克曼库尔特有限公司);电泳仪(北京六一生物科技有限公司);凝胶成像系统(美国Bio-rad公司);Thinkpad移动工作站(联想集团有限公司);超低温冰箱(日本Sanyo电机公司)。

2 方法

2.1 DNA的提取和测序

叶片先用液氮快速冷冻,用研棒磨成粉末后采用十六烷基三甲基溴化铵(hexadecyltrimethylammonium bromide,CTAB)法提取基因组DNA,经电泳检测和浓度测定后置于−20 ℃冰箱备用。基因组DNA用超声波处理,经末端修复、加A尾、加测序接头、纯化、PCR扩增等步骤完成文库构建,再在Illumina高通量测序平台NovaSeq 6000上测序,获得原始数据。

2.2 叶绿体基因组的组装

经去除接头和低质量的数据,获得clean reads。以转子莲C.patensMorr.et Decne.的matK(AY515250)基因为种子序列,利用NOVOPlasty软件的Perl程序拼接单叶铁线莲的叶绿体基因组,参数采用默认值[14]。

2.3 基因组的注释和比较

利用Geneious prime的Find repeats插件检测叶绿体基因组的反向重复(inverted repeat,IR)序列,确定大单拷贝区(large single copy,LSC)和小单拷贝区(small single copy,SSC)的范围。单叶铁线莲叶绿体基因组采用Dual Organellar GenoMe Annotator(DOGMA,http://dogma.ccbb.utexas.edu/)注释,并作手工调整[15];tRNA的预测采用tRNAscan-SE(http://lowelab.ucsc.edu/tRNA scan-SE/)和ARAGORN工具[16-17];最后Organellar Genome DRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)生成圈图,勾选Tidy up annotation,其他参数采用默认值[18]。

2.4 简单重复序列和核苷酸多态性分析

利用MISA(MIcroSAtellite Identification Tool)提供的Perl程序分析简单重复序列(Simple sequence repeat,SSR)位点,程序在WINDOWS命令窗口运行。单核苷酸最低重复次数设定为10,二核苷酸最低重复次数为5,三核苷酸、四核苷酸、五核苷酸和六核苷酸的最低重复次数为4[19]。核苷酸多态性分析采用DnaSP 5.0软件,窗口大小、步移尺寸分别设为600 bp和200 bp。

2.5 系统发育分析

用于多重比对和系统发育分析的叶绿体基因组全长序列下载自NCBI数据库,它们是槭叶铁线莲C.acerifoliaMaxim.(NC_039844)、曲柄铁线莲C.repensFinet et Gagnep.(NC_039578)、长瓣铁线莲C.macropetalaLedeb.(NC_041477)、美花铁线莲C.potaniniiMaxim.(NC_058760)、绣球藤(NC_057507)、灌木铁线莲(MT083932)、甘青铁线莲(MK253446)、芹叶铁线莲C.aethusifoliaTurcz.(MK253462)、牯牛铁线莲(MN527334)、大叶铁线莲C.heracleifoliaDC.(KY120885)、铁线莲C.floridaThunb.(NC_058885)、转子莲(MW900175)、柱果铁线莲C.uncinataChamp.(NC_039846)、威灵仙(MZ351432)和圆锥铁线莲C.ternifloraDC.(KJ956785)等。

MAFFT 7.388程序用于铁线莲属植物及细叶黄乌头Aconitum barbatumPers.叶绿体基因组的两两比对和多重比对,然后采用jModelTest获得最佳替代模型,最后基于最大似然(Maximum likelihood,ML)法构建系统发育树[20-22]。建树时以毛茛科的细叶黄乌头为外类群,自举检测(Bootstrap)次数为1000。

3 结果与分析

3.1 叶绿体基因组的结构

利用NOVOPlasty的Perl程序完成clean reads的拼接,综合运用多个软件或在线工具完成了叶绿体基因组的注释。结果表明,单叶铁线莲的叶绿体基因组为一个典型的四分体结构,由LSC、SSC和2个IR组成(图2)。叶绿体基因组的全长为159 707 bp,GC值为38.0%;LSC、SSC和IR序列的长度分别为79 449、18 100、31 079 bp,GC值分别为36.3%、31.4%、42.0%。

图2 单叶铁线莲叶绿体基因组Fig.2 Chloroplast genome of C.henryi

3.2 基因组成

基因注释结果表明,单叶铁线莲叶绿体基因组共有137个基因,tRNA基因的数量最多,共36个,核糖体蛋白大小亚基基因的数量其次,为31个,其中大亚基基因14个,小亚基基因17个(表1)。tRNA中,trnA-UGC、trnI-CAU、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG和trnV-GAC各有2个拷贝;核糖体蛋白大小亚基基因中,rps3、rps7、rps8、rps12、rps19、rpl2、rpl14、rpl16、rpl22和rpl23也各有2个拷贝;此外,所有核糖体RNA基因、ndhB和ycf2有2个拷贝;Ycf1和infA虽然各有2个拷贝,但其中1份为假基因。trnA-UGC、trnG-UCC、trnI-GAU、trnK-UUU、trnL-UAA、trnV-UAC、rps16、rpl2、rpl16、rpoC1、ndhA、ndhB、petB、petD和atpF各有1个内含子,而rps12和ycf3有2个内含子。单叶铁线莲叶绿体基因组序列已上传NCBI,登录号为OM650806。

表1 单叶铁线莲叶绿体基因组上的基因Table 1 Genes located on chloroplast genome of C.henryi

3.3 SSR检测

经MISA检测,单叶铁线莲叶绿体基因组共有41个SSR,其中单核苷酸重复40个,三核苷酸重复1个,没有发现到其他类型的SSR(表2)。大部分SSR分布在基因间隔区(intergenic spacer,IGS),共29个,占总数的70.7%;10个出现在matK、trnG-UCC、rpoB、psbC、rpoA、ccsA和ycf1的编码区,其中ycf1基因编码区内有4个SSR;另有2个分别位于atpF和ndhA的内含子中。SSR出现在LSR、SSR和IR的次数分别为25、14和2,反向重复区中SSR仅占总数的4.9%。

表2 单叶铁线莲叶绿体基因组SSR的分布Table 2 Distribution of SSRs within C.henryi chloroplast genome

3.4 核苷酸多态性分析

利用DnaSP软件分析了16种铁线莲属植物叶绿体基因组的核苷酸多态性,结果表明,它们的核苷酸多态性范围为0~0.023 57,平均值为0.003 252。rps11、ndhF、ndhD和rpl32-trnl-UAG等基因或基因间隔区具有较高的变异,它们的核苷酸多态性均大于0.015,其中,基因间隔区rpl32-trnl-UAG的多态性最高,ndhD次之,为0.016 9,而rps11、ndhF的多态性分别为0.016 5和0.015 8(图3)。

图3 核苷酸多态性的滑动窗口分析Fig.3 Sliding window analysis of nucleotide diversity

3.5 系统发育分析

序列比对结果表明,单叶铁线莲与牯牛铁线莲和大叶铁线莲的相似性最高,分别达99.6%和99.4%,与外类群细叶黄乌头的相似性最低,仅79.8%。利用jModelTest工具获得分子进化模型,结果表明,GTR+G+I为最佳替代模型,赤池信息标准(akaike information criterion,AIC)与贝叶斯信息标准(bayesian information criterion,BIC)分别为632 080.765 08和632 493.356 54。系统发育分析结果表明,17种铁线莲属植物在ML树上取为4组,绣球藤与美花铁线莲聚于一组,槭叶铁线莲、曲柄铁线莲和长瓣铁线莲聚为一组,铁线莲、转子莲、柱果铁线莲、圆锥铁线莲和威灵仙聚于另一组,单叶铁线莲先与大叶铁线莲和牯牛铁线莲聚于一个分支,支持率达100%,它们再与灌木铁线莲、甘青铁线莲和芹叶铁线莲聚为一组,支持率为99%(图4)。

图4 基于叶绿体基因组序列构建的系统发育树Fig.4 A phylogenetic tree constructed based on chloroplast genome sequences

4 讨论

叶绿体是绿色植物和藻类的重要细胞器,它将光能转换成化学能,并把二氧化碳同化为碳水化合物;叶绿体起源于蓝藻,并保留很多古老的特征,叶绿体自带基因组,基因参与光合作用、硫同化、脂类代谢及淀粉、色素、激素和氨基酸等的生物合成[23-24]。叶绿体基因组的大小通常为120 000~170 000 bp,植物叶绿体基因组的结构、基因的组成及排列的顺序具有一定的保守性[25]。铁线莲属植物叶绿体基因组大小在159 500 bp左右,如绣球藤、灌木铁线莲和牯牛铁线莲的叶绿体基因组大小分别为159 523、159 683、159 682 bp[13]。本研究中,单叶铁线莲的叶绿体基因组为159 707 bp,序列长度与已组装完成的同属物种差异不大[11-13]。叶绿体基因组呈环状,通常可分成4个部分,即LSC、SSC和2个反向重复区IR(IRA和IRB),但也有例外,如松科(Pinaceae)植物中IRB缺失,柏类植物中IRA丢失[26-27]。本研究中,单叶铁线莲的叶绿体基因组为典型的四分体结构,即由LSC、SSC、IRA和IRB组成。

假基因化在叶绿体基因组中十分常见,碱基突变、插入或缺失等引起编码区产生终止密码子是假基因化较为常见的原因。在鸭跖草亚科(Commelinoideae)中,accD、rpoA和ycf15发生假基因化,它们由碱基插入或缺失引起,而杜若Pollia japonicaThunb.和钩毛子草Rhopalephora scaberrima(Blume) Faden中ndhB的假基因化则由点突变引起[28]。产生假基因的另一种情况是编码区截短,通常发生在边界部分,如毛茛科乌头A.carmichaeliiDebeaux和黄花乌头A.coreanum(Lévl.) Rapaics的ycf1位于IRA与SSC的边界,导致其假基因化[29]。本研究中,ycf1有2份拷贝,它们分别位于IRB/SSC和SSC/IRA的边界,前者发生截短现象,成为假基因,另1份拷贝则正常,除ycf1外,2份infA中的1个拷贝也为假基因;类似的现象发生在牯牛铁线莲叶绿体基因组中,它的ycf1和infA均有2份拷贝,其中1份为假基因,不同的是,牯牛铁线莲的rpl32和ndhK也为假基因[13]。infA是叶绿体中蛋白翻译起始的重要成分,该编码蛋白基因假基因化现象十分普遍,假基因化的主要原因为有害突变的积累,包括碱基插入、缺失和替换等[30]。Millen等[31]对16属17种茄科植物叶绿体基因组进行研究,发现所有物种的infA都是假基因,部分缺少起始密码子,3个物种发生移码框突变,而番茄Lycopersicon esculentumMiller叶绿体基因组的infA缺失前面124个碱基。在本研究中,单叶铁线莲infA的假基因化源于3’端序列的缺失。

SSR是指由1~6个核苷酸组成的基本单元经多次重复形成的一段DNA,它们分布在叶绿体基因组的不同部位。与核基因组相比,叶绿体基因组较小,SSR数量相对较少,但也可用于物种鉴定和分子辅助育种。Liu等[32]以圆锥铁线莲叶绿体基因组为参照,开发SSR标记对11个铁线莲属植物的43个个体进行测试,发现SSR可将这些物种完全区分开。褐毛铁线莲变种C.fuscavar.coreanaTurcz.叶绿体基因组中有67个SSR,其中单核苷酸重复50个,二核苷酸-四核苷酸重复共17个[33]。本研究中,单叶铁线莲叶绿体基因组共有41个SSR,数量远少于褐毛铁线莲,另外,SSR类型也较少,仅2种,即单核苷酸重复和三核苷酸重复,其中单核苷酸重复占97.6%。SSR的数量和类型与物种相关,甚至在同一物种不同品种间也存在差异,可用于物种鉴定和亲缘关系分析等[34]。单叶铁线莲在分类学上属于尾叶铁线莲组Sect.Viorna尾叶铁线莲亚组Subsect.Connatae,基于叶绿体基因组构建的系统发育树上,单叶铁线莲与同为尾叶铁线莲亚组的大叶铁线莲和牯牛铁线莲聚为一组,支持率达100%,分子聚类结果与形态分类一致。

本研究以以药用植物单叶铁线莲叶片为材料,经过DNA提取、文库构建、高通量测序、组装和序列分析,明确了叶绿体因组的序列特征和系统发育关系,为后续开展该药用植物的遗传结构和遗传多样性研究打下了基础。

利益冲突所有作者均声明不存在利益冲突

猜你喜欢
叶绿体核苷酸拷贝
慢性乙型肝炎抗病毒治疗进展
共生
人不吃饭行吗
吃味精会对身体有害吗
文化拷贝应该如何“拷”
一种快速提取微藻完整叶绿体及其DNA的方法
影子与我
反相高效液相色谱—串联质谱法测定母乳及奶粉中核苷和核苷酸的含量
分子标记技术的产生与引物设计
对“叶绿体中色素的提取和分离实验”的改进