粗毛淫羊藿叶绿体基因组及其结构分析

2022-12-22 01:53严福林任得强魏升华何顺志
种子 2022年11期
关键词:淫羊密码子叶绿体

严福林,任得强,魏升华,何顺志

(贵州中医药大学,贵阳 550025)

粗毛淫羊藿(Epimediumacuminatum)为小檗科(Beiberdaceae)淫羊藿属,广泛分布于我国西南地区,是淫羊藿属分布较广泛的种类,亦是贵州药用历史较为悠久的民族药之一[1-2]。《贵州省中药材、民族药材质量标准》2003年版收载其根入药,具有补肾壮阳,祛风除湿等功效,用于治疗肾虚阳痿、小便淋漓、咳喘、风湿痹痛等疾病。淫羊藿为贵州著名民族成药“仙灵骨葆胶囊”的主要原料药材,据调查,“仙灵骨葆”的开发初期,其入方调剂药材为贵州地产资源粗毛淫羊藿和黔岭淫羊藿全草,亦称铜丝草、仙灵脾等[3]。据考证,除贵州将其作为常用民族药使用外,粗毛淫羊藿在其各产区均入药使用,药用部位多为全草[4-5]。

徐文芬等[6]、周涛等[7]研究表明,粗毛淫羊藿含有丰富的黄酮类、酚苷类、多糖、色酮类等、淫羊藿次苷类、木脂素类、有机酸类、生物碱等化学成分,具有治疗糖尿病、抗肿瘤、骨骼重塑、抗衰老等药理活性,近年来对淫羊藿属的研究逐渐成为热点。然而,淫羊藿属因其独特的地理分布、杂交可育、种内变异等特点,其种间界定仍模糊不清,被认为是分类和系统发育上最具挑战和困难的类群[8]。国内外诸多学者依据核基因组(ITS序列)、叶绿体基因组和线粒体基因组信息,结合形态学及化学分类方法对淫羊藿属部分类群进行系统关系研究,但该属植物进化关系和属内分类较为模糊,种间序列趋异值低,基因组信息变异位点不足,仍需要大样本数据进一步的研究[9-12]。

叶绿体是绿色植物进行光合作用的细胞器,普遍存在于陆地植物中,可自主遗传,且大多被子植物的叶绿体基因组为母系遗传(80%),其结构较核基因组保守,大多数为双链环状的四分体结构,包括1个大的单拷贝区(large single copy, LSC)、2个反向重复区(inverted repeatssequence, IRa/IRb)和1个小的单拷贝区(small single copy, SSC)。此外,叶绿体基因组还具有碱基变异速率较慢、易于测序等优点。随着测序技术的发展,叶绿体基因组的研究取得了长足发展[13-15],被测序的植物种类与叶绿体基因组数据量迅速增加,对叶绿体基因组的结构和变异有了更深入的了解,这为处理困难植物类群的分类与系统学、植物地理学、功能基因的开发等研究提供了新的方向。

本研究采用Illumina二代测序技术对中国贵州道地特色药材粗毛淫羊藿叶绿体基因组测序,并进行序列分析,以丰富粗毛淫羊藿的叶绿体基因组数据,为其种质资源的保护、系统学研究、功能基因的开发与可持续利用提供参考。

1 实验材料与方法

1.1 实验材料

粗毛淫羊藿实验样品于2017年4月采集于贵阳市乌当区、黔南州龙里县、黔西南州安龙县等地,凭证标本经贵州中医药大学何顺志教授鉴定,保存于贵州中医药大学标本馆(GZYGH),活体材料保存于贵州中医药大学药用植物种质资源圃。本研究从NCBI(https://www.ncbi.nlm.nih.gov/GenBank)下载了前人发表的小檗科淫羊藿属(Epimedium)和南天竹属(Nandina)植物叶绿体基因组共7种8条数据,用于系统发育分析,详见表1。

表1 NCBI下载的叶绿体基因组Table 1 Chloroplast genome downloaded with NCBI

1.2 实验方法

1.2.1DNA提取、测序、序列组装、拼接、注释以及物理图谱绘制

取约200 mg粗毛淫羊藿分子样品,使用CTAB法提取总DNA样品。所得的DNA样品用Qbit V 2.0核酸检测仪及1%的琼脂糖凝胶电泳进行DNA质量检测。DNA样品采用超声法随机打断成较小片段,根据Illuminate建库方法构建成350 bp的DNA文库;委托华大基因(BGI)(中国,武汉)在Illumina HiSeq X-Ten平台进行双端测序,测序深度为3 Gb数据量。将测序获得的过滤数据,根据GetOrganelle V 1.6.2 d软件(https://github.com/Kinggerm/GetOrganelle/releases),在中国西南野生生物种质资源库数据平台服务器进行组装与拼接。将拼接结果导入Bandage V 0.8.1软件进行叶绿体结构可视化,去除覆盖度低的低质量片段,获得单倍体叶绿体全基因组环状结构。以时针淫羊藿(E.lishihchenii)叶绿体基因组(NC_029944)作为参考,在软件Geneious R 11.0.2中与应用Clustal Walignment进行校对,选取相似性较高的序列作为最终获取的叶绿体基因组,并定位到相应序列,验证获得序列的可靠性,并进行手动校对和补充。应用DOGMA(http://dogma.ccbb.utexas.edu/)对拼接好的序列进行在线自动注释,以E.lishihchenii叶绿体全基因组序列(NC_029944)作为参考,在Geneious R V 11.0.2软件中进行校对调整。应用在线绘图软件Organellar Genome DRAW tool(OGDRAW, https://chlorobox. mpimp-golm. mpg. De/OGDraw.html)进行可视化,绘制叶绿体全基因组物理图谱,tRNAscan-SE V 2.0(http://lowelab.ucsc.edu/cgi-bin/tRNAscan-SE 2.cgi)鉴定tRNA。应用Sequin软件完成粗毛淫羊藿叶绿体基因组的规范化处理,并在线提交。

表2 粗毛淫羊藿叶绿体基因组注释基因分类Table 2 Annotated genome classification of E. acuminatum chloroplast

1.2.2叶绿体基因组结构分析

使用Condon W(https://galaxy.pasteur.fr/?form=codonw)软件对粗毛淫羊藿叶绿体基因组密码子偏好进行分析;应用MISA软件(Beier,2017#330)预测微卫星重复序列(SSR),基序大小和最小重复数分别设置为:1-10,2-6,3-5,4-5,5-5,6-5;复合型SSR中2个SSR之间的最大碱基数设置为100 bp。应用TRF(Tandem Repeats Finder)(http://tandem.bu.edu/trf/trf.html)搜寻DNA序列中的串联重复序列,参数:2,7,7,80,10,50,500。

1.2.3系统发育分析

在Geneious R 11.0.2中应用MAFFT V 1.3.7软件对从GenBank下载的淫羊藿属和南天竹属植物7种15条叶绿体基因组与本研究中粗毛淫羊藿叶绿体基因组进行序列比对,在MEGA V 7.0软件中应用最大似然法(ML)构建系统发育树,Boostrap value为1 000次重复。

2 结果与分析

2.1 淫羊藿属植物叶绿体全基因组结构与基本特征

经测序,得到粗毛淫羊藿Raw data为2.23 Gb,经过滤、组装及拼接后,得到粗毛淫羊藿的叶绿体全基因组序列长度为156 894 bp。该序列具有典型的四分体环状结构,大单拷贝区(LSC)长88 496 bp,小单拷贝区(SSC)长16 685 bp,两者被长度为25 809 bp的反向重复区IRa和IRb分隔,GC含量为38.8%(见图1)。

粗毛淫羊藿叶绿体基因组有133个基因,包括85个蛋白编码基因、10个rRNA基因和38个tRNA基因,44个外显子,23个内含子。其中,2个基因(rrn23、trnM-CAU)有4个拷贝,2个基因(rrn16、trnE-UUC)有3个拷贝,12个基因(rrn5、rrn4.5、trnA-UGC、trnK-UUU、trnL-CAA、trnN-GUU、trnQ-UUG、rps12、rps7、rpl23、ycf2、ndhB)有2个拷贝。CDS全长78 567 bp,占叶绿体基因总长的50.1%,具有52 298个密码子,编码23种氨基酸;在粗毛淫羊藿叶绿体基因组中有15个基因含有内含子,3个基因含有2个内含子,12个基因含有1个内含子。最大内含子存在于trnK-UUU基因,长2 548 bp,最小内含子为trnL-UAA基因,长425 bp(详见表2)。

图1 粗毛淫羊藿叶绿体基因组Fig.1 Chloroplast genome of E. acuminatum

图2 黔产粗毛淫羊藿与NCBI下载7种植物的叶绿体基因组最大似然法(ML)系统进化树Fig.2 Phylogenetic tree of chloroplast genome maximum likelihood method (ML) of E. acuminatum from Guizhou and 7 species downloaded from NCBI

2.2 重复序列预测

经预测,粗毛淫羊藿叶绿体基因组中存在串联重复序列35个,长3 339 bp,占总长度的2.13%。其中,长度最小为5 bp,最大为70 bp。在粗毛淫羊藿叶绿体基因组中,共预测出简单重复序列(SSR)66个,其中有58个单核苷酸的SSR(87.9%),2个二核苷酸的SSR(3.0%),6个复合型SSR(9.1%)。在SSR中出现的频率最高的碱基为A/T,共68次,C/G为2次,AT/AT为2次。从表3中看出,粗毛淫羊藿SSR在叶绿体基因组中分布不均匀,这为研究粗毛淫羊藿及淫羊藿属植物的种群遗传多样性、种质资源选育、遗传结构等研究提供参考。

2.3 粗毛淫羊藿叶绿体基因组密码子偏好性分析

分析粗毛淫羊藿叶绿体基因组密码子偏好发现,在粗毛淫羊藿叶绿体基因组中共有52 298个密码子。其中,有7种密码子编码的氨基酸有3个,分别为:甘氨酸(Gly)、精氨酸(Arg)、丝氨酸(Ser),数量分别为:5 438、4 193、3 459个,分别占总数的10.4%、8.0%、6.6%;有6种密码子编码的氨基酸有2个,分别为谷氨酰胺(Gln)、谷氨酸(Glu),数量分别为3 554、4 177个,分别占总数的6.8%、8.0%;编码蛋氨酸(Met)的数量最少,有371个,占0.7%;相对同义密码子使用最高的为AGA/UUA,最低的是CGC,详见表4。

表3 粗毛淫羊藿叶绿体基因组SSR预测Table 3 Prediction of chloroplast genome SSR of E. acuminatum

表4 粗毛淫羊藿叶绿体基因组鉴定与使用分析Table 4 Genome identification and application analysis of E. acuminatum

2.4 系统发育分析

系统发育树结果表明,淫羊藿属与外类群南天竹属及属种间分歧较好,各为一支,但粗毛淫羊藿贵州居群与NCBI下载的其他居群粗毛淫羊藿不能聚类,单列一支;朝鲜淫羊藿两个居群样品关系较近,聚为一支。

3 讨 论

本研究采用高通量测序技术对贵州粗毛淫羊藿叶绿体基因组进行测序、组装与注释,获得贵州粗毛淫羊藿的叶绿体基因组,经结构分析,贵州产粗毛淫羊藿与前人研究的大部分被子植物叶绿体基因组结构一致,具有较为保守的环状四分体结构,长度为156 894 bp,其中大单拷贝区(LSC)长88 496 bp,小单拷贝区(SSC)长16 685 bp,两者被长度为25 809 bp的反向重复区IRa和IRb分隔。

本研究发现,贵州产粗毛淫羊藿叶绿体基因组中含有133个基因,其中包括85个蛋白编码基因、10个rRNA基因和38个tRNA基因,44个外显子,23个内含子。所有基因中,2个基因有4个拷贝,2个基因有3个拷贝,12个基因有2个拷贝,这些结构与张燕君等[12]报道的淫羊藿属植物叶绿体基因组研究结果具有一定差异,表明不同种类和产地的淫羊藿属植物基因结构不尽一致。

SSR是叶绿体基因组多态性以及物种群体遗传学研究的有效工具。经预测,粗毛淫羊藿叶绿体基因组中存在串联重复序列35个,简单重复序列(SSR)66个,SSR在粗毛淫羊藿叶绿体基因组数量较多、多样性丰富、且分布较不均匀,这为黔产粗毛淫羊藿及淫羊藿属植物的种群遗传多样性、种质资源选育、遗传结构、分子标记等研究奠定了良好基础。

密码子偏好性分析是预测叶绿体未知蛋白位置,判断最优密码子与基因表达水平高低、发现新基因的手段。经密码子偏好性分析发现,黔产粗毛淫羊藿叶绿体基因组共有52 298个密码子,共编码23种氨基酸。其中,有3个氨基酸具有7种密码子编码,有2个氨基酸具有6种密码子编码。其密码子类型较为丰富,这为淫羊藿属植物属内、种间鉴定、群体和个体水平的遗传表达差异分析奠定了依据。

与核基因组相比,叶绿体基因组具有相对小的尺寸、单亲遗传、基因含量和顺序的保守性以及高拷贝数等特征。叶绿体基因组序列数据有助于推断与其他被子植物家族的骨架关系,以及解决物种的系统发育关系,是测试谱系特异性分子进化的良好模型。从本研究中的系统发育树分析结果看,淫羊藿属与外类群南天竹属具有很好的分歧,显示出淫羊藿属与外类群南天竹属亲缘关系较远,分类学中易于区分。

朝鲜淫羊藿主要分布于中国东北省区与朝鲜半岛,其余种类主要分布于中国南部,淫羊藿属内的朝鲜淫羊藿与其余种类在100%的支持率下分为2大支,显示了淫羊藿属内种间较远的地理属性。粗毛淫羊藿2个居群样品也呈现出同样的结果,NCBI下载的粗毛淫羊藿样品不能与贵州居群聚类,而是在100%的支持率下单列一支,粗毛淫羊藿贵州居群与其余种类聚为一支,这也显示了淫羊藿属种内因地理分布差异而导致的性状和遗传变化,表明淫羊藿属性状较不稳定,种内性状受环境影响较大,种间变异复杂,基因序列较为保守,存在过渡类型,可能存在大量的生态宗或地理宗,与严福林[22]、刘少雄等[23]的研究结果一致。本研究结果为淫羊藿属植物的地理学、物种形成、群体遗传学等研究提供了新的方向。

猜你喜欢
淫羊密码子叶绿体
不同基原淫羊藿补肾壮阳相关药效学比较研究
淫羊藿“寒”“温”药性古今差异的文献考证
密码子与反密码子的本质与拓展
人不吃饭行吗
新型密码子、反密码子、氨基酸对应盘
10种藏药材ccmFN基因片段密码子偏好性分析
淫羊藿临床中药师注意事项
不同产地箭叶淫羊藿生长与种实形态性状变异研究
南方红豆杉叶绿体非编码序列PCR体系优化及引物筛选
烟草叶绿体密码子的偏好性及聚类分析