徐友阳,王德勤,李静宇,梅瑜,王继华,蔡时可*
(1广东省道地南药资源保护与利用工程中心/广东省农作遗传改良重点实验室/广东省农业科学院作物研究所,广东广州 510640;2广州白云山和记黄埔中药有限公司,广东广州 510515)
显齿蛇葡萄[Ampelopsis grossedentata(Hand.-Mazz.)W.T.Wang]是葡萄科蛇葡萄属的藤本植物,为中药材藤茶的基原植物,也称茅岩莓、白茶、藤茶、甘露茶等,以地上部分入药,茎叶可制茶,还可加工藤茶含片、藤茶饮料、藤茶果冻等产品[1,2]。其中,藤茶味甘淡、性凉,在我国已饮用700 余年,传统记载有清热解毒和消胀止渴等功效[3]。显齿蛇葡萄的适应性很强,多生长在海拔400~1300 m 的山地,主要分布在广东、广西、湖北、湖南和贵州等地,重庆和江西部分地区也有少量野生资源[2]。显齿蛇葡萄含有黄酮类、多酚类、鞣质、氨基酸及微量元素等化合物,尤其二氢杨梅素(Dihy dromyricetin,DMY)的含量高,幼嫩茎叶中可达30%[4],而水溶性多糖及水溶性蛋白含量相对较少[4,5]。其中,DMY 为多酚羟基双氢黄酮醇,同属于黄酮类和多酚类化合物,具有抗氧化、抗炎、抗肿瘤、降血糖、控血脂和护肝等多种药理活性。DMY 可通过抑制Parp 表达介导的线粒体凋亡,增强顺铂对A549 细胞的治疗效果[6]。近年来,显齿蛇葡萄的药用功能获得广泛的关注,显齿蛇葡萄提取物,以黄酮和二氢杨梅素为主的活性成分,是市场上深加工食品、保健品和药品的常见原料[7]。
药用植物次生代谢物质的合成一直以来备受关注,从代谢相关基因的表达对功能分子的代谢是研究的热点之一。近年来,随着生物信息学的飞速发展,植物转录组学技术也广泛应用于解析药用植物中药用成分合成代谢通路和调控机制[8]。但是大量的药用植物基因组还未公布,基因组数据缺乏,限制深入挖掘功能物质的代谢途径,而转录组分析可以不依赖基因组数据,开展功能基因的预测,开展药用植物的生物学过程及次生代谢的分子机制的研究[9]。显齿蛇葡萄基因组学研究相对薄弱,仅查询到其叶片的转录组进行了分析的研究[10]。为此,本研究利用转录组学技术开展显齿蛇葡萄转录组特征研究,为解析其重要基因的挖掘和调控,以及分子标记的开放提供遗传学基础,促进其产业化进程。
实验材料为广州白云山和记黄埔中药有限公司清远基地栽培的显齿蛇葡萄植株,于2021 年5 月份取样,选取显齿蛇葡萄植株的叶片和嫩茎作为转录组测序样品,取样时剪下叶片和嫩茎后,迅速放入液氮中速冻,然后置于超低温-80℃冰箱中保存备用。
采用康为世纪的Total RNA Extractor 试剂盒分别进行显齿蛇葡萄叶片和嫩茎总RNA 提取,利用琼脂糖凝胶电泳检测RNA 的完整性,进行建库。
委托北京百迈客生物科技有限公司在其Illumina HiSeq2500 的高通量测序平台对显齿蛇葡萄叶片和茎进行转录组测序。依据公司标准流程进行组装和拼接。
组装得到的显齿蛇葡萄Unigenes 进行注释和结构分析。分析流程参考本实验室之前过程[11]。
显齿蛇葡萄叶片和嫩茎的总RNA 经过提取、cDNA 文库的构建、测序和原始测序数据过滤,去掉低质量的序列,共获到23,208,741 clean reads,总碱基数目为6,932,838,094 bp,GC含量为45.92%,Q30 bases ratio 达到94.26%。表明显齿蛇葡萄的总RNA 经过提取、cDNA 文库和测序数据的质量良好。经Denovo组装,共得到109,934条转录本,总长165,729,188bp,平均长度为1507.53 bp,N50 为2195 bp,序列长度在1000~2000 bp 的有31,321 条,占总序列数目的28.49%,序列长度在2000 bp 以上的有29,434 条,占总数的26.77%(表1、图1)。对Trinity 拼装后得到的转录本,去除冗余序列后,共获得43,603 条Unigene,总长43,611,776 bp,平均长度为1000.20 bp,N50 为1,580 bp,其中25,147 条序列长度大于500 bp,占总序列数目的57.67%,序列长度在1000 bp 以上的有13,736 条,占总数的31.50%(表1 和图1)。
图1 显齿蛇葡萄Unigene 序列长度分布
表1 显齿蛇葡萄转录组测序的结果
显齿蛇葡萄组装后的Unigenes 序列与NR、NT、CDD、KOG、COG、PFAM、Swissprot、TrEMBL 等多个数据库比对,共有 25714(58.97%)条Unigene 在这些数据库中获得相应的注释(表2)。其中在Nr 数据库中注释到的Unigene 数目最多(25,081 条),占总Unigene 的57.52%,其次为TrEMBL 数据库,注释到的unigene 为24 925 条,占比为57.16%。COG 数据库中注释到的Unigene 数目最少(6283 条,14.41%)。通过与Nr 库的比对分析,获得显齿蛇葡萄在转录组水平上的近缘物种,结果显示与Vitis vinifera、Vitis riparia和Rhodamnia argentea的序列先比较,其分别有62.72%、27.44%和0.72%序列可以匹配。可见显齿蛇葡萄与葡萄的序列相似度最高(图2)。
表2 Unigene 的功能注释
图2 NR 数据库的同源物种分类
根据显齿蛇葡萄Unigene 在KEGG 数据库中注释分析,共有15,934 个Unigene 分布在五大类功能,分别是代谢(3793,20.11%)、遗传信息过程(2620,14.67%)、环境信息过程(944,3.53%)、有机系统(841,2.69%)和细胞过程(496,2.83%)。根据Unigene 在代谢过程的作用,可再细分为18类,共涉及133 个代谢通路(图3)。其中,与次生代谢372 个(1.55%)、氨基酸代谢621 个(3.37%)和脂质代谢621 个(3.33%)相关的Unigene 相对较多。代谢过程为翻译(1029,5.96%)的Unigene 在遗传信息过程中注释到最多,而与内吞作用的Unigene(283,2.83%)在细胞过程中最多。801条显齿蛇葡萄的Unigene 涉及信号转导,可为其生物过程中信号因子及其响应环境刺激提供研究基础。显齿蛇葡萄主要含苯丙烷类、类黄酮类、黄酮和黄酮醇、异喹啉生物碱等化学成分,其中类黄酮类化合物非常丰富。本研究鉴定到187 个Unigene 涉及苯丙烷类生物合成,75 个Unigene 涉及类黄酮类物质的生物合成,其中4 个Unigene 涉及黄酮和黄酮醇类化合物生物合成,48 个Unigene 与异喹啉生物碱生物合成相关,7 个Unigene 参与花青素生物合成,29 个Unigene 涉及二苯乙烯类、姜辣素和二芳基庚烷类生物合成;46 个Unigene 涉及托烷、哌啶和吡啶生物碱的生物合成(图4)。显齿蛇葡萄富含次生代谢物基因,Unigene 的分析为进一步解析其药用成分的代谢提供了基础。
图3 显齿蛇葡萄Unigene 的KEGG 功能分类
图4 其他次生代谢产物的生物合成代谢途径分析
共有20,522 条显齿蛇葡萄Unigene 在GO 数据库的生物过程(Biological process)、细胞组分(Cellular component)及分子功能(Molecular funtion)三大类中得到注释(图5)。其Unigene 可继续划分为43 个功能分类,包括代谢过程、刺激响应、生物调节、转运活性等。其中,细胞组分中的结合注释到的Unigene 最多,共有13,040 个,占47.07%;生物过程中的细胞过程注释到的Unigene也较多,为11,314 条。与药用成分相关的代谢过程(9922),催化活性(8976),抗氧化活性(122),这些通路与显齿蛇葡萄药用成分的代谢密切相关。
图5 显齿蛇葡萄Unigene 的GO 功能分类
黄酮类物质是显齿蛇葡萄的主要活性成分,其中DMY 含量较高,其为多酚羟基双氢黄酮醇,也属于多酚类化合物,具有多种药理活性。根据显齿蛇葡萄的转录组数据分析其黄酮类生物合成代谢途径。肉桂酰CoA 和对香豆酰CoA 在黄酮类化合物合成通路中作为起始底物。在苯丙酸生物合成通路中,苯丙氨酸由重要酶苯丙氨酸解氨酶(PAL)、4-香豆酸-CoA 连接酶(4CL)和肉桂酸4-羟化酶(CYP73A/C4H)催化合成。在黄酮类化合物的生物通路中,对香豆酰CoA 和丙二酰CoA 在查尔酮合酶(CHS)的催化下产生柚皮素查尔酮或异甘草素,然后在查尔酮异构酶(CHI),也是黄酮代谢途径上游的关键酶的作用下,异构化得到柚皮素或甘草素。甘草素还是异黄酮生物合成的主要底物,柚皮素可参与多种代谢途径[12]。显齿蛇葡萄中黄酮类生物合成中还有鉴定到黄烷酮3-羟化酶(F3H),黄酮醇合成酶(FLS)等Unigenes,共同催化产生一系列的具有药用功能的次生代谢产物。在显齿蛇葡萄的转录组数据中共鉴定到75 个黄酮类生物合成通路中的关键基因,包括16 个编码4CL,10 个编码CHS 和7 个编码PAL 的Unigenes(表3)。
表3 黄酮类生物合成相关的主要候选基因
转录因子在植物中普遍存在,调具有调节生物学过程中的基因表达,常以基因家族形式存在,如MYB、bHLH、WRKY 和NAC 等。不同的基因家族与不同功能密切相关,TFs 的调控作用机制是植物功能基因组学的研究热点。根据显齿蛇葡萄Unigene 和TF 数据库的对比,共鉴定出2062 个转录因子,其中属于AP2/ERF 转录因子类的Unigene 数目最多,达到了(74 个),其次是C2H2、bHLH、RLK-Pelle-DLSV、MYB-related、MYB、WRKY等(图6)。显齿蛇葡萄中的转录因子调控其生长发育、环境响应和次生代谢等生物学过程,为进一步研究其药用功能物质的的生物合成和调控提供基础。
图6 显齿蛇葡萄转录因子分类
采用MISA 对组装长度为1,000bp 以上的13,736 条unigene 进行SSR 检测,并对SSR 的类型进行统计。结果表明,在3876 条unigene 中共鉴定到4771 个SSR 位点。其中,895 条unigene 中检测到2 个上的SSR 位点。最丰富的重复类型是单碱基重复,共检测到2314 个位点,其次为双碱基重复1168 个、三碱基重复916 个、四碱基重复60个、六碱基重复7 个,最少的为五碱基重复,仅检测到6 个位点(图7)。基于4771 个SSR 位点,使用Primer 3.0 设计引物,为进一步开发显齿蛇葡萄的遗传标记和近缘种属的遗传图谱提供了基础数据。
图7 显齿蛇葡萄Unigene 的SSR 位点和数目分布
长期以来中药材的质量备受关注,真伪鉴定一直以来是中药材产业的难点[13]。一方面中药材种植规模较小,来源广泛,加之部分品种基源植物不清,严重影响中药材的质量的可靠性和稳定性。利用分子生药学技术,开展中药材的真伪鉴定意义重大[14]。本研究利用二代高通量测序对显齿蛇葡萄的叶片和嫩茎进行转录组测序和分析,共获得的高质量Clean Data 6.3G,测序数量大,质量和数量均满足转录组分析。组装获得显齿蛇葡萄转录组含有43,603 个Unigene,N50 长度为1,580 bp,平均长度1000.2bp,其中25,714 个(58.97%)Unigene在KOG、GO、KEGG、NR 和SwissProt 数据库中得到注释,与Vitis vinifera的亲缘关系最为接近。在显齿蛇葡萄中我们共鉴定到75 个Unigene 涉及黄酮类生物合成、4 个Unigene 参与黄酮和黄酮醇生物合成,13 个Unigene 参与异黄酮生物合成。黄酮类物质合成相关基因数量较多,这也与其该类化合物的含量较多的结果一致。在黄酮类要用在植物中,龙俐叶含量较多的异黄酮,其相应的Unigene也比黄酮相关的多[12]。表明转录组学技术可用于显齿蛇葡萄次生代谢物质的合成途径和重要功能基因的挖掘,调控机制的研究[10]。转录组学技术具有分析速度快、成本低,逐渐应用在分子标记开发[8]。在显齿蛇葡萄的1000 bp 以上的Unigene 分析发现,4771 个Unigene 包含5 869 个简单重复序列,并使用Primer 3.0 设计引物,可用于其物种进化分析和真伪的鉴定。显齿蛇葡萄转录组数据获得了其转录组信息特征,为开展重要功能基因鉴定,次生代谢通的挖掘和更好的利用奠定了研究基础。