茶树咖啡碱合成酶基因分子变异检测及其关联分析

2023-10-17 02:36刘硕谦叶洁连
茶叶通讯 2023年3期
关键词:咖啡碱茶树变异

刘硕谦,叶洁连

湖南农业大学 园艺学院/茶学教育部重点实验室,湖南 长沙 410128

茶多酚、生物碱、茶氨酸是茶叶中的三大次生代谢产物,三者相互协同决定了茶叶的主要品质。生物碱在茶树体内主要是嘌呤类生物碱,最重要的是茶叶碱、咖啡碱和可可碱三种,其中咖啡碱含量最高,是茶叶中最主要的生物碱。咖啡碱化学名为1,3,7-三甲基嘌呤,本身带有苦味,能与多酚类化合物、蛋白质、氨基酸等结合提高茶叶的品质,使得茶汤呈现鲜爽滋味。茶树除种子外,全株都有咖啡碱积累[1],叶片及茎上半段含量较丰富,其中新梢中咖啡碱含量最高,尤其是幼嫩芽叶中,其次是第一叶和第二叶,老叶含量最低[2]。可见咖啡碱在茶树新梢内的分布规律是随新梢生育程度的加深而减少[3],这可作为茶叶老嫩度的标志成分之一。咖啡碱也是茶叶中主要的药理成分,具有许多药理作用[4],如兴奋中枢神经系统的作用。茶叶中咖啡碱的兴奋作用比较温和,在人体内能迅速转化和消除,对人体没有伤害。此外,咖啡碱还有利尿及影响体内代谢等作用。咖啡碱在茶树体内的合成途径有多条[5]。以腺嘌呤为初始物质的途径为腺苷酸(AMP)生成次黄嘌呤核苷酸(IMP),次黄嘌呤核苷酸在次黄嘌呤核苷酸脱氢酶(IMPDH)的作用下生成黄嘌呤核苷酸(XMP),黄嘌呤核苷酸生成黄嘌呤核苷(XR),黄嘌呤核苷在7-甲基黄嘌呤核苷合成酶的作用下生成7-甲基黄嘌呤核苷,7-甲基黄嘌呤核苷生成7-甲基黄嘌呤(7-MX),7-甲基黄嘌呤在咖啡碱合成酶的作用下合成可可碱,可可碱最后在咖啡碱合成酶的作用下生成咖啡碱。

近年来,低、高或者无咖啡碱等特色茶树品种选育成为国内外茶树新品种选育的热点并取得了较好的研究进展。日本通过对茶树和茶树近缘物种进行物种间杂交,选育出多个咖啡碱含量低于1.5%的茶树资源[6]。叶创兴等[7]从毛叶茶中选育低咖啡碱的可可茶,为低咖啡碱品种的选育打下了良好的基础。广东省农业科学院茶叶研究所与中山大学合作,以野生型的南昆山白毛茶作为亲本杂交出一批可可茶新品种,其中‘可可茶1号’和‘可可茶2号’的咖啡碱含量几乎为零[8]。杨维时等[9]在2005年用同属不同种的油茶和茶树进行胚轴嫁接,其中的‘辐射早’咖啡碱含量降低到2.85%,‘黄叶早’降低到2.49%,2007年采用地上部根颈嫁接法,经嫁接后的‘多抗香’茶树咖啡碱含量下降到2.01%。Ogino等[10]从杂交组合Camellia taliensis×Camelliasinensis的后代中选育出2个咖啡碱非常低的茶树品种。所有这些成就,为培育综合性状优良且具咖啡碱特色的茶树新品种奠定了坚实基础。但是,常规育种技术具有较多的局限性,使得茶树新品种选育进展缓慢[11]。分子标记辅助育种技术在水稻、玉米等作物上的应用,显著提高了新品种选育的效率,大幅度缩短了育种周期。分子标记辅助选择育种的准确、可靠及高效率等优越性,也将会加快茶树品种选育的进程[12]。目前,咖啡碱含量相关的分子标记尚未报道。本研究以咖啡碱含量变异丰富的黄金茶群体为材料,通过分子变异检测与分析,筛选与茶树咖啡碱含量相关的变异位点,为咖啡碱含量相关的分子标记奠定坚实的基础。

1 材料与方法

1.1 基因数据库

本研究使用的数据库为美国生物技术信息中心(NCBI: http://www.ncbi.nlm.nih.gov)。

1.2 分析工具

基本BLAST检索:http://www.ncbi.nlm.nih.gov/blast;ORF开放阅读框分析:http://www.ncbi.nlm.nih.gov/gorf/orfig.cgi;蛋白序列及理化性质与结构分析:https://web.expasy.org/protparam。

1.3 数据分析软件

本研究使用的数据分析软件主要包括R语言、DNAMAN和MEGA11等。

1.4 生物信息学分析方法

利用Expasy提供的程序Protparam tool推测蛋白的氨基酸序列的组成和理化性质,运用NCBI-BLASTP工具对获得的基因序列及其编码蛋白进行同源性搜索,用DNAMAN和MEGA11软件进行多序列比对及构建系统发育树,利用ProTScale分析蛋白的亲/疏水性,利用NCBI Conserved Domain Search分析蛋白的保守结构域,通过TMHMMserver 2.0在线预测跨膜结构,通过Signal P5.0预测分析信号肽,运用SOPMA预测TCS蛋白的二级结构,通过SWISS-MODEL在线分析工具预测TCS蛋白的三级结构。

1.5 TCS基因分子变异检测

选取保靖‘黄金茶’群体200份,通过高效液相色谱法检测咖啡碱含量,筛选59份咖啡碱含量差异明显的样本送诺禾致源生物科技有限公司(北京)对TCS基因组DNA进行测序,以‘铁观音’基因组为参考基因组,通过SNP calling获得TCS基因的分子变异数据。

1.6 TCS突变位点的基因型与咖啡碱水平的关联分析

利用R软件对保靖‘黄金茶’群体59份样本的分子变异数据进行处理与分析,选用显性、隐性、共显性等模型对其位点的基因型与茶树咖啡碱含量进行关联分析。

2 结果与分析

2.1 TCS基因序列及其蛋白质的基本理化性质

ORF finder分析表明,TCSgene ID: TGY007486序列开放阅读框为1 104 bp,起始密码子可能位于1 bp处,终止密码子位于1 104 bp,编码一个含有367个氨基酸的蛋白质。ProParam toll在线预测,表明TCS蛋白分子量为41 188.29 Dal,理论等电点(pl)为5.54,呈酸性。带负电荷的残基即碱性氨基酸精氨酸(Arg)和赖氨酸(Lys)36个,带正电荷的残基即酸性氨基酸天冬氨酸(Asp)和谷氨酸(Glu)为46个。TCS蛋白的异亮氨酸(Leu)的含量最高,达10.6%;L-半胱氨酸(Cys)含量最少,为2.2%。不稳定系数为37.11,TCS蛋白为稳定蛋白。脂肪族指数为86.81,亲水性总平均值为-0.136,推测TCS蛋白为亲水蛋白。

2.2 TCS蛋白同源性及系统发育树分析

为进一步鉴定TCS蛋白序列,利用NCBI数据库中的BLAST对TCS蛋白序列进行同源性比较,运用DNAMAN对茶树TCS蛋白的氨基酸序列与其他物种的咖啡碱合成酶氨基酸序列进行同源性比对分析[16]。结果(图1)表明,TCS蛋白与‘狭叶油茶’(Camellia oleifera)、‘榴梿’(Duriozibethinus)、‘可可’(Theobromacacao)、‘阿月浑子’(Pistaciavera)中咖啡碱合成酶序列的一致性分别为96.19%、54.72%、54.28%和54.16%。运用MEGA 11构建系统发育树,结果(图2)可看出TCS蛋白与‘狭叶油茶’(CICS2)进化距离最近,归为一类。

图1 TCS蛋白同源性分析Figure 1 TCS protein homology analysis

图2 TCS蛋白系统进化树Figure 2 Phylogenetic tree of TCS proteins

2.3 TCS蛋白的保守结构域

结果(图3)表明,茶树TCS蛋白在氨基酸序列第59和第363个之间含有N7-甲基转移酶保守结构域(cl04109),属于SAM依赖性N甲基转移酶,为N7-甲基转移酶超家族成员,进一步验证本研究目标序列的正确性。

图3 TCS蛋白保守结构域Figure 3 The conserved structural domain of TCS protein

图 4 TCS蛋白跨膜结构(a)及信号肽(b)预测Figure 4 Prediction of the transmembrane structure (a) and signal peptide (b) of TCS protein

2.4 TCS蛋白跨膜结构及信号肽预测

跨膜结构分析结果(图4a)表明,TCS蛋白的1~367个氨基酸均位于细胞膜表面,预测没有跨膜蛋白,没有发现可能的跨膜结构,因此推测TCS蛋白属于非分泌蛋白。信号肽结果(图4b)表明,TCS蛋白是信号肽的可能性为0.002,说明TCS蛋白不具有信号肽,所以茶树TCS蛋白不属于分泌蛋白,只在细胞内参与反应,与其跨膜结构分析的结果(图4a)相同。

2.5 TCS蛋白二级结构预测和分析

TCS蛋白的二级结构分析结果如图5所示,能够推测α-螺旋(Alpha helix)和无规则卷曲(Random coil)是TCS蛋白主要的二级结构。367个氨基酸中有172个可能形成α-螺旋,其占总二级结构的46.87%;有132个氨基酸可能形成无规则卷曲,其占比为35.97%;有50个氨基酸可能形成延伸链(Extended strand),其占比为13.62%;这些氨基酸中有13个可能形成β-转角(Beta turn),其占比为3.54%。

图5 TCS蛋白二级结构分析Figure 5 Secondary structure analysis of TCS protein

2.6 TCS蛋白三级结构建模及分析

利用SWISS-MODEL对TCS蛋白三级结构进行分析,结果TCS蛋白三级结构模型如图6所示。经模型可靠性评估分析表明,模型覆盖范围为第24个氨基酸到第366个氨基酸,其GMQE为0.89,说明该模型可靠性高、质量好;且其GMEANDisCo global为0.84±0.05,其序列一致性为86.07%,QMEAN值为-2.49,说明该模型可信度较高。

图6 TCS蛋白三级结构预测Figure 6 Prediction of the tertiary structure of TCS protein

2.7 TCS基因及其启动子变异分析

通过上述的序列系统分析证实在‘铁观音’茶树基因组中基因号为TGY007486的序列为茶树咖啡碱合成酶基因TCS。在此基础之上,我们进一步对59份茶树样本的TCS基因的变异数据进行检测与分析,结果表明在TCS基因的编码区中含有11个变异位点。其中包括2个同义突变位点,分别是Chr01:183517193和Chr01: 183519016;9个非同义突变位点,分别是Chr01:183517108、Chr01:183518919、Chr01:183518924、Chr01:183519002、Chr01:183519023、Chr01:183519083、Chr01:183519209、Chr01:183519225和Chr01:183519228。由图7可看出,Chr01:183517108变异位点在HJ01、HJ02、HJ03等样本中有T→C的转换;Chr01:183518919变异位点在HJ04、HJ05、HJ25等样本中有C→T的转换;Chr01:183518924变异位点在HJ02、HJ15等样本中有T→C的转换;Chr01:183519002变异位点在HJ02、HJ04等样本中有A→G的转换;Chr01:183519023变异位点在HJ07、HJ08、HJ09等样本中有C→CCAA的插入;Chr01:183519083变异位点在HJ05、HJ03、HJ02等样本中有G→T的颠倒;Chr01:183519209变异位点在HJ10、HJ13等样本中有A→G的转换;Chr01:183519225变异位点在HJ02、HJ15等样本有G→A的转换,而在HJ04中有A→G的转换;Chr01:183519228变异位点在HJ14、HJ42等样本中有C→G的颠倒。突变类型分析结果表明,在所检测的样本中11个变异位点中均有杂合突变,其中变异位点Chr01:183518919、Chr01:183518924和Chr01:183519228的杂合突变最多,而位点Chr01:183519209和Chr01:183517108的杂合突变最少。此外,TCS基因的启动子区位点Chr01:183522617存在变异,在HJ02、HJ06、HJ07中有T→A的颠倒,在HJ04、HJ05等样本中有A→T的颠倒,在所考察样本中以纯合突变为主。Chr01:183518418极显著变异位点在HJ04样本中有G→A的转换,在HJ04、HJ33等样本中有A→G的转换,在所考察样本中以纯合突变为主。Chr01:183521387极显著变异位点在HJ02、HJ03等样本中有T→G的颠倒,在所考察样本中以纯合突变为主。

图7 TCS基因变异分析Figure 7 TCS gene variance analysis

2.8 咖啡碱含量分子标记的筛选

在获得了TCS基因及其启动子的变异数据后,对各样本各位点的基因型与咖啡碱含量进行关联分析,结果(图8)表明,与咖啡碱含量显著相关(-log10(p-value)≥1.3)的位点有32个,其中在共显性模型下有23个变异位点与咖啡碱含量显著相关,分别是Chr01:183516630、Chr01:183516636、Chr01:183517108、Chr01:183517359、Chr01:183518359、Chr01:183518536、Chr01:183518834、Chr01:183518862、Chr01:183518873、Chr01:183519083、Chr01:183519228、Chr01:183520073、Chr01:183520149、Chr01:183520186、Chr01:183521143、Chr01:183521146、Chr01:183521194、Chr01:183521221、Chr01:183521243、Chr01:183521780、Chr01:183521799、Chr01:183521819和Chr01:183521821;在显性模型下有2个变异位点与咖啡碱含量显著相关,分别是Chr01:183516630和Chr01:183516636;在隐性模型下有3个变异位点与咖啡碱含量显著相关,分别是Chr01:183521194、Chr01:183521221和Chr01:183521243;在超显性模型下有2个变异位点与咖啡碱含量显著相关,分别是Chr01:183516630和Chr01:183519863。而与咖啡碱含量极显著相关(-log10(p-value)≥3.1)的位点有2个,分别是Chr01:183518418和Chr01:183521387,因此这两个变异位点均可作为茶树咖啡碱含量的分子标记开发。

图8 TCS变异位点基因型与茶树咖啡碱含量的关联分析Figure 8 Association analysis of TCS variant loci genotypes and caffeine content in tea plant

3 结论与讨论

茶叶具有多种药理功效[13-14]。饮茶作为一种受欢迎的健康生活方式,具有多种好处,如提高注意力、改善心情和消除疲劳。然而,高咖啡因饮料(如咖啡或能量饮料)的摄入可能对身体有害,导致失眠、心悸、头痛等症状,并增加心血管疾病和中风的风险。为解决这一问题,低咖啡碱茶树新品种的选育成为热点。但传统低咖啡碱茶树的选育是一个长期的过程,而分子标记辅助育种具有高效率及较高的准确性等优越性能够为茶树低咖啡碱选育带来很大的助力。

本研究首先通过同源性分析从‘铁观音’茶树参考基因组中筛选到茶树TCS基因序列,该序列ORF为1 104 bp,编码367个氨基酸,与‘狭叶油茶’咖啡碱合成酶序列一致性为96.19%。考察的10多个物种中,TCS蛋白与‘狭叶油茶’咖啡碱合成酶遗传距离最近,且聚为一类。由此可推测,本研究的目标序列为咖啡碱合成酶基因。进一步研究发现,TCS蛋白为非跨膜蛋白且不具有信号肽,仅能在细胞内参与反应。通过保守结构域分析,确定TCS蛋白属于N7-甲基转移酶超家族的成员,即SAM依赖性N甲基转移酶,这与刘玉飞等[15]的研究结果一致。TCS蛋白二级结构以α-螺旋和无规则卷曲为主,其中α-螺旋占总二级结构的46.87%,而无规则卷曲占35.97%,β-转角占3.54%,这与刘玉飞等[15]的研究结果一致。进一步预测的TCS蛋白三级结构与图6的三级结果模型一致,属于典型的咖啡碱合成酶结构。一般来说,目标蛋白三级结构与模型的GMQE值越高表示可靠性越高,可信度范围为0~1,值越大表明质量越好。本研究的GMQE值为0.89,GMEANDisCo global值为0.84 ± 0.05,QMEAN值为-2.49,其序列一致性为86.07%,表明预测结果可信度较高。综合上述序列分析、同源性分析以及结构分析,系统验证了本研究的序列确实为咖啡碱合成酶基因,可开展下一步的分子变异分析。

分子变异是指生命在遗传的基础上同一基因库中不同个体之间在DNA水平上的差异,也称为“遗传变异”,是对同一物种个体之间遗传差别的定性或定量描述。遗传与变异是生物界不断普遍发生的现象,也是物种形成和生物进化的基础。常见的分子变异类型有单核苷酸多态性、插入缺失突变、错义突变、无义突变及移码突变等,生物的分子变异能够使生物个体产生新的性状以至于形成新的物种,有利于生物的进化。Jang Su等[16]通过对候选等位基因做DNA标记,堆叠几个有利的等位基因具有显著提高水稻每穗穗数的潜力,有利于增加每个穗的小穗数量。Ravi Samathmika等[17]对甜菜土壤中不同程度受立枯丝核菌感染的植物进行限制性位点相关DNA(RAD)测序,位于染色体6上的RsBv1n能够抵抗丝核菌。单核苷酸多态性(SNP)是指由于单个核苷酸以及较短片段的插入或缺失所引起的多态性[18]。根据它的分布位点可以分为基因编码区SNPs、基因间SNPs等[19]。相比于第二代分子标记SSR(Simple sequence repeat)标记它需要对其多态性进行验证,费时费力,开发的成本较高;而SNP遗传标记技术是第三代分子标记,它的优点有高通量、快速、分析简单、成本较低、全基因组覆盖等,因此它的多态性几乎是在所有被研究的物种中都被用作有效的遗传标记,在动物和植物中均被应用。另外,樊晓静等[20]研究得出SNP分子标记也可以用来作为茶树品种种质资源的身份证。

本研究通过TCS基因的分子变异检测发现茶树中TCS基因分子变异丰富,包含了SNP、插入突变及缺失突变。通过单核苷酸多态性分析共检测到11个TCS基因变异位点,其中7个转换,包括A/G 4个和T/C 3个;4个颠倒,包括C/G 1个、A/T 2个、G/T 1个;1个C/CCAA插入,无缺失位点,9个非同义变异位点,2个同义变异位点;两个极显著变异位点分别是2个A/G的转换,1个T/G的颠倒。

为了验证TCS基因分子变异是否影响茶树咖啡碱在茶树中的积累,首先检测了‘黄金茶’群体中各样本的咖啡碱含量,结果发现‘黄金茶’群体咖啡碱含量差异显著,变异范围从0.2%~4.6%。通过表型与基因型的关联分析发现,在TCS基因变异位点中有Chr01:183518418和Chr01:183521387两个位点的基因型与茶树咖啡碱含量极显著相关。Chr01:183518418和Chr01:183521387可以作为茶树咖啡碱含量分子标记开发的候选位点。

本研究筛选了两个茶树咖啡碱含量关联位点,将在茶树咖啡碱特色茶树新品种的分子标记辅助选择育种中有广阔的应用前景。但由于TCS基因的转录调控机制尚不明确,本研究未对其转录因子或其他相关基因的分子变异进行分析。我们下一步将分析茶树咖啡碱含量相关的变异位点以期获得更全面的咖啡碱含量分子标记,更好地服务于茶树的分子育种。

猜你喜欢
咖啡碱茶树变异
安徽农业大学揭示茶树咖啡碱合成调控机制
变异危机
变异
山茶树变身摇钱树
19份茶树资源鲜叶中咖啡碱合成酶的活性
大孔吸附树脂富集速溶茶中咖啡碱的研究
两个推荐茶树品种
晚上喝茶头遍要倒掉
茶树湾
变异的蚊子