杜仲U-box基因家族鉴定及分析

2021-08-19 02:19赵德刚
种子 2021年7期
关键词:进化树泛素杜仲

赵 丹, 李 波, 赵德刚,2

(1.贵州大学农业生物工程研究院/生命科学学院,山地植物资源保护与保护种质创新教育部重点实验室, 贵阳 550025;2.贵州省农业科学院,贵州省植物保育技术应用工程研究中心, 贵阳 550006)

泛素化是蛋白质组中最常见的翻译后修饰之一,是细胞内短寿命蛋白和一些异常蛋白降解的普遍途径。其中E 3连接酶在泛素化过程中主要负责对靶蛋白的特异性识别,介导26 S蛋白酶体系统对靶蛋白进行泛素化修饰[1],该酶决定着靶蛋白的多样性与特异性。研究表明,含有U-box 蛋白结构域的泛素连接酶E 3在植物的生长发育过程中起着重要作用[2],其U-box 保守域含有约70个氨基酸,U-box 结构域在酵母、植物和动物等真核生物中高度保守。

目前,已经利用基因组数据库对多种植物U-box基因家族进行了鉴定和分析,其中拟南芥(Arabidopsisthaliana)中鉴定到64个U-box 蛋白[3],水稻(OryzasativaL.)中鉴定到77个U-box蛋白[4],蒺藜苜蓿(Medicagotruncatula)中鉴定到41个U-box蛋白[5],大豆(Glycinemax(L.)Merr.)中鉴定到43个U-box 蛋白[6],葡萄(VitisviniferaL.)中鉴定到31个U-box蛋白[7],香蕉(Musaacuminata)中鉴定到91个U-box蛋白[8],甘蓝(brassicaoleraceaL.)中鉴定到99个U-box蛋白[9],苹果中鉴定到69个U-box蛋白[10],番茄中鉴定到62个U-box蛋白[11]。许多U-box蛋白在植物生长发育以及非生物胁迫中发挥着重要作用[12]。

杜仲(EucommiaulmoidesOliv.)是我国特有的国家战略资源树种,既是世界上极具开发潜力的天然橡胶资源,又是我国特有的名贵药材和木本油料树种[13]。杜仲基因组测序的完成,为杜仲基因家族的鉴定提供了数据来源。到目前为止,对杜仲U-box基因家族的研究尚未取得突破进展。U-box基因可能在杜仲的生长发育中起着重要作用,因此对杜仲U-box基因家族的研究具有重要意义。本研究对杜仲U-box基因家族进行了鉴定及生物信息学分析,为进一步研究该基因家族在杜仲生长发育等过程中的作用提供理论指导。

1 材料与方法

1.1 数据来源

杜仲(EucommiaulmoidesOliv.):https://bigd.big.ac.cn/gwh/Assembly/13/show。

拟南芥(Arabidopsisthaliana):https://www.ncbi.nlm.nih.gov/assembly/GCF_000001735.4/。

三叶橡胶(Heveabrasiliensis):https://www.ncbi.nlm.nih.gov/assembly/GCA_0 10458925.1/。

1.2 杜仲U-box 基因家族成员检索

从 Pfam 数据库下载U-box 保守序列 PF 04564,利用Hmmer v3.1 b 1软件构建本地隐马尔科夫模型(HMM),用下载的杜仲蛋白序列文件搜索获得杜仲U-box结构候选蛋白。根据Donna等[14]的方法,从拟南芥数据库和GenBank下载了64个拟南芥U-box基因序列和蛋白质序列。从三叶橡胶基因组数据库(https://www.genome.jp/dbget-bin/www_bfind_sub?dbkey=T 05150&keywords=U-box&mode=bfind&max_hit=1000)中下载了12个U-box基因序列和蛋白质序列。同样用构建的HMM模型分别对拟南芥、三叶橡胶基因组蛋白序列文件进行搜索,所获结果与下载的拟南芥、三叶橡胶U-box基因序列和蛋白质序列进行合并,得到最新的拟南芥、三叶橡胶U-box基因序列和蛋白质序列,分别为70个和51个。

利用获得的拟南芥、三叶橡胶的U-box基因CDS序列,与杜仲基因组CDS序列进行BLAST检索,所得序列与隐马尔科夫检索含有U-box结构域的候选序列合并,剔除重复。

1.3 杜仲U-box 基因鉴定与保守结构域分析

将得到的结果经SMART(http://smart.embl-heidelberg.de/smart/set_mode.cgi?NORMAL=1)、NCBI CDD(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)、InterPro(http://www.ebi.ac.uk/interpro/)和Pfam(http://pfam.xfam.org/search)进一步分析,剔除无典型U-box结构域的序列,最终获得杜仲U-box基因家族所有成员,分析U-box结构域长度和位置以及其它结构域类型。利用ExPASy 在线工具(https://web.expasy.org/protparam/)预测U-box蛋白的等电点、分子量和亲水性平均值(Grand average of hydropathicity, GRAVY)。利用Wolfpsort在线工具(https://wolfpsort.hgc.jp/)预测U-box蛋白的亚细胞定位。

截取杜仲U-box家族基因蛋白质序列中U-box保守结构域,采用Clustalx 1.83软件进行多序列联配比对分析。

1.4 杜仲U-box基因结构

利用MEGA 7.0软件生成杜仲U-box蛋白质进化树Newick文件,利用杜仲U-box基因序列ID获得对应基因序列和转录本序列,将U-box基因序列、转录本序列和进化树Newick文件上传至在线工具GSDS 2.0(http://gsds.cbi.pku.edu.cn/index.php)作图。

1.5 进化树构建和 Motif 分析

将杜仲和拟南芥U-box蛋白质序列构建本地fast文件,采用MEGA 7.0程序的进化距离邻接法(Neighbor-Joining,NJ)构建系统进化树,生成进化树Newick文件后采用在线工具iTOL(http://itol.embl.de/upload.cgi)作图。同样的方法生成杜仲与三叶橡胶U-box蛋白的系统进化树。

利用在线工具MEME(http://meme-suite.org/tools/meme)进行Motif 检索,将得到的 Motif 结构基序采用 InterPro(http://www.ebi.ac.uk/interpro/)进一步验证其功能。

1.6 杜仲组织RNA提取及q-PCR分析

杜仲材料取自农业生物工程研究院转基因示范基地,于11月份采集雌雄株叶片、枝条以及果实,液氮速冻,-80 ℃冰箱保存备用。每组材料3个生物学重复。

采用TRIzol RNA法提取植物总RNA,用PrimeScriptTMRT reagent Kit with gDNA Eraser(Perfect Real Time)(TaKaRa, #RR 047 A))试剂盒,将RNA反转录为cDNA。Prime 3设计引物(见表1),内参为杜仲EF1α[15],使用Luna®Universal qPCR Master Mix(NEB)荧光染料在CFX ConnectTM荧光定量 PCR 仪进行表达量分析。反应程序为:95 ℃ 3 min,95 ℃ 10 s,55 ℃ 20 s,72 ℃ 20 s,75 ℃ 5 s,共40个循环。每个处理3次重复。用SPSS软件进行显著性分析(*表示差异显著(p<0.05),**表示差异极显著(p<0.01))。

表1 q-PCR引物序列

2 结果与分析

2.1 杜仲U-box基因家族基本信息

经SMART软件分析,去除不含典型U-box结构域的序列,从杜仲基因组中鉴定到40个U-box基因,其U-box结构域的氨基酸数目在55~67个之间,其中24个U-box蛋白的U-box保守结构域含有63个氨基酸。此外,其中21个U-box蛋白除了含U-box结构域以外,还含有PLN 03200 superfamily、Arm/Arm_2 superfamily、WD 40 superfamily、STK_N、Rho_N、KAP superfamily的结构域(表2)。

表2 杜仲U-box基因家族的信息

根据基因家族成员所含其他结构域的不同,将40个U-box蛋白分为 7类:第Ⅰ类蛋白只含有U-box结构域,有19个;第Ⅱ类蛋白含有PLN 03200 superfamily结构域,有9个;第Ⅲ类蛋白含有Arm/Arm_2 superfamily结构域,有6个;第 Ⅳ类蛋白含有WD 40 superfamily结构域,有2个;第Ⅴ类蛋白含有STK_N结构域,有2个;第Ⅵ类蛋白含有Rho_N结构域、第Ⅶ类蛋白是含有KAP superfamily,同样都只有1个成员。

通过ExPASy在线工具预测,最长的U-box蛋白(GWHPAAAL 018368)有1 486个氨基酸,分子量为165.1 kD,最短的U-box蛋白(GWHPAAAL 019556)有327个氨基酸,分子量为36.51 kD。等电点从5.16(GWHPAAAL 017730)到9.34(GWHPAAAL 005414),其中酸性蛋白质21个,碱性蛋白质19个。亲疏水性统计发现27个杜仲U-box蛋白为亲水性(GRAVY<0),13个杜仲U-box蛋白为疏水性(GRAVY>0),其中亲水性最强的(GWHPAAAL 022717)GRAVY值为-0.569,疏水性最强的(GWHPAAAL 025015)GRAVY值为0.14。

利用Wolfpsort在线工具对杜仲U-box家族成员进行亚细胞定位预测,结果显示该基因家族成员位于细胞的不同位置,主要位于细胞核、叶绿体、细胞质。

2.2 杜仲U-box家族基因结构及保守结构域分析

利用GSDS软件分析U-box成员的基因特征,结果发现杜仲U-box成员之间基因结构存在很大的差异,CAD序列最长(GWHPAAAL018368)为4 458 bp,最短(GWHPAAAL019556)为981 bp。外显子数目为1~14个,其中仅含一个外显子的U-box基因有18个(图1)。

采用Clustalx 1.83软件对 40个杜仲U-box基因家族中U-box保守结构域进行多序列联配比对分析。结果显示杜仲U-box保守结构域有多个氨基酸高度保守,如脯氨酸(Pro)、半胱氨酸(Cys)、甲硫氨酸(Met)、天冬氨酸(Asp)、甘氨酸(Gly)、苏氨酸(Thr)、精氨酸(Arg)、异亮氨酸(Ile)、色氨酸(Trp)、天冬酰胺(Asn),这些保守氨基酸对稳定U-box保守结构域起着关键作用(见图2)。

2.3 U-box蛋白motif分析

通过MEME在线工具分析杜仲U-box蛋白获得10个Motif 结构基序。经 Inter Pro工具分析发现,Motif 1、Motif 2、Motif 4和 Motif 9的数量最多,是杜仲U-box蛋白最常见 Motif 结构基序,其中Motif 1、Motif 2和 Motif 4 对维持U-box 蛋白结构是必不可少的(表3和图3)。Motif 9具有结合蛋白质功能,是ARM保守结构域的组成部分,而U-box-ARM型一般都具有依赖于U-box功能域的E 3泛素连接酶活性,参与泛素/26 S蛋白酶复合体途径介导的蛋白降解。

表3 杜仲U-box蛋白最常见Motif 特征

2.4 U-box基因家族进化树分析

为了进一步研究杜仲U-box蛋白的系统进化,对杜仲(40个)分别与拟南芥(71个)和三叶橡胶(51个)的U-box蛋白构建系统进化树。结果表明,杜仲U-box基因间的遗传距离较接近,如同一个分支上的GWHPAAAL008984、GWHPAAAL011256、GWHPAAAL011401和GWHPAAAL025939,推测可能来自于同一个祖先。同样拟南芥和三叶橡胶的U-box基因家族也有类似的情况(图4)。

2.5 U-box基因家族的表达分析

选取杜仲U-box基因家族中U-box-Arm结构域的6个成员进行组织特性表达分析。结果表明,在杜仲雌株茎、叶、果和雄株茎、叶中各基因均有表达,其中GWHPAAAL022027在雌株叶、果中表达较高,GWHPAAAL025437在雄株茎、雌株茎和果中表达较高,由于U-box-Arm结构域大多与泛素化修饰有关,因此推测泛素化修饰作用参与到杜仲生长发育的各个阶段(图5)。

3 讨 论

泛素连接酶E 3是泛素蛋白降解途径中决定底物特异性的重要因子,在拟南芥1 200多个泛素连接酶E 3中,U-box结构域类的泛素连接酶E 3是具有重要功能的一类[16-18]。目前已鉴定了多个植物的U-box蛋白。本研究通过生物信息学方法鉴定获得了40个典型的杜仲U-box结构基因家族成员,同时还分析获得70个拟南芥U-box基因家族和51个三叶橡胶U-box基因家族,其中拟南芥U-box基因家族成员比之前报道的64个还多6个。杜仲U-box基因家族的蛋白质大小在36.51~165.1 kD,等电点在5.16~9.34之间,家族成员间的差异较大。亚细胞定位显示该基因家族成员主要位于细胞核、叶绿体、细胞质。此外,由于基因组数据为Scaffod版本,因而没有作染色体定位分析。

根据家族成员除U-box结构域以外的结构域,将40个U-box蛋白划分成7类,仅含U-box结构的成员在杜仲中最多,有17个。而在植物中研究较多的U-box-Arm结构在杜仲中为第三大类。研究表明,Arm功能域主要参与蛋白-蛋白间的相互作用,在细胞内信号传递、细胞骨架调控、核输入和转录调控等过程中起作用[19],而U-box蛋白大多数都具有E 3泛素连接酶的活性,参与泛素/26 S蛋白酶复合体的降解过程[20]。U-box和Arm结合起来共同完成E 3连接酶的功能。U-box基因参与叶、花、果、茎等的生长发育[21-22]。U-box-Arm结构的基因家族成员在杜仲雌雄株叶、茎、果中均有表达,但表达高低有很大差异,证明该结构的基因家族成员在组织中发挥着不同的功能。

综上,本研究筛选鉴定了40个U-box蛋白,根据含有的不同结构域将其分为7类,其中U-box-Arm蛋白有6个。通过Real-time分析,U-box-Arm蛋白具有组织特异性。这些结果为进一步研究U-box蛋白在杜仲生长发育等的作用机制提供了参考数据。

猜你喜欢
进化树泛素杜仲
三氯乙烯致L-02细胞毒性中SET蛋白介导的组蛋白泛素化及类泛素化修饰鉴定
嗜肺军团菌效应蛋白质介导的新型泛素化过程
泛素链的体外制备、磷酸化修饰与标记方法
泛素化在心肌梗死后的心肌保护与促再生作用的研究进展
大学生对进化树的常见误解
福州2009—2014年甲型H1N1流感病毒株HA基因进化分析
艾草白粉病的病原菌鉴定
略阳杜仲
殃及池鱼
周末