沙特番茄黄化曲叶病毒AC2基因编码蛋白的生物信息学分析

2020-01-18 02:24朱晓林魏小红王宝强冯悦赵耀东
广西植物 2020年12期
关键词:生物信息学

朱晓林 魏小红 王宝强 冯悦 赵耀东

摘 要:该试验旨在通过生物信息学方法分析沙特番茄黄化曲叶病毒AC2基因编码的转录激活蛋白TrAP(transcriptional activator protein)的结构及功能。该文通过在线软件预测和分析了番茄中AC2基因编码蛋白的一级结构、二级结构、磷酸位点、糖基位点、三级结构及其重要的功能;通过最大似然法对不同物种 AC2基因编码蛋白序列构建系统发育树,进行系统发育分析。结果表明:番茄中AC2基因共编码135个氨基酸,且编码蛋白属于不稳定的亲水性蛋白质;二级结构以无规则卷曲折叠为主,比例为58.52%;该蛋白不存在跨膜结构域,属非跨膜蛋白且不存在信号肽;该蛋白1~129个氨基酸区域为双生病毒超基因家族 (Gemini_AL2 superfamily) 结构域;系统进化情况和植物分类学基本一致,沙特番茄双生病毒AC2基因与南非木薯间的亲缘关系最近。该基因编码蛋白结构与功能的分析为进一步研究AC2双生病毒基因家族奠定了基础,同时为番茄抗病在病虫害防治方面提供一种可行的思路。

关键词:沙特番茄黄化曲叶病毒, AC2基因, 转录激活蛋白, 生物信息学

中图分类号:Q943

文献标识码:A

文章编号:1000-3142(2020)12-1773-08

Abstract:This experiment aimed to analyze the structure and function of the transcriptional activator protein transcriptal activator protein (TrAP) encoded by the AC2 gene of the Saudi tomato yellow leaf curl virus by bioinformatics.In this study, primary structure, secondary structure, phosphate site, glycosylation site, tertiary structure and important functions of the protein encoded by AC2 gene in tomato were predicted and analyzed by online software.Phylogenetic trees were constructed by maximal likelihood method for the encoded protein sequences of AC2 genes from different species for phylogenetic analysis.The results were as follows:The AC2 gene encoded a total of 135 amino acids in tomato, and the encoded protein belonged to an unstable hydrophilic protein; The secondary structure was dominated by random coil folding, with a ratio of 58.52%; The protein did not have a transmembrane domain, it belonged to non-transmembrane protein and had no signal peptide; The 1-129 amino acid region of this protein was the Gemini_AL2 superfamily domain; The phylogenetics and plant taxonomy were basically the same, and the relationship between Saudi tomato yellow leaf curl virus AC2 gene and the South African cassava is recent.The analysis of the structure and function of the encoded protein provides a basis for further understanding of the AC2 geminivirus gene family, and provides a feasible approach for tomato disease resistance in pest control.

Key words:Saudi tomato yellow leaf curl virus, AC2 gene, transcriptional activator protein, bioinformatics

番茄(Solanum lycopersicum)果实营养丰富、风味独特、富含维生素等,能有效降低消化道癌、前列腺癌等多种疾病发生的几率,是深受人们喜爱的蔬菜,在全世界种植广泛(曹玉鑫等,2018)。随着种植面积、复种指数不断增加,各种病害也接踵而至。

番茄黄化曲叶病作为蔬菜作物生产中最具毁灭性的病害,其致病因子是黄化曲叶病病毒。属于双生病毒科,是一个大型的单链DNA病毒家族,它在重要的经济作物上感染并造成毁灭性疾病(Sung & Coutts, 1996)。该病菌由烟粉虱(Bamesiatabasi)传播,其病毒可以是单链DNA(ssDNA))或二份[(两个相等)ssDNA称为DNA A和B](Zerbini et al., 2017)。DNA A编码互补的4~5个开放阅读框(ORF)方向(AC1/C1,AC2/C2,AC3/C3,AC4/C4和AC5/C5)和两个病毒感染的ORF(AV1/V1,AV2/V2)参与反式激活,复制和反应的方向封装(Hanley et al., 2013)。它们被细分为九个属,该病毒属的成员编码称为AC2/C2的致病蛋白,该类转录激活蛋白是能与启动子中特定DNA序列結合并激活基因转录反应的蛋白质分子,其相互作用使许多植物蛋白失活并通过C-末端反式激活结构域反式激活许多宿主基因(Babu et al., 2018)。同时TrAP激活叶肉细胞和原生质体中病毒外壳蛋白(CP)和BR1运动基因启动子的表达,并起到抑制植物组织中CP启动子的作用(Rajeswaran et al., 2007)。谢迎秋等(2001)对棉花曲叶病病毒AC2 功能进行了初步探究,揭示了AC2基因编码的蛋白在寄主植物中反式激活病毒链基因启动子的奇异现象,其为研究病毒与植物间的相互作用的分子机理提供了新依据。

目前国内在番茄抗黄化曲叶病方面,主要集中于抗病基因的研究,对入侵病毒本身基因方面研究较少,尤其对病毒AC2基因的研究还鲜有报道,而当今控制番茄黄化曲叶病病毒迫在眉睫。因此,完成对AC2 基因编码的转录激活蛋白进行全面的生物信息学分析,有助于理解病毒如何成功感染宿主,同时可通过分子手段抑制该基因的表达,从而为以后番茄在防治黄化曲叶病以及抵制抗病方面提供参考价值。

1 材料与方法

1.1 序列来源

利用NCBI数据库获取不同物种病毒基因AC2编码的TrAP氨基酸序列及其他信息。

1.2 蛋白质结构分析预测

1.2.1 一级结构 通过Expasy平台,根据Relative mutability参数、 Zimmerman方案、 Hopp & Woods方案、Bulkiness参数、Average flexibility参数、Janin方案预测蛋白的相对突变性、极性、亲水性、松散性、柔韧性、可及性理化性质等一级结构。

1.2.2 二级结构 通过法国里昂CNRS的SOPMA 软件(https://npsa-prabi.ibcp.fr/cgi -bin/npsa_automat.pl? page = npsa_sopma.html)) 预测该基因编码蛋白的二级结构; 利用CBS 系统中 SignalP5.0 server 平台(http:/ / www.cbs.dtu.dk/services/SignalP/) 预测沙特番茄黄化曲叶病毒TrAP蛋白信号肽序列(李玩生等,2010);利用Scratch Predict Protein 在线软件(徐庆刚等,2010)对该基因编码产物进行二硫键结合的预测与分析;利用 CBS 系统中TMHMM Server v.2.0平台(http://www.cbs.dtu.dk/services/TMHMM/)进行蛋白跨膜区域的预测(Sonnhammer et al., 1998)。

1.2.3 磷酸化位点和糖基化位点预测 利用 CBS 系统中 NetPhos 3.1平台(http://www.cbs.dtu.dk/services/NetPhosK)以及NetOGlyc 4.0进行蛋白磷酸位点与糖基位点的预测。

1.2.4 结构域预测 NCBI中的 CDD 数据库(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 预测蛋白质功能结构域。

1.2.5 三级结构 通过 SWISSMODEL(Lin et al., 2018)对沙特番茄黄化曲叶病病毒基因AC2编码蛋白的三维结构进行同源建模。

1.3 系统发育树的构建

通过NCBI对 13个物种AC2基因编码蛋白序列进行同源比对分析,再利用MEGA X(Wang et al., 2017)软件中的邻接法(neighbor-joining method,NJ)构建系统发育树。

2 结果与分析

2.1 沙特番茄黄化曲叶病毒TrAP氨基酸序列

沙特番茄黄化曲叶病毒AC2基因GenBank登录号为 NC_022229.1,其编码的蛋白TrAP氨基酸序列为MQPSSPSTSHCSQVPIKVQHKLAKKKIIRRR

RLDLDCGCSYYLHINCTNHGFTHRGTHHCSSGNEWRFYLGDKQSPLFQDHQPQREATQHEQRHNFNTNPIQSQHQEGVGDSQMFSQLPNLDDLTASDWSFLKSI。对沙特番茄黄化曲叶病毒AC2基因完整编码蛋白序列进行 BLAST 分析,将其与同源性较高的从NCBI里下载的卷心菜( 序列号:NP_620887.1)、南非木薯 (序列号:NP_620664.1)、棉花(序列号:CDO50035.1)、云南烟草 (序列号:NP_722555.1)、甘薯 (序列号:NP_808770.1)、胡椒(序列号:NP_050016.1)、台湾番茄(序列号:YP_001950236.1)、豆类(序列号:NP_612596.1)、土豆(序列号:NP_808757.1)、海南番茄(序列号:YP_003104749.1)、番木瓜 (序列号:NP_689460.1) 和云南番茄(序列号:YP_008060401.1)等序列构建系统发育树。

2.2 蛋白结构分析

2.2.1 一级结构 预测结果显示,该蛋白共含135个氨基酸,其分子量为15 640.38,等电点为8.67,带负电荷氨基酸残基数为(Asp + Glu)12个,带正电荷残基数为(Arg + Lys)15个;分子式为C676H1037N211O206S7,原子总数为2 137个;不稳定指数为61.37;消光系数为15 470 mol·L-1, 对应吸光值是0.989。脂肪族氨基酸指数为54.89;各个氨基酸组成如图1所示,其中丝氨酸、谷氨酰胺的比例最高,分别为11.1%、10.4%,蛋氨酸、色氨酸的比例最低,均为1.5%。

Expasy平台预测结果显示Relative mutability参数(图2:A)得分位于53.000~100.556间,即该蛋白高突变区位于95~103位氨基酸间;Zimmerman方案(图2:B)评分位于1.748~39.640间,因此可预测该蛋白高极性区位于21~34位氨基酸间;Hopp & Woods方案(圖2:C)评分表明其最大值为1.933,最小值为-1.156,因此该蛋白高亲水性区域位于21~35位氨基酸间;Bulkiness参数(图2:D)位于10.574~18.103之间,其蛋白的高松散区域位于12~33位氨基酸间;Average flexibility参数(图2:E)得分位于0.397~0.494间,因此其高柔韧性区域在25~37位氨基酸之间;Janin方案(图2:F)评分位于-1.067~0.256间,其高可及性区位于36~44位氨基酸间。

2.2.2 二级结构分析预测 由图3可知,无规则卷曲在整个多肽链主链骨架上所占比例最大,为58.52%,由79个氨基酸构成,且其较为突出的区域是1~15、71~83、95~111,其次为α-螺旋,为25.19%,由34个氨基酸构成,其较突出部位为16~34、84~94,而该氨基酸序列无β-转角与β-折叠,而延伸链占16.30%。则该番茄蛋白主要二級结构元件为无规则卷曲与α-螺旋。按照蛋白质二级结构划分标准来看,沙特番茄黄化曲叶病毒基因编码产物在结构上属于混合型(Skolnick & Fetrow, 2000; 曹建等,2012)。

如图4所示, 经预测, TrAP的1~135位氨基酸均位于细胞膜表面(图4:A),由此可以推断该蛋白无跨膜区域的形成。同时该蛋白也无信号肽的存在(图4:B)。运用 Scratch Protein Predictor软件对该蛋白的二硫键进行预测,结果显示,预测沙特番茄黄化曲叶病毒TrAP蛋白5个 Cys 中,2个 Cys 形成 1对二硫键,预计在第37、39、47、60位间形成。

2.2.3 磷酸化位点和糖基化位点预测 运用NetPhos 3.1在线软件对番茄 TrAP蛋白磷酸化位点进行预测,由图5可知,该蛋白的氨基酸序列包含24个磷酸化位点,且其磷酸化位点分别位于丝氨酸 (Ser)、苏氨酸 ( Thr) 和酪氨酸 ( Tyr) 残基上。丝氨酸磷酸化位点15个、苏氨酸磷酸化位点7个以及酪氨酸磷酸化位点2个,多磷酸化位点在蛋白质翻译后修饰水平上发挥着重大作用。而NetOGlyc 4.0预测结果表明该蛋白含有9个糖基化位点。

2.2.4 结构域预测 应用NCBI 中的CDD 数据库( http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 预测蛋白质功能结构域。预测结果如图6所示,结果表明沙特番茄黄化曲叶病病毒基因AC2转录激活蛋白的1~129 个氨基酸区域为双生病毒超家族 (Gemini_AL2 superfamily) 结构域,该结构域对该编码蛋白功能发挥有极其重要的作用。

2.2.5 三级结构 通过同源建模方法构建的沙特番茄黄化曲叶病毒基因AC2编码蛋白的三级结构,结果如图7所示。该蛋白结构较为简单,卷曲链与折叠链结构较少,蛋白质的三级结构对其生物学功能的发挥具有极其重要的作用,因此预测该蛋白功能相对单一。

2.3 AC基因编码蛋白的系统发育树构建

从图8可以看出,在通过系统发育树构建的13个物种中,沙特番茄黄化曲叶病毒与南非木薯间的亲缘关系最近,其次是棉花、番木瓜、海南番茄、胡椒、云南番茄、台湾番茄、云南烟草、土豆、豆类、卷心菜、甘薯。

3 讨论

烟粉虱作为黄化曲叶病病毒的携带者,可操纵植物防御信号。在病虫害侵染后,植物体内主要进化出两种防卫反应机制,水平抗性与垂直抗性。植物首先动员水杨酸(SA)依赖的水平抗性防御,其主要针对病原体。垂直抗性是植物在长期抵制病原菌的过程中形成的专一抗性,通过进化出专一抗性基因来抵抗病毒(Gill et al., 2019), 而部分番茄品种体内不存在抗病基因,因此以病毒基因自身结构作为一个切入点,利用RNA干扰沉默病毒AC2基因有助于病害的防御。黄化曲叶病病毒作为危害番茄产量最主要的病害,由双生病毒引起,其该病毒不仅可作为表达载体在植物中直接表达外源基因,还可提供分离的调控元件,调控植物体的生理生化过程。研究表明,在AC2基因不存在时, ACMV病毒链基因启动子表达活性较低,AC2 基因存在时,病毒链基因启动子活性显著增强,从而使病毒高效复制(Brough et al., 1992)。同时导致AC2激活病毒链基因启动子复杂性的另一个可能因素是病毒链基因启动子的活性受时空调控,具有发育阶段特异性和组织特异性(Sunter & Bisaro, 1997) 。而在该病毒入侵植物时,AC2基因编码的转录激活蛋白在其病毒自我复制中发挥了很重要的作用,已发现在烟草中AC2基因能产生严重的影响,使烟草属植物的叶组织发育不全(Siddiqui et al., 2008)。AC2编码的蛋白可作为植物体内寄主RNA沉默的抑制子,而寄主RNA沉默是植物抵御病毒入侵的有效手段,因此抑制AC2基因编码产物是防止病毒在植物体内传播的有效途径。本研究对沙特番茄黄化曲叶病毒基因编码的TrAP蛋白序列的一级、二级、三级结构以及功能分类等进行预测及分析,该结果为研究AC2基因及其编码产物的结构和功能提供了更多的信息,同时对AC2基因进行全面的生物信息学分析,以期通过分子手段抑制其基因的表达,为番茄抗病育种提供可行的思路。

本研究中AC2 基因编码产物共含135个氨基酸,其中丝氨酸含量最高,该氨基酸含量的高低与蛋白亲水性有密切关联,同时该蛋白不稳定系数高达61.37,因此其属于不稳定的亲水性蛋白质。AC2 基因编码蛋白的二级结构以α-螺旋和无规卷曲为主,存在2个二硫键,这与该蛋白分子对抗外界因素影响的不稳定性有很大关系。该基因编码蛋白是一种转录激活因子,其结构不存在跨膜区,即不属于定位于生物膜的膜蛋白。该编码蛋白含有1个双生病毒超家族结构域,其在细胞被运输以及结合嘌呤和嘧啶中起关键的作用,同时在细胞信号转导中发挥作用。沙特番茄黄化曲叶病毒基因与南非木薯间的亲缘关系最为密切,其次是棉花、番木瓜、海南番茄、胡椒、云南番茄、台湾番茄、云南烟草、土豆、豆类、卷心菜、甘薯。由各物种同源性高于 25% 就可判断其功能上的相似性(Garnier et al., 1996)。 这种同源性一方面体现出各物种间的亲缘关系,另一方面也表明各个物种的AC2基因编码产物在结构特征中的相对稳定性,同时表明AC2基因编码蛋白在漫长的生物演变过程中更多地受净化选择作用的束缚,其保守性较强。

4 结论

本研究通过生物信息学方法对沙特番茄黄化曲叶病毒AC2基因编码的转录激活蛋白进行预测和分析。结果表明,沙特番茄黄化曲叶病毒AC2主要编码病毒转录激活蛋白,其在病毒入侵番茄的过程中发挥极其重要的作用,对病毒在植物体内的繁殖起关键作用。该编码蛋白由135个氨基酸组成, 是一种相对不稳定的亲水性蛋白;二级结构以无规则卷曲与α-螺旋為主,该蛋白无信号肽与跨膜结构域,但存在二硫键;三级结构预测模型较为简单;其蛋白1~129 个氨基酸区域为双生病毒超家族 (Gemini_AL2 superfamily) 结构域。利用邻接法对AC2基因进行系统发育分析,发现沙特番茄黄化曲叶病毒AC2与南非木薯间的亲缘关系最近,与卷心菜、甘薯之间的亲缘关系最远。

参考文献:

BABU KSD, MANOHARAN P, PANDI G, 2018.Computational studies on begomoviral AC2/C2 proteins[J].Bioinformation, 14:294-303.

BROUGH CL, SUNTER G, GARDINER WE, et al., 1992.Kinetics of tomato golden mosaic virus DNA replication and coat protein promoter activity in Nicotiana tabacum protoplasts[J].Virology, 187:1-9.

CAO J, LUO YZ, HU J, et al., 2012.Polymorphism and bioinformatics analysis of CDS in H-FABP gene in Gannan yak[J].J Gansu Agric Univ, 47 (4) :20-26.[曹建,罗玉柱,胡江,等, 2015.甘南牦牛H-FABP 基因 CDS 区多态 性及生物信息学分析[J].甘肃农业大学学报,47(4):20-26.]

CAO YX, CAO HX, WANG P, et al., 2018.Effects of nutrient solution concentration on growth, quality and storability of tomato[J].Food Sci, 39(7):63-70.[曹玉鑫,曹红霞,王萍,等,2018.营养液浓度对番茄生长、品质以及耐贮性的影响[J].食品科学,39(7):63-70.]

GILL U, SCOTT JW, SHEKASTEBAND R, et al., 2019.Ty-6, a major begomovirus resistance gene on chromosome 10, is effective against tomato yellow leaf curl virus and tomato mottle virus[J].Theor Appl Genet, 132:1543-1554.

GARNIER J, GIBRAT JF, ROBSON B,1996.Method for predicting protein secondary structure from amino acid sequence[J].Method Enzymol, 266:540-553.

HANLEY BL, BEJARANO ER, ROBERTSON D, et al., 2013.Geminiviruses masters at redirecting and reprogramming plant processes[J].Nat Rev Microbiol, 11:777-788.

LI YS, LIU L, FENG HY, et al., 2010.Cloning and bioinformatics analysis of porcine T cell receptor beta chain gene[J].J Gansu Agric Univ, 45(3):1-6.[李玩生, 刘磊, 冯海燕, 等, 2010.猪T细胞受体β 链基因的克隆及生物信息学分析[J].甘肃农业大学学报, 45(3):1-6.]

LIN YM, LIN CM, LIN WH, et al., 2018.Mild clinical features of isolated methylmalonic acidemia associated with a novel variant in the MMAA gene in two Chinese siblings[J].Bmc Med Genet, 19:114.

RAJESWARAN R, SUNITHA S, SHIVAPRASAD PV, et al., 2007.The mungbean yellow mosaic begomovirus transcriptional activator protein transactivates the viral promoter-driven transgene and causes toxicity in transgenic tobacco plants[J] .Mol Plant Microbe Interact, 20:1545-1554.

SONNHAMMER EL, HEIJNE G, KROGH A, 1998.Ahidden markov model for predicting transmembrane helices in protein sequences[J].Proc Int ConfIntell Syst Mol Biol, 6:175-182.

SUNG YK, COUTTS RH, 1996.Potato yellow mosaic geminivirus AC2 protein is a sequence non-specific DNA binding protein[J].Febs Lett, 383:51-54.

SUNTER G, BISARO DM, 1997.Regulation of a geminivirus coat protein promoter by AL2 protein ( TrAP):Evidence for activation and depression mechanisms[J].Virology, 232:269-280.

SIDDIQUI SA, SARMIENTO C, TRUVE E, et al., 2008.Phenotypes and functional effects caused ntabacum[J].Mol Plant Microbe Interact, 21:178-187.

SKOLNICK J, FETROW JS, 2000.From genes to protein structure and function:Novel applications of computational approaches in the genomic era[J].Trends Biotechnol, 18(1): 34-39.

WANG XD, MA DH, HUANG XW, et al., 2017.Complete genome analysis of dengue virus type 3 isolated from the 2013 dengue outbreak in Yunnan, China[J].Virus Res, 238:164-170.

XIE YQ, MENG M, ZHU Z, et al., 2001.Preliminary functional studies on AC2, a novel trans-acting factor from cotton leaf curl virus[J].Bull Bot, 32(5):517-521.[谢迎秋, 孟蒙, 朱祯, 等, 2001.棉花曲叶病毒反式作用因子AC2的功能初探[J].植物學报, 32(5):517-521.]

XU QG, LU J, ZHENG JZ, et al., 2010.Characterization and bioinformatics analysis of 4SNc-Tudor domain protein of Takifugurubripes[J].J Anhui Agric Sci, 38(3):1163-1166.[徐庆刚, 陆健, 郑建洲, 等, 2010.河豚 4SNc-Tudor 蛋白的鉴定及生物信息分析[J].安徽农业科学, 38(3):1163-1166.]

ZERBINI FM, BRIDDON RW, IDRIS A, et al., 2017.ICTV virus taxonomy profile:geminiviridae[J].J Gen Virol, 98:131-133.

(责任编辑 周翠鸣)

猜你喜欢
生物信息学
中药蛋白质组学研究策略
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
生物信息学课堂危机及对策研究
案例教学法在《生物信息学》本科教学中的应用
论生物信息学研究进展及在蛋白质组学研究中的应用
农学类专业《生物信息学》课程教学改革探讨
微生物二元网络作用关系研究