基于转录组的芒果MYB家族基因的鉴定及分析

2017-05-30 07:20郑斌武红霞王松标马小卫许文天罗纯姚全胜
热带作物学报 2017年7期
关键词:生物信息学芒果

郑斌 武红霞 王松标 马小卫 许文天 罗纯 姚全胜

摘 要 MYB家族作为植物中较大的转录因子家族之一,参与调控植物的多种生理活动。本研究基于芒果果实转录组测序结果,鉴定出71个MYB家族蛋白,其中包含1个4R-MYB蛋白、3个R1R2R3-MYB蛋白、60个R2R3-MYB蛋白和7个MYB相关蛋白。进化树及基序分析表明:除个别蛋白外,相同类型的MYB蛋白均聚在一起,且相近分支的MYB蛋白具有相同或相似的基序。60个全长MYB家族蛋白中,大部分为不稳定蛋白,且均为不含跨膜结构和信号肽的亲水性蛋白,亚细胞定位分析均定位于细胞核。进化树分析发现芒果R2R3-MYB蛋白与拟南芥有较高的保守性。R2R3-MYB蛋白保守域分析发现,R2和R3结构域均有多个氨基酸保守不变。GO分析发现芒果R2R3-MYB蛋白共注释到生物学过程、细胞组分和分子功能3大类功能的15个亚类。

关键词 芒果;MYB家族基因;R2R3-MYB;生物信息学

中图分类号 S667.7 文献标识码 A

Abstract As one of the large transcription factor families, MYB family is involved in regulating a variety of physiological processes in plants. Based on the results of transcriptome sequencing of the fruits in mango, 71 sequences of MYB family proteins, including one 4R-MYB protein, three R1R2R3-MYB proteins, 60 R2R3-MYB proteins and 7 MYB related proteins, were identified in the study. The phylogenetic tree and motifs analyses showed that, with a few individual exceptions, MYB proteins of the same type clustered together, and the majority of the close members in the phylogenetic tree exhibited same or similar motifs compositions. 60 full-length MYB proteins were analyzed, in which most were unstable, and all of those proteins were hydrophilic proteins, without a signal-peptide and transmembrane region. Subcellular localization analysis indicated that those proteins were located in nucleus. In addition, the phylogenetic analyses of the mango(60 members)and Arabidopsis(126 members)R2R3-MYB proteins showed that those proteins were highly conserved between mango and Arabidopsis. Conserved domain(R2 and R3 repeats)of mango R2R3-MYB proteins contained multiple conserved amino residues. GO(Gene Ontology)annotation showed that those proteins could be categorized into 15 function subgroups of three main categories: biological processes, cellular components and molecular function.

Key words Mango(Mangifera indica L.); MYB family genes; R2R3-MYB; bioinformatics

doi 10.3969/j.issn.1000-2561.2017.07.017

轉录因子即反式作用因子,是一类调控蛋白,能够与真核基因启动子区域中的顺式作用元件发生特异性结合,通过转录因子之间以及转录因子与其他相关蛋白之间的相互作用激活或抑制靶基因的转录[1]。MYB家族是植物中较大的转录因子家族之一。最早的MYB基因u-myb是1982年发现于鸟类的原癌病毒[2],植物中发现的第一个MYB基因为ZmC1[3]。MYB转录因子在N端具有保守的DNA结合结构域[4],该结构域通常由1~4个氨基酸序列重复区(R)组成,每个R区大约由52个氨基酸组成,但是各个R区之间不是完全重复。根据相邻的R区的个数(1,2,3或4)可以把MYB蛋白分成MYB相关蛋白(含1个或多个R区)、R2R3-MYB蛋白、R1R2R3-MYB蛋白和4R-MYB蛋白4种不同类型[5]。

MYB蛋白参与调控植物的多种生理活动,如细胞形态建成、生物和非生物胁迫应答、植物次生代谢等[6-7],但目前对植物MYB转录因子的了解非常有限,大量MYB转录因子还未被鉴定出来。近年来,高通量测序和生物信息学的快速发展为基因的鉴定及功能分析提供了新思路。利用生物信息学方法,吴家胜等[8]从粳稻基因组数据中鉴定出126个R2R3-MYB蛋白、6个R1R2R3-MYB蛋白以及60个MYB相关蛋白,宋杨等[9]从越橘果实转录组数据中鉴定出21个R2R3-MYB基因。

芒果(Mangifera indica L.)作为五大热带水果之一,风味独特,营养丰富,被誉为“热带果王”,主要分布在海南、广东、广西、云南、四川、福建等省(区)[10]。目前关于芒果MYB基因的研究较少,武红霞[11]利用转录组测序对参与花色苷合成的MYB基因進行了筛选分析,而关于MYB家族基因的系统鉴定与分析还未见报道。本研究基于芒果果实转录组测序结果,利用生物信息学手段对MYB家族基因进行鉴定和分析,为进一步探究芒果MYB家族基因的功能提供基础。

1 材料与方法

1.1 材料

芒果蛋白序列来源于本课题组构建的转录组数据库(GenBank accession SRP035450)。拟南芥MYB家族氨基酸序列下载于拟南芥信息资源(TAIR)数据库(http://www.arabidopsis.org/)。

1.2 方法

1.2.1 芒果MYB家族蛋白的鉴定 从Pfam 30.0[12]数据库(http://pfam.xfam.org/)下载MYB结构域种子文件PF00249、PF8914、PF13921、PF12776、PF13873、PF13837和PF15963,用HMMER 3.1b2[13]软件分别构建Profile HMM(数值表格型隐马可夫模型)并检索芒果转录组蛋白数据库,对检索结果进行整合去冗余,得到候选蛋白。将候选蛋白用SMART[14](http://smart.embl-heidelberg.de/)和InterPro[15](http://www.ebi.ac.uk/interpro/)分析SANT/MYB结构域,同时用NCBI blast(https://blast.ncbi.nlm.nih.gov/Blast.cgi)和植物转录因子数据库[16](PlantTFDB)(http://planttfdb.cbi.pku.edu.cn/)进行进一步分析鉴定。

1.2.2 芒果MYB家族蛋白系统发育树构建及基序分析 利用MEGA 6.0软件内置的Clustal W程序对芒果MYB家族蛋白的氨基酸序列进行比对分析,将比对结果采用邻接法构建系统发育树,并进行自举评估(Bootstrap),重复次数为1 000次,其它参数使用默认值[17]。运用MEME 4.11.02程序[18]分析芒果MYB家族蛋白的基序,设定基序宽度为6~50,基序数量为10,其余参数为默认值。

1.2.3 芒果MYB家族蛋白生物信息学分析 选择具有全长氨基酸序列的芒果MYB家族蛋白,利用在线工具ProtParam(http://web.expasy.org/protparam/)对其进行理化性质分析,并用SOPMA[19](https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)在线软件分析其二级结构,信号肽的预测应用SignalP 4.1 Server[20](http://www.cbs.dtu.dk/services/SignalP/)软件进行分析,最后分别采用TMHMM Server v. 2.0(http://www.cbs.dtu.dk/services/TMHMM/)和BaCelLo[21](http://gpcr.biocomp.unibo.it/bacello/)在线软件完成跨膜结构和亚细胞定位分析。

1.2.4 芒果和拟南芥R2R3-MYB进化树构建 使用MEGA 6.0软件将芒果R2R3-MYB蛋白(60个)和拟南芥R2R3-MYB蛋白(126个)共同构建进化树,参数设置同1.2.2。

1.2.5 芒果R2R3-MYB蛋白保守域分析 使用DNAMAN软件(Version5.2.2)对芒果R2R3-MYB蛋白保守域进行比对,将比对结果用在线软件WebLogo 3(http://weblogo.threeplusone.com/create.cgi)分析保守域序列标签。

1.2.6 芒果R2R3-MYB蛋白GO分析 首先使用Blast2GO 4.0软件[22]对芒果R2R3-MYB蛋白序列进行GO(Gene Ontology)注释,然后用在线软件WEGO[23](http://wego.genomics.org.cn/cgi-bin/wego/index.pl)绘制GO功能分类图。

2 结果与分析

2.1 芒果MYB家族成员的获得

本研究从芒果转录组49117个蛋白序列中筛选出395个具有SANT/MYB结构域的候选蛋白序列,通过进一步分析去冗余,共获得71个芒果MYB家族蛋白序列(表1),其中60个为全长序列。71个MYB家族蛋白中包含1个4R-MYB蛋白、3个R1R2R3-MYB蛋白、60个R2R3-MYB蛋白和7个MYB相关蛋白,其中不具有全长蛋白序列的Unigene9486、Unigene6062和Unigene8022虽仅含一个SANT/MYB结构域,但同源分析发现其均为R2R3-MYB蛋白序列。

2.2 芒果MYB家族蛋白进化树及基序分析

芒果MYB家族蛋白结构域、进化树及基序分析见图1。由图1可知,60个R2R3-MYB蛋白除CL6663.Contig1外均聚在一起,3个R1R2R3-MYB蛋白聚在一个分支,7个MYB相关蛋白除CL11270.Contig2外均聚在一起。

本研究分析了芒果MYB家族的10个基序(图2),基序1为R2R3结构域基序,基序2、基序4和基序10为R2结构域基序。由表1可知,基序2存在于所有具有全长的MYB家族蛋白,基序1存在于所有具有全长的R2R3-MYB蛋白。结合进化树(图1)可以看出,相近分支MYB蛋白基序的类型和位置相同或相近。

2.3 芒果MYB家族蛋白特性分析

芒果MYB家族蛋白理化性质及二级结构分析见表2。由表2可以看出,60个全长MYB家族蛋白的相对分子量在21.24~115.88 ku之间,其中含33个酸性蛋白(理论等电点<7)、1个中性蛋白(理论等电点=7)和26個碱性蛋白(理论等电点>7);平均疏水指数均小于0,为亲水性蛋白;不稳定指数(II)分析发现除Unigene1513为稳定蛋白外(II<40),其余均为不稳定蛋白(II>40)。60个MYB家族蛋白均不含信号肽和跨膜结构,亚细胞定位均定位于细胞核。二级结构分析发现:芒果MYB家族蛋白中无规卷曲和α-螺旋所占比例较大,其中48个为无规卷曲所占比例最大,11个为α-螺旋所占比例最大,CL9291.Contig2二级结构中α-螺旋和无规卷曲所占比例一致。

2.4 芒果与拟南芥R2R3-MYB蛋白系统发育树比对

芒果与拟南芥R2R3-MYB蛋白系统进化树见图3。由图3可以看出,大部分芒果R2R3-MYB蛋白与拟南芥不同亚组的R2R3-MYB蛋白聚在一起,说明芒果R2R3-MYB蛋白与拟南芥有较高的保守性。拟南芥相同亚组的R2R3-MYB蛋白具有相同或相似的功能[5],推测聚在不同亚组的芒果R2R3-MYB蛋白与拟南芥该亚组具有相同或相似的功能,其中与拟南芥S4亚组处于同一分支的CL10982.Contig2、Unigene13684和CL6446.Contig2可能参与调控相关基因的表达从而抑制花色苷的合成,与拟南芥S5亚组及AtMYB5处于同一大分支的Unigene13160、CL2107.Contig1、Unigene1513、Unigene12158和CL6888.Contig2以及与S6亚组处于同一分支的CL5638.Contig1和CL5638.Contig2可能具有促进花色苷合成的作用。

2.5 芒果R2R3-MYB蛋白保守域分析

芒果R2R3-MYB蛋白R2R3高度保守DNA binding结合域见图4。由图4可以看出,芒果R2R3-MYB蛋白R2结构域的4(W)、8~9(E、D)、12(L)、20(G)、25(W)、38(R)和41~47(K、S、C、R、L、R、W)等多个位点保守不变,R3结构域的10(E)、14(I)、18(H)、22~23(G、N)、25(W)、28(I)、33~38(P、G、R、T、D、N)、41~42(K、N)和44(W)等位点保守不变。

2.6 芒果R2R3-MYB蛋白GO聚类分析

芒果R2R3-MYB蛋白GO功能分类见图5。由图5可以看出,60个R2R3-MYB蛋白注释到生物学过程、细胞组分和分子功能3大类功能的15个亚类。细胞组分类别中,有4、3和3个R2R3-MYB蛋白分别注释到细胞(Cell)、细胞部分(Cell part)和细胞器(Organelle)。分子功能类别中,58个R2R3-MYB蛋白注释到结合功能(binding),1个注释到催化活性(Catalytic activity)。生物学过程类别中,6个R2R3-MYB蛋白注释到细胞过程(cellular process),注释到代谢过程(metabolic process)、发育过程(developmental process)和刺激响应(response to stimulus)的分别为4个、4个和2个,注释到其他亚类的仅为1个。

3 讨论

MYB蛋白参与植物激素合成、信号转导、初生代谢、次生代谢和类黄酮合成等生理生化过程[24]。Cao等[25]、Aoyagi等[26]和Liao等[27]分别利用生物信息学分析技术从苹果、大豆和木薯基因组数据中鉴定出222、264和166个R2R3-MYB基因,并对其中部分基因进行了功能分析。对于没有基因组信息的物种可以利用表达序列标签(ESTs)和转录组数据进行家族基因的挖掘,Chen等[28]从欧洲油菜表达序列标签(ESTs)中获得72个R2R3-MYB基因,Wang等[29]从地黄转录组数据中鉴定出165个MYB序列,其中40个序列具有完整的开放阅读框。

本研究基于芒果果实转录组数据,鉴定出71个MYB家族蛋白,其中包含1个4R-MYB蛋白、3个R1R2R3-MYB蛋白、60个R2R3-MYB蛋白和7个MYB相关蛋白。进化树及基序分析发现,除个别基因外,不同类型的MYB蛋白分别聚在一起,且相近分支的MYB蛋白具有相同或相似的基序,这与魏海超[30]对大豆和拟南芥MYB家族基因的分析结果是一致的。

对具有全长的60个芒果MYB家族蛋白进行了生物信息学分析,其中酸性蛋白所占比例较大,大部分为不稳定蛋白,且均为不含跨膜结构和信号肽的亲水性蛋白,亚细胞定位均定位于细胞核,大部分MYB家族蛋白二级结构中无规卷曲所占比例最大。

从芒果和拟南芥R2R3-MYB蛋白共同构建的进化树发现,芒果R2R3-MYB蛋白与拟南芥有较高的保守性;芒果R2R3-MYB蛋白保守域分析发现,其R2和R3结构域均有多个氨基酸保守不变,该结果与Chen等[28]对欧洲油菜R2R3-MYB蛋白的分析结果相似。GO分析发现芒果R2R3-MYB蛋白共注释到生物学过程、细胞组分和分子功能3大类功能的15个亚类,其中96.67%注释到结合功能。

MYB蛋白参与植物的多个生命活动,本研究从芒果转录组数据中鉴定出71个MYB家族蛋白,为今后芒果MYB家族蛋白的研究提供了基础。由于取样及测序的局限性,所鉴定的仅为芒果MYB家族的部分蛋白序列,因此,芒果MYB家族蛋白还有待进一步挖掘和研究。

从进化树分析可以看出,大部分的芒果R2R3-MYB蛋白与拟南芥不同亚组的R2R3-MYB蛋白聚在一起,推测芒果R2R3-MYB蛋白与拟南芥具有相似的功能,该分析可为下一步芒果R2R3-MYB蛋白的功能分析提供参考。宋杨等[9]利用此方法结合基因表达分析鉴定出6个可能与越橘着色相关的基因,而芒果R2R3-MYB蛋白的功能还有待进一步研究明确。

参考文献

[1] 刘 强, 张贵友, 陈受宜. 植物转录因子的结构与调控作用[J]. 科学通报, 2000, 45(14): 1 465-1 474.

[2] Klempnauer K H, Gonda T J, Bishop J M. Nucleotide sequence of the retroviral leukemia gene v-myb and its cellular progenitor c-myb: the architecture of a transduced oncogene[J]. Cell, 1982, 31(2): 453-463.

[3] Pazares J, Ghosal D, Wienand U, et al. The regulatory c1 locus of Zea mays encodes a protein with homology to myb proto-oncogene products and with structural similarities to transcriptional activators[J]. Embo Journal, 1987, 6(12): 3 553-3 558.

[4] Lipsick J S. One billion years of Myb[J]. Oncogene, 1996, 13(2): 223-235.

[5] Dubos C, Stracke R, Grotewold E, et al. MYB transcription factors in Arabidopsis[J]. Trends in Plant Science, 2010, 15(10): 573-581.

[6] Kranz H D, Denekamp M, Greco R, et al. Towards functional characterisation of the members of the R2R3-MYB gene family from Arabidopsis thaliana[J]. Plant Journal for Cell & Molecular Biology, 1998, 16(2): 263-276.

[7] Chen Y, Yang X, He K, et al. The MYB transcription factor superfamily of Arabidopsis: expression analysis and phylogenetic comparison with the rice MYB family[J]. Plant Molecular Biology, 2006, 60(1): 107-124.

[8] 吳家胜, 赵彦宏, 汪旭升. 粳稻MYB蛋白家族的生物信息学分析[J]. 华南农业大学学报, 2009, 30(4): 43-47.

[9] 宋 杨, 刘红弟, 张红军, 等. 越橘果实转录组及R2R3-MYB转录因子分析[J]. 园艺学报, 2015, 42(12): 2 383-2 394.

[10] 马小卫, 李 丽, 武红霞, 等. 不同品种芒果果实品质、糖组分及抗氧化性的分析[J]. 广东农业科学, 2011, 38(20): 38-39.

[11] 武红霞.芒果花色苷合成与调控的生理与分子机制[D]. 杭州: 浙江大学, 2015.

[12] Finn R D, Mistry J, Schuster-Bockler B, et al. Pfam: clans, web tools and services[J]. Nucleic Acids Research, 2006, 34(suppl_1): 247-251.

[13] Finn R D, Clements J, Eddy S R. HMMER web server: interactive sequence similarity searching[J]. Nucleic Acids Research, 2011, 39(suppl_2): 29-37.

[14] Letunic I, Doerks T, Bork P. SMART 7: recent updates to the protein domain annotation resource[J]. Nucleic Acids Research, 2012, 40(Databaseissue): 302-305.

[15] Mitchell A, Chang H Y, Daugherty L, et al. The InterPro protein families database: the classification resource after 15 years[J]. Nucleic Acids Research, 2015, 43(Database issue): 213-221.

[16] Jin J P, Tian F, Yang D C, et al. PlantTFDB 4.0: toward a central hub for transcription factors and regulatory interactions in plants[J]. Nucleic Acids Research, 2016, doi: 10.1093/nar/gkw982.

[17] Hall B G. Building phylogenetic trees from molecular data with MEGA[J]. Molecular Biology and Evolution, 2013, 30(5): 1 229-1 235.

[18] Bailey T L, Elkan C. Fitting a mixture model by expectation maximization to discover motifs in biopolymers[C]. International Conference on Intelligent Systems for Molecular Biology. Proc Int Conf Intell Syst Mol Biol, 1994: 28-36.

[19] Geourjon C, Deléage G. SOPMA: significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Computer Applications in the Biosciences Cabios, 1995, 11(6): 681-684.

[20] Petersen T N, Brunak S, Von H G, et al. SignalP 4.0: discriminating signal peptides from transmembrane regions[J]. Nature Methods, 2010, 8(10): 785-786.

[21] Pierleoni A, Martelli P L, Fariselli P, et al. BaCelLo: a Balanced subCellular Localization predictor[J]. Bioinformatics, 2006, 22(14): 408-416.

[22] Conesa A, Gotz S, Garcíagómez J M, et al. Blast2GO: a universal tool for annotation, visualization and analysis in functional genomics research[J]. Bioinformatics, 2005, 21(18): 3 674-3 676.

[23] Ye J, Fang L, Zheng H, et al. WEGO: a web tool for plotting GO annotations[J]. Nucleic Acids Research, 2006, 34(Web Server issue): 293-297.

[24] Qi L, Yang J, Yuan Y, et al. Overexpression of two R2R3-MYB genes from Scutellaria baicalensis induces phenylpropanoid accumulation and enhances oxidative stress resistance in transgenic tobacco[J]. Plant Physiology & Biochemistry, 2015, 94: 235-243.

[25] Cao Z H, Zhang S Z, Wang R K, et al. Genome wide analysis of the apple MYB transcription factor family allows the identification of MdoMYB121 gene confering abiotic stress tolerance in plants[J]. Plos One, 2013, 8(7): e69955.

[26] Aoyagi L N, Lopescaitar V S, de Carvalho M C, et al. Genomic and transcriptomic characterization of the transcription factor family R2R3-MYB in soybean and its involvement in the resistance responses to Phakopsora pachyrhizi[J]. Plant Science, 2014, 229: 32-42.

[27] Liao W, Yang Y, Li Y, et al. Genome-wide identification of cassava R2R3 MYB family genes related to abscission zone separation after environmental-stress-induced abscission[J]. Scientific Reports, 2016, 6. doi: 10.1038/srep32006.

[28] Chen B, Niu F, Liu W Z, et al. Identification, cloning and characterization of R2R3-MYB gene family in canola (Brassica napus L.) identify a novel member modulating ROS accumulation and hypersensitive-like cell death[J]. DNA Research, 2016, 23(2): 101-114.

[29] Wang F, Suo Y, He W, et al. Identification and characterization of 40 isolated Rehmannia glutinosa MYB family genes and their expression profiles in response to shading and continuous cropping[J]. International Journal of Molecular Sciences, 2015, 16(7): 15 009-15 030.

[30] 魏海超. PIGR與MYB基因家族的生物信息学研究[D]. 济南: 山东师范大学, 2012.

猜你喜欢
生物信息学芒果
我爱刷牙
我爱刷牙
我才不要穿
小洞会“咬”人
小洞会“咬”人
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
生物信息学课堂危机及对策研究