哺乳动物TRPM1密码子使用偏性及其聚类分析

2017-02-15 18:02李丽莎李祥龙
湖北农业科学 2016年20期
关键词:哺乳动物聚类分析

李丽莎+李祥龙

摘要:瞬时受体势M亚基1(Transient receptor potential melastatin 1,TRPM1)是一种非选择性离子通道,主要通透Ca2+等二价金属阳离子。利用CodonW软件对15种哺乳动物TRPM1基因序列进行分析,比较了同义密码子相对使用度形成的聚类和编码区形成的系统发育树。结果表明,哺乳动物TRPM1基因对GCC、CAC、ATC、CTG、AAC、CCC、CAG、TCC、GTG和TAC密码子的使用存在偏好性,但终止密码子的使用不存在种属差异。密码子偏爱指数、有效密码子数、GC含量和密码子第三位的GC含量均能影响哺乳动物TRPM1基因所用密码子。两种聚类结果显示,由编码区形成的系统发育树能更准确反映物种间的亲缘关系。

关键词:哺乳动物;TRPM1;密码子偏好性;聚类分析

中图分类号:O755 文献标识码:A 文章编号:0439-8114(2016)20-5378-06

DOI:10.14088/j.cnki.issn0439-8114.2016.20.054

Abstract: Transient receptor potential melastatin-1 is a kind of nonselective cation channels,mainly through a divalent metal cations such as Ca2+. CodonW software was applied to analyze sequences of TRPM1 gene in 15 kinds of mammals,comparing clustering of relative synonymous codon usage and phylogenetic tree of coding region. The result showed that GCC,CAC,ATC,CTG,AAC,CCC,CAG,TCC,GTG and TAC were found to have the use of codon usage bias,but there is no difference between species in the use of termination codon. Codon bias index,effective number of codon,GC-content and G+C content of the third codon position can affect the codon usage of TRPM1 gene in mammals. The two kinds of clustering results show that phylogenetic tree of coding region more accurately reflect the genetic relationship between the species.

Key words: mammal; TRPM1; codon bias; cluster analysis

mRNA作为蛋白质合成的模板,是通过三联密码来实现与蛋白质的联系。三联密码子的个数为64,其中编码20种氨基酸的密码子有61个,每种编码蛋白质的氨基酸至少被1种密码子编码,每种氨基酸最多可被6种密码子编码,如亮氨酸(TTA、TTG、CTT、CTC、CTA和CTG)和精氨酸(AGA、AGG、CGT、CGC、CGA和CGG)。编码同一氨基酸的密码子称为同义密码子。从mRNA到蛋白质的过程中,同义密码子的使用概率并不一致[1,2],某一物种或某一基因会有使用一种或几种特定的同义密码子的倾向,这些密码子即为最优密码子,该种使用倾向即为密码子偏性[3]。对于密码子偏性的影响因素的报道有很多,如基因的表达水平[4,5]、翻译起始效应[6,7]、碱基的组分[8]、某些二核苷酸出现的频率[9,10]、GC含量[11,12]、基因长度[13]、tRNA的丰度[14,15]、蛋白质的结构[16]、蛋白质疏水水平[17]及密码子-反密码子间的结合能力[18]等都会在一定程度上影响密码子的使用。

瞬时受体势(Transient receptor potential)基因首先于果蝇突变体的光感受器中发现[19],已被成功克隆[20]。Trp基因编码一種通透Ca2+的阳离子通道,并将该阳离子通道命名为瞬时受体点位(TRP)[21]。TRP存在于多种哺乳动物组织中,参与基因转录、肌肉收缩、递质释放以及细胞增殖、分化、凋亡和死亡等生理功能[22]。根据编码氨基酸序列的不同,TRP基因超家族可分为:TRPA、TRPC、TRPN、TRPM、TRPML、TRPP和TRPV 7个家族,还包含多个亚型[4,5]。其中TRPM家族仅在哺乳动物体内进行表达,该家族含有8种亚基:TRPM1~TRPM8,这些亚基能在体内形成同聚体或异聚体通道。该家族共有结构:较长的N末端及C末端,且一些亚基的C末端存在完整的酶结构域,这也构成了该家族最大的结构特点[23]。瞬时受体势M亚基1(Transient receptor potential melastatin 1,TRPM1)属于一种非选择性离子通道,主要通透Ca2+等二价金属阳离子[24,25],是最先被发现的TRPM家族成员[26]。研究表明,该基因的表达与黑色素瘤的恶性程度呈负相关,在机体中可能行使肿瘤抑制因子的作用[27],而且在新生黑色素表皮中,该基因的表达与黑色素含量也相关,对正常黑色素细胞的着色有重要影响,已被认定是潜在的色素变异基因,和纯白色表型显著相关[28]。

关于密码子偏性的研究大多集中在确定其影响因素上,鲜有对一些重要功能基因及物种进化关系的分析报道[29]。本研究以TRPM1基因作为研究对象,分析并比较了不同哺乳动物密码子使用偏性和影响因素,再通过两种方法构建该基因的建物种进化关系,以期为TRPM1基因分类、结构和功能的研究提供理论依据。

1 材料与方法

1.1 序列数据来源

15种物种TRPM1基因完整编码区核苷酸序列均来自于NCBI网站(http://www.ncbi.nlm.nih.gov/)的GenBank数据库。

1.2 密码子偏性分析指标

利用CodonW軟件分析TRPM1基因的同义密码子相对使用度(Relative synonymous codon usage,RSCU)、密码子偏爱指数(CBI)、有效密码子数(ENS)、GC含量(GC)和密码子第三位的GC含量。

1.3 聚类分析

通过Clustal W 2.1软件比对15种哺乳动物TRPM1基因编码区核苷酸序列,利用MEGA6.0软件中的最大似然法对TRPM1基因编码区构建聚类树状图,该树的可靠性由1 000次重复的自举检验法来检验。

通过SPSS19.0软件对哺乳动物TRPM1基因密码子使用偏性的欧式平方距离系数进行聚类分析,除去色氨酸(TGG)、甲硫氨酸(ATG)及3个终止密码子(TAA、TAG、TGA),剩余的59个密码子相对使用度被认为是一个变量,计算同义密码子相对使用度的欧式平方距离,该值可用于评定各物种基因间的距离。2个基因间密码子使用偏性的欧式平方距离系数公式如下:

2 结果与分析

2.1 不同物种CBI、ENc、GC和CG3s值分析

由表1可知,所有物种的CBI值均较小,接近0,表明不同哺乳动物对TRPM1基因的所有密码子几乎全部随机使用;家兔和双峰驼的ENc值较小,分别为48.03和49.91,其他物种的ENc值都大于50,但均表明各物种TRPM1基因各密码子在编码氨基酸时出现的频率较为一致,密码子偏性较弱;由GC含量及其GC3s值可知,东非狒狒、黑猩猩、蒙古野马、人和家猫对A或T存在偏好性,褐家鼠、小家鼠、家牛、野牛、双峰驼、单峰驼、家兔、山羊和绵羊对G或C存在偏好性,只有野猪的G+C和A+T使用不存在偏性,但GC3s值高于0.5,表明密码子第三位对G或C存在一定程度的偏好性。

2.2 不同物种RSCU值分析

由表2可知,15种物种均对GCC、CAC、ATC、CTG、AAC、CCC、CAG、TCC、GTG和TAC这10种密码子的使用存在偏性,大部分物种对TGC、GAC、GGC、GGA、AAG、CTC、AGA、AGG、CGG、AGC、ACC和ACA这12种密码子的使用存在偏性。在这些具有偏好性的密码子中,几乎全为G或C结尾的密码子。对于终止密码偏好性的研究,发现使用TAG终止密码子的物种为东非狒狒、黑猩猩、人、山羊和绵羊,只有小家鼠使用TGA终止密码子,其余物种的终止密码子为TAA。推测终止密码子的使用不存在种属偏性。

2.3 密码子使用偏性的影响因素分析

由表3可知,CBI与GC、GC3s均呈显著正相关,与ENc呈显著负相关;ENc与GC、GC3s呈显著负相关;GC和GC3s呈显著正相关,且GC含量是影响哺乳动物TRPM1基因密码子偏性的主要因素。Aromo和Gravy与其他密码子偏性指标的相关性均不明显。结果表明,密码子偏爱指数、有效密码子数、GC含量和密码子第三位的GC含量均能对哺乳动物TRPM1基因所用密码子的偏性有影响,而芳香族氨基酸的含量和蛋白疏水水平对该基因所用密码子的偏性影响不大。

2.4 聚类分析结果

2.4.1 基于编码区的聚类分析 本研究所用的15种动物按照动物学分类可分为6个不同的目,分别是偶蹄目、奇蹄目、食肉目、灵长目、兔形目和啮齿目。由图1可知,家牛、野牛、山羊、绵羊、野猪、双峰驼和单峰驼之间的距离较近,且这些动物均属于偶蹄目;东非狒狒、黑猩猩和人之间的距离较近,且其均属于灵长目;褐家鼠和小家鼠聚成一簇,属于啮齿目。蒙古野马(奇蹄目)和家猫(食肉目)聚成一簇。结果表明,这2个物种TRPM1基因之间的同源性较高,推测某些功能较为一致。由树中分支位置的数值可知,最低置信度为87,因此基于TRPM1基因编码区形成的聚类树状图能够真实反映不同物种TRPM1基因的亲缘关系。

2.4.2 基于密码子使用偏性的聚类分析 由图2可知,基于TRPM1基因的RSCU值聚类树状图共形成两大类,其中双峰驼和单峰驼距离较近,家牛、山羊、野牛和绵羊之间的距离较近,褐家鼠和小家鼠距离较近,蒙古野马、野猪和家猫之间的距离较近。但发现家兔和双峰驼、单峰驼的距离近于其他的偶蹄目,且蒙古野马、野猪和家猫聚成一小类,这与动物学分类不符,并且由密码子使用偏性构建的聚类无置信度的检测,因此推测基于TRPM1基因RSCU值形成的聚类树状图并不能真实反映不同物种TRPM1基因的亲缘关系。

3 讨论

本研究分析了不同哺乳动物TRPM1基因密码子的使用特征,基于同义密码子相对使用度得到的哺乳动物TRPM1基因均对GCC、CAC、ATC、CTG、AAC、CCC、CAG、TCC、GTG和TAC密码子的使用存在偏好性,而这些密码子的第三位都以C或G结尾,这可能与Crick在1996年提出的“摆动假说”(Wobble hypothesis)里阐述的规律相关,即核糖体提供的环境使氨基酸专一的密码子的前两个碱基与相应tRNA上反密码子的第2、3碱基互补配对,但密码子的第3个碱基(3′端)与反密码子5′端碱基的配对专一性相对较差,从而使第三位碱基呈现“摆动”现象。由于反密码子第一位碱基常为修饰过的碱基,很少会使用U,更少会使用A,这样就造成被识别的密码子的第三位使用G或C的频率较高[29]。

研究表明,低复杂度的真核生物(如酵母)和无脊柱动物主要使用终止密码子TAA;真核生物,尤其是脊椎动物主要使用TGA,而TAG的使用几率很低[30]。但本研究分析得到不同哺乳动物TRPM1基因的终止密码子的使用不存在偏好性,这可能是由终止密码子使用根据物种及基因的不同而存在差异造成的。

本研究利用不同哺乳动物同种基因,使结果基本不受基因长度和蛋白结构的影响,对不同哺乳动物TRPM1基因密码子使用偏性的影响因素进行相关性分析,发现密码子偏爱指数、有效密码子数、GC含量和密码子第三位的GC含量均可影响哺乳动物TRPM1基因所用密码子的偏性,而芳香族氨基酸的含量和蛋白疏水水平對该基因所用密码子的偏性影响不大。在这些影响因素中,GC含量是影响哺乳动物TRPM1基因密码子偏性的主要因素,这与Knight等[31]、张之一等[29]、刘庆坡等[32]研究结果一致。本研究发现大部分哺乳动物偏向使用G或C碱基,东非狒狒、黑猩猩和人等哺乳动物偏性使用A或T碱基,侯卓成等[33]认为基因表达水平与GC含量、密码子第三位的GC含量呈正比,但关于哺乳动物TRPM1基因的表达水平还需要实验进行验证。

本研究分析和比较的哺乳动物TRPM1基因两种聚类方法,发现由同义密码子相对使用度的聚类结果与传统的动物学分类上之间存在差异,而由该基因编码区构建的系统发育结果更符合动物学分类。研究表明,基于密码子偏好性的聚类并不能完全、真实地反映亲缘关系[34],这与刘汉梅等[35]、晁岳恩等[36]、郭秀丽等[37]的研究结果一致。此种现象可能是在进化过程中,单基因可能存在较大的突变(自然选择和随机漂变等因素均能引起突变)导致其密码子使用偏性发生较大的变化,造成与真实的分类地位不同。提示对于今后的物种分类不能只局限于碱基序列组成成分的分析,需结合多个水平综合判断物种间的遗传关系,才能得出更为精确的系统发育结果。

4 结论

本研究对不同哺乳动物TRPM1基因密码子使用的偏好性进行分析,发现这些物种均对GCC、CAC、ATC、CTG、AAC、CCC、CAG、TCC、GTG和TAC密码子的使用存在偏好性,且这些密码子都以C或G结尾,而终止密码子的使用不存在种属差异。在本研究所用的物种中,东非狒狒、黑猩猩、蒙古野马、人和家猫对A或T存在偏好性,褐家鼠、小家鼠、家牛、野牛、双峰驼、单峰驼、家兔、山羊和绵羊对G或C存在偏好性,只有野猪的G+C和A+T使用不存在偏性。通过分析影响密码子偏好性的因素中,发现密码子偏爱指数、有效密码子数、GC含量和密码子第三位的GC含量均能影响哺乳动物TRPM1基因所用密码子,而芳香族氨基酸的含量和蛋白疏水水平对该基因所用密码子的偏性影响不大。本研究利用2种不同方法分析该基因在进化过程中的远近关系,发现基于编码区形成的聚类图更能准确反映物种间的亲缘关系。

参考文献:

[1] GHOSH T C,GUPTA S K,MAJUMDAR S. Studies on codon usage in entamoeba histolytica[J].Int J Parasitol,2000,30(6): 715-722.

[2] KARLIN S,MR?魣ZEK J. What drives codon choices in human genes?[J].J Mol Biol,1996,262(4):459-472.

[3] 赵 翔,李 至,陆身枫,等.酵母Yarrowia lipolytica的密码子用法分析[J].复旦大学学报(自然科学版),1999,38(5):510-516.

[4] DURET L,MOUCHIROUD D.Expression pattern and,surprisingly, gene length shape codon usage in Caenorhabditis,Drosophila and Arabidopsis[J].Proc Natl Acad Sci USA,1999,96(8): 4482-4487.

[5] CARLINI D B,CHEN Y,STEPHAN W. The relationship between third-codon position nucleotide content,codon bias,mRNA secondary structure and gene expression in the drosophild alcohol dehydrogenase genes Adh and Adhr[J].Genetics,2001, 159(2):623-633.

[6] SAKAI H,WASHIO T,SAITO R,et al. Correlation between sequence conservation of the 5′ untranslated region and codon usage bias in Mus musculus genes[J].Gene,2001,276(1-2):101-105.

[7] STENSTR?魻M C M,JIN H,MAJOR L L,et al. Codon bias at the 3′-side of the initiation codon is correlated with translation initiation efficiency in Escherichia coli[J].Gene,2001,263(1-2):273-284.

[8] FEDOROV A,SAXONOV S,GILBERT W. Regularities of context-dependent codon bias in eukaryotic genes[J].Nucleic Acids Res,2002,30(5):1192-1197.

[9] OHNO S. Universal rule for coding sequence construction:TA/GC deficiency-TG/CT excess[J].Proc Natl Acad Sci USA,1988, 85(24):9630-9634.

[10] KARLIN S,CAMPBELL A M,MR?魣ZEK J. Comparative DNA analysis across diverse genomes[J].Annu Rev Genetics,1998, 32:185-225.

[11] 石秀凡,黄京飞,柳树群,等.人类基因同义密码子偏好的特征以及与基因GC含量的关系[J].生物化学与生物物理进展,2002,29(3):411-414.

[12] RODR?魱GUEZ-TRELLES F,TARR?魱O R,AYALA F J. Switch in codon bias and increased rates of amino acid substitution in the Drosophila saltans species group[J].Genetics,1999,153(1): 339-350.

[13] MORIYAMA E N,POWELL J R. Gene length and codon usage bias in Drosophila melanogaster,Saccharomyces cerevisiae and Escherichia coli[J].Nucleic Acids Res,1998,26(13):3188-3193.

[14] MORIYAMA E N,POWELL J R. Codon usage bias and tRNA abundance in Drosophila[J].J Mol Evol,1997,45(5):514-523.

[15] MOSZER I,ROCHA E P,DANCHIN A. Codon usage and lateral gene transfer in Bacillus subtilis[J].Curr Opin Microbiol,1999,2(5):524-528.

[16] 顧万君,马建民,周 童,等.不同结构的蛋白编码基因的密码子偏性研究[J].生物物理学报,2002,18(1):81-86.

[17] ROMERO H,ZAVALA A,MUSTO H. Codon Usage in Chlamydia trachomatis is the result of strand-specific mutational biases and a complex pattern of selective forces[J].Nucleic Acids Res,2000,28(10):2084-2090.

[18] 石秀凡,黄京飞,梁宠荣,等.人类基因中同义密码子的偏好与密码子-反密码子间的结合强度密切相关吗?[J].科学通报,2000,45(23):2520-2525.

[19] COSENS D J,MANNING A.Abnormal electroretinogram from a Drosophila mutant[J].Nature,1969,224(5216):285-287.

[20] MONTELL C,RUBIN G M.Molecular characterization of the Drosophila trp locus:A putative integral membrane protein required for phototransduction[J].Neuron,1989,2(4):1313-1323.

[21] HARDIE R C,MINKE B. The trp gene is essential for a light-activated Ca2+ channel in Drosophila photoreceptors[J].Neuron,1992,8(4):643-651.

[22] BERRIDGE M J,LIPP P,BOOTMAN M D. The versatility and universality of calcium signaling[J].Nat Rev Mol Cell Biol,2000,1(1):11-21.

[23] 李中连,江宏兵,高 隽,等.唾液腺腺样囊性癌中TRPM的表达及意义[J].口腔医学,2008,28(12):617-619.

[24] B?魻DDING M. TRP proteins and cancer[J].Cellular Signalling, 2007,19(3):617-624.

[25] PREVARSKAYA N,ZHANG L,BARRITT G. TRP channels in cancer[J].Biochim Biophys Acta,2007,1772(8):937-46.

[26] DUNCAN L M,DEEDS J,HUNTER J,et al. Down-regulation of the novel gene melastatin correlates with potential for melanoma metastasis[J].Cancer Research,1998,58(7):1515-1520.

[27] DOTSENKO O,CHATURVEDI N,THOM S A,et al. Platelet and leukocyte activation,atherosclerosis and inflammation in european and south asian men[J].J Thromb Haemost,2007, 5(10):2036-2042.

[28] OANCEA E,VRIENS J,BRAUCHI S,et al. TRPM1 forms ion channels associated with melanin content in melanocytes[J].Sci Signal,2009,2(70):ra21.

[29] 张之一,陈 蕾,薛慧良,等.13种哺乳动物OTR密码子使用偏性及其聚类分析[J].北华大学学报(自然科学版),2012,13(1):44-48.

[30] SUN J,CHEN M,XU J,et al. Relationships among stop codon usage bias,its context, isochores, and gene expression level in various eukaryotes[J].J Mol Evol,2005,61(4):437-444.

[31] KNIGHT R D,FREELAND S J,LANDWEBER L F.A simple model based on mutation and selection explains trends in codon and amino-acid usage and GC composition within and across genomes[J].Genome Biol,2001,2(4):1-13.

[32] 刘庆坡,谭 军,薛庆中.籼稻品种93-11同义密码子的使用偏性[J].遗传学报,2003,30(4):335-340.

[33] 侯卓成,杨 宁.影响链球菌属肺炎球菌基因组密码子使用的因素分析[J].遗传学报,2002,29(8):747-752.

[34] CHRISTIANSON M L.Codon usage patterns distort phylogenies from or of DNA sequences[J].Am J Bot,2005,92(8):1221-1233.

[35] 刘汉梅,赵 耀,顾 勇,等.几种植物waxy基因的密码子用法特性分析[J].核农学报,2010,24(3):476-481.

[36] 晁岳恩,吳政卿,杨会民,等.11种植物psbA基因的密码子偏好性及聚类分析[J].核农学报,2011,25(5):927-932.

[37] 郭秀丽,王 玉,杨路成,等.茶树CBF1基因密码子使用特性分析[J].遗传,2012,34(12):1614-1623.

猜你喜欢
哺乳动物聚类分析
全球最小哺乳动物盘点
2 从最早的哺乳动物到人类
哺乳动物大时代
哺乳动物家族会
会飞的哺乳动物蝙蝠