豆科植物dxr基因密码子偏好性分析

2020-03-12 02:15李凌烜陈安琪郝博新周嘉裕
生物学杂志 2020年1期
关键词:豆科植物萜类蒽醌

李凌烜,陈安琪,黄 凯,郝博新,周嘉裕,廖 海

(西南交通大学 生命科学与工程学院,成都 610097)

萜类与蒽醌化合物具有多种重要的药用价值。植物萜类与蒽醌类化合物的合成均依赖2-甲基-D-赤藓糖醇-4-磷酸(MEP)途径[1]。1-脱氧-D-木酮糖-5-磷酸还原异构酶(1-deoxy-D-xylulose-5-phosphate reductoisomerase,DXR)是催化MEP途径中第二步反应的酶,即磷酸木酮糖在1-脱氧-D-木酮糖-5-磷酸还原异构酶的作用下形成二甲基四磷酸,经后续反应形成MEP。DXR被认为是萜类与蒽醌化合物合成的关键酶之一。在MEP途径中,DXR被认为是萜类合成途径中发挥“限流”作用的关键酶,对萜类生物合成的重要中间体MEP的积累起决定性作用。阳春砂、丹参、红豆杉、喜树与青蒿等药用植物中dxr基因的表达量与萜类产物的积累表现为正相关。应用转基因技术在薄荷、长春花与丹参中超量表达dxr基因,导致萜类物质含量显著提高,表明该步骤是萜类代谢工程的重要调控靶点[2]。Walter等发现,用真菌作为诱导子,能同时提高dxr基因的转录水平与蒽醌的含量,认为DXR可能是蒽醌合成的一种关键酶[3]。较多豆科植物如决明、番泻叶等含有萜类和(或)蒽醌,并且已有多个dxr基因在豆科植物中被发现以及克隆,这为认识萜类与蒽醌等化合物在豆科植物中的合成打下了重要基础。

不同物种对密码子使用具有偏好性[4]。如果外源基因密码子与宿主表达系统中密码子的使用频率有显著差异,将直接影响外源基因的表达与翻译[5]。由此,研究密码子偏好性有助于为外源基因选择更优的宿主表达系统,这对于提高基因的表达效率必不可少。

本文利用CodonW和EMBOSS程序分析11种豆科植物dxr基因的密码子偏好性。利用SPSS软件进行聚类分析,以确定基因表达的最佳模式植物。并与大肠杆菌、酵母基因组的密码子偏好性比较,确定最适外源宿主表达系统,最后利用本课题组克隆的决明dxr基因进行验证。

1 材料和方法

1.1 材料及分析软件

11种豆科植物的dxr基因均来自NCBI数据库(http://www.ncbi.nlm.nih.gov/),见表1。决明dxr基因序列由实验室克隆获得,尚未录入NCBI数据库。大肠杆菌与酵母基因组的密码子偏好性数据来源于 Codon Usage Database(http://www.kazusa.or.jp/codon/)。采用EMBOSS在线程序(http://emboss.toulouse.inra.fr.)中的CUSP(Create a codon usage table)和CHIPS(Codon heterozygosity in a protein coding sequence)以及CodonW 程序分析密码子的偏好性,并用SPSS对相关基因及基因组密码子使用偏好性进行聚类分析。

1.2 方法

1.2.1dxr基因同义密码子偏好性分析

首先,通过 CodonW程序分析dxr基因的相对密码子使用度 (Relative synonymous codon usage,RSCU)、密码子适应指数(Codon adaptation index,CAI)、同义密码子第3位碱基的GC含量(GC3s)以及同义密码子GC含量;其次,根据所得到的dxr基因编码序列,利用CUSP和CHIPS在线分析程序,计算决明dxr基因密码子出现频率以及有效密码子数(Effective number of codons,ENc)。

1.2.2 基于密码子偏好性的聚类分析

参照李娟娟等[6]的方法,利用SPSS对13种植物的dxr基因进行聚类分析来确定豆科植物dxr基因的最佳模式植物。

1.2.3 决明dxr基因密码子偏好性分析

通过 CodonW 和 CUSP程序分析决明dxr基因的RSCU值和密码子使用频率。将其密码子出现频率同大肠杆菌和酵母基因组密码子的偏好性进行比较,以确定其最适外源表达系统。

表1 11种豆科植物dxr基因信息

2 结果与分析

2.1 豆科植物dxr基因的密码子偏好性分析

若某一密码子的RSCU值为1,表明无偏好性[7]。若RSCU值>1,则该密码子使用频率相对较高;若RSCU值<1,该密码子使用频率相对较低[8]。

如表2所示,11种豆科植物中偏好性较强的密码子有8个,包括GAU(红豆除外)、GAA(木豆除外)、UCA(花生除外)、ACU(绿豆除外)、UAU(蔓花生除外)、GUU、UUG与AGA,其中有4个密码于U结尾,3个密码子于A结尾。AUG和UGG密码子无偏好性。而GCG等10个密码子的偏好性极低。由于AGA密码子具有最大的RSCU值,可认为AGA是最优密码子。

2.2 ENc、CAI、GC3s及GC含量分析

ENc能有效衡量密码子家族中同义密码子非均衡使用的偏好性。其值处于20~61,偏好性越强的密码子其ENc值越接近20[9]。GC3s能反映密码子第三位碱基的偏好性。CAI则指实际编码该蛋白的所有密码子对于完全使用最优密码子编码该蛋白质情况下的适应性指数,常用来衡量基因表达水平[10]。其取值为0~1,偏好程度越低的密码子其CAI值越接近0[11]。

表2 11种豆科植物dxr基因的RSCU值

续表1(Continued table 1)

密码子Codon氨基酸AA1234567891011GAAE(Glu)1.581.561.220.821.671.051.161.291.051.241.43GAGE0.420.440.781.180.330.950.840.710.950.760.57UUCF(Phe)1.040.960.710.910.920.851.000.921.110.480.72UUUF0.961.041.291.091.081.151.001.080.891.521.28GGAG(Gly)1.091.220.830.941.300.761.751.221.431.651.78GGCG0.971.111.172.120.971.710.381.041.140.240.56GGGG1.090.781.330.940.860.570.751.041.140.470.78GGUG0.850.890.670.000.860.951.130.700.291.650.89CACH(His)0.750.551.000.960.671.150.670.401.040.830.53CAUH1.251.451.001.041.330.851.331.600.961.171.47AUAI(Ile)0.580.581.271.500.430.920.950.880.810.740.89AUCI0.830.690.670.680.860.920.611.130.690.910.64AUUI1.581.731.070.821.711.171.431.001.501.361.47AAAK(Lys)1.871.431.001.131.440.941.081.271.091.001.36AAGK0.130.571.000.880.561.060.920.730.911.000.64CUAL(Leu)0.800.780.440.190.800.350.550.690.410.390.41CUCL0.700.910.660.820.930.450.981.200.530.190.52CUGL0.700.781.711.650.931.540.440.171.880.290.52CUUL1.601.170.720.920.930.602.181.540.762.031.86UUAL0.800.520.880.680.531.190.761.200.821.261.34UUGL1.401.831.601.741.871.881.091.201.591.841.34AUGM(Met)1.001.001.001.001.001.001.001.001.001.001.00AACN(Asn)0.690.651.000.760.631.120.840.841.400.530.80AAUN1.311.351.001.241.370.881.161.160.601.471.20CCAP(Pro)1.271.201.742.141.002.461.701.001.431.881.76CCCP0.551.000.520.711.000.620.481.250.860.710.59CCGP0.180.200.870.140.250.310.240.250.290.120.12CCUP2.001.600.871.001.750.621.581.501.431.291.53CAAQ(Gln)1.331.650.690.771.670.891.201.570.951.471.13CAGQ0.670.351.311.230.331.110.800.431.050.530.88AGAR(Arg)3.411.912.462.182.002.231.763.193.113.673.43AGGR2.051.911.852.181.731.541.761.882.221.000.86CGAR0.000.950.620.551.070.171.410.560.000.000.57CGCR0.140.000.310.360.001.030.350.380.220.330.57CGGR0.140.270.620.360.270.690.350.000.440.330.00CGUR0.270.950.150.360.930.340.350.000.000.670.57AGCS(Ser)0.801.250.930.871.270.900.611.221.030.790.48AGUS1.301.160.621.201.010.600.611.501.030.791.20UCAS1.080.991.861.851.012.401.591.031.892.051.80UCCS1.080.991.030.761.100.900.861.031.370.160.48UCGS0.140.450.930.110.420.300.490.090.170.320.12UCUS1.591.160.621.201.180.901.841.130.511.891.92ACAT(Thr)1.251.471.280.951.571.101.001.201.831.941.94ACCT0.880.930.641.140.710.690.861.070.830.770.61ACGT0.130.000.320.190.000.690.430.130.330.000.12ACUT1.751.601.761.711.711.521.711.601.001.291.33GUAV(Val)0.410.710.190.430.270.500.840.570.160.861.00GUCV0.550.940.950.860.800.830.320.860.800.570.20GUGV0.830.471.331.290.531.500.630.291.440.760.90GUUV2.211.881.521.432.401.172.212.291.601.811.90UGGW(Trp)1.001.001.001.001.001.001.001.001.001.001.00UACY(Tyr)0.640.601.430.440.450.750.290.380.750.130.25UAUY1.361.400.571.561.551.251.711.621.251.871.75UAATER0.891.131.661.341.240.970.430.541.061.711.50UAGTER0.390.310.630.870.331.140.430.381.060.000.00UGATER1.721.560.710.791.430.892.142.080.871.291.50

注: 1为大豆;2为花生;3为蔓花生;4为木豆;5为伊犁花生;6为鹰嘴豆;7为羽扇豆;8为红豆;9为绿豆;10为苜蓿;11为山葛。下划线表示大于1的RSCU值。下同

Note: 1.Glycinemax; 2.Arachishypogaea; 3.Arachisduranensis; 4.Cajanuscajan; 5.Arachisipaensis; 6.Cicerarietinum; 7.Lupinusangustifolius; 8.Vignaangularis; 9.Vignaradiata; 10.Medicagotruncatula; 11.Puerariamontanavar.lobata. The RSCU value greater than 1 is underlined. The same below

由表3可知,dxr基因的ENc值处于42.71~54.61,平均为50.33,标准偏差为3.82,可判断以上11个物种的dxr基因密码子的偏好性整体偏低。dxr基因的CG3s值处于0.268~0.501,平均值为0.393,标准偏差0.082,表示同义密码子使用方式比较均一,也意味着dxr基因的密码子多以A/U结尾。

表3 11个物种 dxr基因的ENc、CAI、GC3s和GC

基因的表达水平和偏好性往往呈正相关[12]。dxr基因的CAI值为0.116~0.206,平均值0.178,标准偏差0.027,CAI值偏低,说明dxr基因的表达水平较低,会影响到MEP途径的效率。

2.3 密码子偏好性聚类分析

选取11种豆科植物以及烟草,拟南芥进行聚类分析。除木豆、鹰嘴豆、蔓花生、绿豆这4种豆科植物外,其他大部分豆科植物的dxr基因偏好性与两种模式植物相近(图1),表明烟草和拟南芥均可作为研究豆科植物dxr基因功能的模式植物。

图1 13种植物dxr基因的聚类树状图

2.4 决明dxr基因密码子偏好性分析

对决明dxr基因展开分析,以验证密码子偏好性数据的可信度。如表4所示,决明dxr基因中,有27个密码子的RSCU值大于1。其中有21个密码子以A/U结尾,而且比值也较高,可认为是决明dxr基因的偏好性密码子。同时决明dxr基因的 ENc、CAI、GC3s结果分别为46.38、0.236和0.2147,3个指数均偏低。此结果与豆科植物的密码子偏好性结果一致,说明豆科植物dxr基因密码子偏好性分析结果可信度较高。

表4 CUSP和CodonW程序分析决明dxr基因的密码子偏好性

续表4(Continuedtable4)密码子Codon氨基酸AA比例Fraction频率Frequency个数Number相对密码子使用度RSCUCGAR0.0000.00000.00CGCR0.1254.23720.75CGGR0.0000.00000.00CGUR0.1886.35631.13AGCS(Ser)0.0614.23720.36AGUS0.0614.23720.36UCAS0.21214.83171.27UCCS0.21214.83171.27UCGS0.0302.11910.18UCUS0.42429.661142.55ACAT(Thr)0.46225.424121.85ACCT0.1548.47540.62ACGT0.0774.23720.31ACUT0.30816.94981.23GUAV(Val)0.21616.94980.86GUCV0.1088.47540.43GUGV0.16212.71260.65GUUV0.51440.254192.05UGGW(Trp)1.00016.94981.00UACY(Tyr)0.1112.11910.22UAUY0.88916.94981.78UAA∗0.0000.0000∗UAG∗0.0000.0000∗UGA∗1.0002.1191∗

注:*为终止密码子(Note: * .Terminate codons)

2.5 豆科植物dxr基因与酵母、大肠杆菌的基因组密码子偏好性比较

如果外源基因与宿主基因组之间的密码子使用频率比值在0.5~2.0,说明二者密码子使用比较相近[13]。豆科植物dxr基因与大肠杆菌有31个密码子的使用频率比值大于2.0,而与酵母菌差别较大的密码子仅有14个,说明酵母菌更加适合豆科植物dxr基因的外源表达。但是要实现高效表达还需要对密码子进行优化。

3 讨论

本文对11种豆科植物的dxr基因密码子进行了可信度较高的偏好性分析,分析结果是豆科植物dxr基因的密码子偏好性和表达水平偏低,同义密码子使用方式比较均一,且序列中A+T含量大于G+C含量。推测dxr基因的低表达水平与豆科植物萜类及蒽醌类物质的低含量密切相关。Xing等[14]也认为dxr比MEP 途径上的第1个基因dxs更为关键。

豆科植物dxr基因中偏好性较强的密码子有8个,其中3个密码子(UCA、GUU与UUG)分别编码Ser、Val与Leu,它们在DXR的氨基酸组成中也是属于含量较丰富的氨基酸残基。由于豆科植物dxr基因密码子主要以A/U结尾,而单子叶植物密码子偏好以C/G结尾,因此豆科植物dxr基因更适合导入到双子叶植物中,而进一步的聚类分析表明拟南芥和烟草适合作为研究dxr基因功能的模式植物,但其中只有拟南芥是双子叶植物,说明拟南芥更适合作为模式植物。

相比于大肠杆菌,酵母菌更适合作为豆科植物dxr基因的表达系统。豆科植物dxr基因有31个密码子,与大肠杆菌基因组偏好性差异较大,表明它们在进化上距离较远,这一结果与童宇茹等[15]的研究结果相近,他们发现来源于细菌、藻类与高等植物的dxr基因在进化树中分别聚类,有较大的遗传距离。但是由于豆科植物dxr基因与酵母菌仍然有一定差异,所以要实现其在外源系统中高效表达,还需要对密码子进行优化。

猜你喜欢
豆科植物萜类蒽醌
科学家揭示豆科植物能与根瘤菌共生固氮机制
三叶委陵菜的化学成分和药理作用研究进展
科学家揭示豆科植物能与根瘤菌共生固氮机制
苍耳子中萜类化学成分的研究
大孔吸附树脂纯化决明子总蒽醌工艺
超声辅助双水相提取大黄中蒽醌类成分
深海来源真菌Alternaria tenuissma DFFSCS013中混源萜类化合物及其抗菌活性研究
大黄总蒽醌提取物对脑缺血再灌注损伤的保护作用及其机制
论豆科植物在园林绿化中的应用
植物中萜类化合物的提取方法研究进展