玉米TRIBOA-Glc邻甲基转移酶基因bx7的克隆及其生物信息学分析

2022-08-23 09:38徐碧莹黄伟鹏张敏艳吴委林郑大浩
延边大学农学学报 2022年2期
关键词:氨基酸编码蛋白质

徐碧莹, 黄伟鹏, 张敏艳, 吴委林, 郑大浩

(延边大学 农学院,吉林 延吉 133002)

玉米(学名:Zea mays)在我国是3大粮食作物之一[1],是世界上重要的粮食作物和丰产性最高的谷物作物[2]。在自然界危害玉米的害虫种类超过90多种[3],从玉米的根部到其上部的雄穗,受到根虫、茎秆蛀虫的侵害较多[4]。近年来,由于传统种植方式的改变,导致玉米虫害发生具有越来越加重的趋势[5-6]。据研究,植物内源性苯并噁嗪类次生代谢物与其生抗性和植株表皮组织结构上防御响应密切相关[7-8],赋予了植株对害虫及病原菌的广泛普遍的抗性。苯并恶嗪代谢从吲哚-3-甘油磷酸开始,经过吲哚、吲哚-2-酮、3-羟基吲哚-2-酮合成出2-羟基-苯并恶嗪-3-酮(HBOA),再由HBOA合成出DIBOA及其衍生物DIBOA-葡萄糖苷和TRIBOA-葡萄糖苷[9]。此后在不同的邻-甲基转移酶的作用下进行甲基化产生各种赋予植物真正防御机能的含有甲氧基的苯并噁恶嗪-3-酮-葡萄糖苷类物质[10]。bx7基因是苯并噁嗪代谢途径中的关键酶之一,催化由TRIBOA-葡萄糖苷转化为丁布葡萄糖苷(DIMBOA-Glc),在玉米植株抗虫方面起着重要作用。

该研究采用cDNA-PCR克隆技术,从玉米Mo17中克隆编码TRIBOA-Glc邻甲基转移酶的bx7基因,并对目标序列进行生物信息学分析,为TRIBOA-Glc邻甲基转移酶的体外合成和功能验证奠定基础,这对揭示玉米抗虫性的分子机制具有重要意义。

1 材料与方法

1.1 材料

该试验采用高抗蚜虫玉米自交系Mo17种子,培养在农学院教学实验基地,待玉米苗长至3叶期取样并保存于-80 ℃冰箱,用于RNA提取。

1.2 方法

1.2.1 总RNA提取与cDNA合成

总RNA提取按照RNA提取试剂盒说明书操作,cDNA合成按照Promega公司GoScriptTM反转录试剂盒说明书操作。

1.2.2 基因克隆与测序

利用NCBI网站(National Center for Biotechnology Information)下载玉米TRIBOA-Glc邻甲基转移酶bx7基因的mRNA序列(登录号为NM_001127247.2),然后通过BLAST分析方法,进行多序列比对分析。利用Primer Premier 6.0设计引物,利用Auto Dimer 1.0来检测所设计的引物质量。其中正向引物为bx7EC545F1:GAATTCTGGGAAGAGTGTCATCAA(下划线部分为限制性内切酶EcoR I位点);反向引物为bx7XI2161R:CTCGAGATGTTTCCGTCCTCCGA(下划线部分为限制性内切酶Xho I位点)。引物由生工生物工程(上海)股份有限公司合成。

1) PCR扩增体系 cDNA,1 μL,Taq-GreenMix,5 μL,10 μmol/L引物各1 μL,最终加ddH2O补充至10 μL。

2) 反应条件为 95 ℃预变性,5 min;95 ℃,30 s,57.1 ℃,45 s,72 ℃,1 min 30 s,35个循环;72 ℃延伸反应10 min。

3) PCR产物经1%的琼脂糖凝胶电泳检测验证正确后,利用胶回收试剂盒将扩增出的目标条带进行回收。将回收后的产物连接到pMD-19T载体上,再导入到感受态的大肠杆菌DH5α中,在含有氨苄青霉素、IPTG、X-Gal的培养基上过夜培养,经过蓝白斑选择挑取阳性克隆。经酶切验证正确后将菌液送往上海生工生物工程股份有限公司进行测序。

1.2.3 目标序列的同源性分析

将得到的测序结果,利用DNA Star软件和Gene Doc软件进行序列分析和同源性比对分析。在NCBI上下载禾本科bx7蛋白序列,再用MEGA7软件构建进化树。

1.2.4 目标序列的生物信息学分析

目标序列编码的蛋白质序列分析,通过在NCBI网站上进行Blast分析确定为bx7基因后应用BioEdit软件进行分析,采用ExPASy Proteomics Server在线工具中ProtScale模块对bx7基因编码的蛋白质进行亲疏水性等一级结构的分析;通过NCBI在线网站对目标序列编码的蛋白质进行序列同源性分析;使用TMHMM2.0、SOPMA、SWISS-MODEL在线分析工具对目标蛋白的跨膜区域分析,对二级结构、三级结构进行预测。

2 结果与分析

2.1 bx7基因序列分析

以高抗蚜虫的玉米自交系Mo17为材料,提取RNA反转录为cDNA,以cDNA为模板成功克隆出含有完整的目标基因的cDNA片段(1 522 bp)(图1),在NCBI网站上与标准基因序列进行分析,经分析所获序列含有一个完整的开放阅读框,长1 176 bp,编码392个氨基酸(图2,3)。与标准基因序列相比共发生16处突变,存在1个6碱基和1个3碱基的插入突变,2个3碱基的缺失突变,12个单碱基突变。其中,1个单碱基突变位于起始密码的上游-30 bp处,2个单碱基突变位于终止密码的下游1 300~1 340 bp。蛋白质序列存在6处变化,即从N末端开始第92个氨基酸和第336个氨基酸天门冬氨酸(D)丢失,第124个氨基酸丙氨酸(A)变成甘氨酸(G),第127个氨基酸甘氨酸(G)变成丙氨酸(A),并且存在第120个氨基酸丝氨酸(S)、第122个氨基酸天门冬氨酸(D)、丙氨酸(A)的插入。

注:M为2 000 bp 、15 000 bp DNA marker;第1泳道为以cDNA为模板的PCR产物;第2泳道为PCR扩增回收产物;第3泳道为重组质粒为模板的PCR产物;第4泳道为以插入目的片段的重组质粒(pMD-19T重组质粒);第5泳道为重组质粒酶切产物。

图2 玉米自交系Mo17与标准基因组B73基因序列比较

2.2 目标序列的生物信息学分析

2.2.1 蛋白质理化性质分析

利用在线工具ProtScale、TMHMM 2.0对编码的蛋白质的亲疏水性(图4)与跨膜区域结构(图5)进行分析。结果显示,从自交系Mo17中分离的目标序列编码由392个氨基酸组成的蛋白(bx7Zm1753Mo17P),与玉米标准基因组(B73)的参考蛋白(bx7Ref_B73P)相比,含有相同的亲水性氨基酸残基数,均为226个;含有的疏水性氨基酸残基数不同,参考蛋白含有疏水性氨基酸残基165个;目标蛋白含有疏水性氨基酸残基166个。在参考蛋白中,丙氨酸(A)、亮氨酸(L)、甘氨酸(G)、缬氨酸(V)、天门冬氨酸(D)、丝氨酸(S)等6种氨基酸占蛋白质总氨基酸残基数(391)的50.1%;在目标蛋白中,占蛋白质总氨基酸残基数(392)的50.3%,所占比例差距不大。但在全部氨基酸中,丙氨酸(A)的比例最大(11%),色氨酸(W)与天冬酰胺(N)所占比例最低(均为1.5%)

注:峰值<0表示亲水性,A表示亲水区(Hydrophilic domain);峰值>0表示疏水性,B表示疏水区(Hydrophobic domain)。

图5 参考蛋白和目标蛋白跨膜结构分析

目标蛋白与参考蛋白的相对分子量分别为42.58 KD与42.53 KD;总元素数量分别为5 925与 5 914。除O元素、S元素数量相同外,其余3种组成元素C、H、N均有差异,分别为1 860、24、531和1857、293、530。正电荷残疾总数相同均为38个;负电荷残基总数相差1,分别为54、55。目标蛋白与参考蛋白经在线分析,稳定系数小于40,表明目标序列和参考序列编码的蛋白的稳定性较好,推断为稳定的亲水性蛋白。该蛋白在Mo17与标准基因组的B73中均无跨膜区域结构,属于无跨膜结构的亲水性蛋白。

利用线上ProtScale软件的Hphob. / Kyte& Doolittle模块对目标蛋白bx7Zm1753Mo17P的亲疏水性进行分析,从结果来看(图3),目标蛋白bx7Zm1753Mo17P与参考蛋白bx7Ref_B73P具有相似的亲水结构,疏水结构有些差异。峰值<0表示亲水性,峰值>0表示疏水性,在图中A区(A1-A10)代表亲水区,B区(B1-B10)代表疏水区。在疏水区(B区)B4区域对比可看到有明显不同,不同区域的亲疏水强弱不同,这可能反映了蛋白质的亲水性和疏水性序列谱的折叠情况。

图3 玉米自交系Mo17与标准基因组B73编码蛋白质比较

2.2.2 蛋白质二级三级结构预测

通过使用SOPMA预测目的蛋白的二级结构可看出(表1,图6),目标蛋白和参考蛋白均由α螺旋、β转角、无规则卷曲与延伸链构成,其中,α螺旋与无规则卷曲占氨基酸总数的比例较大,在参考蛋白中分别占47.06%与34.78%,在目标蛋白中分别占44.64%与35.71%,而β转角占氨基酸总数的比例最小,仅占了4.86%与5.61%。

表1 目标蛋白和参考蛋白的二级结构

注:a(蓝色)为α螺旋;b(玫红色)为无规则卷曲;c(绿色)为β转角;d(红色)为延伸链

利用蛋白质数据库PDB网站的3D Structure Viewers在线可视化工具预测参考蛋白bx7Ref_B73P和目标蛋白bx7Zm1753Mo17P的三级结构,得到三维结构图(图7)。由于目标片段编码的蛋白质氨基酸序列与标准基因组上所推断的蛋白质氨基酸序列相比,存在7个氨基酸的差异,导致参考蛋白和目的蛋白的三级结构发生显著变化。

图7 参考蛋白和目的蛋白的三级结构预测

2.2.3 bx7蛋白的同源性分析及进化树

在NCBI在线分析工具中下载获得与bx7相似性高的序列,并且利用MEGA7软件来构建玉米(Mo17)、普通小麦(XP_044393359.1)、硬粒小麦(VAI34156.1)、二粒小麦(XP_037442496.1)、黑麦(AXY54917.1)、大麦(KAE8793625.1)、二棱大麦(XP_044965079.1)、画眉草(TVU31390.1)、柳枝稷(XP_039772587.1)、黍稷(RLM70322.1)、高粱(XP_002441380.2)、疣粒稻(KAF0887985.1)、粳稻(XP_015619557.1)、籼稻(EAY82987.1)、短柄草(XP_014752382.1)、谷子(XP_004962112.1)的进化树(图8)。结果显示,玉米(Mo17)与谷子、短柄草在同一支,普通小麦、硬粒小麦、二粒小麦、黑麦、大麦、二棱大麦、画眉草在同一支,柳枝稷、高粱、黍稷、疣粒稻、粳稻和籼稻在同一分支,说明玉米与谷子、短柄草的亲缘关系最近。

图8 bx7与其他植物的氨基酸序列系统进化树

2.2.4 bx7蛋白的功能预测

将bx7基因编码的氨基酸序列导入到NCBI数据库中的Conserved Domain Database模块进行相关蛋白结构域预测。预测结果表明,该蛋白有2个保守结构域(图9),该结构域分别位于第30~90和170~380位氨基酸之间,属于dimerization2 超级家族和AdoMet_MTases 超级家族。

图9 参考蛋白和目的蛋白的保守结构域

3 讨论与结论

苯并恶嗪类化合物是参与植物防御的一类重要的次生化合物,具有抗病虫害和化感等作用[11]。在苯并噁嗪类化合物中丁布(DIMBOA)被认为是与植物抗病虫害密切相关的代谢物质[11]。有研究资料显示,当丁布含量达到一定程度时,能够完全抑制小麦赤霉病菌孢子的生长[12];同时用丁布来饲喂家蚕幼虫,会导致家蚕幼虫在3 d内死亡[13]。丁布的分解产物也成为有效的化感作用的化合物,能够降低一些杂草的生长和萌发[14]。在丁布合成途径中,bx7基因催化TRIBOA-葡萄糖苷转化为丁布葡萄糖苷(DIMBOA-Glc)[15-16]。不同的玉米对抗虫性存在很大差异可能与TRIBOA-葡萄糖苷转化为丁布葡萄糖苷(DIMBOA-Glc)的效率有关。可以推测bx7基因通过调控植物体内丁布葡萄糖苷(DIMBOA-Glc)的含量高低,进而决定植株抗虫性的强弱[17-22]。该研究中,从玉米自交系Mo17中克隆出含有目标片段的序列长度为1 522 bp,它与玉米标准基因组数据库中的参考序列相比,在序列长度上存在一定差异。与参考序列相比,目标序列在ORF内存在13处碱基突变,导致了蛋白质三级结构的改变;虽然来自Mo17 自交系的蛋白质分子量和总元素数量与参考蛋白有一定差异,其氨基酸序列中也存在7个氨基酸的差异,造成了蛋白质构成元素C、H、O、N 和S 组成以及蛋白质多肽链的正负电荷量以及亲疏水特性等理化特性的略微变化。但通过与其他禾本科植物的同源性分析发现,氨基酸序列一致性较高,说明bx7蛋白在禾本科植物中的功能较为保守。属于dimerization 超级家族和AdoMet_MTases 超级家族。

对克隆基因所编码的蛋白质亲疏水性的分析表明,存在5个氨基酸的差异,其中,有2个氨基酸位于亲水区,3个氨基酸位于疏水区,并且无跨膜结构。bx7基因存在于禾本科植物中,例如玉米、谷子、大麦等,当植物体受到外界侵害,该基因主要以TRIBOA-葡萄糖苷为底物使其转化为丁布葡萄糖苷,而后去糖苷化生成丁布(DIMBOA),最终使植物体产生能够抵御外界侵害的有毒的苯并噁嗪类物质。该研究中,来自自交系Mo17分离出的目标片段有3个氨基酸的插入,2个氨基酸的丢失和突变,这对该基因的表达与对该酶的催化效率是否有影响,还需要进一步深入研究。

猜你喜欢
氨基酸编码蛋白质
HEVC对偶编码单元划分优化算法
蛋白质自由
饲料氨基酸释放动态对猪氮素利用影响的研究进展
住院病案首页ICD编码质量在DRG付费中的应用
生活中的编码
人工智能与蛋白质结构
补氨基酸不如吃鸡蛋
论纪录片影像中的组合编码运用