红景天AG基因(RrAG)的电子克隆及生物信息学分析

2018-12-06 01:49葛春艳李雪彤刘福鹏郑大浩吴委林
江苏农业科学 2018年21期
关键词:登录号红景天结构域

葛春艳, 李雪彤, 刘福鹏, 郑大浩, 吴委林

(1.延边大学农学院,吉林延吉 133002; 2.长春科技学院,吉林长春 130600)

红景天(Rhodiolarosea)为景天科(Crassulaceae)红景天属(RhodiolaL.)多年生草本植物,是我国传统珍稀药用植物,具有抗氧化、抗衰老、抗辐射、抗缺氧、抗疲劳、抗病毒、抗肿瘤、抗应激反应、增强机体免疫力、改善心血管系统功能等药理作用,广泛应用于军事、航天、医药、功能性食品、化妆品等保健和临床方面[1-4]。目前,相关研究主要关注红景天形态特性、栽培措施、红景天苷的生物合成以及药理与药性方面,未见关于其花器官发育等方面的相关研究。研究者依据大量花发育的研究结果提出ABCE模型,其中C+E基因控制雌蕊发育,而C组基因中的AG基因的弱突变体为心皮发育缺陷但雄蕊的发育正常,说明雄蕊和心皮属性的确定与发育对AG基因表达水平的要求不同[5]。

电子克隆(insilicocloning)技术是近几年来新发展的一种新的基因快速克隆方法,基本原理是基于已建立的核酸序列与蛋白质序列数据库,利用计算机技术与生物信息学工具进行比对、拼接及分析而快速获得相应的功能基因。该技术具有高效率、低成本且针对性强等优点[6],已被研究者们在基因克隆之前广泛使用。但是,当前研究者基本以已知相关物种的EST(expressed sequence tags,表达序列标签)序列在基因组数据库中进行反复比对、拼接到没有可供延长的序列为止,得到最终的重叠群(Contig),再进行开放阅读框的查找及后续相关生物信息学分析。随着测序技术与生物信息软件的发展,已有大量已拼接好的转录组数据库,本研究将拟南芥AG基因在红景天转录组数据库中进行比对,得到红景天全长AG基因,减少了反复比对与拼接的麻烦以及可能出现的错误,并对其进行相应的生物信息学分析,以期为后续相关功能基因的克隆与功能分析提供参考。

1 材料与方法

1.1 电子克隆获得红景天AG基因序列

将拟南芥AG基因(NP_001190766.1)在中国国家基因数据库(https://db.cngb.org/blast/blastn/)中选择tblastn程序在红景天转录组数据库中进行比对,将比对得到的多条序列逐一通过BLAST软件进行在线比对分析与Amigo(http://amigo1.geneontology.org/cgi-bin/amigo/blast.c-gi)注释分析,最终确定红景天AG基因(Rhodiola rosea AGAMOUS,简称RrAG)。

1.2 生物信息学分析

(1)将已得到的RrAG基因的mRNA序列利用SeqBuilder软件分析开放阅读框(open reading frame,简称ORF)与美国国立生物技术信息中心(NCBI)网站的CD-search(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)在线分析其编码蛋白的保守结构域(conserved domains)。

(2)用Protparam(http://web.expasy.org/protparam/)分析蛋白的一级结构及其理化性质;用HMMTOP(http://www.enzim.hu/hmmtop/)、TMpred Server(http://www.ch.embnet.org/software/TMPRED_form.html)与TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)进行跨膜结构域分析;用SignalP 4.1 Server(http://www.cbs.dtu.dk/services/SignalP/)进行信号肽预测;用TargetP(http://www.cbs.dtu.dk/services/TargetP/)进行导肽分析;用Protfun 2.2 Server(http://www.cbs.dtu.dk/services/ProtFun/)预测蛋白质功能;利用在线软件PSORT(http://psort.hgc.jp/form.html)进行亚细胞定位分析。

(3)用蛋白质数据库PDB网站的3D Structure Viewers在线可视化工具(http://www.rcsb.org/pdb/home/home.do#Category-visualize)预测其三级结构。用NetPhos(http://www.cbs.dtu.dk/services/NetPhos/)预测磷酸化位点。

2 结果与分析

2.1 红景天AG基因序列的获得及序列分析

将拟南芥AG基因(登录号:NP_001190766.1)序列作为参考序列,在中国国家基因数据库的千种植物数据库(https://db.cngb.org/blast4onekp/blast)中通过选择tBLASTn程序[Expectation Value(期望值,简称E值)<0.001],在红景天转录组数据库中进行比对,得到相似度较高的16条序列,并利用BLAST在线软件分析了每条相似序列,最终确定了每条序列的基因功能。表1的结果表明,仅ZJUL-2061267为AG基因,通过在线Amigo进行注释分析,进一步说明ZJUL-2061267为红景天的AG基因(RrAG)。

使用SeqBuilder软件分析可知,ZJUL-2061267基因全长为1 037 bp,含有789 bp的开放阅读框,编码262个氨基酸(图1)。经NCBI网站CCD在线预测表明,该基因包含MADS_MEF2_like(MADS家族,登录号:cd00265)与K-box(登录号:pfam01486)结构域(图2),这2个区域对植物的形态建成具有重要作用。

表1 用NP_001190766.1在千种植物数据库比对得到的显著相似性序列及基因

2.2 红景天AG基因编码氨基酸理化性质及一级结构预测

基于ExPASy网站蛋白质数据库,利用ProtParam预测ZJUL-2061267蛋白的理化性质,结果表明,该蛋白含有262个氨基酸,分子式为C1 284H2 077N383O420S9,分子质量(MW)为29 888.47 u,由19种氨基酸组成(表2)。其中,丝氨酸(Ser,简称S)数量最多,达到11.8%,其次是亮氨酸(Leu,简称L)与谷氨酰胺(Gln,简称Q),分别达到8.4%与8.0%,而不含有色氨酸(Trp,简称W)、吡咯赖氨酸(Pyl,简称O)、硒半胱氨酸(Sec,简称U)、天冬氨酸(Asx,简称B)、谷氨酰胺(Glx,简称Z)与任意氨基酸残基(Xaa,简称X)。该蛋白理论等电点(pI)为9.27,带负电荷残基数为30个,带正电荷残基数为38个,亲水性平均系数(GRAVY值)为-0.851,说明该蛋白属于亲水性蛋白;理论推导半衰期是30 h,不稳定系数为56.28(>40),说明该蛋白不稳定(表3)。

2.3 红景天AG基因编码蛋白跨膜分析及信号肽与功能预测

使用在线软件HMMTOP、TMpred Server与TMHMM Server v.2.0进行跨膜结构域分析,由图3、图4可以看出,该基因编码蛋白为无跨膜区的膜外蛋白,说明该蛋白为水溶性蛋白,不与膜的疏水部分直接作用;通过在线软件SignalP 4.1 Server进行信号肽预测表明,该基因无信号肽;通过TagetP 1.1 Server进行预测显示,该蛋白为叶绿体转运蛋白(cTP)、线粒体靶向蛋白(mTP)、信号肽的可能性均较小,概率分别仅为0.332、0.103与0.026,而其他蛋白(other)的概率却达到了0.738,预示其为非分泌蛋白。使用Protfun 2.2 Server分析其蛋白功能,由表4可以看出,其中仅转录调节(transcription_regulation)、转录(transcription)与信号转导(signal_transducer)概率大于0.05(P>0.05),分别为0.107、0.079与0.075,说明该蛋白主要起转录调控作用。此外,在Predictprotein网站进行了亚细胞定位预测,表明其定位于细胞核内。综合以上分析,推测该蛋白为转录调控因子。

2.4 红景天AG基因二级结构与三级结构预测

蛋白质的结构是其活性与功能的重要影响因素之一[7-9]。编码的氨基酸借助氢键作用呈现的线性排列形成线性的二级结构,再由范德华力、氢键等相互作用使其进一步折叠形成立体的三级结构。通过使用SOPMA预测红景天AG基因的二级结构表明,红景天AG基因编码的蛋白由α-螺旋、无规则卷曲与延伸链构成,其中α-螺旋、无规则卷曲占氨基酸总数的比例较大,分别占48.09%、40.84%,而延伸链仅占11.07%(表5)。图5更为直观地表明,RrAG基因编码的蛋白二级结构中,α-螺旋与无规则卷曲所占比例较延伸链高。

利用蛋白质数据库PDB网站的3D Structure Viewers在线可视化工具预测红景天AG基因编码蛋白的三级结构得到三维结构。从图6可以直观地看出,红景天AG基因编码的蛋白属于MADS-box家族,在第3~57位氨基酸处存在MADS-box结构域,在第58~86位氨基酸处存在Mef2-type功能域结合DNA,并启动(调控)下游基因的转录。

2.5 蛋白质磷酸化位点分析

蛋白质翻译后的修饰也是其活性的重要影响因素之一,如磷酸化、精氨酸甲基化、糖基化等,其中磷酸化是重要的共价修饰方式之一。通过使用NetPhos(http://www.cbs.dtu.dk/services/NetPhos/)预测红景天AG基因编码蛋白的磷酸化位点。由图7可以看出,该蛋白的蛋白激酶磷酸化位点有36个,分别是21个丝氨酸、8个苏氨酸(Thr)、7个酪氨酸(Tyr)。

2.6 红景天AG基因的结构域与亲缘进化关系分析

将RrAG基因蛋白序列在NCBI中进行比对(BLASTp),下载相似性较高的AG蛋白序列,并使用DNAMAN软件进行序列比对。图8结果显示,在MADS-box与K-box 2个保守结构域上,该基因编码蛋白与其他物种的AG蛋白具有较高的相似度。利用MegAlign与MEGA6.06软件构建红景天AG(登录号:ZJUL-2061267)与麻风树AG(登录号:NP_001292936.1)、八仙花AG(登录号:BAG74745.1)、橡胶树AG(登录号:XP_021662672.1)、茶树AG(登录号:AID22158.1)、木薯AG(登录号:XP_021596031.1、XP_021599035.1)、甜椒AG(登录号:NP_001311689.1)、砂梨AG(登录号:AJW29028.1、AJW29030.1)、苹果AG(登录号:NP_001315863.1)、黑樱桃木AG(登录号:ACH72974.1)、棣棠花AG(登录号:AGZ01978.1)、樱桃AG(登录号:AIU94283.1)、荞麦AG(登录号:AFO83615.1)、蔷薇AG(登录号:AAD00025.1)、烟草AG(登录号:NP_001312829.1)、葡萄AG(登录号:NP_001268097.1、AEG19542.1)、陆地棉AG(登录号:NP_001314177.1、AAL92522.1)、亚洲棉AG(登录号:KHG12869.1)、黑白蜡木AG(登录号:APJ35634.1)、黄金树AG(登录号:AJZ73175.1)、板栗AG(登录号:AAZ77747.1)等植物AG同源蛋白氨基酸序列进化树,由图9可以看出,RrAG(登录号:ZJUL-2061267)与荞麦AG(登录号:AFO83615.1)的蛋白序列相似性最高。

表2 ZJUL-2061267编码蛋白的氨基酸组成

3 讨论与结论

目前,由于红景天的药用价值已经被人们普遍认识到,其需求量正在逐年增加,其所属植物的人工栽培也在全国较多地区得到了较大面积的开展。张雪莲分析发现,从对高山红景天的重要药用成分红景天苷的分析中发现,雄性植株的含量明显高于雌性植株[10],因此,研究红景天花器官发育对于单性植株育种具有重要意义。基于对拟南芥等大量植物花发育同源异型突变体的研究结果,本研究阐释了4类花器官同源异型基因决定花器官特征属性(花器官发育的ABCE模型),其中C+E功能基因控制雌蕊发育[11]。AG基因属于MADS-box转录因子家族,是迄今为止花器官发育中唯一的C类基因,起到花器官形态建成中调控雄蕊与雌蕊发育的作用。

随着高通量测序技术的发展,电子克隆技术(in silico cloning)已经成为克隆基因简便、快捷的新方法。目前,人们以EST为探针,通过比对基因组数据库,结合生物信息学对基因序列及其编码的蛋白质序列进行结构与功能的预测及分析,已成功从高丛越橘(UFGT基因)[12]、甘蔗(Sckn1基因)[13]、辣椒(actin基因)[14]、高粱(SAMDC基因)[15]、小麦(Cyp450基因)[16]等植物中获得了新基因。

表3 ZJUL-2061267编码蛋白的一级结构预测

表4 ZJUL-2061267的主要功能预测

表5 RrAG的二级结构预测

本研究基于红景天转录组数据库,通过电子克隆技术获得了红景天AG基因,生物信息分析及预测表明,该基因全长1 037 bp,包含1个长度为789 bp的开放阅读框,编码262个氨基酸,有MADS_MEF2_like与K-box结构域,该蛋白为无跨膜区的定位于细胞核内的不稳定水溶性蛋白,为参与转录调控作用的转录因子,蛋白的二级结构主要由α-螺旋、无规则卷曲和延伸链组成,有21个丝氨酸、8个苏氨酸、7个酪氨酸为磷酸化位点,该蛋白与荞麦的AG蛋白亲缘关系最近。本研究结果为景天科植物的AG基因的克隆与功能研究等方面的后续研究奠定了基础。同时,本研究采用基于转录组的电子克隆也为未来的电子克隆技术的应用提供了参考。

猜你喜欢
登录号红景天结构域
红景天的神奇功效及作用
基于DNA条形码进行金花茶组种间鉴别
含氟新农药的研究进展
蛋白质结构域划分方法及在线服务综述
小反刍兽疫病毒F基因的序列分析
红景天 直销牌照何日可待
电子版馆藏数据回溯中的交叉、重叠、阻滞问题处理
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析
组蛋白甲基化酶Set2片段调控SET结构域催化活性的探讨
红景天及红景天苷对高糖诱导的血管平滑肌细胞增殖的作用