山羊GDF9基因编码区nsSNPs的生物信息学分析

2021-05-10 03:15张天浩刘华云冯东青刘佳倩葛丛丛李鑫阳巩元芳
河北科技师范学院学报 2021年1期
关键词:产羔山羊位点

张天浩,刘华云,冯东青,刘佳倩,葛丛丛,李鑫阳,巩元芳

(河北科技师范学院动物科技学院 河北省特色动物种子资源挖掘与创新重点实验室,河北 秦皇岛,066600)

生长分化因子9(GDF9)是由卵母细胞分泌的一种生长因子,属于转化生长因子β(TGFβ)超家族的一员,结构上与家族其它成员不同之处是其它成员有7或9个Cys,而GDF9只有6个Cys,即不包含位于C末端参与成熟蛋白二硫键形成的Cys。GDF9不仅对卵泡的前期生长和分化起重要的调节作用,而且对卵巢的颗粒细胞、膜细胞也起重要作用,其也是调控山羊多胎性状的主效基因之一[1]。王百川等[2]研究发现,济宁青山羊和莱芜黑山羊GDF9基因编码区外显子2第795 bp处存在1个错义突变(c.795G>A),该突变位点的不同基因型个体产羔数存在极显著差异(P<0.01)。颜泉梅等[3]研究发现,GDF9基因编码区外显子2第792 bp处1个错义突变(c.792G>A)对西农莎能奶山羊和波尔山羊的产羔数均有极显著影响(P<0.01),认为该突变可作为山羊多胎性状的有效分子标记。Ashkenazy等[4]研究发现,埃及绵羊GDF9基因编码区外显子1的1个突变(A→T)与其产单双羔有关,可用于选育绵羊产羔数的分子标记。以上研究表明,GDF9基因与绵羊、山羊的多胎性状密切相关。

非同义单核苷酸多态性(nsSNPs)是一种可引起氨基酸序列发生改变的单核苷酸突变[5,6]。氨基酸序列的变化会影响蛋白质的空间结构,进而影响蛋白质的功能[7]。因此,笔者采用生物信息学技术拟挖掘山羊GDF9基因的功能性错义突变位点,为进一步深入研究该基因的生物学功能提供理论依据。

1 材料与方法

1.1 山羊GDF9基因nsSNPs的搜集及有害nsSNPs的预测

从Ensembl genome browser(http://asia.ensembl.org)数据库中检索nsSNPs的相关信息。以山羊GDF9基因编码区序列(GenBank登录号:NM_001285708.1)为标准,根据SNPs数据库提供的信息确定各nsSNPs在编码区序列中的位置。

利用SIFT[8],PolyPhen-2[9],PROVEN[10]等3种软件预测分析nsSNPs对山羊GDF9蛋白功能的影响。

1.2 山羊GDF9蛋白跨膜区和有害nsSNPs所处位置的预测

利用TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)在线软件预测山羊GDF9蛋白的跨膜区,并对有害nsSNPs所处位置进行分析。

1.3 有害nsSNPs进化保守性的预测

利用Consurf(https://consurf.tau.ac.il/)在线服务器分析山羊GDF9基因有害nsSNPs的保守性。nsSNPs保守性程度越高,对蛋白质结构和功能的影响可能越大[11]。

1.4 有害nsSNPs对山羊GDF9蛋白稳定性的影响

利用在线软件I-Mutant3.0[12](https://folding.biofold.org/cgi-bin/i-mutant2.0.cgi)评估有害nsSNPs对山羊GDF9蛋白稳定性的影响。在评估结果中,自由能变化值DDG<0或>0分别表示蛋白质稳定性降低或增加。RI(Reliability Index)为可靠性指数,范围在0~10之间。

1.5 有害nsSNPs对山羊GDF9蛋白二级结构和三级结构的影响

利用SWISS-MODEL(https://swissmodel.expasy.org/interactive)在线网站构建GDF9蛋白的高级结构,用PyMOL软件将突变位点定位到GDF9蛋白的高级结构中。分别使用Phyre2(http://www.sbg.bio.ic.ac.uk/~phyre2/html/page.cgi?id=index)和Mutpred(http://mutpred.mutdb.org/#qform)分析nsSNPs对山羊GDF9蛋白二级结构和三级结构的影响[6]。

1.6 山羊GDF9蛋白修饰位点的预测

利用在线软件BDM-PUB(http://bdmpub.biocuckoo.org/)和SUMOplotTM Analysis Program(http://www.Abgent.com/sumoplot)预测山羊GDF9蛋白的泛素化修饰位点;利用GPS-SUMO(http://su-mosp.Biocuckoo.org/)和NetPhos 2.0 Server(http://www.Cbs.Dtu.dk/services/NetPhos-2.0/)预测山羊GDF9蛋白的磷酸化修饰位点。

2 结果与分析

2.1 山羊GDF9基因nsSNPs的搜集及有害nsSNPs的预测结果

从Ensembl genome browser数据库中共检索到14个nsSNPs位于山羊GDF9基因的编码区,分别对应的氨基酸变异为R453H,K375R,V371M,P348S,F347S,V332I,S325Y,G291R,L266S,R250Q,K241E,M212V,R87H,L9F(表1)。

表1 山羊GDF9基因nsSNPs的收集及有害突变位点的预测结果

利用SIFT,PolyPhen-2,PROVEN等3种软件预测分析了有害nsSNPs。结果表明,3种软件预测结果不完全一致(表1)。本次研究将有害次数≥2作为有害突变位点的依据[13]。综合分析,最后在山羊GDF9基因编码区共筛查到6个有害突变位点,即R453H,V371M,P348S,F347S,S325Y,L266S。

2.2 山羊GDF9蛋白跨膜区和有害nsSNPs所处位置的预测结果

TMHMM对山羊GDF9蛋白跨膜区预测结果表明,该蛋白仅存在1个跨膜区域,位于氨基酸序列的6~26位之间,其侧翼序列的情况为1~5位处于胞内,27~453位处于胞外。上述筛查到的6个有害nsSNPs(R453H,V371M,P348S,F347S,S325Y,L266S)全部位于胞外(图1)。

图1 山羊GDF9蛋白跨膜区的预测结果

2.3 nsSNPs对山羊GDF9蛋白稳定性的影响

利用I-Mutant 3.0在线软件分析了14个nsSNPs对山羊GDF9蛋白的稳定性(表2)。结果表明,14个nsSNPs的可靠性指数RI均在0~10之间,说明预测结果是可靠的。在14个nsSNPs中,共有10个nsSNPs(R453H,K375R,V371M,P348S,F347S,L266S,R250Q,M212V,R87H,L9F)降低了GDF9蛋白的稳定性,其中R453H,V371M,P348S,F347S,L266是上述预测到的有害nsSNPs。

2.4 有害nsSNPs进化保守性位点的预测结果

利用Consurf在线服务器对山羊GDF9基因有害nsSNPs的进化保守性进行了分析。结果表明,R453H,V371M,P348S,L266S的保守性得分分别为9,9,8,9。得分处于7~9之间(表3),呈深紫或浅紫(图2),推测这4个nsSNPs均为保守性位点。

表2 nsSNPs对山羊GDF9蛋白稳定性的影响

表3 山羊GDF9基因有害nsSNPs进化保守性的预测结果

2.5 有害nsSNPs对山羊GDF9蛋白高级结构的影响

2.5.1对二级结构的影响利用在线软件Phyre 2分析了山羊GDF9基因6个有害nsSNPs对蛋白质二级结构的影响。结果表明,没有多态位点处在二级结构的α-螺旋区域,V371M和L266S处在β-折叠区域(图3),表明这2个有害nsSNPs可能参与了山羊GDF9蛋白二级结构的形成。

2.5.2对三级结构的影响以相似性>30%的蛋白质序列为模板,构建GDF9蛋白的三级结构,利用软件PyMOL将6个有害nsSNPs定位到GDF9蛋白的三级结构中(图4)。

图2 山羊GDF9基因有害nsSNPs进化保守性的预测结果注:1,图中方框所指6个有害突变位点;2,Consurf输出的不同得分代表不同的保守程度,得分从1到9(颜色由深蓝到深紫),位点保守程度依次增大。

利用Mutpred分析了6个有害nsSNPs对山羊GDF9蛋白三级结构的影响。结果表明,R453H,V371M,L266S的得分分别为0.84,0.52,0.65;P值分别为0.04,0.03,0.02(表4)。推测R453H,V371M,L266S对山羊GDF9蛋白三级结构有影响。

2.6 山羊GDF9蛋白修饰位点的预测结果

利用在线软件BDM-PUB和SUMOplotTM Analysis Program对山羊GDF9蛋白的泛素化修饰位点进行了预测。结果显示,与GDF9蛋白多态位点一致的泛素化修饰位点为K241;利用GPS-SUMO和NetPhos 2.0 Server对山羊GDF9蛋白的磷酸化修饰位点进行预测,结果显示,不存在磷酸化修饰位点(表5)。

图3 有害nsSNPs对山羊GDF9蛋白二级结构的影响

图4 6个有害nsSNPs在山羊GDF9蛋白三级结构的定位

表4 有害nsSNPs对山羊GDF9蛋白质三级结构的影响

表5 山羊GDF9蛋白的磷酸化修饰位点预测结果

3 结论与讨论

生长分化因子9(GDF9)是第一个被发现由卵母细胞分泌的生长因子,主要在卵巢组织中表达,它通过旁分泌方式对卵泡的生长分化起重要作用[14,15]。

本次研究在山羊GDF9基因编码区检索到的14个nsSNPs中有6个有害nsSNPs(R453H,V371M,P348S,F347S,S325Y,L266S)。预测分析发现,山羊GDF9蛋白是一个跨膜蛋白,6个有害nsSNPs均不在跨膜区,这与张小雪等[16]的研究结果相一致。

有研究表明,位点的保守性得分与其功能的重要程度成正比,一般得分越高,其保守性也越高[17,18]。本次研究发现,R453H,V371M,P348S,L266S得分较高,为保守性位点;而F347S和S325Y得分较低,则为一般可变位点。说明这6个nsSNPs的功能存在差异,R453H,V371M,P348S,L266S对GDF9蛋白的功能影响更大。

蛋白质的空间结构决定着蛋白质的生物学功能,基因的错义突变能改变蛋白质一级结构并可能导致其高级结构变化,从而影响蛋白的生物学功能[19,20]。山羊GDF9基因6个有害nsSNPs中有2个位于蛋白质二级结构的β-折叠区域,推测这2个位点参与蛋白质二级结构的形成。对蛋白质稳定性分析结果显示,5个有害nsSNPs(R453H,V371M,P348S,F347S,L266S)降低了山羊GDF9蛋白质的稳定性,意味着这些nsSNPs可能改变了该蛋白的空间结构,进而对其生物学功能产生影响。张健等[21]研究表明,泛素化和磷酸化修饰是细胞内广泛存在的蛋白质翻译后修饰机制。本次研究发现,K241是与山羊GDF9蛋白多态位点一致的泛素化修饰位点,但没有预测到与多态位点一致的磷酸化位点,说明GDF9基因的生物学功能与多态位点的磷酸化无关。

董传河等[22]研究发现,山羊GDF9基因编码区存在多处突变:c.183C>A,c.719C>T,c.959A>C,c.1189G>A。其中,c.183C>A为同义突变;c.719C>T,c.959A>C,c.1189G>A均为错义突变。相应的氨基酸变异位点依次为V240A,Q320P,V397I。关联性分析结果表明:c.719C>T和c.959A>C对济宁青山羊、鲁北白山羊和沂蒙黑山羊产羔数均没有显著影响(P<0.05);c.1189G对济宁青山羊产羔数没有显著影响(P>0.05),但对鲁北白山羊和沂蒙黑山羊有显著或极显著影响(P<0.05,P<0.01)。由此看出,位点不同、品种不同对山羊产羔数的影响不同。本次研究筛选到的山羊GDF9基因6个有害nsSNPs,其功能如何,需要在生物信息学技术预测的基础上通过试验研究进行进一步验证。

本次研究从Ensembl genome browser数据库检索到山羊GDF9基因14个nsSNPs。深入研究发现,R453H,V371M,P348S,F347S,S325Y,L266S等6个nsSNPs可能是山羊GDF9基因潜在的功能性位点,但其具体生物学功能与表型性状有何关联性以及作用机制有待进一步深入研究。

猜你喜欢
产羔山羊位点
Pd改性多活性位点催化剂NH3-SCR脱硝反应机理研究
研究发现湖羊产羔数存在近交衰退
夏季如何让山羊增膘
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
基于网络公开测序数据的K326烟草线粒体基因组RNA编辑位点的鉴定与分析
崇明白山羊母羊繁殖性能研究
绒山羊产羔强度对母羊发情的影响
一种改进的多聚腺苷酸化位点提取方法
山羊受骗
聪明的山羊