宫颈癌相关基因IRF7的生物信息学分析*

2018-02-28 05:49郝玉娟贾克娟郭玉琪许昌市中心医院妇产科河南46000河南省人民医院妇产科郑州450003
现代医药卫生 2018年3期
关键词:信号肽信息学磷酸化

郝玉娟,贾克娟,郭玉琪(.许昌市中心医院妇产科,河南46000;.河南省人民医院妇产科,郑州450003)

宫颈癌作为女性最常见的恶性肿瘤之一,近年来发病率不断上升[1],由于宫颈癌的发病受到多方面的调控,其发病机制尚未明确,且尚未找到有效的治疗手段,导致宫颈癌的高病死率。从分子水平研究宫颈癌的发病机制,能够为宫颈癌的早期诊断提供有效的支持。朱明玥等[2]利用高通量芯片检测与分析技术,筛选出部分在宫颈癌与正常宫颈中差异表达的基因,其中基因干扰素调节因子7(IRF7)的作用机制尚未明确。由于利用分子生物学试验研究基因IRF7需要耗费较大的人力与物力,而生物信息学作为一门交叉学科,可以有效地对基因IRF7的相关功能进行预测,为进一步深入研究提供理论指导。因此,本文利用生物信息学手段分析基因IRF7,以期为宫颈癌的预防和治疗奠定理论基础。

1 材料与方法

1.1 材料 从GenBank数据库中查询到基因IRF7的核苷酸序列,编号为GI:98985818。

1.2 方法

1.2.1 基因IRF7及编码蛋白质的基本理化性质分析利用ORFFinder(http://www.ncbi.nlm.nih.gov/projects/gorf/)查找开放阅读框。使用ExPaSy提供的在线软件ProtParam(http://web.expasy.org/protparam/)分析氨基酸的基本理化性质。

1.2.2 IRF7蛋白质的功能与结构分析 使用InterPro-Scan[3](http://www.ebi.ac.uk/interpro/scan.html)预测蛋白质功能域与结构域,使用Motif Scan(http://hits.isb-sib.ch/cgi-bin/motif_scan/)搜索已知功能基序,使用Net-Phos 2.0 Server(http://www.cbs.dtu.dk/services/NetPhos/)进行磷酸化位点分析,使用 PSORTⅡ server(http://www.genscript.com/psort.html)进行亚细胞定位预测,使用 TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)进行跨膜区预测。使用SignalP 4.1[4](http://www.cbs.dtu.dk/services/SignalP/)进行信号肽预测,物种选择真核生物,其余使用默认参数。使用BLASTP搜索其他物种的相似蛋白质序列,使用MEGA6.0软件构建系统进化树,系统进化树采用邻接法(NJ),对构建的进化树进行自检(bootstrap),重复设为1 000。使用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)分析蛋白质的二级结构。使用 SWISS-MODEL(http://www.swissmodel.expasy.org)预测蛋白的三级结构。

2 结 果

2.1 基因IRF7及编码蛋白质的基本理化性质分析 基因IRF7的GeneID为3 665,定位在11p15.5,含有9个外显子,分别位于 1~632、633~843、844~902、903~1 128、1129~1215、1216~1296、1297~1686、1687~1805、1806~2 051,编码 516个氨基酸的蛋白质(NP_004022),ORF 阅读框长度为 1 551 bp(411~1 961 bp),使用 ExPaSy分析结果显示,蛋白质相对分子质量为55.64×103,等电点为6.12,负电荷残基总数为57个,正电荷残基总数为52个,分子结构式为C2475H3832N700O727S19,不稳定系数为65.82,说明蛋白质不稳定。通常脂肪系数越大的蛋白质热稳定性越高,该蛋白质脂肪系数为70.06,说明热稳定性高。总平均亲水性为-0.410,说明为亲水蛋白。

2.2 IRF7蛋白质的功能与结构分析 InterProScan预测结果显示,20~141aa为侧翼螺旋-转角-螺旋DNA结合域,288~514 aa为类SMAD结构域,Motif Scan分析结果表明存在多个cAMP、CK2、PKC磷酸化位点和N端豆蔻酰化位点。磷酸化位点分析结果显示,以0.5为阈值,存在19个丝氨酸(Ser)磷酸化位点、9个苏氨酸(Thr)磷酸化位点、4个酪氨酸(Tyr)磷酸化位点(图 1)。将序列提交到PSORT中利用k-NN法进行预测,有43.5%的可能性位于核中,说明有可能位于细胞核中。跨膜区预测结果显示不存在跨膜区(图2),信号肽预测结果显示不存在信号肽(图3),亲水性分析结果表明,其总亲水性应为负值(图4),为亲水蛋白,与ExPaSy分析结果保持一致。使用BLASTP搜索其他物种的相似蛋白质序列,多序列比对及系统发生树结果见图5。蛋白质二级结构分析结果表明,α-螺旋为24.61%,延伸链为16.47%,β-转角为5.62%,无规则卷曲为53.29%(图6)。三级结构分析结果见图7。

图1 磷酸化位点分析

图2 跨膜区预测结果

图3 信号肽预测结果

图4 亲水性分析结果

图5 多序列比对及系统发生树分析结果

图6 二级结构分析结果

图7 三级结构分析结果

3 讨 论

生物信息学作为一门生物学、计算机科学、数学等多学科交叉的学科,能够利用软件程序和公共数据库信息为分子生物学提供一条新的研究途径[5]。研究发现,IRF7在肝细胞感染病毒时其具有抵御病毒作用,很好地保护肝细胞[6]。刘路路[7]研究发现,肠道病毒通过3C蛋白酶切割IRF7并抑制IRF7介导的干扰素启动子激活功能,从而逃逸宿主天然免疫。刘爱美[8]通过对尖锐湿疣体组织分别用免疫组织化学法在蛋白水平及应用实时荧光定量聚合酶链反应在基因水平上检测IRF7的表达,发现IRF7能调节干扰素的表达,参与机体抗人乳头状瘤病毒(HPV)的局部免疫反应。而宫颈癌的发生发展也与人乳头瘤病毒的感染密切相关,因此,推测IRF7在宫颈癌的发病过程中起着重要作用。本文从生物信息学角度对基因IRF7进行分析。IRF7蛋白质属于亲水蛋白,不含有信号肽,不属于跨膜蛋白,亚细胞定位结果显示可能位于核中。蛋白质翻译后修饰对蛋白质的结构和功能起着关键作用,IRF7蛋白质有多个磷酸化位点,磷酸化和去磷酸化是细胞内信号传导的重要方式,推测其应该与信号传导有关;蛋白质通过磷酸化和去磷酸化而发生构象改变,导致其活性或性质的改变,从而调节细胞中各个生命活动过程[9],推测其是一个有功能的比较活跃的蛋白质,蛋白质二级结构预测显示,无规则卷曲占有较大的比例。屈宜笑[10]通过对青鱼的研究发现,青鱼IRF7基因的cDNA全长为1 901 bp,磷酸化的IRF3和IRF7进入细胞核内诱导干扰素的分泌,从而诱发宿主天然免疫抗病毒反应。本文利用生物信息学手段分析了基因IRF7的染色体定位、蛋白质的基本理化性质、结构及功能,为深入研究基因IRF7对宫颈癌的作用机制奠定了理论基础。

[1]BEKKERS RL,MASSUGER LF,BULTEN J,et al.Epidemiological and clinical aspects of human papillomavirus detection in the prevention of cervical cancer[J].Rev Med Virol,2004,14(2):95–105.

[2]朱明玥,隋霜,玛依努尔·尼牙孜,等.新疆维吾尔族宫颈癌全基因组表达谱分析及与宫颈癌相关的信号通路的筛选[J].中国妇幼保健,2014,29(32):5233-5238.

[3]BENDTSEN JD,NIELSEN H,VON HEIJNE G,et al.Improved prediction of signal peptides:Signal P 3.0[J].J Mol Biol,2004,340(4):783-795.

[4]YAN Q.Bioinformatics databases and tools in virology research:an overview[J].In Silico Biol,2008,8(2):71-85.

[5]齐月,金清龙,温晓玉,等.肝细胞中固有干扰素调节因子7的表达及其抗病毒作用[J].吉林大学学报(医学版),2012,38(2):183-186.

[6]张红梅.糖尿病新基因SLC30A8的生物信息学分析[J].中国老年学杂志,2010,30(16):2286-2289.

[7]刘路路.肠道病毒属3C蛋白通过调控IRF7拮抗天然免疫的机制研究[D].北京:北京协和医学院中国医学科学院,北京协和医学院,中国医学科学院,清华大学医学部,2016.

[8]刘爱美.TLR9-MyD88信号通路与尖锐湿疣相关性的研究[D].泸州:西南医科大学,2016.

[9]王泳,敬晓红,孙丽岩,等.糖尿病相关基因KCNJ11的生物信息学分析[J].武警后勤学院学报(医学版),2012,21(8):610-613.

[10]屈宜笑.青鱼IRF3及IRF7基因的克隆及功能初探[D].长沙:湖南师范大学,2016.

猜你喜欢
信号肽信息学磷酸化
T69E模拟磷酸化修饰对Bcl-2与Nur77相互作用的影响
基于信号肽策略提高外源蛋白在枯草芽孢杆菌中的表达
鸡NRF1基因启动子区生物信息学分析
ITSN1蛋白磷酸化的研究进展
初论博物馆信息学的形成
磷酸化肽富集新方法研究进展
运用计算机软件预测木质部寄生属信号肽
烟草野火病菌Pseudomonas syringae pv. tabaci yuexi-1信号肽预测及分析
MAPK抑制因子对HSC中Smad2/3磷酸化及Smad4核转位的影响
中欧医学信息学教学对比研究