白假丝酵母菌(Candida albicans)WO-1分泌蛋白质组的生物信息学分析

2020-12-04 07:32王建国赵南南何志云
关键词:信号肽假丝酵母菌

王建国, 赵南南, 何志云, 王 泽

(1.济南市历城区妇幼保健计划生育服务中心, 济南 250100; 2.沈阳师范大学 生命科学学院, 沈阳 110034)

0 引 言

白假丝酵母菌(Candidaalbicans),又称白色念珠菌,是念珠菌中致病力最强的条件性致病真菌。目前,由于广谱抗生素、激素、免疫抑制剂等药物的大量使用,以及器官移植和介入性诊疗技术的普遍开展,白假丝酵母菌已成为医院内获得性真菌致病感染的首要原因[1-2]。研究显示,白假丝酵母菌的分泌蛋白,如天冬氨酸酶、丝氨酸肽酶、胞外磷脂酶B等,与其毒力、对人体上皮细胞的粘附、入侵和抑制免疫应答等致病行为存在非常重要的联系[3-4],已成为白假丝酵母菌相关疾病治疗和预防的确切靶点[5]。随着生物信息技术的长足发展,已成为揭示微生物分泌蛋白质组及其生物学作用的最有效技术手段[6]。因此,本研究根据已公布的白假丝酵母菌的全基因组信息,对其分泌蛋白及其功能进行预测和初步分析,为全面解析白假丝酵母菌致病机理提供新的思路。

1 材料与方法

1.1 材 料

白假丝酵母菌(WO-1)全基因组的6170个ORF序列来源于NCBI数据库(https:∥www.ncbi.nlm.nih.gov/)。

1.2 方 法

采用软件SignalP v 4.1(http:∥www.cbs.dtu.dk/services/SignalP/)对白假丝酵母菌WO-1全基因组蛋白的N端是否存在信号肽和酶切位点进行预测分析;TMHMM server v 2.0软件(http:∥www.cbs.dtu.dk/services/TMHMM/)和 Phobius软件(http:∥phobius.sbc.su.se/)预测蛋白质序列跨膜区的拓扑结构和数量;TargetP 1.1软件(http:∥www.cbs.dtu.dk/services/TargetP/)预测靶标肽段在亚细胞器的定位,确定是否为穿膜信号肽;Big-PI Fungal Predictor v 3.1(http:∥mendel.imp.ac.at/gpi/cgi-bin/gpi_pred_fungi.cgi)预测蛋白质氨基酸序列是否存在GPI锚定位点。符合以下四项标准的序列即为目标分泌蛋白: 1)含有1个N端信号肽; 2)不含跨膜区; 3)没有线粒体或其他胞内细胞器靶定蛋白的信号域; 4)没有GPI锚定位点。同时利用蛋白质数据库Uniprot(http:∥www.uniprot.org/),NCBI数据库(https:∥www.ncbi.nlm.nih.gov/)和Candida Genome Database(http:∥www.candidagenome.org/)对预测的分泌蛋白及其信号肽进行检索与验证分析。

2 结果与分析

2.1 白假丝酵母菌分泌蛋白的预测

2.1.1 信号肽分析

通过SignalP v 4.1软件对信号肽及酶切位点进行识别,最终得到376个含N端信号肽的ORFs,占全基因组蛋白序列的6.07%。

2.1.2 膜结合蛋白分析

采用TMHMM软件和Phobius软件对含信号肽的氨基酸序列进行跨膜域的区分,分辨分泌蛋白和跨膜蛋白。TMHMM软件分析结果显示,376个具信号肽的蛋白中: 1)含2个及以上跨膜区的有52个,提示该部分蛋白可能作为膜受体,锚定蛋白或者离子通道蛋白; 2)66个含有一个跨膜区; 3)258个无跨膜区。利用Phobius软件对筛选的66个具有1个跨膜区的氨基酸序列进行进一步的验证,结果显示,66个氨基酸序列中有23个不含跨膜区。最终得到了281个不含跨膜区,且具有分泌信号肽的氨基酸序列。

2.1.3 亚细胞定位分析

利用TargetP 1.1软件识别待测序列N端前导链中线粒体的靶标肽段(mTP)、叶绿体转运肽段(mTP)等细胞器的靶向序列,对待测蛋白质进行去向定位分析,运算结果最终得到279个蛋白质具有信号肽分泌途径。

2.1.4 锚定位点分析

真核生物蛋白转录后修饰中,GPI锚定比较常见,保证蛋白质能够锚定在细胞膜上。具有分泌信号肽的蛋白质如果存在着GPI锚定位点,将不能分泌到细胞外。利用big-PI Fungal Predictor软件识别出待测氨基酸序列的GPI锚定位点,从而将这些蛋白排除,最终得到216个符合目标标准的氨基酸序列。

2.2 分泌蛋白的特征分析

白假丝酵母菌(WO-1)基因组的6170个ORF序列共甄选出分泌蛋白216个,占ORF总数的3.50%。最长的氨基酸序列具有1447个氨基酸,均值是762,主要集中在401~500个氨基酸区段(见图1)。经过对已公布的白假丝酵母菌数据库的比对分析,预测的分泌蛋白组中31.9%明确注释了细胞外定位,33.33%的氨基酸序列未注释定位。同时,也存在细胞壁、膜泡、线粒体、质膜等位置的平行注释(见图2)。可检索到生物学功能124个,其中具有水解酶活性的蛋白最多,占11.57%,依次为水解酶活性、肽链内切酶活性、脂肪酶活性、金属离子结合活性、致病原、细胞壁形成、催化活性、针对药物、饥饿或者温度的细胞应答及转移酶活性等(见图3),同时存在40.28%的预测序列并未注释功能。

图1 预测的分泌蛋白ORFs长度

图2 预测的分泌蛋白细胞定位分布

图3 分泌蛋白的注释功能分析

2.3 分泌蛋白信号肽的特征分析

预测的分泌蛋白信号肽长度介于12~33个氨基酸残基(见图4),其中具有18个氨基酸的信号肽数量最多。信号肽中非极性及疏水氨基酸(A、V、L、G、I、P)组成出现频率为52.88%,带负电荷的酸性氨基酸(D、E)占1.26%,带正电荷的碱性氨基酸(K、R、H)为5.30%,芳香族氨基酸(W、F、Y)占11.64%,其中亮氨酸(L)出现频率最高,为20.51%。信号肽C端切割位点前后-3~+3氨基酸组成对信号肽的识别具有重要作用,氨基酸分布数量最多的是丙氨酸(A),在-1位出现频率最高,为60.65%,仅-3位和+2位所有氨基酸均出现(见表1)。

图4 预测的分泌蛋白信号肽长度分析

表1 预测的分泌蛋白信号肽氨基酸组成和分布频率

3 讨 论

白假丝酵母菌WO-1可以侵犯人体许多部位,如皮肤、粘膜,甚至引起内脏、中枢神经系统或全身感染,临床症状错综复杂[7-8]。白假丝酵母菌的分泌蛋白在其致病力、侵染性及感染后症状等多种恶性生物行为方面起到了决定性作用。本实验基于白假丝酵母菌基因组数据库信息,利用生物信息学预测算法寻找潜在的白假丝酵母菌分泌蛋白,为更好的破解和阻遏白假丝酵母致病威胁提供有效的数据支持。

2001年斯坦福大学首次公布白假丝酵母菌SC5314的全基因组序列(http:∥www-sequence.stanford.edu/group/candida)[9],Samuel等对白假丝酵母菌SC5314(6165ORF)的分泌蛋白组进行了分析与预测,并得到283个分泌蛋白[10]。经比较发现,WO-1与SC5314分泌蛋白的信号肽特征及各氨基酸使用频率大体一致,长度多集中在18~21,以亮氨酸(L)、丙氨酸(A)、丝氨酸(S)和异亮氨酸(I)的组成为主,WO-1信号肽切割位点的-3~+3位上20种氨基酸使用频率具有很高的多态性,A(丙氨酸)使用频率最高的为-1,同时切割位点相对不保守,这一现象在其他微生物分泌蛋白中比较常见[11-12]。SC5314 和 WO-1是白假丝酵母菌的两个亚种,SC5314具有很低的致病性,因此,除去分析软件的影响,分泌蛋白数量上的差异在不同程度上显示了WO-1与SC5314的生物学特征和功能存在本质性的差别。

本文对WO-1的216个分泌蛋白进行详细的功能检索和分析,预测的分泌蛋白中以水解酶活性蛋白居多,主要包括分泌型天冬氨酸酶、磷脂酶、脂肪酶、分泌丝氨酸肽酶以及α-葡萄糖苷酶等,同时,广泛的涉及到肽链内切酶活性、脂肪酶活性、金属离子结合活性、细胞壁的形成等生物学功能,甚至参与了针对药物,饥饿或者温度的细胞耐受和应答过程,说明分泌蛋白可能参与了白假丝酵母菌致病的多个生物学环节。值得注意的是,预测的分泌蛋白质组中近1/3的成员为未注释功能的蛋白,为我们深入挖掘和理解白假丝酵母菌致病机理等提供了巨大参考数据。生物技术和算法的发展,也将为白假丝酵母菌致病机制的深入研究提供更有效的支撑。

猜你喜欢
信号肽假丝酵母菌
米卡芬净对光滑假丝酵母菌在巨噬细胞内活性的影响
基于信号肽策略提高外源蛋白在枯草芽孢杆菌中的表达
为什么酵母菌既能做面包也能酿酒?
酵母菌及其衍生物在水产养殖中的研究与应用
郫县豆瓣中一株耐盐酵母菌的分离鉴定及其发酵性能
运用计算机软件预测木质部寄生属信号肽
烟草野火病菌Pseudomonas syringae pv. tabaci yuexi-1信号肽预测及分析
中西医结合治疗复发性外阴阴道假丝酵母菌病的临床观察
阴道白假丝酵母菌的耐药性与MDR1基因表达关系研究
妇炎消胶囊联合舒康凝胶治疗复杂性假丝酵母菌阴道炎100例