细胞凋亡、坏死和焦亡信号网络关键节点的识别

2024-01-27 11:33祁宏王洋石艳香
关键词:介数焦亡特征向量

祁宏,王洋,,石艳香

(山西大学 a.复杂系统研究所;b.数学科学学院,太原 030006)

细胞死亡是生物体的一项基本生命过程,在生物体的发育、自稳态和病理方面均发挥着举足轻重的作用[1-2].根据形态学和分子特征的不同,细胞死亡可分为凋亡、坏死、焦亡、铁死亡、溶酶体依赖性细胞死亡、自噬性细胞死亡、铜死亡等[3-4].各种细胞死亡方式均受到各自信号网络的精密调控,目前研究最多的3种方式是凋亡、坏死和焦亡[5].

关于凋亡机制的研究最为深入,它可通过受体途径和线粒体途径发生[6].二者均依赖于凋亡蛋白酶(Caspase,简写为CASP),当细胞受到凋亡信号刺激后会首先活化起始凋亡蛋白酶(如CASP2,CASP8和CASP9),起始凋亡蛋白酶再激活效应凋亡蛋白酶(如CASP3,CASP6和CASP7),效应凋亡蛋白酶进一步切割体内数百种蛋白[7-8].线粒体途径的主要参与者CASP9的活化还受BCL2蛋白家族成员之间相互作用的调控[9].

坏死机制的研究比较清晰.它主要由肿瘤坏死因子(TNF)受体家族以及Toll样受体家族启动,通过和受体蛋白互作的两个蛋白激酶RIP1(receptor interacting protein kinase 1)和RIP3(receptor interacting protein kinase 3)传递死亡信号,进而募集并磷酸化MLKL(mixed lineage kinase domain-like protein),活化的MLKL转位到细胞膜上诱导细胞裂解死亡[10-12].

焦亡机制的研究正在逐渐推进,通常分为经典途径和非经典途径.前者主要由炎症小体募集并激活CASP1;后者常由胞质脂多糖直接激活CASP4,CASP5和CASP11.这些CASP蛋白都能切割打孔蛋白GSDMD(Gasdermin D),使其释放N-末端片段并在细胞膜上组装成孔,导致膜完整性丧失和细胞裂解[13-14].

实际上凋亡、坏死和焦亡的信号网络远比上述情况复杂,完整的信号网络包含数十甚至上百种物质.例如,除了CASP和BCL2蛋白家族,凋亡信号网络还包含细胞色素c、钙离子和XIAP等[15-17].如何从纷繁复杂的网络中找出少数关键节点,一直是研究者关注的焦点.依赖生物学实验寻找关键节点的方法过程复杂、工作量大且成本高.本文在已发表文献的基础上,主要从生物数据库中获取相关数据,并对数据进行处理,然后分别构建凋亡、坏死和焦亡信号网络,最后根据网络测度指标选择关键节点.本研究不仅可为凋亡、坏死和焦亡的研究提供新的参考,而且可为其他细胞死亡方式和其他信号网络的研究提供指导思路.

1 方 法

1.1 凋亡网络构建

构建凋亡网络所用的数据下载自NCI-PID数据库(https://pid.nci.org.au/)和Signor数据库(https://signor.uniroma2.it/).其中,源于NCI-PID数据库的节点和边数据是两个独立的表格,为方便描述,将节点表格和边表格分别简称为Data1和Data2.源于Signor数据库的数据包括抑制细胞凋亡(inhibition of apoptosis)的数据和线粒体调控的细胞凋亡(mitochondrial control of apoptosis)数据,分别将其简称为Data3和Data4.在上述4个表格中,Data1包括Name和Type两列数据,Name列为节点的名称,Type列为节点的类型(如蛋白质、小分子等).Data2共包括7列数据,但凋亡网络的构建仅用到Name和Directed两列数据,Name列的数据格式为节点A(相互作用)节点B,表示节点A与节点B之间存在某种相互作用;Directed列表示节点A与节点B之间的相互作用是否有方向,有方向标记为True,无方向标记为False.Data3和Data4数据格式相同,均包含24列数据,但用于构建网络所用的数据仅包括EntityA,TypeA,EntityB,TypeB和Effect列,分别代表节点A、节点A的类型、节点B、节点B的类型和节点A对B的作用.

为构建比较全面的细胞凋亡信号网络,需将Data1-Data4的数据进行整合,整合包括两部分:一是对节点数据的整合,二是对边数据的整合.虽然不同数据库的数据格式不同,但节点名称的命名方式均保持统一,因此将Data1,Data3和Data4中代表节点和节点类型的数据进行合并,去除重复的行数据后即为细胞凋亡网络的节点数据,共计87个节点.由于两个数据库的边数据格式不同,故需将上述两部分数据中的边数据处理成统一格式并进行融合,再结合生物学知识将部分代表相同相互作用的边进行合并,从而得到凋亡信号网络的边数据,共计198条边.利用处理后的节点数据和边数据构建凋亡信号网络,并用Cytoscape软件对网络进行可视化.

1.2 坏死网络构建

构建坏死网络所用的数据取自Causalbionet数据库(http://causalbionet.com/).该数据的文本格式为功能(From物质名称):相互作用方式:功能(To物质名称),对其进行文本处理,使处理后的数据变为From、To和Interaction 3列,其中From和To列表示直接相连的物质,Interaction列表示物质之间的生物调控关系.由于该数据中包含相同蛋白质的不同状态且物质的分类信息极其详细,故需对数据进行简化处理,处理过程也分为节点和连边两个方面.在节点方面,首先将From和To列分别作文本处理得到表示节点和节点属性的数据.然后依据节点名称和类型合并和去重,便得到坏死网络的节点数据,共计50个节点.在连边方面,由于Interaction列包含的生物关系过于繁杂,需对其进行简化.同时为保证坏死网络与凋亡网络构建原则相一致,需增加一条RIPK1与RIPK3相连的边,其相互作用形式为结合.经过以上处理,最终得到细胞坏死网络的边数据,共计87条边.最后利用处理后的节点数据和边数据构建坏死信号网络,并用Cytoscape软件对网络进行可视化.

1.3 焦亡网络构建

由于焦亡信号通路的研究尚处于初步阶段,因此很难在数据库中找到适合构建信号网络的数据,本文主要借助查阅焦亡研究领域的领军人物(如:邵峰、刘星和Petr Broz等)已发表文献的方式构建焦亡信号网络.将文献[18-22]中提及的物质进行汇总形成Name列,然后根据物质类型增加Type列,最后得到焦亡信号网络的节点数据,共计27个节点.将文献[18-22]中物质之间的相互作用关系进行汇总,得到焦亡信号网络的边数据,共计44条边.该数据包括From、To和Interaction 3列,其含义与坏死网络数据一致.利用处理后的节点数据和边数据构建焦亡信号网络,并用Cytoscape软件对网络进行可视化.

1.4 中心性分析、k-壳分解及社团发现

关键节点虽数量非常少,但对网络的结构和功能有巨大影响[23];关键节点的识别可通过对其进行重要性排序而获得[24].本文利用度中心性、介数中心性、接近中心性和特征向量中心性4种不同的中心性指标对节点的重要性进行排序.

为使研究更加全面和客观,本文还结合k-壳分解和社团发现的结果确定各细胞死亡网络中的关键节点.k-壳分解是一种基于度值、对节点重要性进行粗粒化排序的方法[25],本研究所采用的社团发现算法是Louvain算法[26].

2 结 果

2.1 凋亡、坏死和焦亡网络的全局拓扑性质

本文首先计算了细胞凋亡、坏死和焦亡信号网络的密度、平均度、直径、平均距离、聚类系数以及同配系数等全局拓扑性质,其具体数值见表1.综合这些指标可知,凋亡、坏死和焦亡网络均为稀疏的异配网络,即度大的节点倾向于与度小的节点相连.另外,经统计分析发现本文所构建的凋亡、坏死和焦亡网络的度分布均大致服从幂律分布(结果未展示),即少数的重要节点拥有较多的连接,而大多数节点仅有少量的连接,是无标度网络的典型特征.

表1 凋亡、坏死和焦亡网络全局拓扑性质Tab. 1 Global topological properties of apoptosis,necrosis,and pyroptosis networks

2.2 凋亡网络结果分析

针对1.1节中的数据绘制凋亡信号网络(图1(a)),其中节点表示凋亡网络中的物质(共87个),连边表示物质之间的相互作用(共198条).节点有5种类型:绿色实心椭圆表示蛋白质或蛋白家族,空心椭圆表示复合物,橙色菱形表示小分子,刺激(包括压力、DNA损伤和存活因子)用黑色三角形表示,表型(存活或凋亡)用灰色长方形表示.边有4种类型:红色箭头表示上游物质对下游物质起促进作用,蓝色平箭头表示抑制作用,黑色实心箭头表示具体是促进还是抑制作用并不明确,两者之间形成复合物用虚线表示.

首先,计算凋亡网络中每个节点的度中心性、介数中心性、接近中心性以及特征向量中心性等4个中心性指标.由于篇幅有限,本文仅选择度中心性的结果进行图示(因其为最简单且直接的重要性评价指标,见图1(c));并分别对4个中心性指标的结果进行排序,选取排名前10的节点汇总在表2.

表2 凋亡网络的节点中心性指标(前10)Tab. 2 Node centrality indices of apoptosis network(Top 10)

图1(c)中节点的位置越靠近圆心,其度中心性的数值越高,其在凋亡网络中的地位也就越重要.为便于观察,将排名前10的节点按其数值由高到低分别用黄、紫、橙和绿4种颜色表示,网络中的其余节点用红色表示.由图1(c)可以直观地看出度中心性排名第一的CASP3“鹤立鸡群”,彰显出它作为细胞凋亡“刽子手”的重要地位.

由表2可知,度值高的节点有CASP3,CASP2,CASP8,TNF和TRAF2等,介数高的节点有CASP3,BCL2,BAD,CASP8和CASP2等,接近数高的节点为CASP3,BAD,TFAP2A,CASP8和CASP6等,特征向量中心性高的节点为TNF,TRAF2,RIPK1,TNFRSF1A和TRADD等.综合来看,在度中心性、介数中心性和接近数中心性三方面,CASP3的值均为最高,CASP2,CASP6,CASP8的值较高;BCL2的度值和介数较高;BAD和CASP10的介数和接近数较高.这些结果与CASP和BCL2蛋白家族在凋亡中发挥重要作用的事实相符.至于特征向量中心性不能反映这一事实的原因是下载数据中包含了TNF,RIPK1和TRADD等与坏死相关的蛋白,且这些蛋白间的联系异常紧密(见图1(a)上方).

其次,基于度中心性对凋亡网络进行k-壳分解,结果如图1(b)所示,共有6种k-壳指标:1-壳、2-壳、3-壳、4-壳、6-壳和9-壳,其中1-壳和2-壳中包含的节点最多;且某节点的度越大,代表它的圆圈就越大.将位于9-壳中的蛋白与特征向量中心性排名前10的蛋白进行对比,发现仅存在一个蛋白的差异,表明对于此凋亡网络而言选取k-壳分解中最高指标壳内的蛋白与选取特征向量中心性最高的蛋白能达到相同的效果.利用度、介数和接近数中心性选出的关键节点集中在3、4和6-壳中,该结果符合k-壳分解的一般规律,即重要的节点常位于指标较高的壳内,但不一定只集中在指标最高的壳内.

最后,利用Louvain算法对凋亡网络进行社团划分,结果如图1(d)所示,共被划分为6个社团,其中3号社团所含节点数最多,5号社团次之.细胞凋亡的表型节点Apoptosis和细胞存活的表型节点Survival都属于3号社团,该社团中还包含BAD,BAX,BCL2,BID等BCL2蛋白家族成员,凸显出BCL2蛋白家族对细胞命运的调节作用.CASP蛋白家族成员位于5号社团.

2.3 坏死网络结果分析

利用1.2节中的数据构建坏死信号网络,如图2(a)所示.该网络共包含4种类型的节点,共50个;3种类型的边,共87条,其具体意义与图1(a)中类似.

首先,计算坏死网络中每个节点的4个中心性指标,选择度中心性的结果进行可视化(见图2(c),其具体意义与图1(c)类似);并分别对4个中心性指标的结果进行排序,选取数值最高的前10个节点汇总在表3.

表3 坏死网络的节点中心性指标(前10)Tab. 3 Node centrality indices of necroptosis network(Top 10)

从图2(c)可以看出,表型节点Necroptosis,ROS分子和RIPK1蛋白相比于其他物质明显具有更重要的地位.由表3可知,度值高的物质有ROS,RIPK1,RIPK3,FADD和TNFRSF1A等,介数高的物质有RIPK1,ROS,FADD,TRAF2和RIPK3等,接近数高的物质有ROS,RIPK1,CYLD,RIPK3和ceramide等,特征向量中心性排名靠前的物质为ROS,RIPK1,RIPK3,CYLD和ceramide等.综合来看,在度、介数、接近数和特征向量中心性等方面,ROS,RIPK1,RIPK3,CYLD和ceramide均很高,TNFRSF1A的度、介数和接近数中心性均较高,BNIP3和Arachidonic acid的接近数和特征向量中心性均较高.

其次,对坏死网络进行k-壳分解,结果如图2(b)所示,共有3种k-壳指标,即1-壳、2-壳和3-壳.其中3-壳包含的节点最多,共有20个;根据中心性选取的重要节点大部分在3-壳内,表明中心性指标方法和k-壳分解方法在选取坏死网络关键节点方面具有很高的一致性.

最后,对坏死网络进行社团划分,结果如图2(d)所示,共被划分为4个社团,其中2号社团所含节点数最多,3号社团最少.坏死的表型节点Necroptosis属于数量次多的1号社团(与2号社团仅差一个节点),而凋亡的表型节点Apoptosis位于2号社团,这说明坏死和凋亡之间虽联系紧密,但仍可根据社团划分结果对其进行明确区别.

2.4 焦亡网络结果分析

利用1.3节中所得数据构建焦亡信号网络,如图3(a)所示.该网络共包含5种类型的节点,共27个;3种类型的边,共43条,其具体意义与图1(a)中类似.

首先,计算焦亡网络中每个节点的4个中心性指标,选择度中心性的结果进行可视化(见图3(c),其具体意义与图1(c)类似);并分别对4个中心性指标的结果进行排序,选取排名前10的节点汇总在表4.

表4 焦亡网络的节点中心性指标(前10)Tab. 4 Node centrality indices of pyroptosis network(Top 10)

图3(c)显示排名前5的节点彼此间度值差别不大,这与凋亡和坏死网络的特点明显不同.由表4可知,度值高的物质包括CASP1,NLRP3,CASP11,GSDMD和CASP4等,介数高的物质包括GSDMD,NLRP3,CASP1,CASP11和CASP8等,接近数高的物质包括GSDMD,NLRP3,CASP1,CASP11和CASP3等,特征向量中心性中排名靠前的物质包括CASP1,NLRP3,GSDMD,CASP11和PAMPs等.综合来看,4个指标选取的结果基本一致.在度、介数、接近数和特征向量中心性等方面,CASP1,CASP11,NLRP3和GSDMD的值均很高,CASP3的度、介数和接近数中心性较高,PAMPs的度、介数和特征向量中心性较高,CASP8的度值和介数值较高,AIM2和NLRC4的接近数和特征向量值较高.这些结果与此焦亡网络的规模较小有一定的关系.

其次,对焦亡网络进行k-壳分解,结果如图3(b)所示,共有3种k-壳指标:1-壳、2-壳和3-壳.从图3(b)中可以很明显地看出3-壳包含的节点最多,包含CASP1,CASP4和CASP11等CASP蛋白家族成员,说明该蛋白家族不仅在凋亡中有重要作用,而且在焦亡中也有举足轻重的地位.

最后,对焦亡网络进行社团划分,结果如图3(d)所示,共被划分为4个社团,其中4号社团所含节点数最多.焦亡的表型节点属于4号社团,该社团除了包含几个由中心性指标鉴定出的关键节点外,还包含GSDMA,IL18和IL1β等节点,说明这些物质较其他社团中的物质而言对焦亡起着更为直接的作用.

3 结 论

细胞死亡属于生物体的基本生命活动过程,目前已发现其有10余种形式,其中最常见的3种形式为凋亡、坏死和焦亡[27].鉴于细胞死亡在生理和病理学中的重要作用,众多研究者将很多精力投入其信号网络的研究中,挖掘信号网络的关键节点更是成了重中之重[28-29].长期以来寻找关键节点主要依赖于生物学实验,过程漫长而复杂,工作量大且成本高.随着生物学数据的不断积累,如何利用网络生物学的方法发掘关键节点逐渐成了一种重要手段.

本文从生物信息学数据库以及已发表文献中搜集凋亡、坏死和焦亡信号网络的相关数据,在对这些数据进行去重、合并等文本处理之后构建各自的信号网络,在此基础上利用复杂网络的方法对其展开研究.针对网络全局拓扑性质的研究结果显示:凋亡、坏死和焦亡网络均为异配网络和无标度网络,符合生物网络的特征[31],一方面说明本文所构建网络的合理性,另一方面说明确实应该有少数关键节点在这些网络的运行中起主导作用.在网络局部拓扑性质的研究方面,首先,分别计算各网络的度中心性、介数中心性、接近中心性和特征向量中心性指标,基于这些指标找出各网络中的关键节点.接着,利用k-壳分解和社团发现方法对这3个网络的节点进行不同的划分,并对划分结果进行分析.综合上述方法所得结果,找出各个评价指标都较好的节点作为网络的关键节点,最终得到如下结论:凋亡网络的关键节点为CASP2,CASP3,CASP6,CASP8,CASP10,BCL2和BAD,坏死网络的关键节点为ROS,RIPK1,RIPK3,CYLD和TNFRSF1A,焦亡网络的关键节点为CASP1,CASP3,CASP8,CASP11,NLRP3,GSDMD和AIM2.

关于凋亡信号网络的研究已比较成熟,本文所得其7个关键节点均为实验上研究较多的蛋白,这也充分证明了本研究所采用方法的有效性.坏死信号网络的实验研究多集中在RIP1和RIP3的相关蛋白,焦亡信号网络的实验研究多集中在CASP家族和GSDM家族,而对本文鉴定出的其他关键节点的研究则相对较少,这也许可以给生物实验研究提供方向和思路.

本研究在搜集数据的过程中发现:作为细胞死亡的不同方式,凋亡的信号网络要远比坏死和焦亡的信号网络完善,这说明关于坏死和焦亡(尤其是焦亡)信号通路的研究尚有很多“未开垦之地”.实验研究者可利用本文鉴定的关键节点结合社团发现结果“顺藤摸瓜”,找到与重要节点联系紧密的物质,不断完善坏死和焦亡的信号网络,促使人们对其有更加完整的认识,最终为与细胞死亡相关的疾病提供完美的药物靶点.

猜你喜欢
介数焦亡特征向量
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
针刺对脑缺血再灌注损伤大鼠大脑皮质细胞焦亡的影响
miRNA调控细胞焦亡及参与糖尿病肾病作用机制的研究进展
克罗内克积的特征向量
缺血再灌注损伤与细胞焦亡的相关性研究进展
电针对脑缺血再灌注损伤大鼠海马区细胞焦亡相关蛋白酶Caspase-1的影响
一类特殊矩阵特征向量的求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
基于电气介数的电力系统脆弱线路辨识
树形网络的平均介数*