基于GEO数据挖掘探讨扩张型心肌病发病机制

2022-06-26 07:10尤红俊赵倩倩任淑婷寿锡凌常凤军
山西医科大学学报 2022年5期
关键词:心肌病心肌炎纤维化

尤红俊,赵倩倩,任淑婷,寿锡凌,常凤军*

(1 陕西省人民医院心血管内科,西安 710068;2 空军军医大学第一附属医院临床免疫科;3 西安交通大学医学部基础医学院;*通讯作者,E-mail:mss0392@126.com)

扩张型心肌病(dilated cardiomyopathy, DCM)是导致心力衰竭的主要原因之一,是心肌对多种遗传和/或环境因素共同反应的一种非特异性的疾病表型。该病好发于年轻人,是心脏移植最常见的指征之一[1]。虽然新型抗心衰药物及器械治疗措施更新迭代大大降低了DCM的病死率[2,3],但其预后仍较差,造成严重的社会经济学问题。其发病机制涉及病毒感染、免疫、代谢/内分泌、遗传和环境毒物接触等多方面[4],且尚未完全阐明,因此探讨其发病机制对临床诊疗提升具有积极的推动作用。

随着生物大数据及信息学技术的蓬勃发展,科研工作者可以便捷运用共享的海量生物样本数据库对疾病发病机制进一步深入探讨,促进临床诊疗水平的提升。本研究基于基因表达综合数据库(gene expression omnibus, GEO)中的大样本量DCM表达谱芯片数据,应用生物信息学手段,寻找疾病差异表达基因(differentially expressed genes, DEGs)和核心(hub)基因,构建蛋白质相互作用(protein-protein interaction, PPI)网络,标记基因功能,利用比较毒理基因组学数据库(comparative toxicogenomics database, CTD)评估hub基因与DCM及心衰关联性等,探索DCM的发病机制,从而为临床诊疗提供思路。

1 数据和方法

1.1 数据下载

在美国国立生物中心的GEO数据库(www.ncbi.nlm.nih.gov/ GEO)[5,6]中搜索“dilated cardiomyopathy”,选取大样本量数据集GSE141910,该数据集采用GPL16791 Illumina HiSeq 2500为平台,收录包括扩张型心肌病、围产期心肌病、肥厚型心肌病和正常人心肌组织基因表达谱数据。我们从中提取166例扩张型心肌病和166例正常人的左心室组织转录组数据进行分析。数据进行预处理,包括对缺失值自动补全或基因对应多个探针取均值,及背景校正、标准化等。

1.2 差异表达分析

采用统计软件R语言(版本4.1.1)limma包进行差异基因表达分析。以|log fold change|≥1,P<0.05为差异表达基因的筛选条件,并以R语言绘制热图可视化DEGs。

1.3 蛋白质互作网络分析

将DEGs导入STRING(Search Tool for the Retrieval of Interacting Genes, http://string-db.org/cgi/input.pl),进行蛋白质相互作用(protein-protein interaction,PPI)分析,得到PPI网络[7]。设定可信度confidence为0.4,输出TSV格式文件,用于后续Cytoscape分析[8]。

1.4 Hub基因筛选

使用Cytoscape 3.7.3软件插件CytoHubba(http://hub.iis.sinica.edu.tw/cytohubba/)筛选出PPI网络中的核心(hub)基因。CytoHubba利用12种评分策略剖析PPI网络,包括最大相关性标准(maximum correlation criterion,MCC)、Degree等,该12种拓扑算法无优劣之分[9]。MCC代表基因/蛋白间最大相关性标准,我们以MCC值排序前20位的基因作为PPI网络中的hub基因。

1.5 GO和KEGG富集分析

使用R语言对DEGs和hub基因进行基因本体论(gene ontology, GO, http://www.geneontology.org)和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes, KEGG)通路富集分析[10,11]。GO富集分析,分别在生物学过程(biological processes, BP)、细胞组分(cellular component, CC)和分子功能(molecular function, MF)3个方面对基因进行功能注释[12]。KEGG分析展示基因参与的信号通路。利用R语言将结果可视化。P<0.05被认为差异有统计学意义。

1.6 利用CTD数据库评估hub基因与DCM及心衰关联性

利用CTD数据库(http://ctdbase.org/)的数据分析核心基因与DCM及心衰(收缩性)风险之间的关系。CTD整合了包括化合物-基因/蛋白质相互作用、化合物-疾病和基因-疾病关系在内的信息,以探索与疾病发病机制相关的假设[13]。

2 结果

2.1 基因差异表达分析

与正常对照相比,DCM心肌组织中共有784个DEGs,其中541个表达上调,243个表达下调。差异基因表达谱的火山图见图1。对差异表达处于前100位的基因绘制热图以可视化,结果见图2。

每个圆点代表一个基因,部分基因名称已备注;红色表示上调基因;绿色表示下调基因;黑色为无统计学差异图1 扩张型心肌病和正常人左心室组织转录组数据差异基因表达谱的火山图Figure 1 Volcano map of differential gene expression profiles of left ventricular tissue transcriptome data from dilated cardiomyopathy patients and normal controls

Con:正常对照;Treat:扩张型心肌病;红色表示上调基因;绿色表示下调基因;颜色深浅代表显著性高低图2 扩张型心肌病和正常人左心室组织转录组数据差异表达前100基因表达谱热图Figure 2 Heatmap of top 100 differential gene expression profiles of left ventricular tissue transcriptome data from dilated cardiomyopathy patients and normal controls

2.2 DEGs富集分析

GO富集分析提示DEGs主要参与构成细胞外的结构及基质、细胞质膜外侧面,并参与免疫细胞迁移及活化等生物学过程或分子功能(见图3)。

GeneRatio:富集基因数目/背景基因数目;Counts:富集基因数目;p.adjust:校正后的P值;BP:生物学过程;CC:细胞组分;MF:分子功能图3 DEGs GO富集分析部分可视化(气泡图)Figure 3 Partial visualization for GO enrichment analysis of DEGs(bubble diagram)

KEGG富集分析提示DEGs显著富集于细胞因子-细胞因子受体相互作用、吞噬体、肾素-血管紧张素系统、细胞外基质受体相互作用、自然杀伤细胞介导的细胞毒性、细胞黏附分子和Th17细胞分化等信号通路中(见图4)。

GeneRatio:富集基因数目/背景基因数目;Counts:富集基因数目;p.adjust:校正后的P值图4 DEGs KEGG富集分析部分可视化气泡图Figure 4 Partial visualization for KEGG enrichment analysis of DEGs (bubble diagram)

2.3 PPI网络构建及hub基因鉴定

对784个DEGs进行PPI网络分析,将离散节点隐去后,所构建的初始PPI网络中节点(蛋白)数为775,边数(蛋白互作关系)为3 186,平均节点度值为8.22,PPI富集P<0.001。输出TSV格式文件并导入Cytoscape软件,以CytoHubba插件进行拓扑计算,取MCC排名前20的基因作为hub基因,即:FCGR3A、CD27、CD2、GZMB、PRF1、CCR7、CD247、SELL、TBX21、FCGR3B、ITGAL、LCK、IL10、IL2RB、CD38、CD40LG、CD5、CD3E、KLRB1和ZAP70(见图5),亮色标记的节点即为hub基因,颜色深浅代表MCC值的大小。20个核心基因的差异分析检验数据见表1。

色彩鲜明的节点为20个核心基因,颜色深浅代表MCC值高低;左图:PPI网络;右图:MCC值排名前20的基因构建的子网络图5 扩张型心肌病差异表达基因构成的PPI网络中鉴定核心基因Figure 5 Identification of hub genes from the PPIs network of DEGs for DCM

表1 扩张型心肌病和正常人左心室组织转录组数据核心基因差异表达分析Table 1 Difference analysis of hub genes expression in left ventricular tissue transcriptome data from dilated cardiomyopathy patients and normal controls

2.4 Hub基因富集分析

对hub基因富集分析,其中最显著富集的GO子集包括:白细胞黏附、免疫细胞活化调节;细胞质膜外侧面、质膜受体复合物;免疫球蛋白结合等(见图6)。

KEGG富集分析发现,它们主要参与自然杀伤细胞介导的细胞毒性、Th1/Th2/Th17细胞分化、T细胞受体信号通路、病毒性心肌炎、细胞黏附分子、细胞因子-细胞因子受体相互作用和NF-kappa B信号通路等(见图7)。

2.5 Hub基因与DCM及心衰关联性

核心基因与DCM和心衰(收缩性)的相互作用关联性评分分析提示,11个核心基因IL10、CD38、SELL、LCK、CD27、GZMB、TBX21、ZAP70、CD5、CD3E和CD2同时与DCM及心衰关联紧密(见图8)。提示核心基因与DCM/心衰(收缩性)关联性得分情况,得分越高,关联性越大。

GeneRatio:富集基因数目/背景基因数目;Counts:富集基因数目;p.adjust:校正后的P值;BP:生物学过程;CC:细胞组分;MF:分子功能图6 扩张型心肌病核心基因GO富集分析部分可视化 (气泡图)Figure 6 Partial visualization for GO enrichment analysis of hub genes for DCM (bubble diagram)

GeneRatio:富集基因数目/背景基因数目;Counts:富集基因数目;p.adjust:校正后的P值图7 扩张型心肌病核心基因KEGG富集分析可视化 (气泡图)Figure 7 Visualization for KEGG enrichment analysis of hub genes for DCM (bubble diagram)

图8 核心基因与心衰(收缩性)及DCM关联性分析Figure 8 Correlation analysis between hub genes and heart failure(systolic) and DCM

3 讨论

DCM的病理特征是左心室扩张和收缩功能障碍,可并发心律失常、血栓栓塞或心源性休克等。以往研究提示DCM通常由心肌炎、酒精/药物/毒素接触、代谢或内分泌紊乱和遗传等多因素引起[14,15]。由编码细胞骨架、肌节或核膜蛋白的基因突变引起的DCM约占所有病例的35%[15],因而基因/蛋白水平分子机制研究将提升对DCM病理生理学的认知。本研究基于GEO数据库来源的大样本量DCM心肌组织芯片数据,筛选DEGs,构建PPI网络,鉴定核心基因,通过GO和KEGG分析,利用CTD数据库评估核心基因与DCM及心衰关联性,探讨DCM发病机制,为临床诊疗提供依据。

首先,本研究发现DCM心肌组织中共有784个DEGs,主要参与细胞外结构及基质组成、免疫细胞迁移及活化;含胶原的细胞外基质、质膜外侧面;细胞外基质结构成分、黏多糖结合等。KEGG富集分析提示DEGs主要参与细胞因子-细胞因子受体相互作用、吞噬体、肾素-血管紧张素系统(renin-angiotensin system, RAS)、细胞外基质受体相互作用、自然杀伤细胞介导的细胞毒性、细胞黏附分子和Th17细胞分化等。DCM与心肌及间质急慢性炎症相关,免疫细胞及其调控过程贯穿疾病始末,包括白细胞迁移、黏附、活化及分泌等生物学过程,并涉及细胞外基质的重塑,GO及KEGG富集结果与之符合。细胞因子及其受体是正常免疫及病毒性心肌炎等多种病理生理过程中白细胞募集的关键调节因子,参与免疫反应、心脏纤维化及重塑[16]。RAS在各种心力衰竭病理进程中扮演重要角色,早期发挥代偿弥补有效循环血容量不足,后期推动心脏结构重塑恶化心功能。如血管紧张素Ⅱ已被证明可以激活TGF-β和IL-11,参与了DCM心肌重构,并与细胞外基质蛋白的表达、心肌纤维化密切相关[17,18]。研究表明,Th17细胞分化及分泌IL-17参与心肌炎向心肌病的转归,在心肌炎发生后用抗IL-17A单克隆抗体治疗心肌炎模型小鼠可消除炎症诱导的心脏纤维化并改善心功能,揭示IL-17A在心肌炎后心脏重塑和发展为DCM中起着关键作用,可作为炎性扩张型心肌病的潜在治疗靶点[19]。

为了进一步剖析差异基因在DCM发病机制中的作用,我们构建PPI网络,并利用生物信息学方法筛选出核心基因,即FCGR3A、CD27、CD2、GZMB、PRF1、CCR7、CD247、SELL、TBX21、FCGR3B、ITGAL、LCK、IL10、IL2RB、CD38、CD40LG、CD5、CD3E、KLRB1和ZAP70。核心基因显著富集于白细胞黏附、免疫细胞活化调节;细胞质膜外侧面、质膜受体复合物;免疫球蛋白结合等GO子集中。KEGG富集分析发现,它们主要参与自然杀伤细胞介导的细胞毒性、Th1/Th2/Th17细胞分化、T细胞受体信号通路、病毒性心肌炎、细胞黏附分子、细胞因子-细胞因子受体相互作用和NF-kappa B信号通路等。在柯萨奇病毒B3诱导的心肌炎小鼠模型中,Th1免疫应答一方面会增加急性炎症反应程度,另一方面也可通过减少病毒复制及抑制Th2反应防止进展为慢性炎症及DCM;Th2免疫反应通过调节性T细胞和抗炎细胞因子抑制Th1反应来削弱急性心肌炎,但也会诱导慢性心肌炎/DCM心脏的重构;心肌炎急慢性进程中Th17细胞反应也参与DCM的重构[20]。这些提示辅助性T细胞(Th1/Th2/Th17)在心肌炎/心肌病发生发展中有着不容忽视且错综复杂的作用。NF-kappa B信号通路是经典的炎症反应通路,在多种炎性疾病中扮演重要角色。Pang等[21]研究发现转化生长因子β结合蛋白2沉默可通过下调NF-kappa B信号通路减轻DCM大鼠心肌氧化应激损伤、心肌纤维化和心肌重构。Hub基因富集的其余相关通路及GO子集大多与DEGs富集分析结果相吻合,提示这些hub基因可能在DCM致病过程复杂调控网络中发挥作用。

免疫球蛋白γ Fc区受体Ⅲ-A/B(immunoglobulin gamma Fc region receptor Ⅲ-A/B,FCGR3A/B),即CD16A/B,作为免疫球蛋白IgG Fc区受体,介导抗体依赖性细胞毒性和其他抗体依赖性反应如吞噬作用等,也是单核细胞亚群分型标志物之一;而外周单核细胞亚群CD14++CD16-(经典型)、CD14++CD16+(中间型)和CD14+CD16++(非经典型)的比率动态变化与心衰病情转归密切相关[22,23]。Hub基因富集分析发现,下调的FCGR3A富集于胞质外侧面构成、免疫球蛋白结合、自然杀伤细胞介导的细胞毒性等生物过程,提示免疫介导的细胞毒性作用在DCM发展中起作用。颗粒酶B(granzyme B,GZMB),细胞毒性T细胞和自然杀伤细胞胞质颗粒中含有的一种丝氨酸蛋白酶,参与细胞介导的细胞毒性,当被递送到靶细胞时会激活不依赖于半胱天冬酶的细胞焦亡和死亡;参与炎症性疾病的凋亡、炎症反应、细胞外基质重塑和纤维化等[24]。Shen等[25]研究报道,GZMB在人纤维化心肌组织和血管紧张素Ⅱ诱导的小鼠纤维化心脏中均表达上调,其可促进心肌组织基质重塑和纤维化,而GZMB缺陷对心脏纤维化是一种保护因素。穿孔素(perforin-1,PRF1),在分泌性颗粒依赖性细胞死亡和防御病毒感染或肿瘤细胞中起关键作用,可协作GZMB发挥细胞毒性作用,其与DCM及心衰的研究尚未见报道。T细胞表面糖蛋白CD3 zeta链(T-cell surface glycoprotein CD3 zeta chain,CD247),存在于T淋巴细胞细胞表面,在适应性免疫反应中起重要作用;有研究者报道CD247和非受体酪氨酸蛋白激酶(tyrosine-protein kinase Lck,LCK)可能是心肌坏死的生物标志物[26]。LCK及CD27、CD2、C-C趋化因子受体7型(C-C chemokine receptor type 7,CCR7)、T-盒转录因子X21(T-box transcription factor X21, TBX21)、白介素-10(interleukin-10,IL10)、CD38、CD40配体(CD40 ligand,CD40LG)、CD5、CD3E和酪氨酸蛋白激酶ZAP-70(70 kD zeta-chain associated protein,ZAP70)显著上调并富集于免疫细胞黏附、活化及分化等生物学过程,提示炎症细胞及免疫反应在DCM中的重要地位。L-选择素(L-selectin,SELL),通过与邻近细胞上的糖蛋白结合介导细胞间黏附及免疫细胞与细胞外基质成分间的相互作用[27],我们发现其以上调方式参与细胞黏附分子信号通路,提示可能在DCM组织重构中起作用。整合素α-L(integrin alpha-L,ITGAL),是细胞间黏附分子的受体,参与免疫细胞的黏附和迁移及细胞毒性T细胞介导的杀伤作用。白细胞介素2的受体(interleukin-2 receptor subunit beta,IL2RB),参与受体介导的内吞作用并转导IL2的促有丝分裂信号。心力衰竭与心肺组织白细胞浸润、促炎细胞因子和纤维化的增加有关。IL-2与其单克隆抗体复合物相互作用后可经IL2RB受体促进调节性T细胞分化,减轻心肺炎症细胞浸润及纤维化而改善心功能[28]。杀伤细胞凝集素样受体亚家族B成员1(killer cell lectin-like receptor subfamily B member 1,KLRB1),可抑制自然杀伤细胞的细胞毒性作用,其与DCM的直接关系暂未见文献报道。

综上所述,DEGs和hub基因可能在DCM的发生发展中发挥着关键作用。尽管关于DCM发病机制有广泛的研究,但并发左心室功能障碍、心力衰竭或心律失常的炎症性心肌病预后仍不良,部分患者发生扩张型心肌病的原因尚不清楚。我们的研究进一步揭示了免疫细胞及炎症介质参与DCM的进程,调控心肌组织中这些基因的表达能可能有助于DCM的治疗。本研究也存在一定局限性。例如,本研究仅进行了信息学数据分析,暂未进行基础实验的探索;另外本研究仅是初步的分子筛选,距离应用到临床治疗还有很长的路要走,仍值得后期深入探究。

猜你喜欢
心肌病心肌炎纤维化
线粒体自噬在纤维化疾病中作用的研究进展
炎性及心肌纤维化相关标志物在心力衰竭中的研究进展
肝纤维化无创诊断研究进展
恩替卡韦联合安络化纤丸治疗慢性乙型肝炎肝纤维化的研究
诺欣妥治疗缺血性心肌病致心衰的效果分析
心肌炎患者减少食盐摄入
心肌炎患者减少食盐摄入
肥胖女性易患心肌病
常在夜晚咳嗽要当心扩张型心肌病
警惕感冒引发的心肌炎