胆道闭锁相关基因的生物信息学分析和功能预测

2020-05-12 05:44封明轩朱建军
国际消化病杂志 2020年2期
关键词:差异基因胞外基质性反应

张 宇 封明轩 朱建军 夏 强

胆道闭锁(BA)是一种严重的新生儿疾病,由于肝内胆管和肝外胆管的炎性反应及进行性纤维化,最终导致胆汁淤积性肝硬化[1-2]。尽管Kasai手术可以改善部分患者的症状,但大约80%的BA患者最终需要进行肝移植;同时,BA也是小儿肝移植主要的手术适应证之一[3]。BA的病因和发病机制目前尚未明确,有研究报道其可能主要与遗传易感性、先天发育异常、病毒感染以及异常的自身免疫等因素相关[4]。高通量基因芯片和测序技术的不断发展为从基因水平深入研究BA的病因提供了重要线索。本研究通过对BA肝组织、肝硬化组织和正常肝组织的基因表达谱进行分析后筛选出差异基因,对差异基因进行生物学功能和信号通路分析,旨在进一步揭示BA的发生、发展机制。

1 材料和方法

1.1 材料

生物信息学分析数据GSE46960来自公共数据平台GEO(Gene Expression Omnibus)数据库,该芯片共有85例样本,包括64例BA患者的肝组织、14例年龄匹配的非BA的肝硬化组织和7名正常儿童的肝组织。

1.2 差异基因的分析

用R语言软件读取下载矩阵文件,使用limma包[5]分别对BA肝组织、非BA的肝硬化组织和正常肝组织进行分析,根据基因表达差异倍数|logFC|≥1且adjustP<0.05,得到各自差异表达基因(DEG)。最终筛选出与BA相关的DEG。

1.3 DEG的KEGG分析

通过DAVID(the Database for Annotation, Visualization and Integrated Discovery)数据库[6]对DEG行KEGG(Kyoto Encyclopedia of Genes and Genomes)信号通路分析,得到DEG的KEGG信号通路分析结果,以P<0.05为差异有统计学意义。

1.4 DEG的PPI网络构建和关键基因筛选

通过在线分析网站STRING(Search Tool for the Retrieval of Interacting Genes)得到DEG的PPI(Protein-Protein Interaction)网络,筛选条件为评分>0.4。运用Cytoscape在PPI网络中筛选合适的模块,设置条件为MCODE(Molecular Complex Detection)评分>6。

1.5 GSEA对BA信号通路的分析

运用GSE46960芯片,将BA肝组织和正常肝组织进行GSEA(Gene Set Enrichment Analysis)分析,筛选出差异较显著的两条信号通路,合并这两条通路的Core Enrichment Gene。

2 结果

2.1 DEG的筛选

将BA肝组织与正常肝组织进行比较,筛选出484个差异基因(DEG1),其中在BA肝组织中表达上调的有283个基因,表达下调的有201个基因(图1A)。将非BA的肝硬化组织与正常肝组织进行比较,筛选出438个差异基因(DEG2),其中在非BA的肝硬化组织中表达上调的有205个基因,表达下调的有233个基因(图1B)。在DEG1中去除与DEG2并集的基因,得到在BA中起特异作用的146个差异基因(DEG3),其中表达上调的基因为128个(图1C),表达下调的基因为18个(图1D)。

2.2 DEG的KEGG分析和PPI网络分析

对DEG3进行KEGG分析,发现其主要涉及的信号通路为细胞外基质-受体相互作用、黏附等过程(图2A);同时,将DEG3导入STRING在线分析网站得到PPI网络图,运用Cytoscape软件分析后得到了主要包括21个差异基因(DEG4)的模块(图2B)。

2.3 GSEA筛选BA的信号通路

根据GSE46960数据库,运用GSEA筛选出BA患者中上调较明显的两条信号通路,分别为ECM-receptor interaction(图3A)和Focal adhesion(图3B)。同时富集出79个Core Enrichment Gene,将其与DEG4做交集,得到11个在BA中差异表达且与细胞外基质-受体相互作用和黏附信号通路密切相关的基因(图3C)。

注:NC指正常肝组织,DC指非BA的肝硬化组织

图1 BA的DEG筛选 A BA肝组织与NC相比DEG的表达 B DC与NC相比DEG的表达 C DEG中表达上调的基因 D DEG中表达下调的基因

图2 DEG3的KEGG分析和PPI网络分析 A KEGG分析结果 B PPI网络分析结果

图3 GSEA筛选BA的信号通路 A ECM-receptor interaction通路 B Focal adhesion通路 C PPI网络分析出的差异基因与GSEA富集出的Core Enrichment Gene做交集

2.4 11个DEG诊断BA的准确度

运用受试者工作特征(ROC)曲线检测在肝脏组织中表达的11个DEG诊断BA的准确度,同时运用二元Logistic回归分析筛选出JUN和LAMC2(表1)。联合JUN和LAMC2后,运用ROC曲线诊断BA的准确度可提高至96.4%(图4)。

表1 JUN和LAMC2诊断BA的二元Logistic回归分析

图4 11个DEG诊断BA的ROC曲线

3 讨论

BA的病因尚未明确,可能与遗传易感性、先天发育异常、病毒感染以及异常的自身免疫等因素相关。随着科研技术的发展,微阵列表达谱分析可以提供人类基因组中数千个基因的表达差异的信息,本研究运用此技术预测BA发生、发展中的关键生物学过程以及潜在的基因。

本研究筛选了微阵列数据GSE46960,对64例BA患者的肝组织、14例年龄匹配的非BA的肝硬化组织和7名正常儿童的肝组织进行生物信息学分析,通过比较,最终筛选出可能与BA有密切关系的DEG3,其中表达上调的基因为128个,表达下调的基因为18个。通过KEGG分析,DEG的信号通路主要与细胞外基质-受体相互作用和黏附等相关。细胞外基质可调节细胞的多种功能,如存活、生长、迁移和分化等,且对维持正常的体内平衡至关重要[7],失调的细胞外基质重塑与病理状况可能加剧疾病进展[8]。BA患者处于炎性感染状态[9],异常的基质形成可能是BA患者肝胆管树易遭受感染的重要原因之一;细胞外基质作为可溶性细胞因子储存库[10],异常的细胞外基质的功能失调可进一步加重炎性反应,持续的炎性反应可能与BA的发生密切相关,最终可导致胆汁淤积性肝硬化,肝纤维化的过程同样也是细胞外基质重塑的过程[11]。

本研究运用STRING和Cytoscape 构建DEG的PPI网络,筛选出了DEG4模块。其中白细胞介素-8(IL-8)是人类疾病中炎性反应和免疫反应的重要介质[12]。有报道指出,IL-8在BA中过表达,其表达水平与炎性反应及肝纤维化程度呈正相关[13]。CTGF由多种间充质细胞和上皮细胞产生,是促纤维化因子——转化生长因子-β(TGF-β)的下游介质[14];BA肝组织中CTGF表达上调,且与纤维化程度相关[15]。LOX、COL5A1、BNG、LAMC1等基因在细胞外基质的形成和重建过程中起着重要作用[16-17],其与BA发病机制之间的关系有待进一步研究。本研究通过GSEA对BA信号通路进行分析,筛选出差异较显著的两条通路(细胞外基质-受体相互作用和黏附),提示这两条通路在BA的发生、发展中起着重要作用。同时,本研究富集出79个Core Enrichment Gene,将其与DEG4做交集后得到了11个基因,提示这11个DEG在BA的发生、发展中参与了细胞外基质-受体相互作用和黏附作用。本研究运用ROC曲线进一步探究了这11个DEG对于BA肝脏组织诊断的准确度,并运用二元Logistic回归分析筛选出JUN和LAMC2基因。结果表明,JUN联合LAMC2诊断BA的准确度可达96.4%。

BA是儿童终末期肝病的常见原因,肝移植是目前唯一的治疗手段。BA的发病原因和机制目前尚未明确,本研究通过生物信息学分析发现,细胞外基质-受体相互作用和黏附信号通路与BA的发生、发展密切相关,且筛选了11个与该生物反应过程密切相关的基因,但其在BA中的具体作用有待进一步验证。

猜你喜欢
差异基因胞外基质性反应
脱细胞外基质制备与应用的研究现状
肠道菌群失调通过促进炎性反应影响颈动脉粥样硬化的形成
关于经络是一种细胞外基质通道的假说
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
促酰化蛋白对3T3-L1脂肪细胞炎性反应的影响
水螅细胞外基质及其在发生和再生中的作用
SSH技术在丝状真菌功能基因筛选中的应用
益气活血、舒筋通络法联合西药干预短暂性脑缺血发作炎性反应50例
镰形棘豆总黄酮对TGF-β1诱导的人肾小管上皮细胞分泌细胞外基质成分的影响