应用生物信息学技术筛选结直肠腺瘤相关基因

2018-08-05 12:09陈林波洪芬芬许丰
浙江医学 2018年14期
关键词:趋化因子腺瘤腺癌

陈林波 洪芬芬 许丰

结直肠癌是一种常见的消化道恶性肿瘤,其发病率在男性所有恶性肿瘤中位居第3位,女性中排到第2位[1]。2012年,全球范围内约有140万新发结直肠癌病例,并且有近70万例死于结直肠癌[1]。因此,对结直肠癌的早发现、早诊断、早治疗至关重要。正常结直肠黏膜-结直肠腺瘤-结直肠腺癌被认为是结直肠腺癌形成的经典途径[2],可见作为结直肠腺癌的上游环节,了解结直肠腺瘤发生、发展的分子机制并进行深入研究有助于结直肠腺癌的早期诊治。高通量芯片技术的快速发展为人类研究疾病基因表达谱与分子机制提供了巨大帮助[3],如对结直肠腺癌及配对癌旁组织行芯片分析可筛选出结直肠腺癌相关基因及关键信号通路[4],但目前对结直肠腺瘤的相关研究报道少见。本研究从基因芯片公共数据库Gene Expression Omnibus(GEO)下载结直肠腺瘤基因芯片,采用生物信息学技术对其分析后筛选出结直肠腺瘤与正常结直肠黏膜的差异表达基因(differentially expressed genes,DEGs),之后对DEGs进行功能注释,同时构建蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络,进一步筛选出关键基因,以期为寻找结直肠腺瘤和腺癌的早期诊断标志物及治疗靶点提供理论依据,现报道如下。

1 材料和方法

1.1 数据来源 从美国国立生物技术信息中心(NCBI)公共数据平台GEO数据库下载结直肠腺瘤基因芯片数据 GSE8671,芯片平台是 GPL570(HG-U133_Plus_2,Affymetrix Human Genome U133 Plus 2.0 Array)。该芯片包含32例结直肠腺瘤组织和32例正常结直肠黏膜组织的基因表达矩阵数据。

1.2 DEGs筛选 应用R语言软件limma包[5]对GEO数据库下载的结直肠腺瘤基因表达矩阵进行差异分析,筛选出结直肠腺瘤与正常结直肠黏膜组织的DEGs。筛选标准:log2基因表达差异倍数(foldchange,FC)绝对值≥2,P<0.05。

1.3 DEGs的基因本体论(gene ontology,GO)和KEGG(Kyoto Encyclopedia of genes and genomes)分析 应用生物信息学在线分析工具DAVID(https∶//david.ncifcrf.gov/)[6]对DEGs的GO及KEGG分析,得到DEGs功能富集分析和信号通路分析数据。校正P<0.05为差异有统计学意义。

1.4 DEGs的PPI网络分析 利用Search Tool for the Rtrieval of Interacting Genes (STRING,https∶//string-db.org/)数据库[7]分析结直肠腺瘤DEGs间的PPI网络关系,combined score>0.4视为差异有统计学意义。将得到的PPI网络导入Cytoscape软件[8],找出网络中处于中心位置的关键节点蛋白,得出关键基因。

2 结果

2.1 DEGs筛选结果 在结直肠腺瘤与正常结直肠黏膜组织中共筛选出381个DEGs,其中上调基因248个,下调基因133个,见图1a;对差异表达最大的50个基因进行聚类分析,其结果见图1b。

图1 结直肠腺瘤DEGs筛选结果

2.2 DEGs的GO分析结果 GO分析结果显示,对于上调的248个DEGs,其生物学过程(biological process,BP)主要富集于碳酸氢根转运、趋化因子介导的信号通路、钠离子转运等(图2a),细胞成分(cellular component,CC)富集于细胞外间隙、细胞外泌体、蛋白性细胞外基质等(图2b),分子功能(molecular function,MF)富集于激素激活、趋化因子激活、趋化因子与受体结合等(图2c);对于下调的133个DEGs,其BP主要富集于趋化因子介导的信号通路、炎症反应、免疫反应等(图2d),CC富集于细胞外间隙、细胞外泌体、蛋白性细胞外基质等(图2e),MF富集于趋化因子激活、CXCR趋化因子与受体结合、钙离子结合等(图 2f)。

2.3 DEGs的KEGG分析结果 KEGG分析结果显示,上调的248个DEGs主要涉及消化液分泌、药物代谢、趋化因子受体相互作用等(图3a);下调的133个DEGs主要富集于趋化因子信号通路、肿瘤坏死因子信号通路、军团菌感染等(图3b)。

图2 DEGs的GO分析结果

图3 DEGs的KEGG分析结果

2.4 DEGs的PPI网络分析结果 利用STRING数据库对结直肠腺瘤DEGs进行分析,结果发现其PPI网络由247个节点蛋白和579条相互作用关系构成(图4),将输出结果导入Cytoscape软件进一步筛选关键基因(图5),排名前10的中心节点蛋白分别是IL-8、趋化因子CXCL1、CXCL12、CXCL13、CXCL11、CXCL2、 趋 化 因 子CCL19、CCL20、前血小板碱性蛋白(PPBP)、血小板因子4(PF4),对应的关键基因分别是 IL-8、CXCL1、CXCL12、CXCL13、CXCL11、CXCL2、CCL19、CCL20、PPBP、PF-4。

3 讨论

结直肠癌发生、发展是一个复杂而又漫长的过程,其分子机制涉及多个基因的改变[9]。虽然近年来结直肠癌相关研究不断增多,但目前对其所知仍然十分有限,寻找结直肠癌关键基因并研究其分子机制意义重大。近几年快速发展的高通量芯片技术能够在全基因组水平研究疾病的基因表达谱,为分子水平探索人类疾病发生机制提供了重要技术支持[3]。生物信息学作为一门新兴的交叉学科,可以通过整合生物学、计算机、数学这些不同学科的优势对生物学数据进行挖掘分析,获取需要信息并进一步深入研究,最终为研究疾病分子机制提供理论依据。目前生物信息学技术已经被广泛地应用于分析高通量芯片、转录组测序等数据,它能够发现疾病发生、发展过程中的关键基因并预测其可能的生物学功能[10],从而找出疾病新的诊治靶点,对疾病诊断标志物的研究和新药的研发具有重要意义。

图4 DEGs的PPI网络

图5 PPI网络中前10个关键基因

本研究应用生物信息学技术对结直肠腺瘤基因芯片GSE8671进行分析,共筛选出了381个DEGs,其中248基因在结直肠腺瘤中表达上调,133个基因在结直肠腺瘤中表达下调。对DEGs进行GO功能注释分析,发现生物学功能主要与激素激活、趋化因子激活、趋化因子受体结合等密切相关,而KEGG信号通路分析发现DEGs主要参与趋化因子信号通路、肿瘤坏死因子信号通路、药物代谢等信号通路。用STRING数据库和Cytoscape软件分析DEGs的PPI网络,筛选出处于最核心位置的10个关键基因,分别是 IL-8、CXCL1、CXCL12、CXCL13、CXCL11、CXCL2、CCL19、CCL20、PPBP、PF-4。

本研究结果显示,炎症反应中的各类细胞因子可能在结直肠腺瘤的发生、发展过程中发挥着关键作用。事实上人类许多肿瘤的发生、发展过程中都伴有慢性炎症反应,炎症可以通过释放细胞因子、产生自由基、损伤DNA,促进血管生成和细胞增殖等而促进肿瘤进展[11]。结直肠癌是一种公认与慢性炎症密切相关的恶性肿瘤[12]。目前的研究结果显示TNF-α、转化生长因子β(TGF-β)、干扰素 γ(IFN-γ)、IL-6、IL-8 等细胞因子均参与结直肠癌的发生、发展[13]。如TNF-α是由单核巨噬细胞分泌的一种细胞因子,在病理情况下TNF-α可以促进NF-κB表达,而NF-κB又进一步通过上调细胞周期蛋白 D1(cyclin D1)、血管内皮生长因子(VEGF)等基因发挥促癌作用[14]。TGF-β对结直肠癌的影响和肿瘤发展阶段有关,目前认为在早期结直肠癌中TGF-β主要发挥抑癌作用[15],但其高表达却与晚期结直肠癌患者的不良预后密切相关[16],似乎又暗示TGF-β具有促癌作用,这看似矛盾现象的具体机制仍有待于进一步阐明,可见细胞因子对结直肠癌的影响和作用及其复杂。本研究通过PPI网络筛选出10个关键节点蛋白均属于细胞因子,除了IL-8为IL家族,其余9个均属于趋化因子家族,其中PPBP也叫CXCL7,PF-4也叫CXCL4。IL家族中以IL-6和结直肠癌的关系被研究的最为透彻,研究发现IL-6同样是NF-κB下游靶基因,当IL-6被异常激活后可以进一步通过糖蛋白130(gp130)上调癌基因信号传导与转录激活因子3(STAT3)表达[17-18],表明IL-6通过参与NF-κB/IL-6/gp130/STAT3通路在结直肠癌中发挥促癌作用。Cui等[19]发现IL-8表达水平在正常结直肠黏膜-结直肠腺瘤-结直肠腺癌进展过程中逐步递增,研究认为IL-8主要通过结合趋化因子CXC受体1(CXCR1)和CXCR2后促进下游癌基因表达而引起结直肠肿瘤细胞增殖和血管生成[20]。CXC类趋化因子家族成员众多并且功能各异,包括CXCL1、CXCL12、CXCL13、CXCL11、CXCL2、CXCL7、CXCL4 在内的成员已经被越来越多的研究证实可以和各自配体结合后参与结直肠癌细胞生存、肿瘤生长、肿瘤转移、血管生成等生物学过程[20-21]。作为CC类趋化因子的2个成员,CCL19在结直肠癌中发挥抑癌作用[22],而CCL20却能促进结直肠癌的进展并与肿瘤患者不良预后有关[23],但具体机制目前仍不明确。

综上所述,各类细胞因子尤其是趋化因子广泛参与结直肠腺癌的发生、发展,本研究发现这些细胞因子同样和结直肠腺瘤的发生密切相关,因此可以推测正是炎症反应中的各种细胞因子促进了正常结直肠黏膜-结直肠腺瘤-结直肠腺癌这一演变过程。

猜你喜欢
趋化因子腺瘤腺癌
乳腺癌微环境中CXC趋化因子治疗靶点和预后标志物的综合生物信息学分析
肾嗜酸细胞腺瘤与嫌色细胞癌的MDCT表现及鉴别
结直肠腺瘤的中医药防治进展
云南地区多结节肺腺癌EGFR突变及其临床意义
十二指肠腺癌88例临床特征及相关预后因素
以盆腔巨大包块就诊的宫颈微偏腺癌2例报告
胸腺瘤与自身免疫性疾病的研究进展
重症颅脑损伤术后脑梗死患者血清趋化因子水平的临床意义分析
趋化因子及其受体的研究
后肾腺瘤影像及病理对照分析