基于生物信息学方法筛选结肠癌进展相关的枢纽基因

2022-01-10 01:53王成吕聂玉洁潘润桑朱兰陈双会陈辉张湘燕聂瑛洁
山东医药 2022年1期
关键词:枢纽结肠癌标志物

王成吕,聂玉洁,潘润桑,朱兰,陈双会,陈辉,,张湘燕,,聂瑛洁,

1 贵州大学医学院生物医学系,贵阳550025;2 贵州省人民医院肺脏免疫性疾病诊治实验室;3贵阳市儿童医院骨科

结直肠癌是消化系统常见的恶性肿瘤,也是世界范围内男性第三大常见恶性肿瘤、女性第二大常见恶性肿瘤[1-2]。迄今为止,结肠癌的发病机制仍不十分清楚,可能是遗传因素和环境因素共同作用的结果[3]。肿瘤治疗的选择主要依据临床分期,不同临床分期肿瘤的治疗手段不同,预后差异较大。但目前临床却面临缺乏早期诊断和预后判断生物标志物的难题。通过挖掘与肿瘤进展相关的生物标志物,针对性地进行干预治疗,从而提高治疗效果,改善患者预后。近年来,随着高通量测序技术和DNA芯片技术发展,实现了快速检测成千上万个基因转录体的表达,为探索结肠癌发生、发展的分子机制奠定了基础[4]。2020年10月—2021年4月,我们基于GEO数据库中的结肠癌数据集,筛选了与结肠癌进展相关的差异表达基因(DEGs),旨在寻找结肠癌新的治疗靶点。

1 资料与方法

1.1 数据来源 登录美国国立生物技术信息中心GEO数据库(https://www.ncbi.nlm.nih.gov/geo),以“colon cancer”为检索词,筛选获得GSE127069、GSE145626两个数据集。GSE127069数据集基于GPL17077平台,采用Agilent-039494 SurePrint G3 Human GE v2 8×60K Microarray 039381阵列芯片检测;GSE145626数据集基于GPL23126平台,采用[Clariom_D_Human] Affymetrix Human Clariom D Assay阵列芯片检测。GSE127069数据集包括结肠癌组织样本和正常组织样本各6例份,GSE145626数据集包括结肠癌组织样本和正常组织样本各3例份。

1.2 DEGs筛选 运用GEO数据库在线分析工具GEO2R提取GSE127069、GSE145626数据集中的原始数据,利用韦恩图在线分析工具(http://bioinformatics.psb.ugent.be/webtools/Venn)筛选结肠癌组织样本和正常组织样本中的DEGs。筛选条件为P<0.05且|log2FC|>2(FC为差异倍数)。

1.3 GO功能注释和KEGG通路富集分析 利用基因功能注释在线工具DAVID(https://david.ncifcrf.gov)对GSE127069、GSE145626数据集中的DEGs进行GO功能注释和KEGG通路富集分析。

1.4 蛋白质—蛋白质相互作用(PPI)网络构建与枢纽基因筛选 将获得的DEGs数据导入STRING数据库(https://string-db.org),构建PPI网络,下载TSV文件并导入Cytoscape软件,通过CytoHubba插件筛选枢纽基因。

1.5 枢纽基因表达验证 将筛选获得的枢纽基因导入GEPIA数据库(http://gepia.cancer-pku.cn/index.html)进行验证,选择肿瘤类型为结肠腺癌,分析枢纽基因在结肠癌组织与癌旁组织中的表达差异。

2 结果

2.1 结肠癌DEGs筛选 从GSE127069数据集中共获取表达上调基因599个、表达下调基因784个;从GSE145626数据集中共获取表达上调基因228个、表达下调基因940个。以P<0.05且|log2FC|>2为筛选条件,经韦恩图在线分析工具筛选,共从GSE127069、GSE145626数据集中获得DEGs 142个,其中表达上调基因35个、表达下调基因107个,见图1。

注:A为GSE127069、GSE145626数据集中表达上调基因;B为GSE127069、GSE145626数据集中表达下调基因。

2.2 GO功能注释和KEGG通路富集分析结果 见表1、2。

表1 DEGs的GO功能注释结果

2.3 PPI网络构建与枢纽基因筛选结果 利用STRING数据库构建DEGs的PPI网络,见图2。利用CytoHubba插件筛选PPI网络中相互作用排名前10位的DEGs作为枢纽基因,分别为IL-6、GCG、SLC26A3、TIMP1、SPP1、TMIGD1、MYC、MMP3、MMP1、SLC9A2。

表2 DEGs的KEGG通路富集分析结果

注:浅灰色为筛选出来的枢纽基因。

2.4 枢纽基因表达验证 结肠癌组织GCG、TMIGD1表达低于癌旁组织,TIMP1、SPP1、MYC、MMP3、MMP1表达高于癌旁组织(P均<0.05);而结肠癌组织与癌旁组织IL-6、SLC26A3、SLC9A2表达比较差异均无统计学意义(P均>0.05)。见图3。

注:A为IL-6,B为GCG,C为SLC26A3,D为TIMP1,E为SPP1,F为TMIGD1,G为MYC,H为MMP3,I为MMP1,J为SLC9A2;*表示P<0.05。

3 讨论

结肠癌的发生是一个多基因参与的过程,具有很大的异质性[5]。目前,临床对结肠癌仍缺乏有效的治疗手段,故深入探索结肠癌的发病机制,对其早期诊断、靶向治疗和预后评估具有积极意义。随着生物医学不断进步,人们对结肠癌的发病机制有了更多的认识。基因异常表达与肿瘤细胞的增殖、分化密切相关,具有作为肿瘤标志物的潜力[6]。DNA甲基化、非编码RNA异常、组蛋白修饰等表观遗传学改变能够参与肿瘤的发生、发展,可作为潜在的肿瘤标志物[7]。YANG等[8]研究认为,DNA甲基化的分子亚型对结肠癌预后评估具有重要价值。XU等[9]研究发现,部分长链非编码RNA可促进结肠癌进展并可导致患者预后不良。以上研究提示,寻找潜在的肿瘤标志物将有利于结肠癌的早期筛查和预后评估。

本研究从GEO数据库中获取GSE127069、GSE145626数据集,通过GEO2R在线分析工具提取原始数据,以P<0.05且|log2FC|>2为筛选条件,经韦恩图在线分析工具筛选,共从GSE127069、GSE145626数据集中获得DEGs 142个,其中表达上调基因35个、表达下调基因107个。GO功能注释发现,这些DEGs的生物学过程主要涉及细胞外基质降解、氧化还原过程、细胞黏附,分子功能主要涉及钙离子结合、碳酸盐脱水酶活性,细胞组分主要涉及胞外区域、膜的组成。KEGG通路富集分析显示,这些DEGs主要涉及PI3K-Akt通路和代谢途径通路。细胞外基质(ECM)由基底膜和细胞间质组成。ZHONG等[10]研究报道,ECM与肿瘤的发生、发展密切相关。CHAUDHURI等[11]研究认为,ECM的硬度与肿瘤细胞的侵袭能力密切相关,软化的基底膜可促进肿瘤出芽。PI3K/Akt信号通路能够调控细胞的增殖、分化等生物学过程[12]。实体肿瘤微环境的营养限制使得肿瘤细胞进化出灵活的代谢方式以维持生长和存活。BOROUGHS等[13]研究报道,代谢通路具有促进肿瘤细胞生长的能力。

本研究利用STRING数据库构建了DEGs的PPI网络,通过CytoHubba插件筛选出PPI网络中相互作用排名前10位的DEGs作为枢纽基因,分别为IL-6、GCG、SLC26A3、TIMP1、SPP1、TMIGD1、MYC、MMP3、MMP1、SLC9A2。进一步利用GEPIA数据库分析发现,结肠癌组织GCG、TMIGD1表达低于癌旁组织,TIMP1、SPP1、MYC、MMP3、MMP1表达高于癌旁组织,而结肠癌组织与癌旁组织IL-6、SLC26A3、SLC9A2表达比较差异均无统计学意义。IL-6是由活化的T细胞及成纤维细胞产生的淋巴因子。通过GEPIA数据库检索发现,IL-6在癌组织与癌旁组织中的表达比较无统计学差异,并且其表达与肿瘤分期和患者总生存期亦无明显相关性,但在本研究PPI网络中其相互作用排名第一,提示IL-6在结肠癌中的作用不容忽视。IL-6信号通路与肿瘤生长、转移、耐药性等密切相关。IL-6下调能够抑制肿瘤血管生成,提高抗肿瘤药物疗效[14-15]。若IL-6表达上调则有利于肿瘤细胞逃避免疫系统监视,促进结肠癌转移。LIANG等[16]研究发现,IL-6与肿瘤进展和患者预后密切相关,是肿瘤微环境中的一个重要因子,具有作为结肠癌标志物的潜力。至于GEPIA数据库中癌组织与癌旁组织中IL-6表达比较无统计学差异,可能与样本量大小、样本来源、肿瘤进展程度等因素和本研究不同有关。GCG是胰高血糖素,该基因编码的蛋白是一种前原蛋白,可通过AMPK与MAPK通路作用,从而促进结肠癌细胞增殖[17]。丁志祥等[18]利用生物信息学方法筛选结肠癌的枢纽基因,结果发现MMP1、MMP3、MYC和SPP1为结肠癌的枢纽基因,这些枢纽基因在癌组织中的表达明显高于癌旁组织,本研究结果与其相似。MMP1和MMP3均属于基质金属蛋白酶家族,MYC是一种转录因子,SPP1为分泌磷蛋白1,这四种基因在多种肿瘤的发生和侵袭、转移过程中发挥重要作用。TIMP1是金属蛋白酶抑制剂1,其在癌组织中高表达,可通过抑制金属蛋白酶介导的ECM参与肿瘤的侵袭和转移[19]。ZENG等[20]研究发现,TIMP1表达与结肠癌进展密切相关。TAN等[21]研究发现,TIMP1表达下调能够增强胰腺癌对化疗药物的敏感性。TMIGD1蛋白是包含免疫球蛋白结构域的跨膜蛋白家族成员,是一种细胞表面糖蛋白,也是一种黏附分子,在结合膜突蛋白后可调节微管蛋白的乙酰化,并能促进细胞迁移[22]。SLC26A3和SLC9A2均为溶质转运蛋白超家族成员,二者多在上皮组织的管腔膜中表达,可发挥阴离子交换器功能,可能与结肠癌的进展有关[23]。

总之,本研究基于GEO数据库,利用生物信息学分析工具共筛选出10个与结肠癌进展相关的枢纽基因,分别为IL-6、GCG、SLC26A3、TIMP1、SPP1、TMIGD1、MYC、MMP3、MMP1、SLC9A2等,这些枢纽基因的差异表达可能是结肠癌进展的重要原因。

猜你喜欢
枢纽结肠癌标志物
炎性及心肌纤维化相关标志物在心力衰竭中的研究进展
多项肿瘤标志物联合检测在健康体检中的应用价值
基于TCGA数据库分析、筛选并验证前列腺癌诊断或预后标志物
探讨腹腔镜手术在横结肠癌治疗中的临床应用效果
枢纽的力量
淮安的高铁枢纽梦
期待已久,连接传统与潮流的枢纽 Sonos AMP无线立体声功放
枢纽经济的“三维构建”
结肠内支架联合腹腔镜结肠癌根治术在结肠癌合并急性梗阻中的短期及中期疗效分析
腹腔镜下横结肠癌全结肠系膜切除术的临床应用