基于生物信息学方法对胰腺癌发生发展关键基因的筛选

2022-09-21 02:56陈科洪潇冯彦超应伟李文菠李钊赵敬兵汪杰周国俊冷政伟
山东医药 2022年26期
关键词:基因芯片胰腺癌靶点

陈科 ,洪潇 ,冯彦超 ,应伟 ,李文菠 ,李钊 ,赵敬兵 ,汪杰 ,周国俊 ,冷政伟

1 川北医学院附属医院肝胆外科,四川南充 637000;2 川北医学院附属医院肿瘤干细胞研究中心

胰腺癌是消化系统常见的恶性肿瘤之一,恶性程度极高,5 年总生存率不足8%[1]。胰腺癌起病隐匿,早期发现率极低,确诊时多处于中晚期进展阶段,失去根治性手术机会。目前全世界胰腺癌的诊治现状不容乐观,手术联合辅助化疗是目前可切除胰腺癌的最有效的治疗手段,但仅有20%的患者可行手术治疗,术后易复发和转移,根治性手术后的患者5 年生存率也仅为25%[2-3]。迄今,胰腺癌的病因和确切的分子机制尚不清楚,可能涉及多个基因的表达异常。因此,寻找胰腺癌的关键基因对于确立早期诊断、预后标志物和治疗新靶点至关重要。近年来,随着高通量技术的发展,基因芯片和基因测序的运用已成为研究肿瘤疾病必要且高效的方法。如今各大数据库中拥有丰富的基因检测和分析结果,但缺少精确、有效的数据挖掘。本研究利用生物信息学方法对胰腺癌与癌旁正常组织进行差异表达基因筛选并深入分析,旨在为胰腺癌寻找到特异的肿瘤分子标志物和药物治疗靶点。

1 材料与方法

1.1 基因芯片数据信息来源 从NCBI-GEO数据库(https://www. ncbi. nlm. nih. gov/geo)中下载3 个胰腺癌芯片,即GSE71989、GSE62165、GSE62165,分别包含胰腺癌组织13、118、15例,癌旁组织8、13、7例。

1.2 胰腺癌与癌旁组织差异表达基因及共表达差异基因的筛选 通过GEO2R在线工具,以|logFC|>2 且校正P<0.05 的基因为差异表达基因,其中logFC>2 为上调,logFC<-2 为下调,定义胰腺癌与癌旁组织中的差异表达基因。通过韦恩在线网站(http://bioinformatics.psb.ugent.be/webtools/Venn)绘制韦恩图,获得3 个基因芯片共有的差异表达基因。

1.3 胰腺癌与癌旁组织核心差异表达基因的筛选将所获得的共有差异表达基因用STRING 网站(https://string-db. org)构建蛋白—蛋白相互作用网络(PPI)网络图,利用Cytoscape3.7.2软件及MCODE插件分析PPI网络图,获得PPI中联系最为紧密的核心网络,将这核心网络中的基因定义为核心差异表达基因。MCODE 分析设置条件:度数截断值=2,节点分数截断值=0.2,K-分数=2,最大深度=100。

1.4 核心差异表达基因不同表达量胰腺癌患者的生存情况分析 在GEPIA 网站(http://gepia. cancer-pku.cn)中,对核心差异表达基因分别进行生存分析,选择总生存期(OS)为指标,癌症名称选择胰腺癌,描绘核心差异表达基因高表达与低表达患者的生存曲线图,筛选出生存分析中P<0.05 的基因,作为胰腺癌预后相关基因。

1.5 预后核心差异表达基因在胰腺癌与癌旁组织中的表达分析 在GEPIA 网站中,利用Box Plots 分析胰腺癌与癌旁组织中相关基因的表达量,以P<0.05为差异有统计学意义。

2 结果

2.1 3 个基因芯片共表达差异基因筛选结果 从3 个基因芯片 GSE71989、GSE62165、GSE19650 中分别筛选出1 085、1 598、3 426 个差异表达基因,其中上调 887、1 140、728 个,下调198、458、2 698 个。通过韦恩图分析,获得3 个基因芯片共表达差异基因156个,其中上调62个、下调94个。见图1。

图1 3个芯片差异表达基因的韦恩图

2.2 胰腺癌与癌旁组织核心差异表达基因的筛选结果 将156 个差异表达基因提交至STRING 在线网站后,共有152 个基因出现在PPI 网络中,其中节点数 152 个,边数 291 条,聚类系数 0.447,见 OSID码图1。将得到的PPI 使用Cytoscape3.7.2 软件及MCODE 插件分析后,得到2 个相交点最多的基因簇;将这2 个基因簇涉及的差异表达基因定义为核心差异表达基因,共得到19 个核心差异表达基因,其中上调基因6个,即ANLN、CDK1、ECT2、NUSAP1、RRM2、TOP2A,下调基因 13 个,即 CPA1、CTRL、CLPS、CTRC、CPA2、CEL、CELA2B、PLA2G1B、PNLIPRP1、PNLIP、CELA3A、SYCN、CPB1。

2.3 核心差异表达基因不同表达量胰腺癌患者的OS 比较 使用GEPIA 在线网站对19 个核心差异表达基因不同表达量患者的OS 进行比较,结果显示,ANLN、CDK1、ECT2、NUSAP1、RRM2、TOP2A 基因在高表达患者的OS 低于低表达患者(P均<0.05),见OSID 码图2。其余13 个基因不同表达量患者的OS比较差异无统计学意义(P均>0.05)。

2.4 胰腺癌与癌旁组织核心差异表达基因的表达量比较 在GEPIA 网站中利用Box Plots 对上述6 个与预后相关的基因进行表达量验证,结果显示6 个基因在胰腺癌中的表达量均高于癌旁组织(P均<0.05)。见OSID码图3。

3 讨论

胰腺癌的发生发展涉及基因、环境、饮食等多种因素的共同作用过程,利用生物信息学技术准确筛选出导致胰腺癌发生发展的关键基因,能够为胰腺癌的早期诊断和精准靶向治疗提供重要依据。基因芯片是指利用现代探针固相原位合成技术、照相平板印刷技术、高分子合成技术等微电子技术把大量分子生物学技术具体而微的固定在一定狭小的空间内,以实现高速度、高通量、集约化和低成本的分析技术。本研究基于生物信息学分析,在GEO 数据库中筛选出近几年样本量较大的3份胰腺癌与癌旁组织基因芯片,在多个生物信息分析网站中进行系统全面的分析,最终得出ANLN、CDK1、ECT2、NUSAP、RRM2、TOP2A 基因与胰腺癌的发生发展有重要关系。

ANLN 是一种肌动蛋白结合蛋白,在胞质分裂中起重要作用。在乳腺癌、肾癌、结肠直肠癌、肝癌、肺癌、子宫内膜癌和胰腺癌中,ANLN 上调可影响细胞的增殖、迁移和浸润,进而导致肿瘤的进展[4-5]。研究显示,ANLN 表达水平与肿瘤的转移潜能有关,可能是因为ANLN 可以通过细胞骨架重塑促进上皮间充质转化(EMT)和细胞迁移,从而促进肿瘤细胞的增殖、侵袭和转移[6]。WANG等[7]研究认为,ANLN在胰腺癌高表达可能与肿瘤大小、肿瘤分化程度、TNM 分期、淋巴结转移、远处转移和预后不良有关,ANLN 可诱导 EZH2 上调,通过 miR-218-5p/LASP1信号轴促进胰腺癌发生发展。

CDK1 属于丝氨酸/苏氨酸蛋白激酶家族,在调节细胞周期、DNA 复制和分离的进程中发挥着关键作用。VASSILEV 等[8]报道,使用 CDK 抑制剂诱导的G2期阻滞可阻止DNA 双链断裂的细胞转变为M期,认为CDK1 是一种与肿瘤生长相关的细胞周期调 节 剂 。 ZHANG 等[9]研 究 发 现 ,CDK1 是 BRAF V600E 结直肠癌中细胞凋亡抗性的新介质,其与MEK/ERK 抑制剂联合是一种有效的临床治疗策略。HUANG 等[10]利用 CDK 抑制剂阻断细胞因子干扰素γ 诱导的IDO1 和CD274 在小鼠胰腺癌细胞中表达,小鼠总体存活率显著提高,提示CDK1 可能是胰腺癌治疗的靶点之一。

ECT2 是GTP 酶Rho 家族的鸟嘌呤核苷酸交换因子,ECT2 在结直肠癌、乳腺癌、肺癌、前列腺癌等多种恶性肿瘤中高表达[11-13],可能与肿瘤细胞增殖、迁移、侵袭相关。LI 等[14]研究发现,转录共激活因子相关蛋白1(YAP1)在胰腺癌恶化起着关键作用,通过YAP1 抑制剂降低ECT2 蛋白表达,可以降低胰腺癌细胞在原发部位和转移性肝癌的生长,为早期检测和治疗胰腺癌提供了新的思路。有研究发现,ECT2 可通过RhoA-ERK 信号通路调控VEGF 和MMP9 的表达,抑制食管鳞状细胞癌增殖、侵袭、迁移和肿瘤的发展[11]。MANSOUR 等[12]认为,ECT2 可能是乳腺癌的标志物;HIRATA等[13]对242例非小细胞肺癌和240 例食管鳞状细胞癌进行临床观察,发现ECT2 阳性肿瘤患者的生存期较ECT2 阴性患者缩短。

NUSAP1 是增殖细胞中所需的微管结合蛋白,NUSAP1作为细胞有丝分裂调控因子,其异常表达可能通过影响细胞有丝分裂过程而导致细胞癌变。LIU等[15]报道,NUSAP1表达与肿瘤组织病理学分级、浸润深度、淋巴结转移有关,且NUSAP1高表达患者的生存期明显低于NUSAP1 低表达患者。但NUSAP1 上调的分子机制仍然未知,先前研究报道NUSP1 可能通过调控BTG2/PI3K/AKT 信号通路抑制肿瘤细胞的侵袭、迁移和转移[16]。但关于胰腺癌与NUSAP1关系的报道目前少见。

RRM2是一种参与DNA合成和损伤修复的限速酶,在细胞增殖、侵袭、迁移、血管生成等过程中起着至关重要的作用。利用生物信息学分析,RRM2 过表达可能是肿瘤进展的重要组成部分,也是许多癌症的生物标志物,为RRM2 做为癌症新的治疗靶点提供了依据。YANG 等[17]报道,铁死亡是由脂质过氧化物引发的细胞死亡过程与肝癌发生发展过程密切相关,RRM2 的磷酸化通过谷胱甘肽合成酶以维持谷胱甘肽水平防止铁死亡。RÜSTEM 等[18]研究发现,GW8510 能够显著降低RRM2 蛋白水平,与吉西他滨协同作用可抑制胰腺癌细胞增殖和迁移。

TOP2A 是一种控制DNA 拓扑状态的酶,它在有丝分裂过程中催化双链DNA 断裂并促进基因转录。研究显示,TOP2A 在各种癌症中过度表达。CHEN等[19]通过生物信息方法证实,TOP2A 对胰腺癌具有很高的诊断价值,但并未深入探讨与胰腺癌作用机制。DONG 等[20]报道,TOP2A通过调节SnaiL表达触发上皮间质转化并促进肝癌进展。PEI 等[21]研究认为,TOP2A是miR-139的直接靶点,TOP2A通过激活β-catenin信号通路促进胰腺癌细胞增殖和迁移。这提示TOP2A 在胰腺癌的发生发展中也具有重要作用。

综上所述,本研究使用生物信息学的方法挖掘出 6 个基因 ANLN、CDK1、ECT2、NUSAP1、RRM2、TOP2A 可能是胰腺癌发生发展中的重要基因,且与浸润性乳腺癌、硬囊卵巢、先天性发育不全、喉鳞状细胞癌、雌激素受体阳性乳腺癌等具有重要关系。这6 个基因可为胰腺癌早期诊断及治疗的新靶点,并为胰腺癌的机制研究提供一定的理论基础。

猜你喜欢
基因芯片胰腺癌靶点
CT联合CA199、CA50检测用于胰腺癌诊断的敏感性与特异性探讨
胰腺癌治疗为什么这么难
能谱CT在术前预测胰腺癌淋巴结转移的价值
维生素D受体或是糖尿病治疗的新靶点
吸烟会让胰腺癌发病提前10年
出生时即可预判发育潜力 基因芯片精准筛选肉牛良种
肿瘤免疫治疗发现新潜在靶点
基因芯片技术在生物研究中的应用进展
基因芯片快速检验细菌的临床应用
心力衰竭的分子重构机制及其潜在的治疗靶点