GEO数据库筛选肾透明细胞癌转移相关基因及其与免疫细胞浸润的关系

2022-12-19 02:00刘建生侯阳郑德宇
锦州医科大学学报 2022年5期
关键词:信息学转移性通路

刘建生,侯阳,郑德宇

(1.锦州医科大学解剖学教研室实验教学平台;2.锦州医科大学生命科学研究院;3.锦州医科大学解剖学教研室,辽宁 锦州 121000)

肾细胞癌(renal cell carcinoma,RCC)是一种世界范围内常见的癌症[1],约占成人所有恶性肿瘤的2%~3%。在中国,RCC的发病率呈上升趋势,2014年新发RCC约68 300例,肾癌相关死亡约25 600例[2]。RCC有多种病理分型,其中,透明细胞RCC(clear cell renal cell carcinoma,ccRCC)是RCC最常见的亚型,占RCC的70%~75%。其主要死亡原因是转移性疾病。原发性ccRCC肿瘤和转移性肿瘤之间的基因表达差异尚未确定。转移性传播最重要的预后因素是ccRCC[3]。虽然手术治疗ccRCC非常有效,但对转移性疾病患者的治疗选择非常有限(5年生存率约10%)[4]。早期诊断时,近60%的患者有一个局部的癌症和20%有远处转移[5]。由于约30%的ccRCC患者在手术后发展为转移性疾病,因此,非常需要更好地了解转移性ccRCC。ccRCC的转移性扩散主要发生在骨、肺、肝或脑。转移是ccRCC发病率高、预后差的原因。超过80%的患者在诊断为远处转移后存活少于5年[6]。ccRCC的增殖、复发和癌变过程中的机制至关重要,微阵列基因表达分析的方法以及生物信息学方法已被应用于获得基因表达数据,并可在gene数据库中下载。因此,有必要阐明转移性ccRCC发生和进展的确切分子机制,并建立新的分子基础策略,更好地防治侵袭性转移性ccRCC。

1 材料与方法

1.1 资料

基因表达数据在GEODataSets获得,选取GSE105288基因芯片数据。该芯片来自GPL10558平台,包括26例ccRCC转移患者肿瘤组织及9例原发ccRCC组织。

1.2 差异表达基因分析

GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r)是一个基于R语言的web数据分析工具,可用于GEO数据集的复杂分析。本研究通过在线GEO2R工具筛选,采用Benjamini和Hochberg 检验调整P值,以P<0.05和|logFC|≥0.7为切分标准,其中,logFC≥0.7为上调基因,logFC≤-0.7为下调基因。得到1个差异表达基因数据集(differentially expressed genes,DEGs),然后进行生物信息学分析。

1.3 通路富集分析

通过Metascape 平台(https://metascape.org/gp/index.html#/main/step1)[7]对核心靶点进行GO(geneontology)富集分析及KEGG(Kyoto encyclopedia of genes and genomes)通路分析。富集分析以Enrichment>1.5为标准,以P<0.01为差异有统计学意义。

1.4 PPI网络构建与关键基因筛选

使用STRING(http://www.string-db.org/),其实置信度得分高于0.9为显著相关,结果在Cytoscape软件中进行可视化分析,CytoHubba插件进行差异基因的上调及下调基因中关键基因的筛选,取Degree和MCC两种算法得分,分别选取得分前10个基因确定为关键基因,并对两算法结果取交集,获得核心基因。

1.5 核心基因转录水平表达与总体生存分析

利用GEPIA[7]1-18(http://gepia.cancer-pku.cn/)数据库验证核心基因表达,并通过使用箱线图来可视化基因在ccRCC与临床分期关系和生存分析曲线。筛选条件设置:(1)Stage Plot;(2)Survival Plots;(3)基因;(4)Methods,Overall Survival;(5)肿瘤类型:肾透明细胞癌(KIRC);(6)对应TCGA正常组及GTEx数据,设置信评分>0.4。

1.6 肿瘤免疫浸润相关性分析

使用TIMER网络分析工具:https://cistrome.shinyapps.io/timer/,设置检索上述hub基因并与临床生存有显著关系的基因,限制癌症类型为KIRC,关键基因表达验证,分析关键基因的表达,探究B细胞、CD8+T细胞、CD4+T细胞、巨噬细胞、中性粒细胞与树突状细胞的免疫浸润情况,以P<0.05为差异有统计学意义。

1.7 HPA 数据库

在The Human Protein Atlas数据库(http://www.proteinatlas.org/)内输入选择癌症类型为“RENAL CANCER”,找到肾癌中的相应蛋白免疫组化实验展开分析[8]。

2 结 果

2.1 样品表达与差异表达基因的筛选

如图1所示,样品表达水平处于相同水平。设置表达倍数变化值的对数值|LogFC|≥0.7,且P<0.05为标准,DEGs含有242个上调,137个下调,见图2。

图1 样本表达校正箱式图 图2 差异表达基因火山图

2.2 GO基因功能及KEGG通路富集分析

选取P<0.01为标准,生物过程、细胞组分、分子功能分别富集到617、87、85条,提示DEGs主要涉及生物过程。每个部分单独按照P值排序,主要涉及细胞外基质、细胞粘附的调控等生物过程,含有胶原蛋白的细胞外基质、胶原蛋白三聚物等细胞组分;主要富集在细胞外基质结构成分、血小板衍生生长因子结合等分子功能,见表1。KEGG 通路分析,共富集到50条信号通路,主要为蛋白质消化吸收、人类乳头瘤病毒感染、吞噬体等,见表2、图3。

表1 差异表达基因的GO功能注释

表2 差异基因KEGG通路富集

图3 差异基因KEGG通路富集

2.3 PPI网络的构建及关键基因筛选

使用STRING数据库,对379个DEGs进行PPI及可视化分析。STRING网络共涉及318个节点(去除游离节点)和190条边,如图4所示。再进一步运用Cytoscape 3.9.1软件中degree算法,选取PPI 网络中连通度排序前十的关键基因,发现ITGAV、STAT1、COL1A1、COL3A1、COL1A2、PSMB8、OAS2、ISG15、GBP2、IRF1基因为排名前十的关键基因,见图5;MCC算法,排序前十的关键基因:STAT1、OAS2、ISG15、PSMB8、GBP2、IRF1、HLA-F、ISG20、HLA-B、IFI27,见图6。两者交集基因为STAT1、OAS2、ISG15、PSMB8、GBP2、IRF1,见图7、表6,均为上调基因,我们将此基因集作为核心基因集进一步进行验证和筛选。

图4 差异表达基因构建的蛋白-蛋白相互作用网络

图5 Degree算法关键基因

图6 MCC算法关键基因

表3 MCC与Degree算法交集的核心基因

图7 核心基因的热图

2.4 核心基因的表达情况验证

在TCGA和GTEx数据库,正常肾脏组织与肾脏癌组织中表达比较显示,OAS2、ISG15、PSMB8、GBP2肾透明细胞癌表达升高,明显高于正常肾脏组织,与GEO结果相同,见图8。

2.5 核心基因与患者生存时间的关系

GEO、EGA与 TCGA生存分析显示,STAT1、OAS2、ISG15、GBP2与患者生存时间的关系相关,见图9。

目前,提高制动器压盘锥窝耐磨性能的主要方法为表面感应淬火,主要存在以下问题:感应器仿形性差、淬火工艺难控制。由于制动器压盘锥窝形状小而不规则,给感应器的制作带来很大困难,目前的感应器多为“一字形”,窝头一侧涂覆上导磁粉,这种感应器仿形性差,加热效率低,从而导致表面硬度不足、淬硬层分布不均匀,若加热时间过长则容易过烧甚至烧熔。

2.6 核心基因在肾透明细胞癌分期表达

依据2.4和2.5结果显示,OAS2、ISG15、GBP2是明显升高、同时与生存时间显著相关的基因,我们进一步进行验证和筛选,ISG15、GBP2与肿瘤分期明显相关(P<0.05)随分期级别表达增高,与GEO数据集分析结果基本一致,见图10。

2.7 ISG15和GBP2在ccRCC中的表达与免疫细胞浸润的关系

通过TIMER 数据库分析得到ISG15 表达与ccRCC免疫细胞浸润的相关性结果,表明ISG15 基因表达与细胞纯度明显负相关性,与CD8+T细胞、与树突状细胞的免疫浸润水平呈显著正相关,巨噬细胞负相关。GBP2的表达与ccRCC免疫细胞浸润的相关性结果,表明GBP2 基因表达与细胞纯度明显负相关性,与B细胞、CD8+T细胞、CD4+T细胞、巨噬细胞、中性粒细胞与树突状细胞的免疫浸润水平呈显著正相关。提示ISG15和GBP2有可能参与ccRCC细胞的免疫浸润过程,在ccRCC的肿瘤免疫细胞浸润水平中发挥重要用,见图11、图12。

2.8 ISG15和GBP2在ccRCC中的表达相同验证

从HPA 数据库中获取到12例肾癌组织的蛋白表达情况,ISG15在3例正常肾脏中,肾小球中无表达,肾小管中高表达,主要在细胞浆和细胞膜上表达;癌组织中,高表达6例、中等表达4例、低表达2例,主要在细胞浆和细胞膜上,另外在细胞核也有表达。

GBP2在6例正常肾脏中,肾小球细胞核,肾小管中,主要在细胞浆和细胞核核膜上表达,均为中等表达;癌组织中,高表达5例、中等表达3例、低表达4例,主要在细胞浆、胞膜和细胞核上表达,见图13。

STAT1OAS2ISG15PSMB8GBP2IRF1图8 核心基因在正常肾脏组织与肾脏癌组织中的表达

图9 核心基因与患者生存时间的关系

OAS2ISG15GBP2图10 核心基因在肾透明细胞癌分期表达情况

图11 ISG15在ccRCC中的表达与免疫细胞浸润的关系

图12 GBP2在ccRCC中的表达和免疫细胞浸润的关系

免疫组化法,DAB显色,200×图13 ISG15和GBP2在正常组织与肾细胞癌组织中的表达

3 讨 论

以往的研究主要集中在肿瘤组织与正常组织表达差异的生物标志物的筛选上。然而,在更致命和治疗相关的远处转移性肿瘤中,基因表达谱却不多见。微阵列技术是世界上许多研究人员用来探索癌症基因表达水平的主要方法之一。因此,我们研究的基因微阵列从GEO下载并分析,本研究通过生物信息学对肾透明细胞癌芯片进行分析获得相关差异基因,并通过对差异基因进行GO富集分析以及KEGG通路富集分析,筛选关键基因,通过生物信息学初步验证,为肾透明细胞癌的机制研究进一步提供研究方向及依据。

本研究通过生物信息学分析方法,从GSE105288基因芯片筛选出了379个差异表达基因,包括242个上调,137个下调,最后通过肿瘤分期和生存分析等方法,最终筛选出ISG15和GBP2可能为核心基因。

GBP2是也是一种干扰素诱导蛋白,目前中文对其研究的报道不多,生物信息学报道显示GBP5可能通过影响寡聚化域样受体信号通路活性从而促进肿瘤进展,针对GBP2基因,细胞实验初步验证表明GBP2过表达可促进ccRCC的迁移和侵袭能力,提示GBP2有望成为ccRCC免疫相关的预后生物标志物和治疗靶点[13-14]。肿瘤相关巨噬细胞和T淋巴细胞是肿瘤免疫环境的主要组成部分[15]。本文数据库分析显示ISG15和GBP2基因表达与细胞纯度明显相关性,与B细胞、中性粒细胞等的免疫浸润水平呈显著相关。因此,我们的认为ISG15和GBP2可能对ccRCC的免疫浸润有影响。

综上所述,我们在本研究中通过生物信息学分析了ccRCC样本中的DEGs,并筛选出与ccRCC相关的基因。我们的综合生物信息学分析显示,ISG15和GBP2在转移性ccRCC组织中显著上调,提示ISG15和GBP2转移中具有原癌基因效应。对于ccRCC患者,ISG15和GBP2基因表达与细胞纯度明显相关性,与CD8+T细胞、CD4+T细胞、巨噬细胞、中性粒细胞与树突状细胞的免疫浸润水平呈显著相关。虽然本文我们研究的样本较少,结果存在了一定的局限性,并且暂时还有一些问题没有解决,但是我们的研究有助于更好地理解ccRCC,对改善ccRCC患者转移的风险、ccRCC的诊断、治疗策略和预后预测研究具有重要的临床意义。

猜你喜欢
信息学转移性通路
SPECT/CT显像用于诊断转移性骨肿瘤的临床价值
鸡NRF1基因启动子区生物信息学分析
初论博物馆信息学的形成
耐奥沙利铂人胃癌SGC-7901细胞具有高侵袭转移性及上皮间质转化特征
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
proBDNF-p75NTR通路抑制C6细胞增殖
非远处转移性高危分化型甲状腺癌的低剂量碘-131治疗
通路快建林翰:对重模式应有再认识
miRNA-148a在膀胱癌组织中的表达及生物信息学分析
Hippo/YAP和Wnt/β-catenin通路的对话