卵巢透明细胞癌特征生物标志物及免疫浸润分析

2024-02-06 07:08赵轩宇
现代妇产科进展 2024年2期
关键词:性癌标志物卵巢

赵轩宇,姜 艳,隋 峰

(首都医科大学附属北京妇产医院/北京妇幼保健院,北京 100026)

卵巢透明细胞癌(ovarian clear cell carcinoma,OCCC)是一种罕见且特殊病理类型的卵巢上皮性癌,约占所有卵巢癌的10%[1-2]。与其他卵巢恶性肿瘤相比,早期OCCC患者预后良好,但由于其具有固有化疗耐药性及对放化疗反应性更低的特点,晚期或复发患者的预后更差[3-4]。区别于其他卵巢上皮性癌,OCCC具有独特的临床病理特征和分子生物学差异[1,5-6]。其他卵巢上皮性癌,如子宫内膜样癌或高级别浆液性癌均有合适的特异性标志物,但目前没有发现OCCC的特异性生物标志物。已知的肝特异性转录因子1β(hepatocyte nuclear factor 1 beta,HNF-1β)和酸性核心酶(napsinA)可作为OCCC辅助诊断指标,但其准确性及临床价值仍需进一步研究[7-9]。近年来,随着微阵列技术及生物信息学的发展使疾病相关基因的鉴定更方便。本研究通过搜集OCCC相关基因表达数据,通过机器学习方法筛选其特征生物标志物,并将其与免疫细胞浸润相关性进行分析,以获得更有效地区分OCCC与其他病理类型上皮性卵巢癌的特征生物标志物。

1 材料与方法

1.1 数据下载 从GEO(http://www.ncbi.nlm.nih.gov/geo/)数据库下载GSE6008和GSE29175数据集相关文件[10-11]。GSE6008数据集包含99个卵巢上皮性癌样本。所有样本在Affymetrix HG_U133A阵列上进行分析。此外,应用GSE29175数据集作为验证队列对差异表达基因及ROC曲线进行验证。GSE6008和GSE29175数据集详细信息,见表1。

表1 GSE6008和GSE29175数据集样本信息[n(%)]

1.2 差异表达基因筛选 使用R中的“limma”软件包进行差异表达分析(http://www.bioconductor.org/)。根据校正后的P<0.05和差异倍数对数的绝对值>1来确定差异表达基因(differential expression genes,DEGs)[12]。

1.3 DEGs的富集分析 使用R中的各种软件包进行富集分析以深入了解DEGs相关的生物学功能和通路。包括使用“ClusterProfiler”软件包进行基因本体论(Gene Ontology,GO)、京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)的富集分析[13-15]。

1.4 候选诊断生物标志物的筛选 采用两种机器学习算法分析OCCC与其他卵巢恶性肿瘤之间的潜在特征。使用最小绝对值收缩与选择算子(least absolute shrinkage and selection operator,LASSO)和支持向量机递归特征消除(support vector machines-Recursive feature elimination,SVM-RFE)方法筛选候选基因。在R中使用“glmnet”软件包实现的LASSO回归算法用于识别与OCCC和对照样本显著差别的基因。SVM-RFE是一种基于支持向量机算法的特征选择方法[16]。该方法通过迭代的方式逐步剔除最不重要的特征,直到达到所需的特征数量为止。通过应用这两种机器学习算法,识别出与OCCC相关的候选特征基因,并在GSE29175数据集中验证候选特征基因的表达水平。

1.5 候选生物标志物的诊断价值验证 为了评估候选生物标志物的预测价值,使用GSE6008数据集的mRNA表达数据构建了受试者工作特征曲线(receiver operating characteristic,ROC)。ROC曲线下面积(area under curve,AUC)用于评估生物标志物的诊断效果。此外,使用GSE29175数据集对生物标志物诊断效果进行验证。P<0.05为差异有统计学意义。

1.6 免疫细胞亚型的鉴定 CIBERSORT(https://cibersortx.stanford.edu/)生物信息学算法定量评估OCCC样本中免疫细胞浸润的相对比例以及与对照组之间免疫浸润情况的差异。CIBERSORT是一种基于基因表达数据的免疫细胞组成解析工具,可分析复杂的混合细胞样本中各种免疫细胞亚型的相对丰度[17]。通过R软件中的“corrplot”软件包对免疫细胞浸润情况进行相关性分析和可视化。通过R软件中的“vioplot”软件包生成小提琴图,以展示OCCC和对照样本之间免疫细胞亚型浸润差异情况。

1.7 统计学处理 使用R软件(版本4.2.1)。对于连续型变量,正态分布变量采用Studentt检验,异常分布变量采用Mann-WhitneyU检验。使用“glmnet”软件包进行LASSO回归分析,并在R中使用了e1071软件包进行SVM算法分析。使用ROC曲线分析评估候选特征生物标志物基因的诊断效能。使用Spearman相关性分析研究特征生物标志物与浸润免疫细胞之间的关系。双侧检验,P<0.05为差异有统计学意义。

2 结 果

2.1 筛选差异表达基因 在GSE6008数据集8个OCCC样本与91个其他病理类型的卵巢上皮性癌样本之间,共筛选出18个差异表达基因,其中包括16个显著上调基因和2个显著下调基因(图1A、B)。

2.2 差异基因GO、KEGG富集分析 GO分析结果显示,差异基因在生物过程方面主要在钠离子跨膜转运及相关蛋白活性的正调控、细胞衰老、软骨细胞发育中显著富集。在细胞组分层面差异基因主要存在于钠-钾交换ATP酶复合物,溶酶体膜胞质侧以及微绒毛膜中,但富集不显著。差异基因的分子功能涉及糖胺聚糖结合、氧化还原酶活性、脂肽结合、硫氨基酸跨膜转运蛋白活性以及受体配体活性,但同样富集不显著。KEGG富集分析结果显示,在甲状腺激素合成、蛋白质消化吸收、组氨酸代谢以及近端小管碳酸氢盐回收显著富集,见表2。

表2 差异基因GO及KEGG富集分析结果

2.3 特征生物标志物的筛选及验证 通过两种机器学习的方法共同筛选OCCC的候选特征生物标志物。通过LASSO回归算法筛出了4个OCCC特征基因(图2A)。通过SVM-RFE算法筛选出了16个OCCC特征基因(图2B)。将两种算法取得的特征基因取交集,共获得了4个特征基因,分别为PTHLH、FXYD2、EEF1A2和GLRX(图2C)。

图2 两种机器学习算法筛选特征基因

在GSE29175数据集(验证组)中,分析4个特征基因在OCCC及非OCCC表达水平差异。结果发现,与非OCCC比较,FXYD2基因在OCCC中显著高表达,差异有统计学意义。PTHLH、EEF1A2和GLRX基因在OCCC与非OCCC中表达量无明显差异。见图3。故将FXYD2基因作为OCCC与非OCCC之间鉴别的特征生物标志物,并用后续实验检验其诊断价值。

图3 在GSE29175数据集中四种特征生物标志物在OCCC与非OCCC间表达水平差异

2.4 特征生物标志物诊断价值的评估及验证 在GSE6008数据集中,FXYD2基因ROC曲线的AUC为0.999(95%CI为0.992~1),而在GSE29175数据集中,AUC为0.957(95%CI为0.883~1),见图4。

图4 FXYD2的ROC曲线

2.5 免疫细胞浸润分析 通过CIBERSORT算法分别计算出不同免疫细胞在OCCC组及非OCCC组浸润分数并进行比较,见图5A。结果发现,与其他病理类型卵巢癌相比,OCCC中静息肥大细胞免疫浸润程度明显升高,差异有统计学意义。对22种免疫细胞进行相关性分析,结果显示静息肥大细胞与激活肥大细胞呈显著负相关,与γδT细胞及幼稚B细胞呈正相关,见图5B。

图5 OCCC与非OCCC免疫细胞浸润及免疫细胞间相关性分析

2.6 特征生物标志物与免疫细胞浸润相关性分析 FXYD2基因与嗜酸性粒细胞呈弱正相关(R=0.2,P=0.043),与T细胞CD4记忆激活(R=-0.24,P=0.016)、巨噬细胞M0(R=-0.22,P=0.026)呈弱负相关,见表3。

表3 FXYD2基因与免疫细胞相关性分析

3 讨 论

OCCC在大多数情况下可以靠特殊形态学特征诊断,但一些具有分泌特征的子宫内膜样癌或浆液性癌在形态上与OCCC极其相似。在这种复杂的情况下,免疫组化在OCCC的鉴别诊断中起了重要作用。在其他卵巢上皮性癌中常常存在特征性的改变,如高级别浆液性癌中常出现的BRCA或TP53突变,染色体不稳定或复杂核型[18]。SALL4是卵黄囊肿瘤和无性细胞瘤的标志物。但根据现有研究结果,并未发现特异性OCCC生物标志物,PIK3CA的激活突变仅发生在33%的OCCC病例[19-21]。既然OCCC可表现出区别于其他卵巢上皮性癌的形态学特征和生物学特性,而且不同器官来源的透明细胞癌分子遗传改变相似,推测其可能拥有特征性生物标志物尚未被发现。本研究通过生物信息学方法,分析筛选OCCC的特征标志物并对其诊断效能进行验证,之后再通过CIBERSORT算法比较OCCC与非OCCC之间免疫细胞浸润之间的关系,并分析特征标志物与免疫细胞之间的相关性。

将OCCC与非OCCC进行对比,共筛选出16个显著上调基因和2个显著下调基因。富集分析结果显示,这些差异表达基因主要在钠离子跨膜转运、细胞衰老等方面富集,表明OCCC的肿瘤离子微环境可能区别于其他卵巢上皮性癌。通过LASSO回归和SVM-RFE两种机器学习算法以及通过验证组验证后筛选出FXYD2基因作为特征生物标志物。ROC曲线结果表明,FXYD2基因具有良好区分OCCC与非OCCC的能力。FXYD2基因位于染色体11q23,FXYD2蛋白是Na/K-ATP酶的γ亚基,起到酶活性调节作用[22-23]。Na+/K+-ATP酶是一种由α、β和γ亚基组成的寡聚跨膜蛋白,在上皮细胞中高度表达,在肾脏中发挥重要作用[24]。Na+/K+-ATP酶活性是维持膜电位稳态所必需的,并与许多细胞功能和特定疾病的发病机制有关[25]。既往研究在许多癌症中均发现了Na+/K+-ATP酶上调[26-28]。研究发现,强心苷类,即Na+/K+-ATP酶抑制剂,具有很强的抗肿瘤活性[29-30]。Na+/K+-ATP酶活性或表达的降低也会抑制癌症细胞的增殖和存活[31]。然而,Na+/K+-ATP酶在肿瘤发生中的作用机制尚不清楚。通过CIBERSORT算法分析OCCC与非OCCC之间免疫细胞浸润差异,结果发现OCCC中静息肥大细胞免疫浸润程度显著升高,且静息肥大细胞与激活的肥大细胞呈显著负相关。可能提示免疫系统在OCCC的发生发展中起到了重要作用。因肥大细胞参与了调节炎症和过敏反应,静息状态下肥大细胞浸润程度显著增加提示OCCC有发生严重炎症反应或过敏反应的基础[32]。FXYD2基因与嗜酸性粒细胞显著正相关(R=0.2,P=0.043),与T细胞CD4记忆激活(R=-0.24,P=0.016),巨噬细胞M0(R=-0.22,P=0.026)呈显著负相关。虽然P值均为显著,但R值均为弱相关。嗜酸性粒细胞是白细胞的一种,常常在过敏反应,寄生虫感染或霍奇金淋巴瘤,急性髓系白血病等病理状态下呈免疫浸润增高[33]。表明异常的炎症反应或过敏反应在OCCC与非OCCC之间可能存在差异。此外,T细胞CD4记忆激活是指在第一次遭遇特定抗原后,部分CD4 T细胞会转化为记忆T细胞[34]。当再次遇到相同抗原时,记忆T细胞会迅速被激活,并产生大量的效应分子,从而加强免疫应答。记忆T细胞的激活可导致多种效应,包括促进B细胞分化为抗体产生的浆细胞、促进CD8 T细胞的活化和细胞毒作用,以及调节其他免疫细胞的活性[35]。记忆T细胞的存在使得体内对抗原的再次暴露时,免疫应答更迅速和更有效。巨噬细胞M0是一类成熟的巨噬细胞前体细胞,处于静止状态且能主动调节免疫应答。当M0受到激活信号后,会发生极化分化,分化为巨噬细胞的不同类型,如M1和M2型[36]。FXYD2基因与T细胞CD4记忆激活,巨噬细胞M0呈负相关,表明与非OCCC相比,OCCC在抗原识别、免疫应答等多个免疫环节可能存在抑制。

本研究存在一定的局限性,利用公共数据进行回顾性研究,FXYD2基因高表达以及免疫细胞浸润的差异仅可能是OCCC在基因水平或免疫细胞水平上的特征,仍需临床样本验证其真实性及有效性。

综上所述,FXYD2基因高表达可能作为OCCC的特异性标志物之一。与其他卵巢恶性肿瘤相比,OCCC的细胞特征和表达模式可能具有独特性,其中FXYD2高表达可能是其识别和鉴别的重要特征之一。与非OCCC相比,OCCC可能存在异常的炎症反应以及细胞免疫及体液免疫相关抑制。

猜你喜欢
性癌标志物卵巢
保养卵巢吃这些
卵巢多囊表现不一定是疾病
乳腺腺样囊性癌1例
SRSF2、HMGA2和Caspase-3在卵巢高级别浆液性癌及其前驱病变中的表达及意义
如果卵巢、子宫可以说话,会说什么
294例老年人腺样囊性癌的统计学分析
脓毒症早期诊断标志物的回顾及研究进展
冠状动脉疾病的生物学标志物
卵巢上皮性癌组织中PITX2和β-catenin蛋白的表达
肿瘤标志物在消化系统肿瘤早期诊断中的应用