基于TCGA数据库构建口腔鳞状细胞癌预后模型

2022-06-22 08:05张竞飞
山东医学高等专科学校学报 2022年3期
关键词:预测基因因素

张竞飞,李 玲,秦 汉,蔡 圳*

(1滨州医学院口腔医学院,山东 烟台 264000;2临沂市人民医院,山东 临沂 276000)

口腔鳞状细胞癌(Oral squamous cell carcinoma,OSSC)是口腔最常见的恶性肿瘤,预后较差[1]。选择合适的治疗策略对增加生存时间(OS)至关重要。目前,OSCC的临床预后判断方法主要是经典的AJCC TNM分期。但该分期系统只考虑了疾病的解剖范围,没有考虑非解剖因素,如年龄、性别以及肿瘤的临床和病理特征,不能准确预测OSCC的预后[2]。近年来,体液(如唾液和血清)和肿瘤组织中蛋白质编码基因、信使RNA和长链非编码RNA等多种生物标志物在预后预测方面受到了越来越多的关注[3]。但单一特征通常不足以预测个体的存活率,而组合则可以提供更好的预后可靠性[4]。随着生物信息学技术的快速发展,预后预测模型逐渐应用于癌症,但OSCC相关临床预后模型较少[5]。本研究旨在利用癌症基因组图谱(The cancer genome atlas,TCGA)数据库来探索OSCC和正常组织中基因表达谱的差异,以寻找潜在的生物标记物并评估其在预测OSCC患者生存方面的价值。

1 资料与方法

1.1数据获取 从TCGA数据库中下载了OSCC队列基因表达谱的原始数据和相应临床信息,包括340例肿瘤样本和32例正常样本。排除无随访时间和随访时间小于90 d的样本后,共纳入319名OSCC患者。

1.2差异分析 利用R软件中的limma包对TCGA-OSCC队列中的所有基因进行差异表达分析,以|log2Fc|>1和FDR<0.05为标准获取肿瘤组织与正常组织间的差异表达基因(DEGs)。

1.3构建预后模型 将OSCC患者按3∶2比例随机分为训练集(n=192)和测试集(n=127)。在训练集中,应用单因素COX回归分析(α=0.01)联合lasso-Cox回归分析筛选与OSCC预后相关DEGs,在此基础上进行多因素Cox回归分析,以构建DEGs的OSCC预后模型。

1.4评价预后模型的预测能力 利用多因素Cox回归分析得到的基因回归系数和基因表达水平计算每个患者的风险评分,根据风险评分中位数,将OSCC患者分为低风险组和高风险组。对两组患者进行Kaplan-Meier(KM)生存分析并绘制生存曲线。为了评估预后模型的预测准确性,构建了1、3、5年生存率的时间依赖受试者工作特征(ROC)曲线,并计算曲线下面积(AUC),AUC值越大模型的预测能力越好。为了确定独立的预后因素并验证预后模型的独立预后价值,以风险评分和其他传统临床特征为自变量、OS为因变量进行Cox回归分析,以确定预后模型的预测能力是否独立于其他临床变量(包括年龄、性别、组织学分级和病理分期)。

1.5验证预后模型 在测试集中,风险分数计算使用与训练集相同的公式,后续分组中使用与训练集相同的截止值,接下来通过KM生存分析、ROC曲线分析对预后模型的预测能力进行验证。

2 结果

2.1OSCC患者基因表达谱差异分析 在OSCC肿瘤组织与正常组织中,差异分析共筛选出4248个DEGs,其中包括1301个下调基因和2947个上调基因。

2.2OSCC预后模型的构建 在训练集中发现25个差异表达基因与OSCC患者的OS显著相关,通过Lasso回归分析进一步缩小DEGs的范围,结果共得到18个DEGs;最后进行多因素Cox回归分析,建立包含10个基因的预后模型(见表1),其中AC079921.2、RELT、BCAM、GPX7、HOTAIRM1、AC009948.4、AL162413.1和PPIAP31为保护基因;HS3ST1和BRINP1为危险基因。

表1 10个预后相关DEGs的风险比和95%置信区间

2.3模型预测能力评价 利用10个基因的表达水平和多因素Cox回归得到的基因相关系数计算风险评分,具体公式为:-1.283×AC079921.2+0.146×HS3ST1+0.857×BRINP1+0.197×RELT+0.005×BCAM-0.069×GPX7+0.070×HOTAIRM1+0.668×AC009948.4+0.029×AL162413.1+0.029×PPIAP31

训练集中,高风险组96名,低风险组96名。KM生存分析结果显示,两组的OS有显著差异(P<0.01)。1、3、5年生存率的AUC值分别为0.80、0.84、0.81。另一项涉及风险评分和临床因素的ROC曲线分析表明风险评分的AUC值最大为0.783;年龄、性别、分级、分期、T分期和N分期的AUC值分别为0.532、0.525、0.552、0.554、0.531、0.607。另外,对风险评分和临床因素进行单因素Cox回归分析,结果显示预后模型有一定的预测价值(风险比=1.042,95%置信区间:1.026-1.059,P<0.01)。将年龄、性别、病理分期、和预后模型纳入多因素Cox回归分析,结果显示预后模型与OSCC患者的预后仍然密切相关(风险比=1.041,95%置信区间:1.024-1.059,P<0.01)。

2.4模型验证 利用训练集的风险评分计算公式计算测试集患者的风险评分,结果127例患者中低风险组60例、高风险组67例。KM生存分析结果表明,OSCC高风险组患者的OS显著低于低风险组(P=0.04)。此外,测试集中1年生存率的时间依赖ROC曲线分析表明,该预后模型能够预测OSCC患者的OS(AUC=0.694)。

3 讨论

从患者和临床医生的角度来看,准确的预后判断对于患者术后危险分层和个体化辅助治疗的选择具有重要意义[6]。为了改善OSCC患者的临床预后,必须确定许多潜在和有价值的生物标志物并建立预后模型。本研究建立的预后模型包括10个DEGs,其中AC079921.2、HOTAIRM1、AC009948.4和AL162413.1同属于lncRNA。许多研究表明,lncRNA具有调节功能,影响肿瘤细胞的生物学行为、免疫反应和细胞的表型转化,并与肿瘤的发生、发展和转移过程密切相关[7-9]。其中HS3ST1、RELT、GPX7为代谢相关基因。OSCC的分子发病机制很复杂,目前已有研究证实OSCC与代谢相关基因的突变和代谢物水平改变之间相互作用密切相关[10-12]。另外,BCAM上调与转移性胃癌预后不良有关[13]。目前尚未有研究证实BRINP1和PPIAP31在OSCC发生中的分子机制。

将上述基因构成的预后模型进行KM生存分析和ROC曲线分析,KM曲线表明该预后模型可以成功地将OSCC患者分为OS明显不同的低危和高危两组;1、3、5年ROC的AUC值均大于0.80。这意味着该预后模型在预测OSCC患者OS时具有较高的灵敏度和特异度。将预后模型风险评分和年龄、性别等临床因素放在一个ROC曲线中,发现与年龄、性别、分级、分期、T分期和N分期相比,预后模型风险评分的AUC值最大。这证明预后模型较临床因素具有更高的预测性能。以上结果表明预后模型的风险评分可以将患者分为不同风险组并准确预测OSCC患者预后。通过Cox回归分析评价风险评分和临床因素的独立预后能力,结果证明风险评分可以作为OSCC的独立预后因素。上述结果在测试集中均得到了证实。但本研究属于回顾性研究,且仅分析了来自于公共数据库的基因表达谱,在以后的研究中还需要对OSCC发生、发展和转移过程中的分子机制进行进一步探索。

综上所述,本研究结果表明,以10个DEGs为基础的预后模型是预测OSCC患者OS的可靠工具,它可以帮助临床医生为OSCC患者选择个性化的治疗方案。

猜你喜欢
预测基因因素
无可预测
腹部胀气的饮食因素
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
Frog whisperer
四大因素致牛肉价小幅回落
修改基因吉凶未卜
基因
短道速滑运动员非智力因素的培养