基于TCPA数据库分析宫颈癌蛋白表达及其临床意义

2022-02-13 10:45王文湛阴克强张三元
中国生育健康杂志 2022年1期
关键词:宫颈癌通路蛋白

王文湛 阴克强 张三元

宫颈癌作为仅次于乳腺癌的发展中国家女性第二大常见恶性肿瘤,主要包括宫颈鳞状细胞癌和宫颈腺癌,其中腺癌占20%~25%[1-2]。近年来随着宫颈癌筛查的普及与HPV疫苗的应用,宫颈鳞癌的发病率有下降趋势,而宫颈腺癌的发病率呈上升趋势,且趋于年轻化[3],腺癌组织病理学复杂、预后差,其早期诊断与预后判断显得尤为重要。

癌症基因组图谱(the cancer genome alas,TCGA)是目前使用广泛、数据维护相对成熟完善的公共组学数据库,随着后基因组时代、蛋白质组学、代谢组学研究的不断深入,利用生物信息学方法处理海量数据,对肿瘤发生发展增加宏观、整体化的认识成为了目前的重要趋势,国内外诸多肿瘤领域专家基于TCGA等数据库在寻找潜在的肿瘤预后、早期筛查、发生发展相关的肿瘤分子标志物等方面进行了大量研究[4-5],本文基于癌症蛋白质组图谱(the cancer proteome atlas,TCPA) 数据库及TCGA数据库中的宫颈癌蛋白表达与临床预后数据进行分析,以期寻找宫颈癌预后相关蛋白,并构建风险模型预测宫颈癌预后。

资料与方法

1.数据收集:从TCPA数据库(https://www.tcpaportal.org/)下载v4.2版本的的CESC患者肿瘤的的反相蛋白芯片(reverse-phase protein arrays,RPPA) 的level 4数据,Dataset ID 为TCGA- CESC -L4,Platform 为MDA_RPPA_Core,共171个样本的220个蛋白的数据。TCGA数据库(https://portal.gdc.cancer.gov/,检索时间:2020.6.22)下载CESC患者的临床资料,共307例患者。

2.蛋白表达与宫颈癌预后分析及风险模型构建:将蛋白数据与生存资料合并,根据蛋白表达量的中位值将患者分为高表达和低表达两组,使用Kaplan-Meier方法进行高低表达组之间的总生存期(overall survival,OS)的比较,并作log-Rank检验,检验标准为P<0.05。同时使用单因素Cox比例风险模型分析蛋白表达与OS的关系,检验标准为P<0.05,并绘制火山图。将同时符合log-RankP<0.05和CoxP<0.05的蛋白筛选出来并使用多因素Cox比例风险模型分析,以向前法和向后法进行筛选,绘制模型蛋白生存曲线,并计算出风险得分,以风险得分中位值为界分为高低风险两组,并绘制风险生存曲线和风险曲线热图。

3.风险模型的独立预后分析:将风险得分与临床资料合并,并删除临床资料不完整及不确定的数据,共得到78例患者的数据,风险值与患者临床病理学特征的关系采用χ2检验,检验标准为P<0.05。并进行单因素及多因素Cox比例风险模型分析风险模型的预后作用,检验标准为P<0.05。利用受试者工作特征曲线(receiver operator characteristic curve,ROC),评价风险值在诊断宫颈癌中的灵敏度和特异度,ROC曲线下面积(area under the ROC curve,AUC)评估模型效能。

4.统计学处理:所有的统计分析均在R 3.6.3中进行。KM分析及Cox分析采用survial包,火山图绘制采用ggplot2及ggrepel包,风险热图绘制采用pheatmap包,ROC曲线绘制采用survialROC包。

结果

1.蛋白表达与宫颈癌预后分析及风险模型构建:单因素分析显示与宫颈癌预后相关的高风险蛋白有ACC1、ASNS、BCLXL、BID、CRAF_pS338、CYCLIND1、FASN、HER3_pY1289、MEK1_pS217S221、MIG6、MRE11、NCADHERIN、PAI1、RAB11、RAD51、SMAD3、STATHMIN、X1433BETA、X4EBP1_pT70、YAP等20种蛋白,低风险蛋白Bcl-2、CD31、CHK1_pS345、ERALPHA_pS118、JAK2、KU80、PDK1_pS241、SF2等8种蛋白(图1)。单因素及多因素分析及KM分析筛选出来的与预后显著相关的纳入风险模型的蛋白有7个,其中Bcl-2为低风险蛋白(图2a),CRAF_pS338、CYCLIND1、MEK1_pS217S221、SMAD3、X4EBP1_pT70、YAP为高风险蛋白(图2b-2g)。风险生存曲线显示风险得分与预后显著相关(图2h),高低分险5年生存率分别为0.547(95%CI:0.398~0.750)、0.813(95%CI:0.681~0.971)。风险曲线热图显示CYCLIND1、MEK1_pS217S221、SMAD3、X4EBP1_pT70、YAP、CRAF_pS338为高风险蛋白,Bcl-2为低风险蛋白(图3)。

图1 宫颈癌预后相关的蛋白表达

图2 蛋白表达与宫颈癌预后的生存曲线

图3 宫颈癌预后的风险曲线

2.风险模型的独立预后分析:单因素分析显示,风险得分与预后显著相关(表1)。多因素分析显示,风险得分与预后显著相关(表1)。风险得分的AUC为0.919(图4)。

表1 宫颈癌风险模型的独立预后分析

图4 风险模型的ROC曲线

讨论

本文通过单因素分析显示与宫颈癌预后相关的高风险蛋白有ACC1、ASNS、BCLXL、BID、CRAF_pS338、CYCLIND1、FASN、HER3_pY1289、MEK1_pS217S221、MIG6、MRE11、NCADHERIN、PAI1、RAB11、RAD51、SMAD3、STATHMIN、X1433BETA、X4EBP1_pT70、YAP等20种,低风险蛋白Bcl-2、CD31、CHK1_pS345、ERALPHA_pS118、JAK2、KU80、PDK1_pS241、SF2等8种。主要集中在肿瘤代谢、细胞周期、凋亡调控、细胞运动等肿瘤研究领域,与肿瘤的发生、发展、侵袭、转移、耐药等过程密切相关。

最终发现纳入风险模型的CYCLIND1、MEK1_pS217S221、SMAD3、X4EBP1_pT70、YAP、CRAF_pS338六种蛋白作为高风险蛋白。CYCLIND1系典型的细胞周期G1/S期调控蛋白,G1/S期作为细胞周期中信号传递及细胞增殖的关键调控窗口。CYCLIND1促细胞周期不断G1/S转化从而使细胞持续分裂致瘤。有研究[6]表明,CYCLIND1的高表达通常提示宫颈癌预后不良。张倩雯[7]等的研究表明,CIN和宫颈癌中CYCLIND1蛋白表达率高于正常组。周密[8]等的研究表明,宫颈癌新辅助化疗后CYCLIND1阳性率降低,且其为影响新辅助化疗效果的影响因子。分析可能机制为G1/S转化致DNA异常转录,对化疗敏感性降低。这与我们的研究其作为模型蛋白中的高风险蛋白一致。MEK是一类参与丝裂原活化蛋白激酶 (mitogen-activated protein kinase,MAPK)信号转导的酶家族,已鉴定出7种。其中MEK1、MEK2参与RAS/RAF/MEK/细胞外信号调节蛋白激酶(extracelluar regulated protein kinase,ERK)通路,并最终激活效应分子ERK1/ERK2参与线粒体途径的凋亡,该通路的过度激活可致细胞恶性增生[9]此外,作为线粒体凋亡途径中的凋亡抑制分子Bcl-2和促凋亡分子Bax均受到ERK1/2的调节,活化的ERK1/2使BCL-2表达增多、Bax表达抑制,进而通过BCL-2和Bax对线粒体凋亡途径进行抑制,增强细胞抗凋亡能力,促进细胞生长。预后模型中的蛋白作为经典肿瘤信号通路互相调控的节点或可反映肿瘤信号网络的核心调控过程。作为肿瘤发生、发展及转移浸润密切相关的转化生长因子β(Transforming growth factor-β,TGF-β)信号传导途径的下游信号分子,Smads蛋白家族在宫颈癌细胞的分化、增殖过程中有着重要的意义。韦荣飞等[10]的研究表明Smad3在乳腺癌、肺癌、宫颈癌中均可促进肿瘤细胞迁移。TGF-β信号通路在肿瘤的进展中起着双相的作用,在初期通过影响细胞周期抑制肿瘤生长。肿瘤进展中,这种抑制作用逐渐减弱甚至消失,使得肿瘤细胞出现生长优势。这可能与该传导路中传导元件突变有关[11]。4EBP1是eIF4E的特异性抑制分子,被PI3K/AKT磷酸化为p-4EBP1后失去对eIF4E的抑制作用,进而通过eIF4E的转录因子活性来调控多种基因的表达,作为PI3K/AKT/mTOR这一具有广泛生物学效应信号通路的关键介质,陈凤霞等的研究[12]表明,p-4EBP1在宫颈癌组织中的含量显著高于癌旁病灶组织及宫颈上皮内瘤变组织。同时观察到与宫颈癌旁病灶及宫颈上皮内瘤变组织相比,宫颈癌病灶组织中的CyclinD1 mRNA表达量显著升高,这与本研究模型中高风险蛋白同时包含了4EBP1、CyclinD1相一致,也体现了蛋白表达在宫颈癌病理生理过程可视化中的意义,蛋白表达的改变必然适于功能的需要或者说功能是通过蛋白的改变来实现的。刘兰等[13]的研究表明EBP1在癌组织中的表达明显高于癌旁组织,且表达与肿瘤的临床分期及淋巴结转移等预后相关因素密切相关。这也与本研究最终将该蛋白纳入预后模型一致。YAP作为经典肿瘤信号通路Hippo通路的核心效应分子,目前被普遍认为是原癌基因,在多种癌症中均检测到了YAP的高表达现象,王文慧[14]等的研究表明:YAP1在宫颈癌组织呈高表达,其表达与临床分期、是否淋巴结转移关系密切,为宫颈癌的独立预后影响因素,高表达YAP1的宫颈癌患者预后差。这与本研究模型的研究结果相一致。CRAF是RAF激酶家族的重要成员,可通过激活下游的MEK/ERK信号通路调节细胞增殖及肿瘤耐药[15],但其在宫颈癌中的研究尚少。

BCL-2家族于1988年发现,作为目前研究最深入、广泛的经典凋亡调控基因,严格调控细胞的凋亡机制。在本研究的模型中,Bcl-2蛋白作为低风险蛋白,随着表达量的增高,患者风险值降低。现有的研究表明,在多种人类肿瘤中,均出现了Bcl-2蛋白的过表达[16]。作为凋亡调控基因其机制在于限制细胞的死亡。目前普遍认为Bcl-2的表达水平随着CIN等级升高,但与这些研究相反,Shukla等的研究表明[17]Bcl-2的表达随着CIN等级的升高而降低。Bcl-2在宫颈癌进展中的意义尚存在争议。本研究结果中Bcl-2作为低风险蛋白是在本文数据库分析中,以风险模型及风险值分析方法下的结果。具体其在宫颈癌发生、发展中的意义尚需进行更加深入的研究。

本研究中,单因素分析所得到的与预后相关的蛋白种类众多,而最终形成预后模型的蛋白仅剩7种,这可能与纳入模型的蛋白处于宫颈癌病理生理过程中的核心过程,与这些蛋白所涉及信号通路的网状调控相关。这也与我们目前的认识相一致,在肿瘤发展过程中,多种功能协同的信号通路及核心蛋白的改变呈现出协同化态势以适应肿瘤的发生、发展、浸润、转移等生物学行为。

目前随着宫颈癌疫苗及筛查手段的广泛普及,宫颈癌的防治效力已得到了极大改善,但早期、内生型宫颈癌的诊断应临床表现不典型、阴道镜评估不满意,存在一定漏诊率,此外由于宫颈在生育中所承担的重要作用,早期提供预后相关信息对保留生育功能等临床决策十分重要。肿瘤作为一种多病因学且异质性极高的基因病,在现代肿瘤学领域对其认知已进入到不同疾病、不同条件下全基因组广度的基因、RNA、蛋白质等的表达谱数据近乎完整捕获的时代,这为从整体发展上把握肿瘤病理生理学的分子机制奠定了基础,而大量的生物信息学分析方法将低通量所不易捕捉到的分子活动特征涉及的海量数据进行了挖掘,为目前对肿瘤病理生理学的进一步认识提供了新的研究方向。本文中基于对数据库蛋白与预后数据的分析所构建的风险模型作为宫颈癌的独立预后因子,AUC为0.804,具有良好的预后预测价值。目前众多蛋白已被初步明了其在各类肿瘤中的表达量改变、原癌或抑癌效应、在多种信号转导通路中所扮演的角色、上下游信号的调控、多种通路之间的网状调控效应以及与临床病理学特征的关系,但这对理解肿瘤的发生及后续的研究来说远远不够,无法获取整体视野的认知。本文中所构建的模型为进一步认识、研究海量蛋白质改变及其背后的信号转导通路与预后之间的关系提供了一种新的思路。但因其仅作为基于TCPA数据库所涵盖检测样本数据的分析与构建,数据涵盖的人种、肿瘤的具体分期、病理类型均十分复杂,与中国真实世界的数据之间匹配性如何不得而知,因此该预后模型仅可作为初步的理论探索,后续仍需在中国宫颈癌患者中进一步验证其蛋白表达并进行预后随访,建立自己的数据库,在我国的真实世界数据库中进行模型的预后检测效能验证,方可进一步评估该模型的预后判断效能,以期为宫颈癌早期检测、预后判断提供可靠靶点与证据。

猜你喜欢
宫颈癌通路蛋白
DJ-1调控Nrf2信号通路在支气管哮喘中的研究进展
基于改进TF-IDF算法的基因通路富集方法
AngⅡ激活P38MAPK信号通路在大鼠NSAID相关小肠损伤中的机制研究
RNA结合蛋白与恶性肿瘤发生发展关系的研究进展
锌指蛋白与肝细胞癌的研究进展
细砂糖对法式蛋白糖的质量影响研究
中国首个宫颈癌疫苗厦门诞生
如何选择不同效价的宫颈癌疫苗?
水通道蛋白的发现
宫颈癌术前介入治疗22例近期疗效分析