生物信息学一致性相关系数法预测非小细胞肺癌的NP化疗方案药物敏感性基因*

2021-02-04 02:55王卓智陈秋月韩勇陈永孜黄怡菲龚卫静徐双兵李居怡邓艾平刘亚妮曾芳吕永宁张玉
医药导报 2021年2期
关键词:细胞系敏感性长春

王卓智,陈秋月,韩勇,陈永孜,黄怡菲,龚卫静,徐双兵,李居怡,邓艾平,刘亚妮,曾芳,吕永宁,张玉

(1.天津医科大学生物医学工程与技术学院,天津 300070;2.华中科技大学同济医学院附属协和医院药学部,湖北省重大疾病精准用药医学研究中心,武汉 430022;3.天津医科大学肿瘤医院肿瘤细胞生物学实验室,天津市肿瘤防治重点实验室,国家肿瘤临床医学研究中心,天津市恶性肿瘤临床医学研究中心,天津 300060;4.华中科技大学同济医学院附属协和医院肿瘤科,武汉 430022;5.武汉市中心医院,武汉 430024)

肺癌是全球常见的恶性肿瘤之一。肺癌包括两种主要的组织学类型:小细胞肺癌(small cell lung cancer,SCLC)和非小细胞肺癌(non-small cell lung cancer,NSCLC)。其中,NSCLC是常见的组织学类型,占肺癌总病例的80%[1]。NSCLC是一种高度异质性疾病,患者对化疗敏感性个体差异较大。近年来有很多研究通过筛选生物标志物(如CTR1、ABCB1等)能够预测NSCLC患者化学治疗(化疗)的生存情况[2-6]。但这些生物标志物基于较少临床样本量的检测与验证,且每项研究用于检测和分析的备筛选生物标志物数量有限。由于NSCLC在早期无典型症状,患者确诊时多以中晚期为主[7]。长春瑞滨+顺铂序贯化疗治疗方案(NP方案)是晚期NSCLC的一线化疗方案,临床研究表明,NP 方案可显著延长晚期患者的生存期(P<0.001)[8-9]。本研究利用生物信息学中的一致性相关系数(concordance correlation coefficient,CCC,或ρc)从GEO和NCI 60等生物学信息数据库的高通量基因信息中,筛选多类型细胞系与NSCLC癌症样本中表达一致的基因[10],对NSCLC的NP方案药物敏感性基因进行预测和分析,为将来结合临床样本进一步构建、验证和优化NP方案精准化疗模型提供研究基础。

1 数据与方法

1.1数据来源 从美国国家癌症研究所网站(http://discover.nci.nih.gov)下载使用HG-U133A GeneChip阵列分析的NCI 60细胞系数据(Affymetrix)。从NCI数据库获得(http://dtp.nci.nih.gov)NCI 60细胞系50%生长抑制(GI50)的药物敏感性数据。从基因表达数据库 GEO 数据库中下载NSCLC患者数据GSE3593(Potti198,198个NSCLC样本)[11]。平台信息:GPL96[HG-U133A]Affymetrix Human Genome U133A Array。

1.2方法

1.2.1筛选药物敏感性基因 使用5种统计学方法,包括Pearson相关分析、Spearman相关分析、Welch's t-test、协方差分析(ANCOVA)和rank-based ANCOVA,以GI50为临界值,比较两个化疗药物(顺铂和长春瑞滨)对同一细胞系各个基因的不同作用,筛选出这两种药物的敏感性基因。这些基因与体外药物敏感性高度相关或在每种药物的敏感和耐药细胞系之间明显存在差异表达。示意图见图1。

1.2.2筛选CCC基因 使用CCC进行相关分析[10,12-13]。本研究检索GEO和ArrayExpress数据库,限定检索条件“NSCLC;Homo sapiens;Expression profilling by array”筛选出所需NSCLC数据库,选择样本量最大的 Potti198作为研究对象[11]。具体过程简化为3步:①将NCI 60数据库里面的每个基因与剩余其他基因的spearman相关系数定义为CRi,N为基因个数,有CRi={cri-1,cri-2,…,cri-N};②将NSCLC样本Potti198里面每个基因与剩余其他基因spearman相关系数定义为HRi,有HRi={hri-1,hri-2,…,hri-N};③计算每个基因在这两个数据集中的相关系数的相关系数(correlation of correlations),即ρc=r(CRi,HRi),以截断值(cutoff value)为0.1,筛选出一致性相关基因。所有统计分析使用R软件(R Studio,版本1.0.143)分析。经CCC算法分析得到的基因为CCC基因。

1.2.3DAVID通路分析 将5种统计学方法筛选出的基因取合集,导入DAVID 6.8分析工具(https://david.ncifcrf.gov),进行KEGG通路富集分析,条件设定为P<0.01,富集结果使用“ggplot 2”绘制气泡图进行展示。

图1 从细胞系中筛选药物敏感性基因

2 结果

2.1药物敏感性基因的筛选结果 NCI 60细胞系数据用于药物敏感性基因的筛选。筛选出的化疗药物顺铂和长春瑞滨的药物敏感性基因,其生物学功能类型见图2和图3,其数量见表1。

图2 顺铂药物敏感性基因通路富集图

图3 长春瑞滨药物敏感性基因通路富集图

表1 顺铂和长春瑞滨的药物敏感性基因数量

2.2CCC算法分析结果 通过CCC算法分析NCI 60细胞系与 Potti198样本中具有共同表达模式的基因,筛选出可能应用于预测NSCLC化疗药物敏感性的基因。化疗药物顺铂和长春瑞滨的药物敏感性基因数量见表1。除了Welch's t-test 分析未得到长春瑞滨药物敏感性基因外,CCC算法分析结果与药物敏感性基因的筛选结果相似。

2.3基因通路富集分析 将CCC算法分析结果取合集,在DAVID网站进行KEGG通路富集分析,将具有相似功能的基因放到一起,进一步解读基因的功能,作气泡图。P值越小,富集越显著,顺铂的药物敏感性基因主要富集在蛋白聚糖(Proteoglycan in cancer)、细菌侵袭上皮细胞(Bacteria invasion of epithelial cells)中;长春瑞滨的药物敏感性基因主要与癌症信号通路(Pathways in cancer)有关、可能与蛋白聚糖(Proteoglycan in cancer)表达有关。其中具代表性的部分生物学功能和基因见表2。药物敏感性基因通路富集图见图2和图3。

表2 CCC基因的生物学功能

3 讨论

NSCLC是一种异质性疾病,肿瘤异质性一直以来是影响抗肿瘤药物治疗敏感性的一个关键问题,筛选生物标志物能预测患者对化疗的敏感性,能够为临床提供更有效的个体化化疗方案。生物信息学中某些算法可以通过从细胞系中初步筛选出适用于临床精准化疗的肿瘤学生物标志物,如进一步运用临床样本进行模型构建、验证与优化,可为克服肿瘤异质性、提高抗肿瘤药物治疗敏感性提供精准治疗方案。近年来,生物信息学被广泛应用于癌症生物标志物的筛选。ZHU等[14]通过生物信息学中最大化R2算法预测出表征NSCLC患者NP方案化疗预后的基因。CHEN等[15]使用稳健多阵列平均值(robust multi-array average,RMA)算法分析单个基因表达值筛选与NSCLC患者预后相关的恶性风险基因,但这些基因都需要更多的数据集进行验证。

笔者在本研究采用生物信息学中CCC算法,预测NSCLC患者一线化疗NP方案(顺铂+长春瑞滨)的药物敏感性基因。研究中对5种统计方法得到的药物敏感性基因取合集,并通过KEGG通路富集分析,对筛选出的药物敏感性基因功能进行了分类阐释。顺铂能够与DNA分子交叉联结,影响DNA复制,高浓度时也能抑制RNA及蛋白质合成。富集分析后发现药物敏感性基因主要与蛋白聚糖和细菌侵袭通路有关。由性别、烟草史和组织学类型建立的Cox回归模型显示,肺癌组织中蛋白聚糖表达水平高的患者具有较高的生存风险[16]。细菌侵袭通路中PTK2是miR-16-5p 的靶标蛋白,miR-16-5p的过表达抑制了NSCLC细胞的增殖和侵袭[17]。上皮-间质转化(epithelial-mesenchymal transition,EMT)是癌细胞转移和化学耐药所必需的细胞过程,而CRK家族衔接子蛋白有望抵消EMT和化学抗性[18]。长春瑞滨为周期特异药物,抑制微管蛋白的聚合,并使分裂期微管崩解,导致细胞在有丝分裂过程中微管形成障碍。富集分析后发现其药物敏感性基因主要与癌症信号通路有关,可能与蛋白聚糖表达有关。研究显示表麻黄醇A通过抑制癌症信号通路中细胞迁移关键调节剂蛋白激酶B(Akt)的激活,进而抑制肺癌细胞的迁移[19]。SU等[20]研究发现通过直接介导FZD1下调,miR-135b抑制NSCLC的化学耐药性。黄芩素通过靶向RHOA / ROCK信号通路,抑制了NSCLC中血管生成拟态(VM)的形成,发挥抗癌作用[21]。

本研究通过生物信息学中CCC算法初步筛选出可能应用于NSCLC化疗的NP方案药物敏感性基因。但由于可以获得的公开数据集非常有限,目前得到的这些基因只能够作为NSCLC化疗中的候选药物敏感性基因,尚需通过更多的临床研究数据集或临床样本信息进行验证与优化。未来我们将密切关注TCGA、GEO等数据库中含有两种药物治疗信息的新公开数据集;同时,课题组拟开展相关临床研究,收集临床样本,基于上述初筛结果完善相关生物标记物检测并收集与分析患者信息(如人口学信息、预后等各种临床指标),以进一步构建、验证和优化NSCLC的NP方案精准化疗模型[22]。

猜你喜欢
细胞系敏感性长春
CT联合CA199、CA50检测用于胰腺癌诊断的敏感性与特异性探讨
富翁借伞
计及需求敏感性的电动私家车充电站规划
灵动优雅 长春花篮
长春“方舱医院”投入使用
动物细胞培养技术研究现状与思考
去泛素化酶OTUD3调控胆固醇酯化酶SOAT1蛋白稳定性的机制
新媒体时代培养记者新闻敏感性的策略
何为盐敏感性高血压
长春大学教师艺术作品