基于生物信息学的乳腺癌治疗药物的筛选及其分子机制研究

2019-05-21 02:47廖思帆吴丽媛梁碧怡李焕丹周漩
广东药科大学学报 2019年2期
关键词:棉酚白藜芦醇黄素

廖思帆,吴丽媛,梁碧怡,李焕丹,周漩

(广东药科大学药学院,广东 广州 510006)

乳腺癌是女性常见的恶性肿瘤之一,发病率和死亡率居妇女各类恶性肿瘤之首,严重威胁着女性的身体健康[1]。近年来乳腺癌的治疗手段不断发展,手术治疗、化学治疗、靶向治疗等多种临床治疗手段已经日趋成熟,但由于乳腺癌本身具有高度异质性[2]及易转移性等特点,乳腺癌患者的死亡率仍然得不到有效的控制。因此,筛选更有效的乳腺癌治疗药物,延长病人的生存期和降低乳腺癌的死亡率,具有重要意义。

传统的药物研发是一个复杂而漫长的过程,需要耗费大量的人力物力,才能找到较为行之有效的候选药物。基因表达谱芯片可以同时观察成千上万个基因在不同个体、不同组织、不同发育阶段的表达状况[3],根据基因在不同条件下的表达差异性来进行药物筛选,可为药物研发提供方向,加快药物的发现。

因此,本文采用生物信息学方法对乳腺癌相关基因表达谱数据进行挖掘分析,筛选乳腺癌候选治疗药物,并对筛选得到的候选药物进行生物学通路、作用靶点等分析,研究其分子机制,加快乳腺癌药物研发的进程,为乳腺癌临床治疗研究提供理论参考。

1 数据集

本文研究所用的乳腺癌基因表达谱数据来自于NCBI的GEO数据库(https://www.ncbi.nlm.nih.gov/ geo/)的GPL570平台,包括GSE29044、GSE42568、GSE9309和GSE50428。其中,GSE29044包括73个乳腺癌组织与36个正常乳腺组织,共109个样本;GSE42568包括104个乳腺癌组织与17个正常乳腺组织,共121个样本;GSE9309包括128个乳腺癌组织与9个正常乳腺组织,共137个样本;GSE50428包括26个乳腺癌组织与5个正常乳腺组织,共31个样本。

2 方法与结果

2.1 筛选差异基因

GEO2R[4]是一个在线的芯片分析工具,可用于比较两组或多组样品的差异表达基因。本文采用GEO2R对前述4个样本集分别进行基因差异表达分析,将样本分为正常组与癌症组,以P<0.01筛选得到差异基因,根据筛选所得差异基因对应的LogFC值,>2的即为上调基因,<-2的即为下调基因。对4个样本集的差异基因取交集,获得共同差异表达基因138个,其中上调表达基因12个,下调表达基因126个(见表1)。

2.2 CMAP筛选候选治疗药物

为了筛选有价值的乳腺癌候选治疗药物,采用Connectivity Map[5]对上述共同差异基因进行分析,在基因水平上对药物进行筛选。CMAP是一个药物作用基因表达数据库,搜集了大量小分子药物处理过的肿瘤细胞表达谱的变化模式。CMAP可通过比较正常样本与肿瘤样本的基因表达差异,基因富集分析算法得到相关药物,当富集分数为负数时,意味着此药物能够反向作用于差异表达模式,以此筛选与肿瘤相关的药物。以乳腺癌差异表达基因为query signature,与CMAP数据库中的药物基因表达谱数据进行配对,筛选得到的药物相关实验次数越多,负性富集分数越高,其与乳腺癌的相关性越强。按实验次数大于3,富集分数小于-0.5进行筛选,得到100多个相关药物,这些药物可较好地逆转乳腺癌的基因表达谱。

表1 4个数据集的共同差异表达基因Table 1 Common differential expression genes in four datasets

筛选得到的候选治疗药物中,部分药物为已知抗肿瘤药物(见表2),其中甲氨蝶呤是已知明确的乳腺癌治疗药物,说明了筛选结果的可靠性。此外,筛选得到的药物还包括有激素类药物,如甲羟孕酮、左炔诺孕酮等;抗菌类药物,如克霉唑、硫链丝菌肽等;抗病毒类药物,如三氟尿苷、阿糖腺苷等;抗组胺类药物,如地普托品等;心血管类药物、抗抑郁类药物等。

表2 筛选得到的候选治疗药物中已知抗肿瘤药物Table 2 Known anti-tumor drugs of the screened candidate therapeutic drugs

筛选得到的候选治疗药物中,已知的具有抗肿瘤作用的药物应为后期研究的重点。本文从实验次数、富集分数、已知抗肿瘤作用等多方进行比较,首先选择了白藜芦醇、芹黄素、棉酚3个药物进行其抗乳腺癌分子机制的研究。其中,白藜芦醇和芹黄素已有报道其干预乳腺癌细胞的实验研究,但并未成为正式的乳腺癌治疗药物;而棉酚则只报道了抗其他肿瘤的作用。本文采用生物信息学方法,分析这些药物的靶蛋白及其与乳腺癌相关基因的相互关系,研究其治疗乳腺癌的分子机制,为药物治疗乳腺癌提供理论依据,也为其他药物的进一步分析和筛选提供思路。

除了表2中的已知抗肿瘤药物,候选治疗药物中的其他类药物也同样具有可能的抗乳腺癌作用。部分糖皮质激素和雌激素已被证明有抗肿瘤活性,其中甲羟孕酮是明确的乳腺癌治疗药物。抗菌类药物可通过干扰和抑制细胞的生长繁殖过程而杀灭细菌和病原微生物,而近年来研究发现,抗生素对于癌细胞也具有相同作用,对有癌变趋势的细胞使用抗生素,可抑制癌细胞的生长与扩散,表现出抗癌活性。抗病毒药物可用于治疗或辅助治疗恶性肿瘤,而抗组胺药能够干扰髓源性抑制细胞的功能,亦有可能成为候选抗癌药。心血管类药物目前没有发现有直接的抗癌作用,可能是因为某些癌症治疗药物具有心血管毒性,引发心血管并发症从而使癌症病人的基因表达谱与心血管类药物的治疗谱类似;抗抑郁类药物亦可同理解释,这两类药物具有抗癌活性的可能性相对较小。

2.3 候选药物抗乳腺癌机制分析

2.3.1 药物靶蛋白 在NCBI的PubChem Compound[6]中,分别搜索白藜芦醇、芹黄素、棉酚的靶蛋白,白藜芦醇得到NQO2等95个靶蛋白,芹黄素得到ESR1等48个靶蛋白,棉酚得到THRB等50个靶蛋白。

在Genecard[7]数据库中寻找已知与乳腺癌相关基因,得到了BRCA1等308个乳腺癌相关基因。

2.3.2 靶蛋白String分析 String[8]是1个由已知或预测的蛋白质相互作用数据组成的数据库(基因则被识别为相应的编码蛋白质),它主要用于构建蛋白质相互作用网络,并通过联合其他平台进行GO和KEGG富集等分析,有助于挖掘核心的调控基因。分别对各药物的靶蛋白以及乳腺癌相关基因进行String分析,寻找各药物靶蛋白与乳腺癌相关基因之间的共同KEGG通路和位点,结果见表3。共同通路可以反映药物发生治疗作用的生物通路,共同位点则应为药物可对乳腺癌发生作用的关键靶蛋白,如白藜芦醇可能通过作用于AKT1、TP53、PTGS2等位点来发生抗乳腺癌作用。表3中共同位点包括有,BRCA1、ESR1等典型乳腺癌基因,说明了本文筛选候选治疗药物结果的合理性,其他位点则为乳腺癌靶向治疗提供了新的参考方向。靶向治疗特异性强,效果显著,针对乳腺癌发生、发展有关的信号通路进行靶向药物的开发与临床应用亦是乳腺癌治疗研究的热点[9]。

Cytoscape[10]是1个生物网络的综合分析和可视化工具,它的中心组织原则是1个网络图,其中生物实体(如基因、蛋白质等)为节点,生物相互作用表示为节点之间的边。采用cystocape软件对各药物的靶蛋白相互作用网络进行可视化及拓扑结构分析,分析网络中的中心节点(度数和介数高的基因),结果见图1和表4。这些网络中心节点在网络中起到关键调控作用,部分与表3中的关键靶蛋白重合,进一步说明了这些靶蛋白的重要性;而与关键靶蛋白未发生重合的网络中心节点,则应是通过调控关键靶蛋白而间接实现药物作用。

表3 各药物靶蛋白String-KEGG通路富集分析结果Table 3 String-KEGG pathway enrichment analysis of target proteins of the screened drugs

A.白藜芦醇; B.芹黄素; C.棉酚。

3 小结

本文采用生物信息学方法,从GEO数据库中收集与乳腺癌相关的基因表达谱数据并进行分析,筛选乳腺癌候选治疗药物。筛选得到的药物主要包括有以白藜芦醇、芹黄素、棉酚为代表的抗肿瘤类药物,还包括激素类、抗菌类等药物,这些药物可较好地逆转乳腺癌的基因表达谱,有望成为乳腺癌的候选治疗药物或辅助治疗药物,对乳腺癌的治疗研究具有重要意义。此外,本文还对白藜芦醇、芹黄素和棉酚进行了药物抗乳腺癌机制的研究,分析药物治疗乳腺癌的作用靶点,为乳腺癌靶向治疗提供了新的参考方向。

猜你喜欢
棉酚白藜芦醇黄素
醋酸棉酚对人舌鳞癌Cal-27细胞侵袭性作用的实验研究
醋酸棉酚旋光异构体的制备及其含量测定研究
高效液相色谱法同时测定棉籽油中游离棉酚及其降解产物四甲氧基棉酚含量
穿越时光的黄素石楼
当药黄素抗抑郁作用研究
棉籽中棉酚的危害及检测方法的研究进展
氧化白藜芦醇对小鼠肝癌淋巴结转移的抑制作用
当药黄素对H2O2诱导PC12细胞损伤的保护作用
漆黄素固体分散体的制备
白藜芦醇通过上调SIRT1抑制阿霉素诱导的H9c2细胞损伤