卵巢子宫内膜异位症病灶组织黏附相关基因与通路分析

2021-08-31 05:55倪喆鑫毕艳丽孙帅程雯俞超芹
中国生育健康杂志 2021年5期
关键词:差异基因卵巢内膜

倪喆鑫 毕艳丽 孙帅 程雯 俞超芹

子宫内膜异位症是一种雌激素依赖性疾病,其特征是子宫内膜基质细胞与腺细胞在子宫被覆粘膜及子宫肌层以外部位种植生长,影响着10~15%的育龄妇女[1]。患者遭受着不同程度的影响,如痛经、月经紊乱、不孕等,也会造成不良妊娠结局的发生[2-3]。卵巢子宫内膜异位症由于内膜组织在卵巢部位种植生长导致,通常以囊肿形式存在并对卵巢功能存在不利影响[4]。虽然该病的病理诊断已经明确,但发病机制仍存在争议,可能与遗传、表观遗传、环境因素和免疫功能紊乱等多种因素有关[5]。

在该病众多发病机制学说中,经血逆流学说最为广泛接受。随着月经血逆流,内膜组织碎片会沿着子宫-输卵管-腹腔方向前进,在特定部位特定条件下种植生长[6]。在这一过程中,组织细胞间的黏附作用极为重要。为此,本研究拟从Gene Expression Omnibus数据库(GEO)中挖掘卵巢内异症病灶组织差异表达基因,聚焦黏附相关差异基因,从基因差异角度出发,探讨经血逆流学说中内膜组织黏附种植的可行性与现实性。

资料与方法

1.基因芯片的选取以及差异基因的筛选:研究利用美国国立生物技术信息中心(National Biotechnology Information Center, NCBI)的Gene Expression Omnibus (GEO)数据库(http://www.ncbi.nlm.nih.gov/geo/)进行基因数据的搜索与筛选。选择检索式为((ovary endometriosis) OR (ovarian endometriosis)) AND "Homo sapiens"[porgn:__txid9606],搜索限定条件为Expression profiling by array,tissue。搜索时间为2019年10月8日。利用GEO的R语言分析工具GEO2R进行分析,利用变化倍数(fold changes,FC)判定基因差异大小,取logFC绝对值>2,多次试验调整后的P(adj.P)<0.05的基因,得到两组相关差异基因与数据。利用value distribution软件计算所选样本的值数据分布,以显示值数据是否在样本中居中,从而适合交叉比较。

2.差异基因生物学功能及KEGG通路分析:将得到的差异基因去重,并删除无对应Gene symbol的基因片段后,利用功能注释生物信息学芯片分析技术(Functional Annotation Bioinformatics Microarray Analysis,DAVID)(https://david.ncifcrf.gov/)对所有差异基因进行ID转换。利用Functional Annotation Tool对所有差异基因进行GO(gene ontology)生物学过程富集分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析,找出最显著富集的功能注释。基因富集程度用EASE评分(修正Fisher精确检验P值)表示,范围从0到1。修正Fisher精确检验P值等于0表示完全富集。通常P值≤0.05,在注释类别中被认为是非常丰富的。

3.黏附相关基因筛选与通路图制作:在GO生物学过程富集以及KEGG通路富集分析的基础上筛选出黏附相关基因,利用文氏图在线工具(http://bioinfogp.cnb.csic.es/tools/venny/index.html)筛选出两部分共同基因。利用GEO2R分析这些基因在每个样本中的表达情况,然后用在线KEGG 数据库(http://www.kegg.jp/kegg/pathway.html)找出密切相关的通路。

结 果

1.差异基因筛选:共检索到12篇相关文献,通过PubMed数据库逐一阅读后,最终纳入研究涉及GEO平台为GPL571,实验组为GSE25628,卵巢异位内异症病灶组织样本7个(设为OEM组),正常内膜组织样本6个(设为CON组)。所选样本值数据在样本中居中,适合交叉比较(图1)。经筛选后,在OEM样本中符合logFC绝对值>2,adj.P<0.05的上调基因有247个,下调基因有321个。

图1 所选样本值数据分布图Figure 1 Data distribution of selected sample values

2.差异基因生物学过程及通路富集分析:运用在线生物学信息注释数据库DAVID,对上述差异基因进行GO生物学过程富集分析,其中细胞粘附、血管生成、炎症反应等35个生物学过程显著富集(表1)。对上述差异基因进行KEGG信号通路富集注释,共得到13条有显著富集的KEGG通路,主要包括血管平滑肌收缩、局灶性粘连和细胞粘附分子等(表2)。

表1 差异表达基因生物学过程富集分析结果Table 1 Results of Gene Ontology analysis on differentially expressed genes

表2 差异表达基因相关KEGG通路分析结果Table 2 Results of KEGG pathway analysis on differentially expressed genes

3.细胞黏附相关基因及KEGG通路:GO生物学过程富集分析发现细胞黏附(cell adhesion)涉及差异基因数目最多(7.7%),而在KEGG通路富集分析中局灶性粘连(Focal adhesion)相关基因最多(3.0%)。将两部分相关基因罗列分析,利用文氏图在线工具筛选发现THBS1、VWF、THBS2等8个基因(排除名称转换过程中相同基因)在两种黏附相关分析过程中均涉及。通过GEO2R在线分析发现,卵巢内异症病灶组织中THBS1、VWF、THBS2、COMP、COL5A1、COL6A2和ITGA7显著上调,而ITGB8显著下调(图2)。在此基础上,对这8个基因进一步用KEGG 数据库工具明确相关通路情况,发现与细胞外基质受体相互作用(ECM-receptor interaction)、局灶性粘连(Focal adhesion)和PI3K-Akt 信号通路(PI3K-Akt signaling pathway)这3条通路密切相关。

图2 黏附相关基因在各样本中表达情况Figure 2 Expression degree of adhesion genes in each sample

讨 论

本研究通过现有数据挖掘发现,卵巢内异症病灶组织中表达差异显著的基因较多(568个)。利用GO生物学过程富集分析筛选显著差异生物学过程35个;利用KEGG通路富集分析筛选出显著差异通路13条。在此基础上,进一步综合两种分析结果,筛选出黏附密切相关基因8个,分别为THBS1、THBS2、VWF、COMP、COL5A1、COL6A2、ITGA7和ITGB8。

THBS1别名TSP、THBS、TSP1、TSP-1,其编码的蛋白质是一种粘附性糖蛋白,可通过CD36-和CD47-介导的一氧化氮(NO)信号抑制以及调节血管内皮细胞生长因子(VEGF)[7]的活性和生物利用度,直接抑制血管生成。THBS2与THBS1共有80%的蛋白质序列,但THBS2是一种控制内皮细胞凋亡增殖平衡的基质细胞蛋白,与肿瘤血管生成有关[8]。THBS2通过直接影响内皮细胞的迁移、增殖、存活和凋亡以及拮抗VEGF活性来抑制血管生成[9]。在内膜组织成功黏附特定部位后,需要新生血管来维持。在这一过程中,血管生成这一生物过程尤为重要。本研究中卵巢内异症病灶已具备丰富的血管提供营养支持,而THBS1和THBS2上调可认为是机体抑制病灶血管生成的自我调节过程。在内异症诊断方面,监测THBS1和THBS2编码蛋白水平增高程度也许能够成为一种判断内异症病情程度的有效辅助手段。

VWF别名VWD、F8VWF,能够编码一种参与止血的糖蛋白,在血小板与血管损伤部位的粘附和血液中各种蛋白质的转运中发挥作用[10],更是正常血管生成的关键调节因子[11]卵巢内异症病灶存在周期性出血的疾病特征,伴随着局部病灶血管的破坏与再生。VWF上调提示病灶内血管生成活动活跃,VWF在促进卵巢内异症发生发展过程中起着重要作用。

COMP别名MED、EDM1、EPD1、TSP5、PSACH、THBS5,编码的蛋白是一种非胶原细胞外基质蛋白,属于基质金属蛋白酶的一种,可降解细胞外基质的成分[12],有研究显示结肠癌组织中COMP的表达水平明显高于癌旁正常组织,并通过激活PI3K/Akt/mTOR/p70S6K通路部分促进结肠癌细胞增殖[13]。本次研究发现,卵巢内异症病灶中COMP显著上调,这可能与COMP编码蛋白加大对内膜基质细胞外基质破坏作用,促进内异灶生长密切相关。此外,COMP编码的蛋白很可能通过激活异位基质细胞PI3K/Akt通路,从而促进该种细胞增殖。

V型胶原蛋白的α1链是由COL5A1编码[14]。V型胶原蛋白占到总胶原含量的1%到5%之间,能够影响胶原原纤维形成和直径[15],从而影响非软骨结缔组织的构成[16]。COL6A2编码VI型胶原的三个α链中的一个,而VI型胶原是一种在大多数结缔组织中发现的珠状纤维胶原,可与多种细胞膜和细胞外基质蛋白相互作用[17]。这两种基因在病灶中都显示上调,并可能在逆流的内膜组织碎片中也存在上调,促进了组织碎片的局部黏附,在构成和维持病灶起了很大作用。

整合素是由α链和β链组成的异二聚体膜蛋白,介导广泛的细胞-细胞和细胞-基质相互作用,从而在细胞迁移、形态发育、分化和转移中发挥作用[18]。ITGA7编码的蛋白质属于整合素α链家族而ITGB8编码的蛋白质是整合素β链家族的一员。在研究中发现,虽然ITGA7与ITGB8同属于整合素相关基因,却在卵巢内异症病灶组织中成相反的变化。鉴于研究的是已经形成并稳固的内异灶,推测在一定程度上ITGA7可能与病灶形成后的维持相关,而ITGB8可能与病灶早期的黏附相关。

由于目前卵巢内异症组织与正常内膜组织的基因芯片数据较少,本次研究纳入的数据有限,并受限于该基因芯片的完成时间较早,可能存在诸多不足。但本次研究在一定程度上表明,上述8个黏附相关基因在内异症形成和发展过程中起着重要作用。本次研究只讨论了黏附相关基因,而上文提示有显著性差异基因多达几百个,涉及生理生化的方方面面,这需要在下一步研究中继续挖掘与分析。但值得注意的是,本研究从生物信息学角度探究了随经血逆流内膜组织黏附种植发展成为卵巢内异症的可能性,为经血逆流学说提供了基因角度证据,对内异症的临床和基础研究具有一定积极意义。

猜你喜欢
差异基因卵巢内膜
miR-145通过调控人子宫内膜基质细胞OCT4的表达促进子宫内膜异位症的发展机制
保养卵巢吃这些
绝经后子宫内膜增厚别大意
子宫内膜增厚需要治疗吗
卵巢早衰,可以自然怀孕吗
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析
紫檀芪处理对酿酒酵母基因组表达变化的影响
卵巢按摩保养效果没想得那么大
SSH技术在丝状真菌功能基因筛选中的应用