基于RNA-seq技术对13-三体综合征脐带血差异性表达环状RNA研究

2019-06-04 08:08林南新汤冬娥龚蔚蔚欧明林陈洁晶林华周献青郭辉周俊黄锦龙戴勇
中国产前诊断杂志(电子版) 2019年1期
关键词:文库三体染色体

林南新 汤冬娥 龚蔚蔚 欧明林 陈洁晶 林华 周献青 郭辉 周俊黄锦龙 戴勇*,

(1.广西师范大学生命科学学院,广西 桂林 541004;2.中国人民解放军联勤保障部队第九二四医院肾脏科、 全军器官移植与透析治疗中心、广西代谢性疾病研究重点实验室,广西 桂林 541002;3.暨南大学第二临床医学院、深圳市人民医院临床医学研究中心,广东 深圳 518020)

13-三体综合征,又名为Patau综合征,最早在1960年由Klaus Patau所报道[1]。13-三体综合征发生的主要原因是由于双亲之一的生殖细胞在减数分裂时不分裂所导致[2]。13-三体综合征在新生儿中的发病率约为1/10 000~20 000[3],而且预后很差,90%的新生儿在6个月内死亡,仅有5%的患儿能够活过10岁[4]。其中,13-三体综合征的发生与孕妇的高龄密切相关。至今,13-三体综合征尚未有根治的方法,其复杂的发病机制一直未能阐明,找到可靠的生物标志物对Patau综合征患者及时诊断和治疗显得尤为重要。

13-三体综合征的发生和发展与非编码RNA的异常表达密切相关。约有98%的人类基因组是非编码RNA,这表明它们对生理和病理具有非常重要的作用[5]。circRNA是一类在哺乳动物中广泛表达的非编码RNA,具有不编码蛋白质却能同时调控体内多个基因的功能。circRNA有着结构稳定、序列保守性高、丰度高和组织特异性高的特点[6]。

基因芯片一直以来都是研究转录组学的最重要的工具。但是,基因芯片及技术有着固有的缺陷[7]。近些来随着高通量测序技术的迅猛发展,特别是RNA-seq技术出现,俨然成为了转录组学研究最具有革命性的工具。与基因芯片相比,RNA-seq技术不仅可以获得所有RNA丰富的、准确性较高的转录本,而且对差异表达的基因具有定量更准确、检测范围更广、分析更加可靠的优势[8-10]。RNA-seq技术在肿瘤的研究中被广泛的运用,而在13-三体综合征中研究却尚未提及。本研究拟从circRNA为切入点,采用RNA-seq技术获得13-三体综合征患者和健康对照组之间差异性表达的circRNA,并对差异性表达的circRNA进行生物信息学分析,并从circRNA靶向吸附的miRNA预测中找到参与13-三体综合征机制的circRNA。

1 材料和方法

1.1 研究对象 本研究获得了深圳市人民医院伦理委员会批准,并且按照赫尔辛基宣言进行。选取2017年1月1日至2018年1月1日在深圳市人民医院确诊为13-三体综合征患者和一名产检正常的志愿者为研究对象。分别抽取患者和健康对照组的脐带血0.5 ml,置于-80 ℃的液氮中保存。研究对象染色体核型图如下(图1、2)

图1 健康对照组染色体模型分析图

图2 PS患者染色体模型分析图

1.2 RNA的提取和检测使用Trizol提取RNA。用琼脂糖凝胶来分析样品RNA完整性以及是否存在DNA污染。用NanoPhotometer Spectrophotometer 检测RNA纯度(OD260/280及OD260/230比值),使用Qubit2.0 Fluorometer对RNA 浓度精确定量,用Agllent 2100 bicanalyzer精确检测侧RNA完整性。

1.3 文库构建及测序建库起始RNA为totalRNA,总量大于1 ug。通过Oligo(dT)磁珠富集带有polyA尾的mRNA,随后在NEB Fragmentation Buffer 中用二价离子将得到的mRNA 随机打断,以片段化的mRNA随机打断,以片段化的mRNA为模板,随机寡核核苷酸为引物,在M-MuLv逆转录酶体系中合成cDNA第一条链,随后用RNaseH降解DNA链,并在DNA polymeraseⅠ体系下,以dNTPs为原料合成cDNA 第二条链,纯化后的双链cDNA经过末端修复,加A尾并连接测序接头,用AMPureXPbeads纯化PCR产物,最终获得文库。文库构建完成后,先使用Qubit 2.0 Fluoro meter 进行初步定量,稀释文库至1.5 ng/μl,随后用Agilent 2100 bioanalyzer对文库的insert size 进行检测,insert size 符合预期后,qRT-PCR对文库有效浓度进行准确定量(文库有效浓度高于2nM),以保证文库质量。文库检测合格后,使用Illumia高通量测序平台(HiSeq/MiSeq)进行测序。

1.4 测序数据分析由于测序获得的原始数据中包含少量带有测序接头或测序质量较低的reads。为了保证数据分析的质量及可靠性,需要对原始数据进行过滤。主要去除带接头的reads,去除含N的reads、去除低质量reads。同时对 clean data 进行Q20、Q30和GC含量计算。后续所有分析均是基于clean data 进行的高质量分析。我们使用HISAT2V.2.0.5 构建参考基因组的索引,并使用HISAT2V.2.0.5 将配对末端 clean reads 与参照组对比。最后使用feature Counts 用于计算映射到每个基因的读数。然后根据基因的长度计算每个基因的FPKM,并计算映射到该基因的读数。

1.5 差异表达基因的筛选应用DEseq2R 软件进行两个比较组合之间的差异表达分析,并用TPM进行表达量的归一化处理。在不同样本组差异表达RNA检测中,将Fold change >2且P<0.05作为筛选的标准。

2 结果与分析

2.1 差异表达的circRNA分析通过使用RNA-seq技术比较13-三体综合征患者和健康对照组可知,共有9039个差异表达的circRNA,其中有8005个差异表达的circRNA具有统计学上的意义(|log2FoldChange|>2,P<0.05)。表达上调的circRNA有4275个,表达下调的circRNA有3730个,差异表达circRNA火山图(图3)。差异表达的circRNA大部分属于内含子,只有少数属于外显子。

图3 circRNA火山图

2.2 GO和KEGG富集分析对差异表达的8005个circRNA进行GO分析和KEGG分析。GO富集分析主要在细胞代谢、代谢过程、细胞内大分子代谢生物过程中富集;在细胞内细胞器部分、细胞内、细胞器细胞组成过程中富集;而在分子结合方面,主要在RNA结合上富集(图4)。KEGG分析差异表达的circRNA主要在子官内膜癌、肾细胞癌、RNA降解、细胞周期富集(图5)。

图4 来源基固GO富集图

图5 来源基固KEGG富集图

2.3 对差异倍数前十的circRNA分析从差异表达的circRNA筛选出表达上调前十的circRNA和表达下调前十的circRNA进行分析,发现差异表达的circRNA主要分布在染色体16上,且大部分属于内含子和外显子-内含子circRNA(表1/2)其中hsa_circ_0002473是位于13号染色体上表达最上调的circRNA,和8种miRNA相互作用(has-miR-486-3p、has-miR-130a-3p、has-miR-320C、has-miR-17-3p、has-miR-320b、has-miR-4236、has-miR-320a、has-miR-197-3p)。

3 讨论

13-三体综合征染色体变异疾病中比较常见的形式之一,它的发生和发展与非编码RNA的异常表达密切相关。近些年来,大量的circRNA的发现,引起了越来越多学者们的重视,circRNA的功能研究也成为了新的热点。有研究报道,hsa_circ_0004018和hsa_circ_0005986在HCC(肝癌)的表达水平显著降低[11,12]。hsa_circ_002059在胃癌组织中的表达显著下调[13]。Li等[14]发现circHIPK3的表达水平在膀胱癌组织中显著下调。尽管circRNA在肿瘤中的研究取得了一定的进展,但在13-三体综合征的作用尚未提及。

本研究通过RNA-seq技术得到13-三体综合征患者和健康对照组差异性表达的circRNA。其中共有9039个circRNA差异性表达,8005个circRNA具有统计学上的意义。表达上调的circRNA共有4275个,表达下调的circRNA共有3730个,同时也对差异性表达的circRNA进行了GO和KEGG分析。GO富集分析主要在细胞代谢、代谢过程、细胞内大分子代谢生物过程中富集;在细胞内细胞器部分、细胞内、细胞器细胞组成过程中富集;而在分子结合方面, 主要在RNA 结合上富集。KEGG分析差异表达的circRNA主要在子官内膜癌、肾细胞癌、RNA降解、细胞周期富集。

表1 差异表达量上调10个circRNA

表2 差异表达量下调10个circRNA

同时,我们对差异倍数前十的circRNA进行分析。我们发现hsa_circ_0002473是我们研究中在13号染色体上表达最上调的circRNA,与8种miRNA相互作用(has-miR-486-3p、has-miR-130a-3p、has-miR-320C、has-miR-17-3p、has-miR-320b、has-miR-4236、has-miR-320a、has-miR-197-3p)。研究证实,has-miR-486-3p在习惯性流产的孕妇中表达显著降低[15],我们推测这可能与13-三体综合征流产有一定的联系。has-miR-130a-3p在冠心病中表达显著失调[16],has-miR-320家族包括(has-miR-320a、has-miR-320b、has-miR-320c)均与乳腺癌、宫颈癌等女性高发疾病有关[17,18]。我们推测hsa_circ_0002473和其靶向吸附相关的miRNA参与调控13-三体综合征的发生和发展。目前来说,关于circRNA在13-三体综合征的研究还在起步阶段,circRNA在13-三体综合征的功能分析尚未完善,同时由于本次研究样本量不足,仅用了一个RNA-seq的数据集进行分析,所研究的结果是基于生物学信息分析,研究的结论尚未得到验证,这需要我们在后期的实验中继续探索。

综上所述,本研究通过RNA-seq技术得到了13-三体综合征患者脐带血差异表达的circRNA,并推测出hsa_circ_0002473有可能成为13-三体综合征新型的生物标志物,为13-三体综合征的诊断和治疗提供了新的思路。

猜你喜欢
文库三体染色体
用生命保卫中央文库的陈为人
专家文库
优秀传统文化启蒙文库
关于推荐《当代诗坛百家文库》入选诗家的启事
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?
刘慈欣《三体》将由亚马逊投资拍摄
《三体》中的物理学
真假三体的遗传题题型探析
能忍的人寿命长