鸡繁殖性状近交衰退相关lncRNA的筛选

2022-06-06 05:26李国辉邢伟杰周成浩张会永殷建玫朱云芬曹愉夏苏一军
中国畜牧兽医 2022年6期
关键词:下丘脑测序卵巢

薛 倩,李国辉,邢伟杰,周成浩,张会永,殷建玫,朱云芬,曹愉夏,苏一军,韩 威

(1.江苏省家禽科学研究所科技创新有限公司,扬州 225125;2.江苏省家禽科学研究所,扬州 225125)

近交衰退是指因近交而导致的后代适合度(群体均值)下降的现象[1]。在中国地方鸡遗传资源活体保护过程中,由于保种群规模有限,在保种群继代繁殖过程中其繁殖性状的近交衰退现象时常发生,严重影响群体的世代延续。近年来,长链非编码RNA(long non-coding RNA,lncRNA)在哺乳动物和禽类繁殖方面发挥着重要的调控作用。lncRNA是一类长度>200 nt、缺少蛋白编码功能的RNA,可从多层面调控基因表达,影响表型性状[2]。在哺乳动物中,lncRNA已被证明在性成熟前后小鼠、山羊和湖羊等睾丸组织中存在差异表达[3-4],参与雄性生殖细胞发育调控,一些关键lncRNAs如Tsx和ALKBH5可能与雄性不育有关[5];MSTRG.42992和MSTRG.52048 2个lncRNAs可能参与猪卵母细胞体外成熟调控[6]。在禽类中,黄子妍等[7]研究鸡弱精子症调节机制时发现,lncRNA-MSTRG.15568.9可能调控精子相关抗原4(sperm associated antigen 4,SPAG4)基因的表达,参与鸡精子发生和精子活力调控;任晋东[8]通过研究不同繁殖阶段鸭卵巢转录组差异发现,lncRNA在鸭产蛋性能调控中发挥着重要作用。因此,不管雄性还是雌性动物的繁殖调控,lncRNA均可在其中发挥重要作用。

鸡繁殖性状近交衰退调控是个复杂的过程,尽管研究者对近交衰退分子机理的研究已较为深入,但关于鸡繁殖性状近交衰退的调控机理少有报道,随着现代分子生物学技术的快速发展,需要从多角度多层面进行研究。本研究从转录组lncRNA水平探索鸡繁殖性状近交衰退的调控机制,筛选鸡繁殖性状近交衰退相关的lncRNA及其靶基因,以期为深入阐明鸡繁殖性状近交衰退分子调控机制提供参考,为物种资源保护和家禽育种提供科学依据。

1 材料与方法

1.1 样品采集

前期研究中,以江苏省家禽科学研究所国家级地方鸡种基因库狼山鸡保种群为素材,组建了狼山鸡高、低近交试验群体[9],高、低近交群体平均开产日龄分别为173和150 d,300 d产蛋数分别为84和98枚。基于这2个试验群体,本研究从高近交群体中选取繁殖性能显著衰退的健康个体3只,从低近交群体中选取繁殖性能处于群体平均值附近的个体3只,300日龄时快速屠宰并采集其下丘脑和卵巢组织,投入液氮中,-80 ℃保存备用。

1.2 RNA-Seq测序及数据质控

试验分为4组,分别为:高近交组下丘脑(Sinb_H)、低近交组下丘脑(Winb_H)、高近交组卵巢(Sinb_O)和低近交组卵巢(Winb_O)。使用Trizol法分别提取各组织总RNA,通过1.0%琼脂糖凝胶电泳和分光光度计等对RNA进行质量检测,质检合格后,去除核糖体RNA;将RNA片段化,连接上测序接头;PCR扩增构建链特异性lncRNA测序文库,测序文库通过安捷伦生物分析仪2100系统评价检测合格后,使用IlluminaHiseq 4000测序平台进行双末端测序。

对测序获得的原始数据(raw data),使用Cutadapt 1.10软件[10]去除带接头、空读和低质量碱基序列,使用FASTQC 0.10.1软件[11]进行质量控制,针对获得的有效数据,采用Hisat 2.0.4软件[12]将其与参考基因组(GRCg6a:RefSeq GCF_000002315.6)比对,基于比对结果,使用转录本组装软件StringTie 1.3.0[13]对reads进行组装和定量。

1.3 lncRNA鉴定和差异lncRNA筛选

对拼接好的转录本,通过以下步骤进行筛选和预测:①转录本长度≥200 bp,且包含外显子数目≥1;②转录本覆盖度≥3;③使用Cuffcompare将其与鸡已知的非lncRNA序列(mRNA、rRNA、tRNA、snRNA、snoRNA、pre-miRNA、Pseudogenes 等)进行比对,去除与以上非lncRNA序列相似或相同的转录本,并确定剩余转录本的基因组位置;④利用CPC(coding potential calculator)[14]和CNCI(coding-non-coding index)[15]等软件对剩余转录本进行蛋白编码潜能预测,最终获得无编码潜能的转录本被鉴定为lncRNA。采用edgeR软件[16]进行lncRNA差异表达分析,筛选狼山鸡高、低近交组间表达量差异倍数≥2(log2|FoldChange|≥1),且P<0.05的lncRNA为差异lncRNA。

1.4 lncRNA靶基因预测及其功能分析

lncRNA调控方式主要分为两类,一类为顺式调控(cisregulation),即lncRNA调控同一染色体上与其邻近基因的表达;另一类为反式调控(transregulation),即lncRNA跨染色体调控基因的表达。本研究中主要对差异lncRNA顺式调控的靶基因进行预测分析,将lncRNA上下游100 kb距离的蛋白编码基因作为其顺式作用靶基因,并通过GO和KEGG数据库对靶基因进行功能注释和富集分析,来预测lncRNA的功能。

2 结 果

2.1 测序结果

来自4个分组的12个样本经测序质控后,下丘脑和卵巢平均每个样本分别获得98.20和96.9 M的有效reads数,共产生有效数据量175.65 Gb,碱基质量值Q30均>95%(表1),测序数据可满足后续分析要求。

表1 测序数据统计

2.2 lncRNA鉴定和特征分析

对reads进行拼接和组装后,去除已知的mRNA和<200 bp的转录本,对余下的转录本通过CPC、CNCI等软件进行编码能力预测,筛选没有蛋白编码潜能的转录本,最终在12个样本中共鉴定出4 222个lncRNAs,占所有转录本数量(63 828个)的6.6%。统计分析lncRNA转录本长度、外显子数和开放阅读框(ORF)长度等结构特征,并与mRNA进行比较,结果发现,长度>1 000 bp的lncRNAs占比(64%)显著低于mRNA(91%)(图1);大部分lncRNAs外显子数量只有1~3个,而50%以上的mRNA外显子数量在9个以上(图2);lncRNA ORF长度主要分布在100 bp以内,而大部分mRNA ORF长度均>100 bp(图3)。因此,与蛋白编码基因相比,lncRNA具有序列和ORF长度短、外显子数目少的特征。对lncRNA和mRNA的整体表达水平进行比较分析,发现本研究中lncRNA的表达水平显著高于mRNA(P<0.05,图4)。

*,差异显著(P<0.05)。图4同*,Significant difference (P<0.05).The same as fig.4图1 lncRNA和mRNA长度分布Fig.1 Distribution of lncRNA and mRNA length

图2 lncRNA和mRNA外显子数量分布Fig.2 Distribution of lncRNA and mRNA number

图3 lncRNA(A)和mRNA(B)开放阅读框长度分布Fig.3 Distribution of lncRNA (A) and mRNA (B) ORF length

图4 lncRNA和mRNA表达水平比较Fig.4 Expression comparison of lncRNA and mRNA

2.3 差异lncRNA筛选鉴定

与狼山鸡低近交组相比,高近交组下丘脑中发现差异表达lncRNAs 35个(|FoldChange|≥2,P<0.05),其中上调21个,下调14个;高近交组卵巢中发现差异表达lncRNAs 215个,其中上调176个,下调39个(图5)。下丘脑和卵巢中共同差异表达的lncRNAs有10个(图6),包括MSTRG.9195.2、MSTRG.4054.1等。对部分差异lncRNAs表达水平进行聚类分析,结果显示,来自同一个分组的3个重复样本聚在一起(图7、8),验证了试验样本采集的准确性。

图5 下丘脑和卵巢中差异表达lncRNAsFig.5 Differentially expressed lncRNAs in hypothalamus and ovary

图6 下丘脑和卵巢中共同差异表达lncRNAsFig.6 Common differentially expressed lncRNAs in hypothalamus and ovary

所有差异lncRNAs中随机挑选35个做聚类结果展示。图8同35 of all differential lncRNAs were randomly selected for clustering results display.The same as fig.8图7 下丘脑中差异表达lncRNAs热图Fig.7 Heatmap of differentially expressed lncRNAs in hypothalamus

2.4 差异lncRNA靶基因预测及其功能分析

对下丘脑中差异表达lncRNA进行顺式调控靶基因预测,发现28个差异lncRNAs预测到靶基因98个,这些靶基因显著富集到出生或孵化时胚胎发育终止(embryo development ending in birth or egg hatching)、胚胎心导管发育(embryonic heart tube development)、视黄酸应答(response to retinoic acid)等繁殖相关GO生物过程(P<0.05),涉及差异lncRNAs MSTRG.9196.4、MSTRG.9195.2、MSTRG.6254.2及相应靶基因DNAAF2、FKBP1B(表2);卵巢中159个差异lncRNAs预测到靶基因414个,这些基因显著富集于信号转导(signal transduction)、基因表达昼夜节律调控(circadian regulation of gene expression)、神经突触聚集正调控(positive regulation of synapse assembly)等生物过程(P<0.05),以及卵母细胞减数分裂(oocyte meiosis)、MAPK、叶酸合成(folate biosynthesis)等繁殖相关KEGG信号通路(表3),筛选到MSTRG.7683.1、MSTRG.13604.4、MSTRG.16570.1、MSTRG.8330.5、MSTRG.8330.4等lncRNAs可能与狼山鸡繁殖调控相关。细胞组分和分子功能中没有发现显著富集的繁殖相关条目。

图8 卵巢中差异表达lncRNAs热图Fig.8 Heatmap of differentially expressed lncRNAs in ovary

表2 下丘脑中差异lncRNAs靶基因显著富集的繁殖相关GO生物过程

表3 卵巢中差异lncRNAs靶基因富集的繁殖相关KEGG通路

3 讨 论

下丘脑和卵巢是动物性腺轴中的重要组织,鸡下丘脑和卵巢中基因的表达情况与其繁殖性能密切相关,如促性腺激素释放素(GnRH)、卵泡刺激素(FSH)、黄体生成素(LH)、雌激素受体(ESR)等[17]。哺乳动物和鸟类性腺轴组织转录组测序显示,卵巢和下丘脑中存在编码和非编码RNA,它们参与繁殖性能神经内分泌调节和生殖发育,其中lncRNA近几年被广泛研究并证明在动物繁殖调控方面发挥重要作用[18]。本研究在下丘脑和卵巢中共鉴定出4 222个lncRNAs,对其结构特征分析发现,这些lncRNA具有序列和ORF短、外显子数目少的特征。本研究结果与李辉等[2]研究表明鸡lncRNA平均长度小于鸡蛋白编码基因平均长度且外显子数普遍少于鸡蛋白编码基因外显子数的结果相一致,同时验证了本研究lncRNA鉴定的准确性。

高、低近交组间下丘脑和卵巢中分别筛选出35和215个差异表达lncRNAs,lncRNA的功能与其相邻的蛋白编码基因相关,通过寻找lncRNA周围蛋白编码基因的方式来预测lncRNA的靶基因,以推测其主要功能。下丘脑中差异lncRNA靶基因显著富集到出生或孵化时胚胎发育终止、胚胎心导管发育、视黄酸应答等繁殖相关GO生物过程。视黄酸是维生素A的一种形式,在雄性和雌性生殖及胚胎发育过程中发挥重要作用,其参与胚胎早期神经系统、心脏等组织器官发育[19]。Cheong等[20]研究表明,DNAAF2的一个空等位基因与胚胎发育缺陷和死亡率有关。本研究中,下丘脑差异lncRNAs MSTRG.9196.4、MSTRG.9195.2、MSTRG.6254.2及相应靶基因DNAAF2、FKBP1B显著富集于视黄酸应答通路中,其中DNAAF2基因为差异lncRNAs MSTRG.9196.4、MSTRG.9195.2的靶基因,推测差异lncRNA MSTRG.9196.4和MSTRG.9195.2在狼山鸡繁殖性能近交衰退调控中发挥重要作用。FKBP1B基因编码肽基-脯氨酸顺反异构酶,调节神经元肌浆网和内质网钙离子的释放,进而影响神经元的功能活动[21],研究证实,FKBP1B参与心脏发育、疾病发生、大脑衰老及神经功能障碍等重要机体活动[22-23],本研究中FKBP1B基因为下丘脑差异lncRNA MSTRG.6254.2的靶基因,推测lncRNA MSTRG.6254.2靶向正调控该基因,使该基因在狼山鸡高近交组中显著下调,进而导致狼山鸡高近交组胚胎期心脏发育异常及神经功能障碍等。

机体昼夜节律的变化影响激素的分泌及释放,进而影响神经内分泌调节及生理机能[24]。本研究中,卵巢内差异表达lncRNAs MSTRG.16570.1和MSTRG.6979.1靶基因功能与昼夜节律调控有关,推测lncRNAs MSTRG.16570.1和MSTRG.6979.1可能通过调控高近交组狼山鸡昼夜节律引起其神经内分泌调节及繁殖机能的改变。叶酸是动物繁殖和胚胎发育过程中所必需的,饲粮中添加叶酸可以改善畜禽的繁殖性能[25]。本研究卵巢中差异lncRNA靶基因显著富集于叶酸合成、卵母细胞减数分裂、MAPK等繁殖相关KEGG信号通路,其中差异lncRNA MSTRG.7683.1的靶基因CCDC149在卵母细胞成熟分裂中发挥重要作用[26],而CPEB4基因作为差异lncRNA MSTRG.13604.4的靶基因与细胞周期和减数分裂相关[27]。推测狼山鸡卵巢中差异lncRNA主要参与繁殖相关的神经内分泌调节及配子生成,进而影响其高近交组的繁殖性能。本研究结果为揭示狼山鸡繁殖性能近交衰退调控机制提供了线索,为物种资源保护和家禽育种提供了理论依据。

4 结 论

本研究在狼山鸡下丘脑和卵巢中共鉴定出4 222个lncRNAs,高、低近交组间下丘脑中差异表达lncRNAs 35个,卵巢中差异表达lncRNAs 215个。下丘脑中差异lncRNA靶基因显著富集于胚胎发育相关生物过程,涉及lncRNAs MSTRG.9196.4、MSTRG.9195.2、MSTRG.6254.2及相应靶基因DNAAF2和FKBP1B;卵巢中差异lncRNA靶基因富集到了神经内分泌调节及配子生成等繁殖相关生物学过程和信号通路,筛选到MSTRG.7683.1、MSTRG.13604.4、MSTRG.16570.1、MSTRG.8330.5、MSTRG.8330.4等繁殖相关候选lncRNAs。

猜你喜欢
下丘脑测序卵巢
新一代高通量二代测序技术诊断耐药结核病的临床意义
宏基因组测序辅助诊断原发性肺隐球菌
生物测序走在前
卵巢早衰,可以自然怀孕吗
基因测序技术研究进展
保养卵巢就两点:心情好、别受凉
科学家发现控制衰老开关
正念认知疗法在抑郁症患者日常护理中的应用
卵巢按摩保养效果没想得那么大
OntheapplicationofAntConcinpre—translationofmachine