利用50K芯片解析和田羊和策勒黑羊的遗传规律

2022-04-24 01:58张成龙郑浪漫刘春洁高庆华刘书东
畜牧兽医学报 2022年4期
关键词:黑羊和田绵羊

张成龙,郑浪漫,刘春洁,高庆华,刘书东*

(1.塔里木大学动物科学与技术学院,阿拉尔 843300;2.新疆生产建设兵团塔里木畜牧科技重点实验室,阿拉尔 843300)

新疆南疆和田地区位于塔克拉玛干沙漠南缘,昆仑山北麓。年降水量在21~146 mm,年均蒸发量达2 600 mm,每年沙尘天气220 d以上,其中浓浮尘(沙尘暴)天气在60 d以上,生态环境脆弱。该地区汉朝已有养羊业记载,地方品种绵羊与和田羊、策勒黑羊两个品种的相同点:鼻梁微隆,耳大、下垂,体格较小,舍饲状态常年发情。不同点:和田羊被毛白色,以产地毯毛为主;策勒黑羊被毛黑色,以产羔皮和多胎著称。经过长期选择能抵抗多变的沙漠环境,是我国独特的优势种质资源绵羊群体。

家畜在历史驯化和品种培育及改良过程中受到强烈的自然选择和人工选择,在家畜基因组上留下相应的遗传印记,具体表现为基因组上连锁不平衡程度增加或降低和受选择位点及其附近遗传多样性降低。2004年美国、英国和新西兰的科学家公布了第三代高密度的绵羊遗传连锁图[1]。绵羊基因组学的研究是开展绵羊分子遗传标记研究与应用的基础[2-3],2014年,华大基因和中国科学院的研究者公布了绵羊基因组序列,以雌性陶赛特为绵羊材料,通过二代测序技术与基因组图谱技术相结合,测序深度为75X,其中Contig N50为39 959 bp,Scaffold N50为2 231 873 bp,共包括20 908个基因,141个大结构改变,近一万个拷贝数变异,大约有1 000万个SNPs,基因组全长2.61 Gb[4]。绵羊基因组测序的完善为功能基因定位、相关分子标记的研究提供了遗传信息。Li等[5]选择99只Finnsheep不同颜色的绵羊群体,通过全基因组关联分析和选择性清扫相结合的方法,获得了毛色相关的基因(TYRP、ASIP、MITF)。Kijas等[6]基于Ovine SNP50 BeadChip通过Fst方法对全世界74个绵羊品种进行了品种间的选择性清扫检测,共获得181个基因,其中KIT、MITF和色素沉积相关;ASIP和黑、白色或黑白相间的毛色相关;NPR2、HMGA2、BMP2和动物的身体大小、肌肉肥大等生产性状相关;FGF5和毛质性状相关等。Zhao等[7]用3个典型的中国本土绵羊品种,基于 Ovine Infinium HD SNP BeadChip 进行选择性清扫,其中25 个基因组区域被选择,筛选出73 个候选基因,这些基因与尾部脂肪的形成、繁殖、生长性状等有关。沙漠环境抗逆性是在沙漠极端环境下生物生长发育和生产性能表现正常的能力,外来引入品种对沙漠环境适应性差[8],生产性能下降[9],Yang 等[10]使用重测序方法从不同的生态环境中获得77个绵羊基因组,并确定绵羊与沙漠(ANXA6、GPX3、GPX7和PTGS2)和高原(IFNGR2、MAPK4、NOX4、SLC2A4和PDK1)等极端环境相适应有关的相关基因。

和田地区存在和田羊和策勒黑羊两个地方绵羊品种,不断的自然选择和人工选择在这两种绵羊基因组上留下了大量的遗传印记。和田羊与策勒黑羊均具有适应沙漠环境的能力,但是关于两个品种的基因组差异研究较少。本研究旨在利用基因组选择性清扫检测和田羊和策勒黑羊的基因组差异,寻找适应南疆沙漠环境的优异分子标记,为南疆土著绵羊保护和育种提供理论基础。

1 材料与方法

1.1 样品采集

本试验于和田地区策勒县绿源种畜场随机选取策勒黑羊41只,于和田羊保种场随机选取和田羊84只,均为成年母羊,采样时间为2018—2021年。藏绵羊37只,数据来自International Stroke Genetics Consortium(ISGC)(http://www.Sheephapmap.org)。

1.2 DNA提取和基因组芯片制备

利用耳缺钳在每个个体的耳缘处剪下直径3 mm的组织块,放入己灭菌含有75%酒精的离心管。采用苯酚-氯仿法提取DNA,TAE电泳和核酸仪检测分析后,进行Ilumina Ovine SNP50 BeadChip制备。BeadScan软件对图像进行转换,利用Genome Studio软件对数据结果进行处理。

1.3 质控分析

采用Plink1.07[11]软件进行数据质控,质控标准为:去掉样本中检出率小于95%的个体样品,SNPs检出率小于90%、最小等位基因频率小于5%、哈代-温伯格平衡检验P值小于1×10-6。

1.4 主成分分析

使用GCTA软件[12]对过滤后的SNPs数据进行PCA分析,该主成分分析基于个体间的遗传相关性识别,代表种群结构的主要成分[13]。

1.5 基因组选择信号的计算

本试验以和田羊和策勒黑羊为研究对象,采用HapFLK方法,选择藏绵羊作为外群。HapFLK软件[14]基于群体间单体型频率来检测选择差异。使用Arlequin软件[15]来构建雷诺(Reynolds)亲属矩阵,在fastPHASE模型中,亲缘关系矩阵假设有10个群集(cluster),使用 20 次迭代的期望最大化算法(EM)对所有染色体进行 FLK 分析。得出结果后,利用以下公式校正HapFLK统计量:

其中,mean(hapFLK)为hapFLK统计量的平均数,sd(hapFLK)为hapFLK统计量的标准偏差。校正以后的HapFLK统计量近似服从正态分布,利用Excel 2016的函数1-NORM.DIST(HapFLKadj,0,1,TRUE)得到每个位点的P值,若-lgP≥3认为该位点受到了选择[16]。

1.6 GO和KEGG富集分析

所有获得SNPs基于Oar_v4.0(https://www.sheephapmap.org/)进行注释。基因的功能分析参考NCBI数据库(http:/www.ncbi.nlm.nih.gov/gene)、OMIM数据库(http://www.ncbi.nlm.nih.gov/omim)以及相应的参考文献。使用DAVID工具[17](http://david.Abcc.ncifcrf.gov/)进行GO 和 KEGG(Kyoto Encyclopedia of Genes and Genomes)分析。每个富集条目的重要程度由P值衡量,P值遵循超几何分布,公式为:

其中,N为总基因数;n为N中差异表达基因的总数;M为N中属于某个富集条目的基因个数;i为n中属于某个富集条目的基因个数。为了避免结果假阳性,对富集分析结果P采用多重检验(False Discovery Rate, FDR)进行校正。FDR的公式为:

其中,P是原始P值,n是测试次数,rankP是特定原始P值的等级。FDR≤0.05时,符合此条件的GO术语和途径被定义为候选基因显著富集。

2 结 果

2.1 主成分分析

如图1所示,藏羊与策勒黑羊、和田羊群体可以由第一主成分分为两组,前两个主成分(PC1和PC2)可以将所有样本分为4个子组,PC2与PC3两个主成分也大致将所有样本分为4个组。其中藏羊群体与和田羊、策勒黑羊群体明显区分为两个群体,和田羊群体与策勒黑羊群体基因组差异很小。

A、B、C分别为PC1-PC2、PC1-PC3和PC2-PC3所对应的区分结果;PCA结果将所有个体大致分为3组,其中和田羊与策勒黑羊遗传关系较近

2.2 选择性清扫结果

采用HapFLK结果的前1%作为有效结果,共计470个SNPs,结果如图2所示,OAR1、OAR3、OAR6号染色体上的选择信号较强烈。通过基因注释(距离该位点最近的基因)找到这些位点相对应的候选基因,并去除重复与无效的基因,共得到了167个基因,其中绵羊毛生长相关基因有KRT82、KRT80、KRT1、KRT79、KRT8、KRT7、KRT77、KRT5、KRT84、KRT18;毛色相关基因为KIT,生长发育相关基因有AMHR2、SP1、OARDACVR1B、ADIPOQ。候选位点及注释结果见表1。

黑色虚线表示显著水平,黑色实线表示极显著水平

表1 HapFLK候选位点及其基因

2.3 目的基因富集分析

将选择信号突出的1、3、6号染色体的候选基因进行富集分析,内容包括细胞组分(cellular component)、分子功能(molecular function)、生物学过程(biological process)和KEGG信号通路分析。167个候选基因参与富集,对P值进行FDR校正后,共得到7个显著GO组分和6个显著KEGG通路。候选基因GO分析显著结果如表2所示,每个条目名称及其数量见图3;候选基因KEGG通路及其关系见图4。

表2 候选基因显著富集的GO条目

图3 候选基因富集分析得到的GO条目及其基因数

3 讨 论

3.1 基因组选择性清扫检测揭示两个绵羊品种生产性状的不同

通过基因组选择性清扫检测物种的起源进化和基因交流[18],探究家畜在环境变化过程中的遗传机理。不同绵羊品种之间分子遗传标记不同,利用基因组选择性清扫的方法获得具有一定意义的分子标记。本研究采用HapFLK方法,以藏绵羊作为外群,在剔除祖先成分之后,选择性清扫结果集中体现了两个品种间的基因组差异。两个绵羊品种的主要差异体现在毛质、毛色、尾型等性状,这些结果在表型上也有体现。在表型上,和田羊与策勒黑羊在全年发情及多胎性上不一致,但在基因组清扫中并未体现其差异,认为和田羊与策勒黑羊类似,均存在多胎潜力,可能因为饲养方式不同,而没有表现出多胎性状,这个结论与王琼等[19]的研究结果相似。

3.2 角蛋白基因家族

基因组选择信号分析获得了KRT82、KRT80、KRT1、KRT79、KRT8、KRT7、KRT77、KRT5、KRT84、KRT18等角蛋白基因家族基因,富集分析结果显示,KRT基因数量较多,且富集程度高。KRT基因主要为角蛋白基因和角蛋白相关基因[20],角蛋白是羊毛纤维的主要成分,是形成皮肤毛囊细胞的主要结构蛋白质,是维持毛囊结构并在毛囊中表达最丰富的蛋白质,在很大程度上决定了羊毛的结构特性,其编码基因是毛囊基因表达和毛发生物学研究中重要的候选基因。该基因家族广泛存在于绵羊的毛发和皮肤中,调节与控制绵羊毛囊及毛发的发育。同时,KRT基因参与动物皮肤组织分化和绵羊毛长、弯曲度、卷曲方式[21]和纤维直径[22-24]调控,是羊毛质量[25-26]的主要调控基因。

经过长时间的选育,两个绵羊品种毛质性状存在很大差异,在生产性状上策勒黑羊被毛为异质毛,而和田羊为地毯型毛。相关研究显示,在绵羊机体中,KRT基因的突变会导致羊毛分叉,变细,变秃。在其他生物中,KRT基因也广泛参与了其相关表型的表达与调控[20,27-28],在人类的大部分皮肤病中都能找到KRT基因的影子,如人类KRT1突变可能会导致表皮溶解性鱼鳞病(EI)的发生[29],另外,人类的头发相关表型也与KRT基因有关[30-32]。KRT18参与到小鼠肌肉的功能表达和小鼠表皮细胞的分化[33]。KRT7从头表达导致上皮细胞可塑性和干细胞特性的改变是增加终末期肾肿瘤发生风险的关键因素[34]。

3.3 其他的基因及其功能

血小板衍生生长因子受体ɑ(platelet derived growth factor receptor alpha,PDGFRA)位于OAR6染色体,物理位置为69 735 803~69 771 932 bp,该基因在机体器官发育、伤口愈合中起着重要的作用,其突变位点与特发性嗜酸性粒细胞增多症和家族性胃肠道间质瘤以及其他多种癌症有关,并参与皮肤及毛发色素沉着的表达[35-36],是绵羊抗逆性和毛发颜色研究的候选基因。

KIT原癌基因,受体酪氨酸激酶(KIT proto-oncogene, receptor tyrosine kinase,KIT)位于OAR6染色体,物理位置为70 189 729~70 234 612 bp。该蛋白磷酸化多种细胞内蛋白,这些蛋白与多种不同类型的细胞增殖、分化、迁移和凋亡相关,在造血、干细胞维持中起重要作用。KIT是调节黑色素生成、控制黑色素细胞增殖和凋亡的关键基因,是影响动物毛皮色素沉着机制的重要基因[37]。和田羊被毛为白色,策勒黑羊被毛为黑色,该基因可能与两个绵羊品种毛色相关。此外,KIT基因是生物环境适应性相关基因,参与绵羊的环境适应性及驯化[38-39]。

激酶插入域受体(kinase insert domain receptor,KDR)位于OAR6染色体,物理位置为70 607 356~70 562 533 bp。该基因为血管发育中至关重要的蛋白质的编码基因[40],与类风湿性关节炎(RA)的易感性[41]和原发性乳腺血管肉瘤的发生[42]紧密相关。

脂联素,C1Q和胶原结构域(adiponectin, C1Q and collagen domain containing,ADIPOQ)位于OAR1染色体,物理位置为198 631 126~19 861 993 bp,脂联素蛋白基因完全在脂肪组织中表达[43-44]。编码蛋白在血浆中循环,并参与代谢和荷尔蒙生成的过程。该基因极有可能与绵羊尾部脂肪的大小相关,绵羊尾部脂肪是绵羊能量的储存库,具有供能与保暖的作用,是绵羊适应恶劣环境的一个重要特征。该基因可以作为培育适应南疆环境绵羊的候选基因。

4 结 论

本研究通过基因组选择性清扫的方法,解析和田羊和策勒黑羊的遗传规律和基因组差异,发现两个绵羊品种主要在毛质性状上存在差异,繁殖相关性状差异较小,这表明和田羊经过纯繁能够显著提高繁殖性能。该结果可为南疆绵羊品种的遗传改良提供理论基础和分子选育方向。

猜你喜欢
黑羊和田绵羊
冬末春初 注意防治绵羊痘病
在雨中“躲雨”的绵羊
羊的一片草
和田出土《法华经》古藏译本的初步研究报告(二)
黑羊(五则)
绵羊和小鸟
黑羊和白羊
巧计得绵羊
怪城