基于转录组测序的高原鼢鼠多态性微卫星标记筛选

2021-03-02 02:42刘倩倩谭宇尘姚宝辉康宇坤苏军虎
草业科学 2021年12期
关键词:鼢鼠微卫星碱基

刘倩倩,谭宇尘,姚宝辉,康宇坤,苏军虎,3

(1.甘肃农业大学草业学院 / 草业生态系统教育部重点实验室 / 中—美草地畜牧业可持续发展研究中心, 甘肃 兰州 730070;2.甘肃农业大学—新西兰梅西大学草地生物多样性研究中心, 甘肃 兰州 730070;3.甘肃省祁连山草原生态系统野外科学观测研究站, 甘肃 兰州 730070)

微卫星DNA 也称为简单重复序列(simple sequence repeat, SSR),通常是由1~6 个核苷酸重复单元构成的串联重复序列,在真核生物基因组中,微卫星DNA 绝大多数位于基因非编码区,但也存在于编码序列及外显子中[1-2]。微卫星具有分布广泛、高度多态性及共显性遗传等优点,已被广泛应用于确定种群间的遗传分化、估计种群结构和种群的遗传多样性研究中[3]。微卫星DNA 按照其来源可分为基因组SSR (genomic simple sequence repeat,gSSR)和表达序列标签SSR (expressed sequence tagssimple sequence repeat, EST-SSR)。与gSSR 相 比,EST-SSR 来源于DNA 的转录区域,其开发成本低、速度快,具有良好的物种间通用性且数量大等特点[4],已成为对缺少基因组数据信息的生物进行分子标记开发的有效方法之一。

高原鼢鼠(Eospalax baileyi)隶属于啮齿目鼹形鼠科鼢鼠亚科凸颅鼢鼠属,是青藏高原高寒草甸生态系统的特有种,它们的大部分活动均在地下洞穴系统中进行,主要依靠植物的地下贮存器官作为食物[5]。近年来,在自然因素和人为活动的影响下,高原鼢鼠的高密度种群加速了草地退化,危及青藏高原生态安全和区域经济的发展[6]。随着国家生态安全战略的实施,高原鼢鼠在高寒草甸生态系统中的有效管理备受重视,然而有效的防控工作不仅需要了解高原鼢鼠的生物学特性,还需要了解其种群生态作用和种群生态学等方面的知识[7]。已有研究表明高原鼢鼠在不同地理种群间存在着限制性基因流,会导致种群分化与种群遗传结构改变[8-9],影响到群体遗传多样性和繁殖策略,进而影响高原鼢鼠的种群动态及其防控决策[10]。但对于高原鼢鼠种群自身的近交回避、亲权识别和繁殖策略等问题至今仍然知之甚少,解决这些问题对于高原鼢鼠的有效管理至关重要,因此迫切需要有效的分子生物学技术和方法得以应用。

近年来,学者们利用线粒体基因细胞色素b[11]和D-loop 区[12]等测序方法研究了不同群体高原鼢鼠的遗传多样性和遗传结构。关于高原鼢鼠核基因组微卫星位点开发也有零星的报道,Su 等[13]基于454 高通量测序,获得了12 个微卫星位点。康宇坤等[14]分析并验证了跨种的通用性,但相较于模式生物和其他生物具有上千个微卫星位点,高原鼢鼠现有的40 多个微卫星位点仍无法满足不同地理群体的分析需求,还需更多的微卫星位点进行婚配方式、遗传结构和基因流等检测,而迄今对高原鼢鼠的EST-SSR 标记筛选未见报道。鉴于此,本研究基于Illumina HiSeq 测序平台,测定高原鼢鼠的特异性微卫星标记,分析其分布特征,并对这些SSR 位点在高原鼢鼠中的多态性进行验证,以期筛选出具有高多态性的高原鼢鼠EST-SSR 引物,旨在为其种群遗传学和分子生态学等相关研究提供技术基础。

1 材料与方法

1.1 材料

选用高原鼢鼠63 只,其中雌性46 只,雄性17只,样本采集于甘肃省甘南州碌曲县境内(100°46′—104°44′ E,33°06′—36°10′ N),用活捕笼非损伤性捕捉,麻醉处死,迅速剖取其大脑组织,存入液氮速冻后置于-80 ℃冰箱中保存备用,采集腿部肌肉保存于95%酒精中,用于基因组DNA 的提取。

1.2 试验方法

1.2.1 RNA 提取及EST-SSR 序列的获得

取24 只高原鼢鼠,雌雄各12 只,每只取0.3 g 新鲜的大脑组织,用MiniBEST Universal RNA Extraction Kit (Takara,日本)提取总RNA,通过1.0%琼脂糖凝胶电泳和Nanodrop-2000 紫外分光光度仪检测总RNA的浓度和纯度,送样至北京诺禾致源科技股份有限公司构建cDNA 文库,利用Illumina HiSeq 平台进行测序,对其得到的数据进行评估、过滤(去除接头、低质量区域等),用Trinity-v2.5.1 软件进行拼接组装[15],共得到46 858 条unigenes,利用SSR 分析软件MISA 1.0(http://pgrc.ipkgatersleben.de/misa/)搜索高原鼢鼠组织转录组数据中潜在的SSR 位点[16]。

1.2.2 DNA 的提取及检测

选择63 只高原鼢鼠腿部肌肉组织(保存于95%酒精中)为试验材料,运用常规的酚氯仿抽提法提取基因组DNA。通过紫外分光光度计检测DNA 的浓度和纯度,用1%琼脂糖凝胶电泳检测DNA 的质量,-20 ℃保存。

1.2.3 引物的合成及PCR 扩增

基于转录组测序得到的29 090 条序列,用Primer 3.0 软件设计引物,共随机选取104 对引物由上海生工生物工程股份有限公司合成。PCR 反应体系总体积25 μL,其组成为2 × Taq PCR Master Mix 12.5 μL,上下游引物各1 μL,模板DNA 1 μL,ddH2O 补足至25 μL。反应条件为95 ℃预变性4 min,95 ℃变性45 s,53 ℃退火45 s,72 ℃延伸30 s,共30 个循环,72 ℃延伸10 min,4 ℃保存。

1.2.4 微卫星基因型分型

扩增产物经1%琼脂糖凝胶电泳扩增出清晰条带后,利用8%聚丙烯酰胺凝胶电泳进行初步多态性筛选,筛选出12 对引物进行毛细管电泳检测,在正向引物5’末端用FAM、HEX 及TAMR 3 种荧光染料标记,送至上海生工生物工程股份有限公司,用ABI 3 730 分析仪进行毛细管电泳分型。

1.2.5 微卫星数据分析

用GeneMapper 4.0 对SSR 分型后得到的荧光电泳图谱进行判读,并进一步人工校正,获取每个微卫星位点在不同个体上的等位基因片段大小;用POPGENE 1.32 统计等位基因数(number of alleles,Na),计算观测杂合度(observed heterozygosity, Ho)和期望杂合度(expected heterozygosity, He);用Cervus 3.0计算多态信息含量(polymorphism information content,PIC)并检验哈迪—温伯格平衡(Hardy—Weinberg equilibrium, HWE)。

2 结果与分析

2.1 转录组SSR 重复类型分析

对高原鼢鼠的转录组微卫星数据进行筛选,完美型微卫星是最常见的类型,共有29 090 个,其次是复合型微卫星,不完美型微卫星数量最少,只有1 001 个。本研究仅对高原鼢鼠转录组中1~6 碱基重复完美型SSR 进行分析,结果显示,对高原鼢鼠转录组中46 858 条unigenes 的数据进行搜索,共找到29 090 个微卫星位点,分布在7 306 条unigenes中,发生频率(含有SSR 的unigenes 数量与总unigenes数量之比)为25.12%。在高原鼢鼠SSR 重复基序中,以单核苷酸重复单元的SSR 含量最多,所占比例为56.57%,其次是二核苷酸及三核苷酸重复,所占比例分别为28.65%和10.17%,四核苷酸、五核苷酸、六核苷酸重复的SSR 类型较少,共占4.61% (表1)。

表1 高原鼢鼠转录组微卫星位点重复次数及长度Table 1 Repeats and length analysis of SSRS microsatellite loci in the transcriptome of the plateau zokor

2.2 转录组微卫星优势重复单元碱基组成

在高原鼢鼠转录组29 090 个微卫星位点中发现重复碱基类型共有227 种,其中单碱基、二碱基、三碱基、四碱基、五碱基、六碱基重复分别有2、8、29、91、55 和42 种。其中四碱基重复类型最多。转录组SSR重复次数在5~64 次,单核苷酸重复次数种类最多,为10~64 次,二核苷酸重复次数分布在6~37 次。从合计看,在高原鼢鼠SSR 重复单元中,重复次数最多的是10 次,有5 780 个,占19.87% (表2)。单碱基重复A/T 为重复次数最多的SSR 类型,占总数的54.31%,CA/TG 是二碱基重复的主要重复单元,共2 629 个,8 种类型的二碱基重复类型占微卫星重复的36.53%,GCC/GGC 和CAAA/TTTG 分别是三碱基、四碱基的主要重复单元,分别有343 和103 个,占总数的1.18%和0.35% (图1),而五碱基、六碱基重复单元由于数量较少、分布松散,分别只有163、50 个,各重复类型分布较为均匀,由于其相应的SSR 总数较少,且每种基元中均只有1 个SSR,故不作比较。

表2 基于高原鼢鼠转录组数据的不同类型微卫星重复数量统计Table 2 Repeated number statistics of different types of SSRS based on the transcriptome data of the plateau zokor

图1 基于重复类型的微卫星分布Figure 1 Distribution of microsatellites based on repeat types

2.3 多态性微卫星位点筛选

从高原鼢鼠转录组中随机筛选出104 个符合引物设计要求的EST—SSR 位点进行引物合成,其中重复微卫星数量以四碱基最多,有52 个,二碱基为43 个,三碱基为 18 个。以63 个高原鼢鼠基因组DNA 为模板进行PCR 扩增和毛细管电泳检测,结果显示有12 对引物能够在高原鼢鼠个体肌肉组织DNA 中成功扩增,表现出特异性扩增产物且大小符合,扩增成功且在这些个体的扩增产物中均可找到2 个以上的等位基因,即呈现出多态性。对12 对SSR 引物在63 个高原鼢鼠个体中的扩增片段进行统计(表3)得出,共获得76 个等位基因, 每个位点产生等位基因数Na 为3~12 个,Ho 为0.263~0.937,平均值为0.651。He 为0.285~0.844,平均值为0.600。PIC 在0.251~0.816,其中有7 个微卫星位点表现为高度多态性,5 个位点为中度多态性。使用Bonferroni校正后,有2 个微卫星位点显著偏离哈迪—温伯格平衡(P< 0.01),10 个微卫星位点未观察到显著的连锁不平衡(P> 0.01)。

表3 12 对高原鼢鼠微卫星位点的遗传特征Table 3 Analysis of genetic characteristics of 12 pairs of Eospalax baileyi microsatellite loci

3 讨论

高通量测序技术的快速发展使得SSR 标记的开发变得简单快捷,利用微卫星分子标记技术进行物种种群遗传学研究已得到广泛应用[17]。目前,微卫星位点开发主要是基于基因组文库和转录组文库进行筛选的[18],通过基因组数据可有效地分析SSR 的序列特征和功能,如涂飞云等[19]对大鼠(Rattus norvegicus)基因组各部分微卫星位点的分布特点进行了分析,为大鼠全基因微卫星研究积累了宝贵的资料;冯丹丹等[20]测定了长爪沙鼠(Meriones unguiculatus)全基因组数据,从中筛选出了357 个符合标准的微卫星位点,结果有135 个扩增成功。转录组测序是第二代高通量测序技术一个发展较为迅速的重要应用[21],对于缺失基因组数据的高原鼢鼠来说,利用筛选效率高、工作量较小的转录组数据进行微卫星位点的筛选是一种有效的方法。本研究共发现29 090 个高原鼢鼠的微卫星,其发生频率为25.12%,与以往学者关于密斑刺鲀(Diodon hystrix)转录组微卫星位点的发生频率结果相近[22],但远远高于已报道的斑点叉尾鮰(Ictalurus punctatus)[23]、黄姑鱼(Nibea albiflora)[24]等物种,因此微卫星位点的分布频率还因物种和组织不同而不同。转录后的unigene 是通过剪接产生的,有些微卫星其重复单元可能是内含子剪除后,两侧外显子拼接而成的,其本身在基因组DNA 上并不是微卫星[25],其多态性可能是落后的分型技术产生的。现阶段最常用于微卫星分型的方法有聚丙烯酰胺凝胶(polyacylamide gel electrophoresis,PAGE)和毛细管荧光电泳(capillary electrophoresis,CE),与聚丙烯酰胺凝胶电泳相比较,毛细管电泳准确性更高、速度更快且仪器操作可自动化[26]。因此本研究采用高灵敏度的毛细管荧光电泳来检测每个位点的多态性。根据转录组微卫星测序结果,在高原鼢鼠中微卫星重复单元以单核苷酸重复最多,原因可能是A/T 含量高的序列退火温度较低,易导致DNA 解链造成微卫星序列滑动错配的可能性增加;其次为二核苷酸重复及三核苷酸重复类型,呈现随着碱基数增加微卫星数量逐渐减少的现象,该结果与大熊猫(Ailuropodamelanoleuca)、兴国红鲤(Cyprinus carpiovar.singuonensis)等的转录组微卫星组成情况相似[27-28],但不同物种的微卫星碱基重复类型仍存在种属间差异。

高原鼢鼠营地下独居生活,稳定的生活环境和有限的迁移能力使得该物种的变异性较小,进化潜力较弱,扩散能力有限[29]。与地面活动的啮齿类动物相比,高原鼢鼠种群结构的特殊性在生态系统中占据着不可替代的地位,引起了国内外学者的广泛关注,迫切需要有效的技术手段对其遗传资源进行开发利用。目前对于高原鼢鼠种群生态学方面的研究,大多数均从生物学特性入手,研究其在高寒草甸生态系统中的作用及其分布与防治措施,而对于研究高原鼢鼠种群遗传分化、种群间的扩散特点等众多问题还需要有效的分子生物学手段[30]。唐利洲等[8]以线粒体细胞色素b基因作为分子标记,对不同地理种群间的高原鼢鼠个体进行研究,结果显示其种群间存在严重的限制性基因流。随后蔡振媛等[11]测定了采自青藏高原东部不同地理种群高原鼢鼠个体的线粒体基因组序列变异情况,发现主要是地理隔离所导致的种群间遗传分化,并且地理隔离对高原鼢鼠的作用大于甘肃鼢鼠(Eospalax cansus)。目前,微卫星标记已成功应用于高原鼢鼠的种群遗传多样性分析中,刘丽等[31]利用10 个中度多态性的微卫星位点,探讨不同地理种群高原鼢鼠的遗传结构,研究发现对种群个体信息交流起到阻碍作用的主要是河流和公路。在Su 等[13]和康宇坤等[14]的研究中,二者利用了高原鼢鼠近缘种鼹形鼠科和甘肃鼢鼠中已开发出的微卫星位点,在高原鼢鼠中进行了跨种扩增,有部分微卫星位点呈现出多态性,为高原鼢鼠微卫星标记的运用奠定了基础。但高原鼢鼠仅有上述的微卫星标记还远远不够,本研究筛选出的104 个转录组微卫星位点中仅成功扩增出12 个条带清晰且具有多态性的微卫星位点,大部分微卫星位点表现为单态性,原因可能是转录组微卫星主要分布于外显子上,其多态性受到选择压力及突变等的影响要比其他区域的微卫星低,因而多态性较低[32]。群体的遗传多样性可以通过等位基因数、杂合度和多态信息含量来反映[33]。本研究筛选出12 对引物能够产生特异性扩增产物且均呈现出中度及高度多态性,表明该群体处于中高度多态性,与Li 等[34]在高原鼠兔(Ochotona curzoniae)及Ingram等[35]在常年营地下生活的裸鼹鼠(Heterocephalus glaber)中筛选的微卫星位点相比,大多数位点的等位基因数量较少,杂合度水平较低,且有2 个位点显著偏离哈迪—温伯格平衡,原因可能是所选高原鼢鼠群体较小,大多数等位基因差异存在于群体间和区域间,特殊地下生境使得群体内变异较小,导致近交,也有可能是由于无效等位基因的存在,被视为纯合子,增加了纯合子比例[36]。

本研究基于高原鼢鼠转录组测序数据开发出的12 对微卫星标记为进一步寻找更多、更有效的高原鼢鼠高度多态性微卫星位点提供了合适的工具,为进一步研究高原鼢鼠种群内部亲缘关系及迁移扩散等生态学问题奠定了基础,为高原鼢鼠种群遗传学和分子生态学等相关研究提供了基础数据。

猜你喜欢
鼢鼠微卫星碱基
绿鳍马面鲀全基因组微卫星分布特征
Phylogenetic relationships of the zokor genus Eospalax(Mammalia, Rodentia, Spalacidae) inferred from wholegenome analyses, with description of a new species endemic to Hengduan Mountains
正宁县中华鼢鼠的为害及有效防治措施
中华鼢鼠的防治方法
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来4名新成员
生命“字母表”迎来4名新成员
中华鼢鼠的生活习性及防治探析
红尾蚺和原矛头蝮基因组微卫星分布特征比较分析