田螺科4种代表性贝类基因组调研及SSR特征分析

2023-05-08 06:23季秋婷王俊杰唐伯平
江苏农业科学 2023年6期
关键词:田螺贝类杂合

朱 颖, 陈 瑜, 唐 俊, 季秋婷, 王俊杰, 唐伯平, 王 刚

(盐城师范学院湿地学院/江苏省盐土生物资源研究重点实验室,江苏盐城 224007)

田螺科(Viviparidae)贝类是我国淡水水域常见的软体动物,其属于腹足纲、中腹足目,广泛分布于湖泊、沼泽、水库、池塘及溪流等处[1],能对水体健康起到维持作用,净化水体,是重要的生态指示物种[2]。田螺科物种多为经济贝类,其营养价值高,螺肉鲜美,是低脂肪、高蛋白食品,在我国广受欢迎,同时也是家禽,水产养殖鱼类、虾蟹类的天然饲料[3]。田螺科贝类属于世界物种,我国包含9个属,70多个种,其中河螺属(Rivularia)和螺蛳属(Margarya)为特有属,环棱螺属和圆田螺属物种最为常见[4]。随着资源环境的破坏和对田螺的需求日益增加,加上外来淡水螺的不断入侵,我国本土田螺科物种分布和数量受到严重威胁,很多种群在数量上明显衰退,严重的已濒临灭绝[5]。基于田螺科物种的重要生态价值和经济价值,保护和恢复田螺科物种的多样性及种群数量的问题显得尤为重要。

随着组学时代的到来和发展,测序成本下降,高通量测序被广泛用于软体动物基因组测序中。在软体动物中,首个贝类——太平洋牡蛎(Pacific oyster)基因组图谱于2012年完成,标志着软体动物组学时代的到来,填补了软体动物家族基因组图谱的空白[6]。随后,霸王莲花青螺(Lottiagigantea)[7]、章鱼(Octopusbimaculoides)[8]、牡蛎(Crassostreavirginica)[9]等其他软体动物的基因组图谱陆续发表,这为其他软体动物的基因组图谱的构建提供了基础。截至2022年6月,在NCBI数据库中已公布92个软体动物基因组图谱。基因组的解析可为贝类优良性状基因挖掘、遗传机制解析提供研究基础。然而,目前淡水的田螺科贝类分子生物学研究基础相对薄弱,关于田螺科的研究大多集中在初步调查、系统发育和分类地位等方面的分析[10-12]。在NCBI数据库中,提供的田螺科分子数据十分有限,缺乏田螺科贝类参考基因组信息。在构建基因组精细谱图之前进行基因组特征调研,可为后续的测序方案提供参考依据。目前,主要采用K-mer分析方法对基因组进行调研评估获取物种杂合率、重复度等信息[13-15]。本研究选取淡水田螺科的中华园田螺(Cipangopaludinacathayensis)、铜锈环棱螺(Bellamyaaeruginosa)、多棱角螺(Angulyagrapolyzonata)、湄公螺(Mekongiarivularia)等4种代表性贝类进行基因组调研,通过K-mer分析,进行物种杂合率、基因组重复序列比例及基因组大小的评估,以期为田螺科贝类基因组学研究提供参考。同时,利用Illumina 测序数据对4个田螺科贝类进行初步组装和初步比较分析,采用MISA工具对简单重复序列(SSR)进行鉴定和分析,为进一步分子标记开发和资源鉴定提供研究基础。

1 材料与方法

1.1 材料

中华园田螺、铜锈环棱螺、多棱角螺和湄公螺,于2021年5—6月分别采集自四川(30°23′36.82″N,104°4′50.46″E)、江苏盐城(33°22′33.4″N,120°12′7.19″E)、湖南(27°49′36.25″N,113°7′59.75″E)、江西(28°30′7.34″N,115°48′22.93″E),采集的田螺科样本保存于江苏盐城师范学院沿海滩涂重点实验室。

1.2 样品DNA提取

在江苏省盐城师范学院沿海滩涂重点实验室,使用Omega公司的试剂盒D3373-01 Mollusc DNA Kit(50)提取田螺科4种代表性螺的基因组DNA(取螺的部分样品),用NanoDrop 光谱仪测定DNA 的浓度和纯度。DNA样本标准为:DNA总量≥20 μg 且浓度≥300 ng/μL;样本纯度要求为:D260 nm/280 nm≥1.8,D260 nm/230 nm≥1.8。

1.3 4种贝类样本测序和基因组评估

DNA样本送到武汉菲沙基因信息有限公司进行文库制备,基于高通量测序仪(MGI-SEQ2000)平台采取双端150 bp(PE150)技术进行测序,测得的数据经过质控后用来进行下一步数据分析。4种贝类Illumina测序数据存储在国家基因组科学数据中心数据库(https://ngdc.cncb.ac.cn/),项目编号:PRJCA013294。

文库构建参照Illumina标准规程[16],构建并插入片段大小为270 bp的文库[17]并测序。完成构建的文库在Illumina HiSeq 2500平台进行测序。选用AdapterRemoval(version 2.1.7)软件对测序数据去接头,用FastQC软件进行质量评估,并过滤质粒污染。采用基于K-mer分析进行估算,K值取21,在测序reads均匀分布的前提下,计算基因组大小(基因组大小=总碱基数/平均测序深度=总K-mer数平均值/平均K-mer深度)。利用Jellyfish和 GenomeScope 软件对K-mer频数分布数据进行统计并拟合作图,得到K-mer分布图。

1.4 基因组组装和GC深度分析

对过滤数据利用SOAPdenovo软件进行基因组组装,将读长(reads)分成100 bp长度的K-mer,再基于 K-mer 数据构建de Bruijn图。利用perl脚本对组装的基因组进行滑窗统计,设置窗口为10 kb,根据GC分布和覆盖深度统计结果,应用R脚本绘制散点图。

1.5 简单重复序列(SSR)特征分析

对初步完成组装的基因组进行简单重复序列分析。使用微卫星识别工具(microsatellite identification tool,MISA)搜索SSR位点对于150 bp以上的序列片段(Scaffolds)[18]。同时运行MISA软件程序的配置文件misa.ini,使用MISA默认参数。

2 结果与分析

2.1 田螺科4种贝类基因组测序质量和基因组大小评估

对Illumina Hiseq PE测序平台测得的中华园田螺、铜锈环棱螺、多棱角螺、湄公螺等4个代表性贝类的原始数据,经过滤和校正等质控步骤后,分别获得52.59、58.64、55.71、54.90 G的有效数据,有效数据均大于96%(表1)。测序质量评估结果显示,4种螺的Q20分别为 96.5%、96.1%、96.4%、96.6%,Q30分别为88.5%、87.5%、88.3%、88.8%,Q20均大于95%,Q30均大于85%,表明4种贝类的测序质量较好,满足分析要求。4种田螺科贝类GC 含量分别为33.4%、33.7%、33.1%、33.8%,GC含量基本持平。

表1 田螺科4种螺基因组调查测序结果统计

本研究采用K-mer 的分析方法,取K为21来进行物种基因组特征分析,K-mer分布图如图1,实际观测的K-mer分布为蓝色区域;测序频数较低的K-mer为红色线条下方区域(测序错误);黑色线条下方是可靠的K-mer数据,用于4种贝类基因组大小的评估;黄色线条下方区域是非重复区域。由图1可知,中华园田螺、铜锈环棱螺、多棱角螺、湄公螺的主峰分别在测序深度18×、18×、45×、23×左右,均只有1个主峰,说明4种螺均为2倍体。在测序数据中去除深度异常的K-mer后,评估得到4种螺的基因组大小分别为1 353、896、991、1 196 Mb;杂合度分别为0.77%、1.37%、2.41%、0.91%。4种贝类杂合率均大于0.5%,为高杂合基因组。4种螺的重复序列比例分别为26.2%、26.7%、27.8%、28.8%,比例基本一致(表2)。

表2 田螺科4种螺基因组评估结果

2.2 田螺科4种贝类基因组序列初步组装

利用SOAPdenovo软件分别对4种贝类经过质控处理后得到的高质量read,进行初步组装,中华园田螺、铜锈环棱螺、多棱角螺、湄公螺的基因组大小分别为 1 598、1 845、1 202、1 322 Mb,其中铜锈环棱螺基因组长度最大,多棱角螺基因组长度最小。4种贝类的Contigs N50分别为690、200、1 025、889 bp(表3)。初步组装得到的基因组大小与K-mer评估得到基因组大小有差异,其组装的基因组大小偏大,这可能杂合度有关,也有可能与二代测序数据读长较短和覆盖度较低等因素有关。

2.3 田螺科4种贝类初步组装的GC含量与覆盖度分布

对4种田螺科贝类初步组装得到的基因组,过滤覆盖深度10×以下的contig序列,基于覆盖深度和GC含量绘制成散点图。由图2可知,中华园田螺、铜锈环棱螺、多棱角螺、湄公螺4种螺的GC含量较为一致,在27%~43%范围内,但区域测序深度分布有所差异。其中中华园田螺测序深度较高,在20~40×区域深度分布比较集中,其次分别是湄公螺(18~25×)、多棱角螺(10~38×)、铜锈环棱螺(10~20×)。4种田螺科贝类均为1个主峰,说明无外源污染。

2.4 田螺科4种贝类SSR特征分析

对中华园田螺、铜锈环棱螺、多棱角螺、湄公螺等4种贝类初步组装的基因组,通过微卫星识别工具MISA软件对组装基因组的Scaffolds进行SSR分析。4种贝类总共分别搜索到 928 562、824 342、739 299、739 407个SSR。其中,4种贝类分别有 196 158、127 288、158 667、160 694条序列包含1个以上碱基重复;分别有13 360、127 897、118 293、118 258 个复合形式存在。4种贝类SSR位点的核苷酸重复类型可划分6种类型。其中,单核苷酸重复的SSR基元类型最丰富,五核苷酸重复、六核苷酸重复基元类型和分布相对较少。具体而言,中华园田螺、铜锈环棱螺、多棱角螺、湄公螺的单核苷酸重复、双核核苷酸重复序列占比最高,分别达79.2%、79.9%、78.7%、80.9%(表4)。对检测出的重复基元进行排序,其中,4种贝类优势重复基元分别是A/T、AC/GT、AAT/ATT、AGAT/ATCT、ATAAT/ATTAT、CTAACC/GGTTAA。对双核苷酸重复、三核苷酸重复、四核苷酸重复中基元进行比较发现,4种贝类的优势重复基元大体相同(图3)。

表4 田螺科4种螺基因组SSR类型

3 结论与讨论

近年来,随着测序技术的发展,越来越多的软体动物基因组被解析,为研究软体动物起源、进化、生殖、发育、性别调控和免疫等问题提供分子生物学基础。目前基因组调研的主要手段是高通量二代测序技术。本研究通过Illumina数据,利用生物信息学手段,首次对腹足纲淡水软体动物田螺科贝类中华园田螺、铜锈环棱螺、多棱角螺、湄公螺等代表性物种的基因组大小、杂合度进行评估分析。4种贝类的基因组大小分别为1 353、896、991、1 196 Mb,说明田螺科物种基因组大小存在差异,但与已公布大多数腹足纲物种的基因组大小接近[19-21]。腹足纲软体动物基因组大小存在丰富的多样性,如在已测腹足纲中,基因组最大的物种是地中海芋螺(Conusventricosus),基因组大小为 3.6 G;霸王莲花青螺(Lottiagigantea)基因组最小(359.5 Mb)[8],这2个物种基因组大小差异约为10倍。基因组是反映生物物种遗传信息的重要指标,在物种进化和适应中起着重要作用,其大小与生物参数有关,如细胞大小、抗逆性和个体生长等。在本研究中,田螺科贝类生长个体大小与基因组大小没有直接的相关性。

前人将一个物种杂合度高于0.5%定义为高杂合度物种[22],在本研究中,中华园田螺、铜锈环棱螺、多棱角螺、湄公螺4种贝类的杂合度分别约0.77%、1.35%、2.41%、0.91%,均大于0.5%,说明这4种田螺科贝类是高杂合率物种,这可能与田螺科物种的特殊性有关。田螺科贝类属于雌雄异体,且生境基本相同,不同种群间基因交流可能是造成杂合率高的原因之一。这在Wang等应用线粒体基因组构建系统发育树的研究中有所显示[23],说明田螺科存在着种间基因交流,而部分种间是否存在生殖隔离还存在争议,需要进一步研究。实践证明,高杂合度基因组会导致组装过程中同源区域的read无法合并,分支结构过多,连续性降低,从而造成组装的基因组偏大。在本研究中也存在这样的问题,应用二代测序数据从头组装结果大小均高于应用K-mer评估的结果。另外,高杂合还导致组装结果中Contig N50较小,造成GC平均深度及分布较小。以上结果说明高杂合度提高了对田螺科物种精细基因图谱的构建难度。在本研究中4个田螺科物种重复序列占全基因组较小,分别为26.2%、26.7%、27.8%、28.8%,与已发表的其他腹足纲物种接近[24-26],为低重复序列基因组(重复序列比例高于50%是高重复基因组)[27],但非洲大蜗牛(Achatinafulica)例外,其重复序列比例较大,占整个基因组的70%,前人研究发现其发生基因组复制事件[28]。本研究4个田螺科贝类基因组重复序列占比较小,推测较少发生全基因组复制事件。

物种GC比例是评估、分析物种调研图准确度,评估后续基因组图谱组装难度的重点衡量标准之一[29]。在本研究中,田螺科4种贝类的GC含量分别为33.4%、33.7%、33.1%、33.8%,腹足纲其他物种GC含量在26.8%~45.5%的区间内,其中绿唇鲍(Haliotislaevigata)GC含量最小(26.8%)[30],印度洋热液喷口蜗牛(Alviniconchamarisindica)最大(GC含量为45.5%)[31]。事实上腹足纲物种线粒体基因组中也有存在GC含量较低的规律,如福寿螺(Pomaceacanaliculata)、斑点果瓶螺(P.maculat)和皱纹盘鲍(Haliotisdiscushannai)的线粒体GC含量在33%~40%范围内[32],说明腹足纲物种核基因组和线粒体基因组均具有AT偏好性。研究发现物种在基因组图谱构建中,过高或过低的GC含量将导致测序错误,GC贫乏或富集区通常会引起扩增效果较差,并影响组装数据的准确性[33],且对准确度的干扰高于完整性。这也是本研究4个贝类物种中基因组初步组装质量较差,以及其他贝类基因组序列组装难度较高的因素之一[34]。

SSR分子标记具有多态性高、等位差异显著的优点[35],是遗传研究中应用广泛的分子标记[36-37]。本研究利用MISA分析方法对田螺科代表性4种螺进行SSR特征分析,与植物的SSR主要是双核苷酸和三核苷酸不同[22],本研究4种贝类中单、双核核苷酸重复序列占比最高,分别达79.2%、79.9%、78.7%、80.9%,这与扁玉螺(Neveritadidyma)[35]、泥东风螺(Babylonialutosa)[38]的研究结果相一致。从4种田螺科贝类的SSR重复基元来看,单核苷酸中SSR位点占比最多的为A/T,双核苷酸重复基元中,AC/GT占比均最高,这与前人研究的结果[39]相一致。SSR的长度会影响其本身多态性,而4种螺所含SSR的长度绝大部分在10~24 bp 之间的,分别占71.4%、64.9%、68.4%、70.2%,推测田螺科物种可能受到强烈的趋同选择压力。本研究为田螺科物种基因图谱构建、物种分子鉴定提供了前期基础。

猜你喜欢
田螺贝类杂合
我国海水贝类养殖低碳效应评价
田螺姑娘的夏天
甘蓝型油菜隐性上位互作核不育系统不育系材料选育中常见的育性分离及基因型判断
QuEChERS-液相色谱-高分辨质谱法测定贝类中6种亲脂性贝类毒素
摸田螺
田螺
吃田螺
从翻译到文化杂合——“译创”理论的虚涵数意
雄激素可调节的肾脏近端肾小管上皮细胞靶向杂合启动子的优化
贝类水产品中汞的形态分析