白三叶转录组SSR 位点特征分析及引物开发

2023-10-10 09:37张婷婷张鹤山宋康杰赵泽宇许本波
草业科学 2023年9期
关键词:白三叶碱基种质

张婷婷,张鹤山,宋康杰,赵泽宇,许本波,刘 洋

(1.长江大学生命科学学院, 湖北 荆州 434025;2.动物胚胎及分子育种湖北重点实验室 /湖北省农业科学院畜牧兽医研究所, 湖北 武汉 430064)

白三叶(Trifolium repens)在世界温带和亚热带地区广泛分布[1-2],在我国西南、华中、华北、东北等地区有野生分布。白三叶适应性强,蛋白含量高,适口性好,几个世纪以来一直作为优质蛋白饲料被人们饲喂家畜[3],在鄂、湘、川、云、贵等省(区)有大面积栽培。据统计,云南有一半的栽培草地混播了白三叶,湖北也建植了近4 万hm2的白三叶混播草地[4]。此外,白三叶生有固氮作用的根瘤,并且花期长、叶形美观,在南方草地生态建设、果园生草和景观绿化方面亦具有很高的利用价值[5]。

分子标记技术被广泛用于植物聚类分析、种质资源鉴定和基因定位[6-8]。简单重复序列(simple sequence repeats, SSRs)主要指在真核生物基因组非编码区中,重复核心序列较短(1~6)而重复次数较多的串联重复序列。SSR 广泛存在于真核生物中,是基于PCR 的共显性标记[9],具有丰富的基因组水平多态性,并且在同一物种不同的种质材料间可以高度表达[10-12],因此,SSR 标记被认为是植物染色体组分析的理想技术[13],被 广泛应用于遗传多样性的评估、种群遗传结构分析、系谱确定、构建遗传图谱等多个领域。

研究发现SSR 分子标记技术可简单、高效开展遗传多样性和基因定位研究。国外Jones 等[14]和Barrett 等[15]分别利用78 对、365 对SSR引物标记了135 个、493 个位点。国内李莉等[16-17]利用SSR 技术分析了贵州白三叶种群和不同种质间同一花序的多样性,夏岩石等[18]将菜薹品质和SSR 标记进行了关联分析,这些研究为白三叶种质资源的创新利用提供了技术支持。尽管如此,目前用于白三叶种质资源研究的专用引物及白三叶特异性引物仍然较少,已经制约了白三叶分子辅助育种技术的发展。鉴于此,本研究以不同花瓣颜色的白三叶转录组测序为基础,利用生物信息学方法分析白三叶SSR 位点序列分布特征、碱基重复类型、引物设计等信息,并开发具有多态性的白三叶SSR 标记,以期为白三叶遗传信息分析、种质资源高效鉴定及杂种优势利用等方面提供理论支持。

1 材料与方法

1.1 试验材料

白三叶种植于湖北省农业科学院牧草种质资源圃(114°10′ E,30°18′ N,海拔31 m),在开花期采集生长良好的白三叶花瓣,3 次生物学重复,液氮速冻后保存-80 ℃冰箱。由北京百迈客生物科技有限公司完成样品RNA-seq 测序。

用于多态性引物筛选的白三叶种质如表1 所列,其中来自丹麦和德国的材料各2 份,来自美国的材料4 份,来自新西兰的材料6 份,来自英国和中国的材料各3 份。除来自于中国云南和贵州的2 个白三叶材料为野生类型外,其他材料均为栽培品种。

表1 材料及其来源Table 1 Experimental materials and their sources

1.2 SSR 序列识别

转 录 组 数 据 已 上 传 至GEO (Gene Expression Omnibus database)数据库,登录号为GSE101059。利用MicroSatellite (MISA,http://pgrc.ipk-gatersleben.de/misa/)软件定位、识别转录组unigene 数据中的SSR 位点。参数标准为:重复单元1~6 bp,单碱基和二碱基的最低重复参数分别为10 次和6 次,三碱基、四碱基、五碱基和六碱基最低重复5 次,SSR 位点两侧序列长度大于50 nt。

1.3 SSR 引物设计

利 用 Primer 6.0 设 计SSR 正 向 引 物 和 反 向 引物。引物长度控制为18~25 nt (碱基),Tm 值55~65 ℃,GC 含量40%~60%,产物长度80~300 bp。为更清晰地读取谱带数据,将每条引物的正向引物加上通用M13 接头序列“TGTAAAACGACGGCC AGT”,合成含HEX 荧光基团M13 荧光接头引物。

1.4 PCR 扩增体系

本研究以来自不同地区的20 个白三叶种质为材料,从批量设计的引物中随机选择60 对检测其SSR 位点多态性。

采用CTAB 法提取白三叶叶片总DNA[19]。以DNA 为模板,进行三引物PCR 扩增(反向引物、M13 接头引物和M13 荧光接头引物),PCR 反应体系中包含1 μL 模板DNA,5 μL PCR Master Mix (天一辉远),0.1 μL 正向引物,M13 接头引物0.4 μL,0.4 μL荧光M13 引物,用ddH2O 补足10 μL。扩增程序如下:95 ℃ 预变性5 min;分别扩增30 个循环(95 ℃变性 30 s,60 ℃退火30 s,72 ℃延伸30 s)和8 个循环(95 ℃变性 30 s,52 ℃退火30 s,72 ℃延伸30 s);72 ℃保温10 min。利用毛细管荧光电泳检测PCR产物,统计条带情况。

2 结果与分析

2.1 白三叶转录组中SSR 位点类型

白三叶SSR 位点总数为24 960 个,分布于20 142条序列上,平均每5.29 kb 中出现1 个SSR 位点,出现频率为13.25%。含1 个以上SSR 位点的序列有3701条,含有复合SSR 位点的序列有1 940 条。白三叶转录组中共有273 种重复单元,其中,单碱基重复有两种,即C/G 重复和A/T 重复,以A/为主,共6 202 个,出现频率和平均距离也最高,分别为3.29%和21.30 kb;二碱基重复共4 种,AG/CT 重复最多,最少的是CG/CG 重复,只占二碱基重复的0.18%;三碱基重复数量最多的是AAG/CTT,出现频率为1.18%;四碱基重复有27 种,有5 种只存在于1 处,最多的有189 处,即AAAT/ATTT;五碱基重复共有79 种,其中,AAAAT/ATTTT 最多,有82 处;六碱基重复的种类最多,共有151 种,但每一种重复的数量均较少,最多的AATCAT/ATGATT 也只有22 处(表2)。在这6 种碱基重复中,种类与数量成反比,既数量越少,但重复种类却更多,比如六碱基重复的数量最少,但其种类最多。

表2 白三叶转录组SSR 基元类型Table 2 Transcriptome SSR repeat types in Trifolium repens transcripts

2.2 SSR 位点重复次数

在每一类型碱基基元中,重复数量随重复次数的增加而减少。单碱基、二碱基和三碱基重复中,重复最多次数的数值分别为12 次、6 次和5 次,分别 有2 194 处、2 113 处 和4 620 处,占 比 分 别 为35.13%、31.16%和49.09%;四碱基、五碱基、六碱基重复中,重复最多次数的数值分别为5 次、4 次和4 次,分别有532 处、655 处和520 处,占比由64.33%到79.11%最后上升至85.86%,由此可以看出,重复最多次数的数值在降低,占比却在升高。在单碱基重复到六碱基重复的过程中,重复次数的类型逐渐降低。单碱基重复中的重复次数有38 种类型,二碱基和三碱基重复中的重复次数分别有37 种和23种,但四碱基、五碱基、六碱基重复的重复次数仅分别有12、10 和12 种(表3)。

表3 SSR 重复次数Table 3 SSR number of replications

2.3 白三叶转录组中SSR 重复的长度分布

白三叶SSR 重复片段平均长度为18 bp,SSR 重复的长度主要集中在12~35 bp,有24 069 条,占了总数的96.43%,其中,数量最多的为15、12 和18 bp,分 别 有5 216、4 307 和3 109 条;36~132 bp 只 有891 条,占总数的3.57%,其中,最长的4 种长度为92、93、126 和132 bp,只有1~2 条(图1)。

图1 SSR 长度总的分布情况Figure 1 Distribution of total SSR length

2.4 SSR 引物设计

为了筛选出可应用于白三叶相关分析的SSR分子标记,利用软件对24 960 个SSR 位点进行引物设计(表4),共设计出18 549 对引物,长度为18~28 bp,预测扩增产物大小为80~240 bp,退火温度为55.00~63.50 ℃,正反引物温差不大于6 ℃。在设计的18 549 对SSR 引物中,扩增产物最多的为三碱基重复,有11 589 对,占62.48%;其次是二碱基重复,有4 953 对,占26.70%;剩下4 种重复类型设计出的引物占比均不大。尽管单碱基重复SSR 位点有6 246处,占总数的25.02%,但设计出的引物只有69 处,仅占所有引物的0.37%。

表4 设计的SSR 引物统计信息Table 4 Statistics of designed SSR primers

2.5 白三叶品种的指纹图谱构建

为进一步检验设计引物的有效性和实用性,本研究利用20 个不同生态背景的白三叶种质材料对随机选取的60 对引物的多态性进行了多态性检测。结果表明,52 对引物能扩增出目的条带,引物扩增率为86.7%。将荧光PCR 产物进行毛细管电泳检测,33 对引物的扩增产物能检测到目的片段,占引物数量的63.5%,其中具有多态性位点的引物有17 对,占32.7%。

以筛选出的多态性引物扩增出的毛细管峰图为基础,选取5 对具有代表性的引物ZHS11、ZHS39、ZHS41、ZHS56 和ZHS109 构建DNA 指纹图谱,引物信息如表5 所列。ZHS41 的144 bp、ZHS11 的214 bp、ZHS56 的230 bp 分 别 可 以 将EM10、EM17 和EM18 区 分 出 来(图2)。EM7 和EM10 在ZHS11 的166 bp 处均有条带,但EM7 还有178 bp、190 bp 和202 bp 条带而EM10 没有,因此可以把EM7 区分出来。以此类推,这5 对引物可以将20 份白三叶品种在分子层面区别出来,说明由这5 对引物所构建的20 份白三叶DNA 指纹图谱具有较强的鉴定、区别能力。

图2 20 份白三叶品种的DNA 指纹图谱Figure 2 DNA Fingerprinting of 20 white clover cultivars

表5 引物信息Table 5 SSR primer information

3 讨论

SSR 的数量和物种进化水平相关,数量越多表明进化时间较长或变异频率较高,相反则表明其变异水平越低[20]。本研究表明,白三叶转录组中平均每5.29 kb 中出现一个SSR 位点,其频率高于高加索三叶草(T.ambiguum)[21]、杂花苜蓿(Medicago varia)[22],低于矩镰荚苜蓿(M.archiducis-nicolai)[23],这种差异可能和物种之间SSR 位点的表达差异有关[24]。通常认为物种中的高级重复基元即四碱基、五碱基、六碱基重复越多,其变异水平越低,低级重复基元即单碱基、二碱基、三碱基重复越多,其进化时间较长或变异频率较高[25]。白三叶转录组中SSR 重复主要为单核苷酸、二核苷酸和三核苷酸重复,由此可见,白三叶具有较长的进化时间和较高的进化频率。

SSR 位点长度与多态性相关,SSR 位点长度≥ 20 bp 时具有较高的多态性,12~19 bp 时多态性中等, <12 bp 时多态性极低[17]。本研究中,白三叶转录组SSR 位 点 长 度≥ 20 bp 的 有7 343 处,占 总 数 的29.42%,说明白三叶SSR 位点的多态性水平较高。分子标记的多态性是判断其可用性的重要依据,数量丰富、多态性潜能高的低级SSR 重复基序是高效开发白三叶良好的前提,本研究中的白三叶SSR 多态性较好,是后续分子标记的试验基础。

本研究中,根据白三叶转录组SSR 设计出的引物的扩增产物最多的为三碱基重复,其次是二碱基重复,这说明进化时间较长、多态性较高的SSR 更有可能被用来作为特异性引物。品种或种质资源的特异性是新品种保护的技术基础和授权的科学依据[25]。利用分子标记技术构建品种指纹图谱,可以快速准确地进行品种(系)的鉴定,同时具有很强的个体特异性,为作物育种和种子管理工作提供了极大的便利[26]。SSR 分子标记技术作为比较理想的分子标记技术之一[27],已被广泛应用于豆科牧草如苜蓿[28]、红三叶(T.pratense)[29]、红豆草(Onobrychis viciifolia) [30]等多个物种的品种鉴定。本研究筛选出具有较高多态性的SSR 引物,对20 份白三叶品种构建DNA 指纹图谱。DNA 指纹图谱的构建对白三叶种质创新、品种选育及鉴定均具有积极作用,也可为新品种知识产权保护与有效利用提供保障。马骢毓等[30]利用6 对引物为13 个白三叶品种构建了指纹图谱,经过比较分析,与本研究所利用的白三叶品种和引物均不相同。就本研究而言,随着白三叶国外品种的不断引进且筛选的引物数量有限,特征条带也可能在其他品种中出现,因此目前的引物组合仅在一定的材料范围内适用。

4 结论

白三叶转录组中SSR 位点分布频率较高,分布密度大,重复基元种类丰富,具有较高的特异性和多态性。基于白三叶转录组SSR 位点批量设计并筛选多态性引物是可行的。本研究将为白三叶多态性及特异性引物的开发、遗传多样性评价及分子标记辅助育种等方面的研究提供理论依据。

猜你喜欢
白三叶碱基种质
三叶草属2 种草坪草出苗和幼苗生长阶段的种内与种间关系
华南地区最大农作物种质资源保护库建成
9月可以播种白三叶吗?
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来4名新成员
生命“字母表”迎来4名新成员
亚麻抗白粉病种质资源的鉴定与筛选
浅析白三叶的虫害防治
贵州玉米种质资源遗传多样性及核心种质库构建