基于重测序鉴定SbHKT 基因在陆地棉基因组中的插入位点

2021-09-14 00:50徐鹏郭琪徐珍珍孟珊陈天子沈新莲
棉花学报 2021年4期
关键词:株系转基因引物

徐鹏,郭琪,徐珍珍,孟珊,陈天子,沈新莲

(江苏省农业科学院经济作物研究所/农业部长江下游棉花与油菜重点实验室,南京 210014)

目前,转基因作物在许多国家和地区已经被批准种植、加工和出口。 为了确保消费者健康和环境安全,在进入市场之前,必须强制性地对转基因作物进行安全评估[1]。 转基因作物的安全性评估从分子特征开始, 然后才是转基因与非转基因作物之间的表型和农艺性状的评估。 分子特征包括外源插入物的结构、表达、稳定性遗传信息以及插入位点的序列特征[2]。 因此在转基因作物的风险评估中,分子特征识别是必不可少的。

近些年来,随着更多的转化体获准商业化种植,转基因作物的安全评价监督管理及其知识产权的保护受到更广泛的关注。 明确转化体插入位点的分子特征是对转基因作物知识产权保护和安全监督管理的技术依据。 由于T-DNA 插入植物基因组中位置的不确定性, 不同转化事件中T-DNA 插入位点的侧翼序列也不同;因此,每一个转化体都是唯一转化事件,T-DNA 插入位点是每个转化体的标签。 鉴定出T-DNA 在植物基因组中的插入位点,根据插入位点处的侧翼序列以及T-DNA 骨架序列建立转化体特异性聚合酶链式反应(Polymerase chain reaction,PCR)检测方法可以准确地识别不同转化事件。 因此,明确新转化体的侧翼序列是建立PCR 检测转化体方法的基础。目前,获得T-DNA 插入位点侧翼序列主要报道的方法有反向PCR 法[3]、 热不对称交错PCR[4-5]、PCR 步移[6-7]和基因组重测序法[8-9]。 近些年来,陆地棉基因组序列的公布为准确而有效地鉴定外源转基因在陆地棉中的插入位点奠定了基础。

前期笔者团队从盐生植物海蓬子中获得了高亲和钾离子转运体SbHKT基因, 利用农杆菌介导法将其转入棉花,Southern 杂交结果显示T0代转基因阳性单株L-HKT-69 为单拷贝插入[10]。本研究对L-HKT-69 的T5代株系HKT-1 进行重测序, 获得SbHKT基因在陆地棉基因组中的侧翼序列, 分析外源T-DNA 在陆地棉基因组插入位点的序列特征, 从而构建SbHKT基因转化事件的特异性检测方法。

1 材料与方法

1.1 供试材料

转SbHKT基因抗逆棉花L-HKT-69 阳性单株是通过农杆菌介导转化陆地棉品系R15 子叶和下胚轴而获得[10]。 HKT-1 为L-HKT-69 单株繁殖的T5代。 所用植物表达载体为pCAMBIA2301。

1.2 HKT-1 株系的重测序

用CTAB 法[11]提取3 株HKT-1 阳性株系基因组DNA,然后等量混合。 利用Thermo Nanodrop 2000 超微量分光光度计检测DNA 的纯度,Qubit 2.0 荧光定量仪精确定量DNA 浓度。 检测合格的DNA 样品通过Covaris 破碎机随机打断成长度为350 bp 的片段, 采用TruSeq Library Construction Kit(Illumina 公司)进行建库。文库构建完成后,先使用Qubit 2.0 荧光定量仪进行初步定量, 稀释文库至1 mg·L-1, 随后使用Agilent 2100 生物分析仪对文库插入片段大小进行检测,符合预期后, 使用实时定量聚合酶链式反应(Quantitative real time-PCR,qRT-PCR)方法对文库的有效浓度进行准确定量(文库有效浓度大于2 nmol·L-1),以保证文库质量。 文库检测合格后通过Illumina HiSeq PE150 进行测序。 对下机得到的原始数据(Raw data)进行质量控制得到干净数据(Clean data)。

1.3 侧翼序列的预测

以干净数据作为检索项, 含有SbHKT基因的pCAMBIA2301 载体(后文简称为:T-DNA 区)骨架序列作为参考序列进行本地BlastN 比对(E值<1×10-10); 用CAP3 软件进行聚类与拼接。剔除T-DNA 骨架序列后, 剩余部分序列为插入位点的侧翼序列。

1.4 侧翼序列的验证

分别针对左边界(Left border,LB)端侧翼序列HKT1_LSEQ 和右边界 (Right border,RB)端侧翼序列HKT1_RSEQ 以及T-DNA 区段内的骨架序列设计引物, 特异性扩增T-DNA 区骨架序列到其插入位点两端侧翼序列之间的片段。 同时以HKT1_LB_F 和HKT2_RB_R 为引物,特异性扩增HKT1_LSEQ 到HKT1_RSEQ 之间的序列(包含整个T-DNA 区)。 引物由南京擎科生物科技有限公司合成, 序列如表1 所示, 位置如图1所示。 PCR 产物经琼脂糖电泳分离后,将特异条带回收纯化,连接到pMD18-T 载体,转化大肠杆菌,随机挑选单克隆进行PCR 检测,选择PCR 检测阳性的克隆测序验证。

表1 本研究所用引物序列Table 1 Primer sequences in this study

2 结果与分析

2.1 基于重测序预测HKT-1 株系的侧翼序列

利用Illumina 双端对转基因阳性株系HKT-1 进行了30×的重测序,对含有接头的、低质量的原始数据过滤后得到约50 Gb(Gigabyte)的干净数据,以其为检索序列,以含有SbHKT基因的T-DNA 区完整序列作为参考序列进行本地BlastN 比对, 获得与T-DNA 区联配的干净数据共计1 887 条,其中38 条干净数据仅有部分序列比对到T-DNA 骨架序列两端 (表2)。 利用CAP3 对38 条干净数据拼接,获得了图2 所示的2 条序列, 为SbHKT基因插入位点的侧翼序列, 其中LB 端侧翼序列HKT1_LSEQ 长度为107 bp,RB 端 侧 翼 序 列HKT1_RSEQ 长 度 为122 bp。 因为在T-DNA 骨架序列两侧仅各自获得1 条侧翼序列, 暗示本研究中插入事件为单位点插入。

表2 部分干净数据与T-DNA 区的比对结果Table 2 Alignment results of some clean reads with SbHKT vector

利用以上预测的侧翼序列HKT1_LSEQ 和HKT1_RSEQ(图2)作为检索序列,比对陆地棉基因 组[12],HKT1_LSEQ 和HKT1_RSEQ 均 锚 定 到D08 染色体,两者的物理距离约为2.5 Mb(表3),表明应该有2 个不同的插入事件, 与2.1 的结果矛盾。相关研究表明,由于T-DNA 的插入通常伴随着插入位点序列的删除、复制、染色体易位或倒位等现象[13]。 因此,推测本研究中T-DNA 的插入引起了陆地棉染色体的结构变异。 我们提取了HKT1_LSEQ 和HKT1_RSEQ 序列之间2.5 Mb 的参考基因组序列作为参考序列,以干净数据作为检索序列进行本地BlastN 比对, 其中编号为H5WHNDSXX:1:2454:27227:3646 的干净数据前端58 bp 能够比对到HKT1_RSEQ 附近, 而末端83 bp 能比对到HKT1_LSEQ 附近(表4),初步推测SbHKT基因的插入引发了陆地棉基因组较大的结构变异。

表3 侧翼序列在陆地棉基因组中的定位Table 3 The position of the flanking sequence

表4 编号为H5WHNDSXX:1:2454:27227:3646 干净数据的比对结果Table 4 Alignment results of clean reads numbered H5WHNDSXX:1:2454:27227:3646

2.2 侧翼序列的验证

为了验证T-DNA 的插入位点, 分别针对HKT1_LSEQ 和HKT1_RSEQ 以 及T-DNA 骨 架序列设计特异引物(表1),特异性扩增T-DNA 骨架序列及其插入位点两侧的陆地棉基因组序列。2 对引物在转SbHKT基因株系HKT-1 中均扩增出与预期大小一致的目的条带,而转化受体R15中均没有扩增产物(图3A)。 测序结果与参考序列完全一致, 显示HKT1_LSEQ 和HKT1_RSEQ是SbHKT基因插入位点处的左右侧翼序列。 为了进一步证明HKT1_LSEQ 和HKT1_RSEQ 为同一插入事件的侧翼序列, 用引物HKT1_LB_F和HKT2_RB_R 对HKT-1 株系和对照R15 进行PCR 扩增, 在HKT-1 株系中扩增出7 000 bp 左右条带,而R15 中并未扩增出任何产物(图3B)。直接对7 000 bp 的PCR 产物测序发现, 产物包含完整的T-DNA 骨架序列以及SbHKT基因序列,结果与参考序列一致,证实HKT1_LSEQ 和HKT1_RSEQ 为同一插入事件的2 个侧翼序列。

2.3 插入位点分析

SbHKT基因的插入造成了陆地棉R15 基因组发生了大片段的结构变异,利用CAP3 对结构变异处的干净数据拼接后获得序列Contig1,比对后发现D08 染色体65 715 837~65 716 919 bp片段倒置插入到63 234 670 bp 之前(图4)。 根据Contig1 序列设计特异PCR 引物, 克隆并测序证实了HKT-1 株系中的结构变异。 然后,对HKT-1株系T-DNA 插入位点侧翼序列(两侧各500 bp)的分析显示,AT 含量分别为68.2%、66.8%。 说明T-DNA 偏好插入到AT 含量较高的区域,与前人研究结果[4-5]一致。

3 讨论

目前, 棉花中获取T-DNA 侧翼序列的主要手段是通过高效热不对称交错PCR 和PCR 步移方法获取T-DNA 侧翼序列。 这些方法操作步骤复杂,特异性差,无法获得很高的成功率。 前期的研究中, 我们通过高效热不对称交错PCR 分离SbHKT基因插入陆地棉基因组的侧翼序列,但是结果不太理想。 重测序技术是1 种简单、可靠、高效的获取外源T-DNA 插入位点的方法。 陆地棉基因组序列的公布为准确而有效地鉴定外源转基因插入位点奠定了基础。 本研究基于重测序技术获得了转SbHKT基因在陆地棉基因组中的侧翼序列,证实通过重测序技术可以快速、准确且有效地鉴定外源转基因插入位点。

基于以下4 点原因, 我们认为SbHKT基因的插入引发了陆地棉基因组较大的结构变异。(1)HKT1_LSEQ 和HKT1_RSEQ 的物理距离约为2.5 Mb。 我们分别从陆地棉基因组中调取HKT1_LSEQ 下游和HKT1_RSEQ 上游1 000 bp的序列作为其理论上存在的另一侧侧翼序列,设计特异引物对HKT-1 阳性株系以及对照R15 进

行PCR 扩增,均未能扩增出任何产物(结果未列出);(2)HKT1_LSEQ 和HKT1_RSEQ 锚定现有已公布的棉花基因组序列[12,14-17]均得到类似的结果,进一步排除了参考基因组的原因;(3)编号为H5WHNDSXX:1:2454:27227:3646 的干净数据前端1~58 bp 序列定位到HKT1_RSEQ 附近,且末端68~150 bp 区间定位到HKT1_LSEQ 附近;(4)用特异引物HKT1_LB_F 和HKT2_RB_R 对HKT-1 株系和对照R15 进行PCR 扩增,在HKT-1 株系中扩增出7 000 bp 含有SbHKT基因的T-DNA 区完整序列, 而R15 中并未扩增出任何产物,证实HKT1_LSEQ 和HKT1_RSEQ 为同一插入事件的侧翼序列。 因为测序深度有限,SbHKT基因插入后具体结构变异是如何发生的仍不清楚。目前,棉花中仅报道了T-DNA 插入引起序列删除的研究,还未见引起染色体易位或倒位等现象的报道。 侯娜等[4]和陈天子等[5]均发现T-DNA 插入事件造成了棉花基因组序列缺失。拟南芥中有T-DNA 插入引起较大结构变异的报道。 Beying 等[18]利用金黄色葡萄球菌Cas9 核酸酶, 诱导拟南芥2 条异源染色体发生了0.5 Mb左右的相互易位,易位发生频率为0.01%。本研究中,SbHKT基因的插入造成了陆地棉D08 染色体上的结构变异,但是具体是如何发生的仍有待进一步的分析和验证。

4 结论

基于重测序技术获得了SbHKT基因在陆地棉基因组中的侧翼序列, 分析了外源T-DNA 在陆地棉基因组插入位点的序列特征, 构建了SbHKT基因转化事件的特异性检测方法。

猜你喜欢
株系转基因引物
应用MAS技术改良水稻特异种质大粒溪香的稻瘟病抗性
转基因,你吃了吗?
甜菜全基因组SSR引物的筛选与评价
玉米品种德美亚多重SSR-PCR系统的建立及应用
美国首次释放转基因蚊子
花菜类杂交种纯度鉴定SSR 核心引物筛选
《转基因技术》新书推荐
转录因子OsNAC2对逆境下水稻产量性状的影响
大叶蒲公英耐盐性变异株系的培育
有关PCR扩增过程中的疑虑与剖析