乳酸乳球菌乳酸亚种IMAU11823全基因组测序及胞外多糖基因簇分析

2021-05-15 07:11李伟程刘亚华尤利军孙志宏
中国食品学报 2021年4期
关键词:基因簇亚种半乳糖

李 敏,李伟程,刘亚华,尤利军,马 腾,赵 洁,孙志宏

(内蒙古农业大学 乳品生物技术与工程教育部重点实验室 农业农村部奶制品加工重点实验室 呼和浩特010018)

乳酸菌广泛应用于发酵乳制品,其中一些菌株可以产生胞外多糖(Exopolysaccharides,EPS)。乳酸菌EPS 是乳酸菌在生长代谢过程中分泌的一类长链聚合物,根据其相对于菌体的位置分为荚膜多糖和黏液多糖[1]。EPS 不仅可以改善发酵乳制品的质构特性、流变性和口感,而且具有抑菌性,抗氧化,抗肿瘤,免疫调节等多种生物活性[2-5],因此,能够产生EPS 的乳酸菌在发酵工业中具有重要的应用价值和广阔的应用前景。

EPS 合成分为糖核苷酸合成和eps 基因簇合成2 个阶段。糖类经转运系统由细胞外转运到细胞内,再经过一系列酶促反应生成糖核苷酸。糖核苷酸作为合成EPS 的前体物质,在pgmA、galE、galU 等看家基因和eps 基因簇的调控下完成重复单元的合成、聚合和输出[6]。乳酸菌eps 基因簇结构由4 部分组成:糖基转移酶、调节域、输出蛋白和其它功能蛋白,如多糖的修饰[7]等。全基因组测序有助于深入了解物种的基因组成、分子进化以及功能预测。Schell 等[8]对长双歧杆菌NCC2705 全基因组序列的研究表明,该菌株基因组中含有几段与低聚糖代谢相关的基因簇。随着DNA 测序技术的快速发展,集高通量、快速度、长读长等优点于一身的第3 代测序技术已广泛应用于基因组学的研究[9]。通过PacBio SMRT 测序技术对施氏假单胞菌273(Pseudomonas stutzeri 273)和戊糖乳杆菌SLC13(Lactobacillus pentosus SLC13)等进行全基因测序并注释到eps 基因簇[7,10],该技术将为EPS 的深入研究提供支持。

乳酸乳球菌是发酵乳制品中常用的发酵剂之一,常被应用于奶酪和低温发酵乳的生产。目前,对于乳酸乳球菌EPS 的研究大多集中于乳酸乳球菌乳脂亚种(Lactococcus lactis subsp.cremoris,L.lactis subsp.cremoris),如乳酸乳球菌乳脂亚种SMQ-461[11]、乳酸乳球菌乳脂亚种NIZO B40[12]、乳酸乳球菌乳脂亚种Ropy352[13]等菌株中都存在的eps 基因簇,而对于乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.lactis,L.lactis subsp.lactis)的研究较少。前期试验研究发现乳酸乳球菌乳酸亚种IMAU11823 具有优良的发酵特性,同时高产EPS,有开发成发酵剂的潜力。为深入研究该菌株的EPS 合成机制,本研究采用PacBio SMRT 三代测序技术对乳酸乳球菌乳酸亚种IMAU11823 进行全基因组测序,解析其EPS 的合成机制,为该菌株的工业化应用提供依据。

1 材料与方法

1.1 试验菌株

本研究所用菌株乳酸乳球菌乳酸亚种IMAU11823 分离自内蒙古锡林郭勒盟自然发酵乳制品嚼口,由内蒙古农业大学乳酸菌菌种资源库(LABCC)保藏并提供。目前,已报道完成全基因组完成图测序的乳酸乳球菌有40 株,选取11 株由PacBio SMRT RSII 平台测序的乳酸乳球菌乳酸亚种菌株和乳酸乳球菌乳酸亚种IL1403 为参考菌株,基因组均下载自NCBI 的GenBank 数据库(http://www.ncbi.nlm.nih.gov/genbank/),具体菌株信息如表1所示。

表1 乳酸乳球菌乳酸亚种基因组基本特征比较分析Table 1 General features of several sequenced L.lactis subsp.lactis genomes

1.2 主要试剂、仪器和设备

M17 液体培养基,英国OXOID 公司;氯化钠、磷酸氢二钠、磷酸二氢钾等均为国产分析纯级试剂;基因组DNA 提取试剂盒WizardRGenomic DNA Purification Kit (A1120),美国Promega 公司。

ND-1000 型超微量紫外分光光度计,美国Nano Drop 公司;HH-SI-NI 恒温水浴锅,上海一恒科技有限公司;DHP-9272 型电热恒温培养箱,北京一恒科技有限公司;Eppendorf 5810R 高速冷冻离心机,德国Eppendorf 公司。

1.3 菌株培养与基因组DNA 的提取

将冷冻干燥保藏的乳酸乳球菌乳酸亚种IMAU11823 接种于5 mL M17 液体培养基,37 ℃恒温培养24 h,以2%的接种量接种于5 mL M17液体培养基,继代培养3 代,以8 000 r/min 离心2 min 收集菌体,并用灭菌后的PBS 缓冲液(8.0 g/L氯化钠,1.15 g/L 磷酸氢二钠,0.2 g/L 磷酸二氢钾)清洗2 遍。采用WizardRGenomic DNA Purification Kit 试剂盒提取菌株基因组DNA,具体操作按照产品说明书进行。

1.4 全基因组测序和组装

提取的基因组DNA 通过0.6%琼脂糖凝胶电泳和超微量紫外分光光度计进行质量鉴定。在浓度和纯度达到测序要求后,采用PacBio SMRT RSII 测序平台进行乳酸乳球菌乳酸亚种IMAU11823 的全基因组序列测定,构建10 kb 左右的大片段文库,使用1 个测序芯片,共获得高于250×的高质量原始数据。数据下机后,使用SMRTRPortal 中的RS_HGAPAssembly.3 模块对菌株的全基因组序列进行组装拼接[14]。

1.5 基因组注释

采用Prokka[15]软件对菌株基因组进行基因预测,根据预测得到的CDS 位置信息提取氨基酸序列,与蛋白质直系同源簇数据库 (Cluster of orthologous groups of proteins,COG)、日本京都基因和基因组百科全书 (Kyoto encyclopedia of genes and genomes,KEGG)和碳水化合物活性酶数据库(Carbohydrate-active enzymes,CAZy)等数据库进行蛋白质同源序列比对(E 值<1×10-5),结合RAST(http://rast.nmpdr.org/) 网上在线工具完成功能注释。

1.6 基因组比较分析

基于Prokka 软件对菌株基因组进行基因预测后,采用Roary[16]软件识别核心基因,其中以编码氨基酸相似性大于95%的标准识别基因家族。利用MEGA 6.0 软件构建系统进化树。采用R 软件(V.3.3.2)比较不同菌株的特有基因(Unique gene,只在1 株菌中存在)并将结果进行可视化处理。

1.7 核酸序列登录号

乳酸乳球菌乳酸亚种IMAU11823 基因组序列已提交至GenBank 数据库,登录号为CP041759.1-CP041762.1。

2 结果与分析

2.1 乳酸乳球菌乳酸亚种IMAU11823 的基因组特征

采用PacBio SMRT 测序技术对乳酸乳球菌乳酸亚种IMAU11823 进行全基因组测序,最终得到4 条序列,长度范围为7 734~2 458 520 bp。基因组由1 条2 458 520 bp,GC 含量为35.2%的环状染色体DNA 和3 个环状质粒pIMAU11823A(127 965 bp,GC 含量为35.7%),pIMAU11823B(24 554 bp,GC 含量为39.5%),pIMAU11823C(7 734 bp,GC 含量为32.7%)组成(图1)。乳酸乳球菌乳酸亚种IMAU11823 在基因组大小、GC 含量、tRNA 数量等方面与其它12 株乳酸乳球菌乳酸亚种菌株十分相似(表1),符合乳酸乳球菌乳酸亚种基因组的基本特征,表明测序结果满足后续生物信息学分析要求。

图1 乳酸乳球菌乳酸亚种IMAU11823 基因组信息Fig.1 The global view of the genome of L.lactis subsp.lactis IMAU11823

2.2 乳酸乳球菌乳酸亚种IMAU11823 功能注释

采用本地BLASTP 的方法对乳酸乳球菌乳酸亚种IMAU11823 进行COG 和KEGG 数据库比对注释。COG 数据库共注释到648 个功能基因(图2a)。从图中可以看出,COG 聚类中未知功能(S)、氨基酸运输与代谢(E)、翻译、核糖体结构与生物合成(J)以及一般功能预测(R)的蛋白占据较大比例,分别为18.06%,12.35%,10.96%和9.72%,而与胞内运输、分泌和囊泡运输(U)和防御机制(V)相关的基因仅分别有8 个(1.23%)和5 个(0.77%)。此外,有55 个基因与碳水化合物运输与代谢(G)相关,其中编码半乳糖激酶、N-乙酰氨基葡萄糖苷酶、半乳糖-1-磷酸尿苷转移酶、葡萄糖渗透酶、甘露糖-1-磷酸脱氢酶等基因与糖核苷酸的合成相关。

图2 乳酸乳球菌乳酸亚种IMAU11823 的COG(a)和KEGG(b)功能分类图Fig.2 COG (a) and KEGG (b) functional classification map of L.lactis subsp.lactis IMAU11823

乳酸乳球菌乳酸亚种IMAU11823 在KEGG数据库共有2 110 个基因得到注释,可分为6 个大类的34 个亚分类(图2b)。其中与碳水化合物代谢相关的基因最多为201 个,这些基因主要参与淀粉和蔗糖代谢、半乳糖代谢、果糖和甘露糖代谢等,这些代谢途径的部分中间产物可能会参与糖核苷酸的形成[17]。

2.3 乳酸乳球菌乳酸亚种基因组的比较分析

为探究13 株乳酸乳球菌乳酸亚种的系统发育关系,运用邻接法构建的核心基因系统发育树(图3a)。分析结果表明13 株菌株形成2 个分支,分离自狼尾草的乳酸乳球菌乳酸亚种G50 为一支,其它12 株食源分离株聚为一大支。从系统发育树中可以看出,乳酸乳球菌乳酸亚种IMAU11823 与乳酸乳球菌乳酸亚种UC08、UC11和UC06 的遗传距离较近。据报道,菌株UC08 和UC11 染色体上具有与EPS 生物合成相关的基因簇[18]。

进一步比较了菌株IMAU11823 与其它12 株乳酸乳球菌乳酸亚种菌株之间的差异,采用UpsetR 分别对13 株乳酸乳球菌乳酸亚种基因组中特有的基因进行分析。结果显示,菌株IMAU11823 基因组中特有基因261 个,其中73.2%为假定蛋白(图3b)。除此之外,含有编码荚膜多糖生物合成蛋白、UDP-α-D-葡萄糖、寡糖生物合成蛋白、糖基转移酶和糖转移酶等与EPS 生物合成相关的基因,表明菌株IMAU11823 具有特殊的多糖合成能力。

图3 乳酸乳球菌乳酸亚种亲缘关系(a)和UpsetR(b)分析Fig.3 Genome neighbor (a) and UpsetR (b) analysis of L.lactis subsp.lactis strains

2.4 糖代谢相关基因的分析

以上研究结果发现,菌株IMAU11823 具有较强的碳水化合物代谢能力和EPS 合成潜力,为深入研究其EPS 合成机理,从基因组层面针对菌株IMAU11823 的碳水化合物活性酶、糖转运系统和糖核苷酸合成途径进行分析。

2.4.1 碳水化合物活性酶分析 乳酸菌可以利用碳水化合物并转化成小分子物质供其生长需要,同时产生一些具有生物应用价值的代谢产物,如:EPS。将13 株乳酸乳球菌乳酸亚种菌株的蛋白序列分别与CAZy 数据库进行序列比对后获取注释信息。13 株乳酸乳球菌乳酸亚种菌株共注释到五大类碳水化合物活性酶的基因,主要以糖苷水解酶(Glyside hydrolases,GHs)和糖基转移酶(Glycosyltransferases,GTs)的含量最为丰富,分别占所有酶类的52%和34%(图4)。

图4 功能相关基因在不同菌株中的分布及丰度Fig.4 Distribution and abundance of functional related genes in different strains

GHs 在糖类生物合成、细胞壁代谢、信号转导等多种生物过程中发挥着独特的作用[19]。Sun 等[20]基于213 株乳杆菌属模式菌株的比较基因组学研究表明,目前已发现的所有乳杆菌基因组中,共有48 种GHs 的编码基因。本研究中,13 株乳酸乳球菌乳酸亚种菌株共有GHs 基因21 种,菌株IMAU11823 含有17 种,说明该菌株中GHs 的种类丰富,其中GH1 和GH13 的数量最多,分别为7和8 个(图4),这可能是由于其在营养丰富的乳环境中长期适应的结果。GH1 主要编码与乳糖和半乳糖代谢相关的β-葡萄糖苷酶[21],GH13 是糖苷水解酶中最大的序列家族,主要编码与淀粉代谢相关的α-葡萄糖苷酶[22],而α/β-葡萄糖苷酶能够通过水解葡萄糖苷键产生单糖,为EPS 的生物合成提供前体物质。因此,菌株IMAU11823 基因组中丰富的糖苷水解酶能够有效利用代谢不同的碳源,从而为糖核苷酸的形成提供基础。

GTs 可以催化生命活动中低聚糖、多糖等多种糖轭合物的形成,也可以催化合成具有重要的生物学意义的碳水化合物[23]。本研究同样发现菌株IMAU11823 中具有多种编码GTs 的基因,以GT2 和GT4 的数量最为丰富,分别为14 个和4 个(图4)。GT2 和GT4 酶类与蔗糖等二糖以及脂多糖、纤维素、壳聚糖的合成相关,在发酵乳中这些物质尤其是多糖类化合物可能与发酵乳最终的黏度、持水性等品质相关[14]。菌株IMAU11823 富含GT2 和GT4 说明其有较高的糖合成能力,具有合成EPS 的潜力。

2.4.2 糖转运系统 磷酸烯醇式丙酮酸-糖磷酸转移酶系(Phosphoenolpyruvate-phosphotransferase system,PEP-PTS)是糖类物质的主要转运方式。基于RAST 注释结果统计菌株IMAU11823 中参与糖转运系统的基因 (表2),结果显示,菌株IMAU11823 基因组中不仅含有能量耦合蛋白酶EI,还含有PTS 乳糖转运体亚基EII、PTS 纤维二糖转运体亚基EII、PTS 蔗糖转运体亚基EII、PTS果糖转运体亚基EII 和PTS 甘露糖转运体亚基EII 等10 个糖特异性通透酶的基因,其中PTS 乳糖转运体亚基EII 位于质粒pIMAU11823A,其余均位于染色体上。同时含有乳糖和半乳糖渗透酶。因此,从基因组分析,菌株IMAU11823 可以利用乳糖、纤维二糖、蔗糖、果糖、甘露糖和半乳糖。

表2 乳酸乳球菌乳酸亚种IMAU11823 的PTS 相关基因Table 2 Putative genes related to phosphotransferase system (PTS) in L.lactis subsp.lactis IMAU11823

2.4.3 糖核苷酸的合成途径 根据基因组信息将菌株IMAU11823 可能利用的糖结合KEGG 代谢通路数据库进行比对,预测IMAU11823 糖核苷酸的合成途径,如图5所示。蔗糖、果糖、纤维二糖、甘露糖由PEP-PTS 转运系统从胞外进入胞内,磷酸化后分别产生蔗糖-6-磷酸、果糖-1-磷酸、纤维二糖-6-磷酸和甘露糖-6-磷酸,在相关酶的作用下生成果糖-6-磷酸或葡萄糖-6-磷酸,这2 种产物在葡萄糖-6-磷酸异构酶的作用下相互转换,最终参与UDP-N-乙酰葡萄糖胺、UDP-N-乙酰半乳糖胺、UDP-N-乙酰甘露糖胺、dTDP-葡萄糖、UDP-葡萄糖和dTDP-鼠李糖的生物合成。

菌株IMAU11823 可以通过PEP-PTS 和渗透酶2 种途径利用乳糖,乳糖-6-磷酸和乳糖分别在6-磷酸-β-半乳糖苷酶和β-半乳糖苷酶的作用下水解成葡萄糖/半乳糖-6-磷酸和乳糖/葡萄糖。水解产生的半乳糖以及通过渗透酶进入胞内的半乳糖通过UDP-半乳糖途径生成UDP-半乳糖和Leloir 途径生成葡萄糖-1-磷酸[24];葡萄糖在葡萄糖激酶的催化下,生成葡萄糖-6-磷酸。葡萄糖-6-磷酸和葡萄糖-1-磷酸是糖核苷酸(dTDP-葡萄糖、UDP-葡萄糖和dTDP-鼠李糖)的中间产物,参与EPS 的生物合成,并且在磷酸葡萄糖变位酶的作用下完成两者之间的转化。葡萄糖-1-磷酸分别通过UDP-葡萄糖-1-磷酸-尿苷转移酶和葡萄糖-1-磷酸胸苷转移酶合成UDP-葡萄糖和dTDP-葡萄糖,或者在多种dTDP-鼠李糖合成酶的协助下合成dTDP-鼠李糖。值得注意的是,UDP-葡萄糖和UDP-半乳糖可以在UDP-葡萄糖-4-差向异构酶的作用下相互转化。因此,从基因组分析,菌株IMAU11823 可以合成UDP-葡萄糖、dTDP-葡萄糖、UDP-半乳糖、dTDP-鼠李糖、UDP-N-乙酰葡萄糖胺、UDP-N-乙酰半乳糖胺和UDP-N-乙酰甘露糖胺7 种糖核苷酸。这些糖核苷酸在eps基因簇的调控下完成EPS 重复单元的组装、聚合和输出。

2.5 胞外多糖生物合成基因簇的鉴定

乳酸菌EPS 的生物合成是由位于染色体或质粒的eps 基因簇调控和决定的[24]。结合基因注释和BLASTP 比对结果,乳酸乳球菌乳酸亚种IMAU11823 染色体上存在一条完整的eps 基因簇,全长16 kb,由20 个开放阅读框(ORF)组成(图6)。在eps 基因簇上游包含3 个假定蛋白(Hypothetical protein)和3 个转座酶(Transposase)的基因,可能参与DNA 的重组和移动[11]。与其它乳酸乳球菌类似,epsRXCDB 是位于菌株IMAU11823 eps 基因簇起始处的保守基因,参与EPS 生物合成的调节和重复单元组成[18]。EPS 生物合成开始于具有调节功能的基因epsR,该基因仅存在于乳酸乳球菌的eps 基因簇中,说明与其它乳酸菌相比乳酸乳球菌具有独特的EPS 生物合成的调节方式或机制[25]。epsX 广泛存在于乳酸乳球菌的eps基因簇中,可能具有膜锚定的作用,然而目前没有通过试验得到证实;epsBC 与乳酸乳球菌中Eps-BC 具有97%以上的氨基酸同源性,其预测的蛋白主要负责EPS 链长测定[11]。根据CAZy 数据库分类,乳酸乳球菌eps 基因簇中糖基转移酶的基因三分之一属于GT2,三分之一属于GT4,剩余部分属于其它分类[18],这与乳酸乳球菌菌株中GT2 和GT4 的数量最为丰富密切相关。

图5 乳酸乳球菌乳酸亚种IMAU11823 糖核苷酸的合成Fig.5 Synthesis of sugar nucleotides in L.lactis subsp.lactis IMAU11823

图6 乳酸乳球菌乳酸亚种IMAU11823 的eps 基因簇Fig.6 Exopolysaccharides gene cluster in L.lactis subsp.lactis IMAU11823

编码糖基转移酶的基因位于eps 基因簇的中间区域,主要负责将单糖转移到多糖链上,从而完成重复单元的合成,然而对重复单元中形成主链和侧链的供体和受体单糖分子具有多重特异性[13]。菌株IMAU11823 的eps 基因簇中心区域为编码不同糖基转移酶的基因 (epsDEFJ,GTF1 和GTF2)。epsD 和epsE 编码引导糖基转移酶,负责将糖核苷酸转运到脂载体上,是催化EPS 生物合成的第1 步。epsD 可将UDP-葡萄糖转运到脂载体,该基因介导的自调节可能是乳酸乳球菌中控制合成EPS 的一个普遍特征[26];epsE 可将构成侧链的磷酸化半乳糖转运到构成主链的半乳糖残基上,同时与EPS 的产量密切相关[12,27]。epsFJ、GTF1和GTF2 这些编码糖基转移酶的基因对决定EPS重复单元的生物合成起到关键作用。乳酸乳球菌乳脂亚种SMQ-461 的eps 基因簇中epsEF 共同作用将第2 和第3 个葡萄糖单元连接到脂载体连接的糖核苷酸上,形成三糖[11]。Wu 等[7]研究发现eps 基因簇中缺失编码引导糖基转移酶的基因,菌株将完全丧失合成胞外多糖的能力;而缺失部分编码糖基转移酶的基因仍可产生不同分子质量的胞外多糖,说明eps 基因簇中含有多个编码糖基转移酶的基因时,对于糖苷键的形成具有互补作用。

基于氨基酸序列一致性分析,epsH 和epsK为编码参与EPS 重复单元的聚合基因。Dabour等[11]对epsH 的疏水性分析表明,该基因具有9 或10 个假定的跨膜片段,可能为多糖生物合成相关的聚合酶。epsM 位于基因簇的末端,编码1 种膜蛋白,参与EPS 重复单元的输出,与乳酸乳球菌乳脂亚种SMQ-461 的eps 基因簇中epsM 以及乳酸乳球菌中编码寡糖翻转酶的基因具有较高的氨基酸一致性,分别为99.59%和98.54%。

3 结论

采用PacBio SMRT 三代测序技术对乳酸乳球菌乳酸亚种IMAU11823 进行全基因组测序,基因组包括,1 条染色体DNA 和3 个环状质粒。对菌株IMAU11823 和12 株乳酸乳球菌乳酸亚种进行比较基因组分析发现,乳酸乳球菌乳酸亚种IMAU11823 含有261 个特有基因,其中包括5 种与EPS 生物合成相关的基因。通过CAZy 分析发现该菌含有数量丰富的糖苷水解酶和糖基转移酶,分别占所有酶类的52%和34%,其中数量最多的GH1、GH13 和GT2、GT4 分别与糖核苷酸以及多糖合成。进一步研究发现,该菌株基因组内具有乳糖、纤维二糖、蔗糖、果糖、甘露糖和半乳糖转运系统以及7 种糖核苷酸合成相关的基因,同时发现含有1 个eps 基因簇主要分为:调控因子(epsR)、链长决定 (epsBC)、重复单元的生物合成(epsDEFJ 和GTF1,GTF2)、聚合(epsHK)和输出(epsM)。本研究的相关结果将为乳酸乳球菌乳酸亚种IMAU11823 所产胞外多糖的结构解析提供帮助,同时为该菌株的工业化应用提供理论基础。

猜你喜欢
基因簇亚种半乳糖
亚沉茶渍亚洲亚种Lecanora subimmersa subsp. asiatica Zahlbr.的订正研究
链霉菌沉默基因簇激活在天然产物生物合成中的研究进展
珍稀蝴蝶的亚种分类问题及保护意义:以喙凤蝶属为例
盘羊新亚种
——和田盘羊
长双歧杆菌婴儿亚种的快速区分
冬瓜高通量转录组测序及分析
泽兰多糖对D-半乳糖致衰老小鼠的抗氧化作用
黄芩-黄连药对防治D-半乳糖痴呆小鼠的作用机制
半乳糖凝集素-3与心力衰竭相关性
半乳糖凝集素-3在心力衰竭中的研究进展