基于基因组学分析Pseudoalteromonas paragorgicola GHS18 菌株产絮凝活性物质基础

2021-08-05 12:33王玉霞周海军
关键词:菌株基因组测序

王玉霞,崔 霞,周海军,穆 军

(浙江海洋大学海洋科学与技术学院,浙江舟山 316022)

微生物絮凝剂作为一种绿色环保的水处理剂,往往因高生产成本和复杂的发酵、回收过程而限制了其工业化投入,因此越来越多的研究者投入到开发新的生物絮凝剂资源,菲律宾蛤仔黏附污泥(Ruditapes philippinarum conglutination mud,RPM)就是一种被报道的水产养殖废物利用的天然生物絮凝剂资源,能克服其昂贵的成本和发酵过程,具有很好的前景[1-4]。研究表明RPM 无论是对高岭土悬浮液的絮凝率还是不同染料的脱色率均高达90%以上,具有高效的絮凝活性,而RPM 的共附生细菌被报道为絮凝活性的主要承担者,且从RPM 中已经分离得到了17 株产生物絮凝剂菌株,胞外多糖被认为是这些细菌代谢的絮凝活性物质[1-8]。

本研究从RPM 中分离、筛选获得1 株新的高絮凝活性菌株GHS18,先对其进行16S rDNA 分型鉴定、生理生化特征测定将其鉴定到物种,然后基于基因组学水平对菌株GHS18 进行全基因组的框架扫描测序,基因预测以及功能注释来分析菌株GHS18 产絮凝活性物质的分子水平依据,为该菌株未来的深入研究奠定基础。

1 材料和方法

1.1 产絮凝剂菌株GHS18 的来源

从抗生素培养获得的具有絮凝活性的RPM 中分离纯化获得产絮凝剂菌株。

1.2 絮凝率测定

菌株的絮凝率测定参照MU Jun,et al[1]使用的方法。取93 mL 4 g·L-1高岭土悬浮液、5 mL 10 g·L-1氯化钙溶液和2 mL 待测菌株GHS18 的菌悬液于250 mL 烧杯中,pH 调至7.5。200 r·min-1快速搅拌混合液1 min,然后80 r·min-1慢速搅拌2 min。静置10 min 后,取液面下1 cm 处悬浊液于分光光度计测定OD值,吸光度为550 nm,测得值记为A0空白对照组以2 mL 去离子水代替待测菌液,测得OD 值记为A0。菌株的絮凝率(flocculation rate,FR)计算公式为:

A0和A 分别为空白对照组和待测样品组的OD550值。

1.3 生理生化性状测定

菌株GHS18 的形态特征、生理生化指标、生长温度与盐度范围、胞外酶活性检测、碳源的利用测定方法参照《伯杰氏细菌鉴定手册》[9]、《常见细菌系统鉴定手册》[10]以及BAUMANN,et al[11]。

1.4 16S rDNA 测序

将菌株GHS18 接种到液体培养基中恒温25 ℃培养10 h 后使用TaKaRa 全基因组提取试剂盒(DNA Extraction Kit Ver.3.0)进行核酸DNA 的抽提。扩增引物为27F(5'-AGA GTTTGATCATGG CTC AG-3')和1492R(5'-TAC GGTTACCTGTTACGACTT-3')[12],反应体系终体积为20 μL,包括2.0 μL 10×Ex Taq buffer、1.6 μL 2.5 mM dNTP mix、5p 引物、0.5 μL 模板、0.2 μL Ex Taq,加ddH2O 补至终体积。扩增程序为:95 ℃,5 min;95 ℃,30 s,55 ℃,30 s,72 ℃,90 s,24 个循环;72 ℃,10 min。扩增结果以凝胶电泳进行检测,检测合格后使用ABI 3730XL 测序仪进行测序。

1.5 比对鉴定及系统发育树构建

将测序拼接后的序列于EzBioCloud(http://www.ezbiocloud.net)进行blast 比对,将菌株鉴定到种属水平。菌株GHS18 的16S rDNA 序列上传到NCBI 数据库,登录号为KX702262。选取比对结果中相似度高的模式菌株及外间组模式菌株通过软件MEGA7 进行系统发育树的构建。

1.6 菌株GHS18 的全基因组框架扫描

将菌株GHS18 纯培养后提取基因组DNA,利用1%琼脂凝胶电泳检测并收集抽提的DNA。对质检后收集的DNA 进行300~500 bp 片段化,然后使用TruSeqTMDNA Sample Prep Kit 进行文库构建,TruSeq PE Cluster Kit 进行桥式PCR,最后使用Truseq SBS Kit 利用Illumina 测序技术对DNA 进行paired-end(PE)测序。将测序得到的原始数据进行有效数据的统计、序列拼接(SOAPdenovo v2.04 软件)、序列矫正(GapCloser v1.12 软件),得到拼接后的序列,以便进行下一步分析。

1.7 生物信息学分析

对拼接后的序列进行rRNA/tRNA 的查找(RNAmmer-1.2 和tRNAscan-SE v1.3.1 软件)、串联重复序列预测(http://tandem.bu.edu/trf/trf.basic.submit.html)[13]、插入序列预测(https://www-is.biotoul.fr/)[14]、基因的功能预测(Glimmer 3.02 软件),并将预测基因的蛋白序列与Nr、genes、string 和GO 数据库进行blastp 比对(BLAST 2.2.28+软件),得到预测基因的功能注释信息。

2 结果与讨论

2.1 絮凝率与菌株鉴定

分离纯化的单菌株GHS18 恒温25 ℃纯培养10 h,测得其絮凝率为75.1%。比对结果显示菌株GHS18的16SrDNA 序列与Pseudoalteromonas paragorgicola KMM 3548T 和P.distincta ATCC 700518T 序列具有99.92%的相似性。菌株GHS18 的系统进化发育树如图1,低于80%的值被隐藏,由图1 可知,菌株GHS18与P.paragorgicola 和P.distincta 聚集在一个分支。

图1 菌株GHS18 的系统进化发育树Fig.1 The phylogenic tree of strain GHS18

菌株的生理生化指标测定结果见表1。由表1 可知,菌株GHS18 为杆状菌,革兰氏阴性菌,具有极性鞭毛,出现黄色色素沉着;生长盐度耐受范围与模式菌株相比,由1%~6%提升到了10%;高温不耐受,37 ℃无法生长;能产生淀粉酶;能利用葡萄糖、阿拉伯糖、半乳糖、麦芽糖、甘露醇、木糖,而蜜二糖、乳糖、山梨糖醇、柠檬酸盐均无法利用。与模式菌株的理化特征比对,结合16S 序列比对和系统发育树结果,菌株GHS18 被鉴定为P.paragorgicola。

表1 菌株GHS18 的生理生化特征测定结果Tab.1 The results of biochemical tests of strains GHS18

2.2 基因组基本特征

为了深入研究产絮凝物质的菌株GHS18 分子机制,本研究利用Illumina 技术对菌株GHS18 的基因组进行了框架扫描测序,序列拼接为43 个大框架序列,总长度为4 691 518 bp,其中43 个框架序列长度均大于1 000 bp,最长框架为536 748 bp,框架N50 为227 074 bp,N90 为68 684 bp,GC 含量为39.191 mol%。将菌株GHS18 拼接后的序列进行与基因预测,包含11 个rRNA、94 个tRNA 和4 342 个基因。

2.3 重复序列预测

通过TRF(tandem repeat finder)对菌株GHS18 的基因组进行串联重复序列的在线预测,共预测到142条串联重复序列,57.7%的序列匹配分值为50~100,19.7%的序列匹配分值为101~500,其余匹配分值大于500,表明菌株GHS18 的基因组中多存在短串联重复序列。通过IS Finder 对菌株GHS18 的插入序列进行在线预测,7 条潜在的插入序列被筛选出,筛选结果以E-value(0.001)为标准,IS3 和IS110 序列家族各含有3 条,1 条属于IS91 家族。

2.4 COG 功能分析

将注释基因与COG 数据库进行比对,结果表明2 608 个(60.1%)基因具有COG 编号,即具有明确的生物学功能(见图3)。其中,COG 功能一级分类中参与代谢的蛋白数最多,高达1 109 个(42.5%),其次是参与细胞内进程和信号传导功能(31.3%),以及信息储存和处理(21.0%)。COG 功能二级分类中,拥有最多功能基因的是E(氨基酸转运和代谢,9.7%)、类别J(翻译、核糖体结构和生物发生,9.2%)、T(信号转导机制,7.5%)和C(能源生产和转换,6.9%)。参与次生代谢产物的生物合成、转运和分解代谢功能的类别Q 仅占2.2%。

图3 菌株GHS18 的COG 的功能分类Fig.3 The results of COG second level class in P.paragorgicola GHS18

图2 菌株GHS18 的基因组CG 图谱Fig.2 The CG view of P.paragorgicola GHS18

2.5 GO 功能分析

GO 功能注释结果统计如图4 所示,总共2 296 条列具有GO 数据库的注释信息,占预测总蛋白数目的52.9%。GO 功能分为生物学过程、细胞成分和分子功能三类。由图可知,细胞内过程、单生物过程和代谢过程在生物学过程中占优势,细胞部位、细胞膜部位、细胞膜和细胞是细胞组分中的优势功能组,结合和催化活性在分子功能分类中占绝对优势。作为具有絮凝活性的功能菌株GHS18,其在表达过程中需要大量的代谢、生物调控、代谢产物转运等各种生物学过程互作,从而实现胞外多糖的产生,这些注释功能占优势的也与它们的菌体繁殖和代谢活动息息相关,因此菌株GHS18 基因组在GO 数据库中进行功能注释与这些生物过程相关的基因表达占优势。

图4 菌株GHS18 的GO 功能分类图Fig.4 Functional classification of GO annotation in P.paragorgicola GHS18

2.6 KEGG 代谢通路分析

将菌株GHS18 基因组预测的基因序列与KEGG 数据库进行比对,结果显示在菌株GHS18 基因组中预测的4 342 个全长基因中,有2 241 个基因(51.6%)匹配到KEGG 数据库中的基因,且在其对应的代谢途径上均进行了定位,共参与了193 条KEGG 的代谢途径。其中参与代谢途径的总共583 个基因,参与次生代谢产物的生物合成有256 个基因,参与不同环境的微生物代谢共有170 个基因。此外,参与碳代谢的有89 个基因,主要包含淀粉、蔗糖、氨基糖、核苷酸糖、果糖、甘露糖、肽聚糖、半乳糖、脂多糖的生物合成与代谢。

到目前为止,研究已经明确了一些具有絮凝活性的多糖物质的结构以及生物合成途径,如纤维素、几丁质、普鲁兰多糖、果胶、淀粉、海藻酸钠和黄原胶[16-19]。合成途径主要分为3 个步骤[20-21]:ⅰ)前体底物的合成;ⅱ)多糖的聚合和转移;ⅲ)通过外膜分泌到胞外。其中报道的一些前体底物如UDP-Glucose、GDPmannose 和UDP-glucuronate 在菌株GHS18 中均能找到,这些前体的转化为后续胞外多糖的聚合提供了基础。而多糖聚合过程中的一些重复单元如UDP-Gal、dNTP-D-Glu、dNTP-L-Rham、UDP-3-O-(3-acetyl)-GlcNAc 也能在菌株GHS18 代谢中发现它们的生物合成,这些重复糖单元在对应的聚合酶/糖基转移酶作用下聚合成多糖,奇怪的是,本研究中并未发现将重复单元聚合成胞外多糖的eps 基因簇,但菌株代谢具有絮凝活性的胞外多糖是不争的事实,因此推测其具有与eps 基因簇相似的基因簇来代替行使其功能。由于国内外研究者对于产絮凝剂菌株的研究多集中于高絮凝活性菌株的分离筛选,或优化其培养的理化条件以期达到更高的产量,相较于其分子水平的研究存在很大的不足,因此对于菌株GHS18 的产絮凝剂依据按照当前研究证据来看还需要未来更进一步的研究。

2.7 NR 功能分析

将菌株GHS18 组装后预测的基因注释到NR 数据库,有96.4%(4 187)的基因在NR 数据库中获得了注释结果。对注释到NR 数据库基因的E 值进行统计,4.2%基因的E 值位于1×10-30~1×10-5,5.0%位于1×10-50~1×10-30,14.0%位于1×10-100~1×10-50,23.9%位于1×10-180~1×10-100。63.1%的基因序列具有100%的相似性,34.3%的相似性集中在80%~99%。注释结果的物种分布表明,97.7%的预测基因与Pseudoalteromonas sp.有相似的同源序列,其中62.4%(相对于注释到Pseudoalteromonas sp.中相似基因的百分比,下同)的预测基因与P.haloplanktis 相似,11.2%的预测基因与P.arctica 相似。由于目前对于P.paragorgicola 物种的全基因组学研究尚未完善,因此菌株GHS18 的基因注释功能偏向于进化分类学分支相隔较近的物种也是合理的。

2.8 Swiss-Prot 数据库注释

将菌株GHS18 的预测基因注释到Swiss-Prot 数据库,2 818 个基因在该数据库有注释信息,占总基因数的64.9%。对E 值分布进行统计,5.3%基因的E 值处于1×10-10~1×10-5,25.0%位于1×10-30~1×10-5,13.9%位于1×10-50~1×10-30,24.2%位于1×10-100~1×10-50。1.9%的基因序列具有100%的相似性,23.3%的相似性集中在80%~99%,36.6%相似性为60%~79%,24.5%相似性为50%~59%。

2.9 次级代谢产物合成基因簇

通过antiSMASH 对菌株GHS18 的序列进行次级代谢产物合成基因簇预测,分别在GHS18_scaffold1、GHS18_scaffold9、GHS18_scaffold10、GHS18_scaffold16 和GHS18_scaffold22 序列中各预测到1 个基因簇,分别为细菌素、细菌素、间二苯酚和芳基多烯、细菌素和四氢嘧啶合成基因簇。

3 结论

从RPM 中分离筛选的1 株新的高絮凝活性菌株GHS18 通过16S rDNA 序列比对和生理生化特征结果鉴定为P.paragorgicola,絮凝活性为75.1%。通过一系列的预测对菌株GHS18 的基因组进行了初步分析,一共预测到了94 个tRNA,11 个rRNA,142 条串联重复序列,7 条插入序列,4 342 个基因和5 个次级代谢产物合成基因簇。将预测的基因进行数据库的注释,60.1%、52.9%、51.6%、96.4%、64.9%的基因分别在数据库COG、GO、KEGG、NR 和Swiss-Prot 匹配到了相应的注释信息。在菌株GHS18 的功能注释中发现了一些产絮凝活性多糖的代谢途径中重要的前体底物、重复单元以及一些调控基因,然而未找到eps 基因簇,推测该菌株具有类似的基因簇来代替其行使相应的功能,这也可能是目前这一类研究领域数据大量缺乏的原因,如果需要进一步探索菌株的代谢通路,未来还需要更深入的分子水平研究。

猜你喜欢
菌株基因组测序
食品微生物检测实验室标准菌株的管理和质量控制
两种高通量测序平台应用于不同SARS-CoV-2变异株的对比研究
“植物界大熊猫”完整基因组图谱首次发布
我国小麦基因组编辑抗病育种取得突破
宏基因组测序辅助诊断原发性肺隐球菌
植物根际促生菌Bacillus mycoides Gnyt1菌株生物学特性比较研究
菌株出马让畜禽污染物变废为宝
第一代基因组设计的杂交马铃薯问世
牛参考基因组中发现被忽视基因
生物测序走在前