基于比较基因组学的解脂亚罗酵母CA20高产赤藓糖醇机理及进化分析

2023-10-30 07:16夏凯刘芳美陈雨晴陈珊珊黄春莹赵学群沙如意黄俊
遗传 2023年10期
关键词:赤藓糖醇酵母

夏凯,刘芳美,陈雨晴,陈珊珊,黄春莹,赵学群,沙如意,黄俊

研究报告

基于比较基因组学的解脂亚罗酵母CA20高产赤藓糖醇机理及进化分析

夏凯,刘芳美,陈雨晴,陈珊珊,黄春莹,赵学群,沙如意,黄俊

浙江科技学院生物与化学工程学院,浙江省农产品化学与生物加工技术重点实验室,浙江省农业生物资源生化制造协同创新中心,杭州 310023

解脂亚罗酵母()是赤藓糖醇生产中使用的主要菌种,复合诱变是选育优良菌株的常用方法。然而,诱变处理所引起的基因组变化尚待探索。本研究对前期获得的高产菌株CA20和原始菌株WT5进行基因组测序,并与已发布的8株解脂亚罗酵母进行比较基因组分析,旨在探究菌株CA20高产赤藓糖醇的机理以及不同菌株的基因组进化关系。结果显示,菌株CA20基因组大小为20,420,510 bp,GC碱基含量为48.97%,编码6330个CDS和649个ncRNA,菌株CA20和其他8株菌高度同源,平均核苷酸同源性(average nucleotide identity,ANI)> 99.50%,其中与菌株IBT 446和H222具有更近的亲缘关系。比较基因组分析显示,CA20和其他8株菌共有5342个核心基因,而CA20特有的65个基因主要参与物质跨膜运输和蛋白质转运过程。CA20基因组中含有166个碳水化合物活性酶(carbohydrate-active enzymes,CAZymes)基因,远多于其他菌株(108~137个),包括特有的4个糖苷水解酶类(glycoside hydrolases,GHs)、2个糖基转移酶类(glycosyltransferases,GTs)和13个碳水化合物酯酶类(carbohydrate esterases,CEs)。除转醛酶TAL1外,赤藓糖醇代谢途径有关酶在不同菌株中高度保守。此外,菌株CA20的赤藓糖醇产量和产率为190.97 g/L和1.33 g/L/h,显著高于WT5的128.61 g/L和0.92 g/L/h (<0.001)。相比于WT5,CA20中5个基因发生移码变异,15个基因存在非同义突变位点,这些基因主要参与细胞分裂、细胞壁合成、蛋白质合成及稳态维持等过程。以上结果表明,解脂亚罗酵母基因组在进化过程中保守;生存环境不同是导致菌株间基因组差异的重要因素;基因组中CAZymes数量的差异是不同菌株间性能差异的原因之一;菌株CA20高产赤藓糖醇与其细胞结构及内环境稳定性的提升有关。本研究结果为赤藓糖醇高产菌株的定向选育提供基础。

解脂亚罗酵母;赤藓糖醇;比较基因组;移码变异;蛋白激酶

糖过量摄入造成的肥胖、糖尿病等健康问题给人们的生活造成了困扰[1,2]。甜味剂的合理使用有助于降低食品中高热量糖的添加,从而达到减少糖摄入的目的。赤藓糖醇(erythritol),化学名为(2R, 3S)-butane-1, 2, 3, 4-丁四醇,是一种白色、不吸湿、无光学活性、热稳定性好以及易溶于水的四碳醇,广泛存在于水果、蔬菜和发酵食品中[3,4]。近年来,天然甜味剂赤藓糖醇凭借独特的理化性质如热值低、基本不被人体代谢、稳定性高和食用不会引起肠道不适等受到广泛关注,市场需求量持续增加。据预测,到2025年,其市场需求将达到48.9万吨左右,这对赤藓糖醇的生产提出了新要求[5,6]。

赤藓糖醇主要通过微生物发酵进行生产,所用菌种为解脂亚罗酵母()[7]。解脂亚罗酵母可以利用葡萄糖、甘油等为底物,通过磷酸戊糖途径代谢合成赤藓糖醇,整个过程由葡萄糖-6-磷酸脱氢酶(glucose-6-phosphate dehydrogenase,ZWF1)、6-磷酸葡萄糖酸内酯酶(6-phosphogluconolactonase,PGLS)、磷酸葡萄糖酸脱氢酶(phosphogluconate dehydrogenase,GND1)、核酮糖磷酸 3-差向异构酶(ribulose phosphate 3-epimerase,RPE1)、核酮糖-5-磷酸异构酶 (ribulose-5-phosphate isomerase,RPI)、转酮酶(transketolase,TKL1)、转醛酶(transaldolase,TAL1)、赤藓糖-4-磷酸激酶(erythrose-4-phosphate kinase,E4PK)和赤藓糖还原酶(erythrose reductase,ER)共同催化完成[2,8,9]。目前,赤藓糖醇生产过程中存在成本较高、冷却能耗大以及生产效率低等问题[1,10]。因此,如何有效降低赤藓糖醇生产成本一直备受关注。

提高单位时间内细胞的赤藓糖醇产量是降低生产成本的有效举措,目前采用较多的方法是菌种诱变选育、发酵工艺优化和代谢途径改造[4,11,12]。其中,诱变选育是重要的基础性工作。通过紫外线(ultraviolet,UV)辐射、硫酸二乙酯(diethyl sulphate,DES)处理、以及常压室温等离子体(atmospheric and room temperature plasma,ARTP)诱变等方法,研究人员已获得产量显著增加的优势突变株[13~15]。然而,已报道的不同菌种间性能差异显著,同时对于诱变所引起性状变化的潜在机制尚未清楚。诱变处理可以引起菌种DNA发生突变和重组,进而产生新的性状[16]。然而,诱变所引起的性状变化具有随机性。因此,探究诱变处理所引起的基因组序列变化有助于阐明菌种高产赤藓糖醇背后的机制,挖掘适用于高产菌株定向构建的新靶点。

课题组前期利用60Co-γ射线辐射结合ARTP复合诱变处理,已获得一株高产赤藓糖醇且遗传性能稳定的解脂亚罗酵母CA20,具有较大的工业应用潜力[17]。为进一步揭示CA20高产赤藓糖醇的分子机制,深入了解并挖掘其基因资源,本研究对CA20进行全基因组测序,同时对原始菌株WT5进行重测序分析,比较分析高产菌和原始菌株之间的基因组序列差异。此外,通过比较基因组学分析,比较菌株CA20和已公布的解脂亚罗酵母菌株的基因组异同,分析不同菌株的进化关系。同时,分析碳水化合物活性酶(carbohydrate-active enzymes,CAZymes)家族的多样性,明确赤藓糖醇代谢途径中关键酶的保守性,以期为进一步利用基因工程技术定向构建优良菌株提供理论基础。

1 材料与方法

1.1 菌株和培养条件

解脂亚罗酵母CA20保藏于中国典型培养物保藏中心(CCTCC: M2022880)。研究中所用原始菌株WT5由浙江科技学院生物与化学工程学院生物工程实验室保存。菌种活化采用YPD (yeast extract peptone dextrose medium)培养基:D-葡萄糖20 g/L、酵母浸出粉(Oxoid) 10 g/L、蛋白胨(Oxoid) 5 g/L、NaCl 5 g/L、KH2PO40.5 g/L,pH值6.0。发酵培养基中葡萄糖浓度更换为300 g/L,其他成分浓度保持不变。

赤藓糖醇发酵实验[17]:挑取单菌落过夜活化培养,之后以5% (v/v)比例转接于30 mL YPD培养基(250 mL 摇瓶)中于30 °C、200 r/min 条件下培养24 h制备一级种子液;而后以5%比例转接于80 mL (500 mL 摇瓶)YPD培养基中培养制备二级种子液,之后以10%比例转接于6.0 L发酵培养基(发酵罐体积10 L);控制通气量在0.6 vvm,转速600 r/min,罐压0.1 MPa,发酵周期为6天,消泡剂自动添加,发酵过程中不进行补料和pH调节。发酵过程中每隔24 h取样测定赤藓糖醇浓度、葡萄糖浓度和菌液OD600。

1.2 赤藓糖醇及葡萄糖检测

产物和底物浓度测定采用高效液相色谱(high performance liquid chromatography,HPLC),具体过程参照文献所述[17]。取样后离心收集上清(8000 r/min,5 min),过0.22 μm滤膜,保存于–20 ℃备用。样品检测采用e2695高效液相色谱仪(美国Waters公司)、Aminex HPX-87H分析柱(300 mm× 7.8 mm) (美国Bio-Rad公司)、2414示差折光检测器(美国Waters公司)。检测条件为柱温35 °C,上样量10 μL,流动相为5 mmol/L硫酸,流速0.6 mL/min。

1.3 基因组提取与测序

菌株CA20和WT5基因组DNA的提取参照真菌基因组DNA提取试剂盒(OMEGA)说明进行。采用TBS-380 fluorometer(美国Turner BioSystems公司)对提取的DNA进行定量。高质量DNA样品(OD260/280= 1.8~2.0,> 6 μg)用于后续文库构建和测序。

文库构建和测序工作由上海凌恩生物科技有限公司完成。采用Illumina NovaSeq PE150二代测序(美国Illumina公司)结合PacBio Sequel II三代测序平台(美国Pacific Biosciences公司)完成CA20的全基因组测序以及WT5的重测序分析。

1.4 基因组组装与基因分析

使用软件Trimmomatic (v0.39,http://www. usadellab.org/cms/index.php?page=trimmomatic)去除测序过程中产生的质量较低的序列。利用软件MaSuRCA (v4.0.8,http://www.genome.umd.edu/ masurca.html)对二代Illumina reads和三代PacBio long-reads进行混合组装。使用软件Canu (v2.1.1,https://github.com/marbl/canu)组装三代PacBio long- reads,同时使用软件MUMmer (v4.0,http:// mummer.sourceforge.net/)整合MaSuRCA和Canu的组装结果,并去冗余。最后使用软件Racon (https:// github.com/isovic/racon)和Pilon (https://github.com/ broadinstitute/pilon/wiki)对整合后的基因组序列进行3轮polish和碱基校正。

以数据库中已报道的解脂亚罗酵母基因组序列为参考,采用AUGUSTUS(v3.2.3)软件 (http://bioinf. uni-greifswald.de/augustus/)对CA20基因组进行de novo基因预测。利用参考基因组的蛋白序列进行同源比对预测,过滤较差结果,去冗余,之后运行软件Genewise (v2.4.1,https://www.ebi.ac.uk/seqdb/ confluence/display/THD/GeneWise)做精确比对,确定基因编码区和内含子区。利用软件EVidenceModeler (v1.1.1,http://evidencemodeler.github.io/)对所预测基因集进行整合,得到样品基因组编码基因。非编码RNA (non-coding RNA,ncRNA)包括sRNA、snRNA、miRNA、tRNA及rRNA的预测采用rRNAmmer(v1.2)、tRNAscan-SE(v2.0.7)以及Rfam(v14.9)等软件。串联重复序列(tandem repeat,TR)的预测采用软件RepeatMasker (v4.1.5,http://www.repeatmasker.org/)。

1.5 基因功能注释

将预测基因的蛋白序列分别与NR (non-redundant protein database,http://www.ncbi. nlm.nih.gov/)、Swiss-Prot (https://www.uniprot.org/ downloads#uniprotkblink)、eggNOG (evolutionary genealogy of genes:non-supervised orthologous groups,http://eggnogdb.embl.de/)、GO (gene ontology,http://geneontology.org/)和KEGG (kyoto encyclopedia of genes and genomes,http://www.genome.jp/kegg/)数据库进行blastp比对(BLAST+ 2.7.1,值小于10–5),注释相关基因的功能。碳水化合物相关酶(CAZymes)的注释采用碳水化合物活性酶数据库(http:// www.cazy.org/)[18]。蛋白质结构域分析采用NCBI CDD v3.20-59693 PSSMs数据库(Conserved Domain Database,值小于10–3,https://www.ncbi.nlm.nih. gov/Structure/cdd/wrpsb.cgi?)。

1.6 基因组序列比较与分析

将CA20基因组序列和NCBI数据库中已完成测序的8株解脂亚罗酵母基因组进行比对分析,基因组序列信息如表1所示。使用MUMmer(v3.23)软件对目标基因组和参考基因组进行比对,确定基因组间的大范围共线性关系。然后使用LASTZ (v1.03.54)对区域间进行比对,确认局部位置排列关系,查找易位(translocation,TRA),倒置(inversion,INV)和易位+倒置(TRA+INV)区域。采用pyani (https://github.com/widdowquinn/pyani)对样本进行平均核苷酸同源性(average nucleotide identity,ANI) 聚类分析。

利用MUMmer软件将每个样品与参考序列进行全局比对,找出样品序列与参考序列之间的差异位点并进行初步过滤,检测潜在单核苷酸多态性位点(single nucleotide polymorphism,SNP)。提取参考序列SNP位点两边各100 bp序列,然后使用BLAT(v35)软件将提取的序列和组装结果进行比对,验证SNP位点。利用LASTZ软件将样品和参考序列进行比对,检测得到初步插入和缺失(insertion + deletion,Indel)结果。然后取参考序列Indel位点上下游150 bp与样品的测序reads用软件BWA (v0.7.12-r1039)及SAMtools(v1.17,http://www.htslib. org/)进行比对验证,过滤得到可靠的Indel。利用软件ANNOVAR(v2019Oct24)对所鉴定的SNP和Indel位点进行注释。此外,利用软件BreakDancer(v 1.1.2)鉴定染色体结构变异区域(structure variants,SV)。

表1 基因组信息

同源基因分析采用软件cd-hit (v4.6.1,http://cd-hit.org)。利用软件对需要分析的多个样品的蛋白序列进行聚类分析(identity > 50%,coverage > 50%),所有样本中均存在的同源基因作为共有基因(core gene),其余为不同样品中的特有基因(specific gene)。基于同源基因分析,利用软件MUSCLE (v3.8.31)进行蛋白多序列的比对,比对结果用于进化树构建。采用PhyML(v3.0)软件(http://www.atgc- montpellier.fr/phyml/)基于最大似然法(1000 boot­strap)构建全基因组系统进化树。赤藓糖醇代谢途径中相关酶的比较分析由NCBI在线BLAST完成,以菌株CA20的蛋白序列为参考序列进行搜索比对。

1.7 重测序分析结果验证

以菌株CA20基因组为参考序列,对菌株WT5进行基因组重测序分析,针对由于基因突变或插入、缺失突变引起的基因缺失及蛋白非同义突变,采用PCR方法进行体外扩增验证。

1.8 数据统计分析

研究中所涉及生物学实验均重复三次以上,每次3组平行,数据差异显著性分析由Origin 9.0软件中的ANOVA(analysis of variance)分析方法完成[19],选用Bonferroni多重比较,<0.05为两组数据间差异显著。图片组合采用软件Adobe Illustrator CC 2022。部分图表的绘制由凌波微课在线云平台完成(http://www.cloud.biomicroclass.com/CloudPlatform)。

2 结果与分析

2.1 菌株CA20基因组特征及系统发育分析

菌株CA20的基因组大小为20,420,510 bp (不包含线粒体),含有6条染色体(表2)。基因组的平均GC含量为48.97%,包含6330个CDS,基因平均长度为1437 bp,基因总长占基因组的44.54%。基因组含有的ncRNA数量为649,包括510个tRNA,112个5S rRNA,2个18S rRNA,2个23S rRNA,以及23个snRNA (表2)。此外,串联重复序列(TR) 的数量为9663。已报道的解脂亚罗酵母基因组大小和GC碱基含量分别在20 Mb和49%左右(表1),CA20与其接近。已将CA20基因组序列上传至NCBI数据库,BioProject号为PRJNA957569。

CA20基因组中分别有4033、4301、和3325个基因具有GO、COG、和KEGG注释功能,分别占全部基因的63.71%、67.95%、以及52.53%。COG和KEGG功能分类如图1所示。COG功能分类中,功能未知蛋白(function unknown,S)数量最多,共539个,其次为蛋白翻译后的修饰、伴侣蛋白(posttranslational modification,protein turnover, chaperones,O)、胞内转运、分泌和小泡运输(intracellular trafficking, secretion, and vesicular transport,U)、翻译、核糖体结构和生物发生(translation, ribosomal structure and biogenesis,J)以及信号转导机制(signal transduction mechanisms,T) 等。丰富的功能未知蛋白分类可能和CA20特殊的性状及功能相关,同时较多的蛋白与基因表达过程相关预示着CA20具备较强的蛋白合成能力。KEGG功能分类中,较多的基因参与信号转导(signal transduction)、翻译(translation)、转运和代谢(transport and catabolism)、细胞生长和死亡(cell growth and death)、碳水化合物代谢(carbohydrate metabolism)以及氨基酸代谢(amino acid metabolism),预示着CA20具备较强的环境压力响应能力。

表2 解脂亚罗酵母CA20基因组特征

图1 解脂亚罗酵母CA20基因功能注释

A:COG功能分类;B:KEGG功能分类

为探究菌株CA20和其他解脂亚罗酵母的亲缘关系,从NCBI数据库下载已完成测序的8个基因组序列用于构建全基因组系统发育树(表1)。根据数据库信息可知,除菌株DSM 3286和CLIB122未记录分离来源外,其他菌株分离于废水(W29、22301-5和PO1f)、奶酪(IBT 446)和泥土(H222和WSH-Z06)。虽然分离于不同环境,但是ANI分析显示CA20和其他8株解脂亚罗酵母高度同源,ANI值>99.50% (图2A),其中CA20和IBT-446及H222的ANI值分别高达99.84%和99.98%,表明这三株菌进化距离更近,亲缘关系更强。全基因组进化树分析结果同样证实CA20、IBT-446及H222处于同一分支(图2B)。

2.2 比较基因组分析

2.2.1 基因组共线性分析

系统发育分析表明CA20和IBT 446以及H222具有更近的亲缘关系。类似地,共线性分析显示这三株菌的基因组线性关系更好(图3,A和B)。同时,分析结果表明CA20和其他8株菌的基因组之间存在较大区域的倒位(inversion)和易位(translocation)现象。其中,和22301-5相比,易位区域存在于Chr2、Chr3、Chr4、Chr5和Chr6 (图3C);与DSM 3286相比,易位区域主要存在于Chr3、Chr4、Chr5和Chr6 (图3D);和W29、IBT 446、CLIB122、PO1f以及WSH-Z06相比,CA20的Chr2、Chr3、Chr4和Chr6染色体上均存在大区域的易位现象(图4,A~D);此外,Chr1存在倒置加易位区域。大区域基因组重排现象的发生可能归结于不同菌株为适应不同生存环境而产生的适应性变化。

2.2.2 基因突变位点分析

除了大区域基因组重排,基因位点变异是引起菌种遗传性状改变的另一个重要因素。单核苷酸多态性分析(SNP)显示,CA20和W29、DSM 3286、22301-5、CLIB122、PO1f以及WSH-Z06基因组相比存在大量突变位点,其中同义突变位点数量大于非同义突变。CA20和IBT 446以及H222之间存在的突变位点数较少,这与上文中的ANI分析结果相一致(图5A)。此外,位点突变所引起的读码框改变以及CDS区域变化在不同菌株中存在差异。其中,除菌株IBT 446和H222以外,其他6株菌中发生移码突变的基因数量均在30个以上,而CDS区域中含有插入突变的基因数量在100个以上(图5B)。

图2 基于全基因组序列的ANI分析和系统发育树

A:核苷酸同源性分析;B:系统发育树分析。

图3 解脂亚罗酵母CA20和H222(A)、IBT 446(B)、22301-5(C)以及DSM 3286(D)基因组的共线性分析

图4 解脂亚罗酵母CA20和W29 (A)、CLIB122 (B)、PO1f (C)以及WSH-Z06 (D)基因组的共线性分析

2.2.3 泛基因和核心基因分析

对包括CA20在内的9株解脂亚罗酵母全基因组进行同源基因聚类分析,参与分析的基因总数为57,254个。结果显示,核心基因数量随着样本数量的增加而减少(图6A),泛基因数量随着样本数量的增加而逐步增加(图6B),表明解脂亚罗酵母基因组为开放式基因组,具备较高的遗传多样性。9株菌共有的核心基因数量为5342个(图6C)。此外,各菌株存在的特有基因数量分别为65个(CA20)、64个(W29)、72个(DSM 3286)、55个(22301-5)、62个(IBT 446)、63个(H222)、242个(CLIB122)、54个(PO1f)和54个(WSH-Z06)。

图5 解脂亚罗酵母CA20与其他菌株基因组间的单核苷酸多态性和插入缺失位点分析

A:单核苷酸突变所引起的同义突变和非同义突变位点数量;B:碱基插入或缺失所引起的基因突变数量。

图6 解脂亚罗酵母核心基因和泛基因分析

A:核心基因分析;B:泛基因分析;C:9个基因组的共有和特有基因花瓣图,圆圈部分为共有基因数量,花瓣部分为各个菌株中特有的基因数量。

为进一步理解不同菌株中特有基因可能发挥的功能,对这些特有基因进行GO功能注释。结果显示,各菌株特有的基因中未得到注释的(not available,NA)占有较大比重,特别是菌株CLIB122中,比例高达75%以上(图7)。在注释的特有基因中,大部分基因所编码蛋白均位于细胞质膜或者细胞膜(plasma membrane or membrane)。不同的是,菌株CA20和DSM 3286中部分蛋白位于线粒体(mitochondrion),而H222和WSH-Z06中部分蛋白位于细胞核中(nucleus)(图7A)。大部分蛋白具有跨膜转运活性 (transmembrane transporter activity) (图7B)。除此以外,CA20中部分蛋白具有氧化还原酶活性 (oxidoreductase activity);DSM 3286中部分蛋白具有NADH脱氢酶活性(NADH dehydrogenase activity)以及催化活性(catalytic activity);IBT 446中部分蛋白具有核酸结合活性(nucleic acid binding)。类似地,生物过程(BP)分析显示不同菌株中均存在部分蛋白参与跨膜转运(transmembrane transport) (图7C)。此外,菌株CA20中部分蛋白参与定位(localization);DSM 3286中部分蛋白参与好氧呼吸过程(aerobic respiration);IBT 446中部分蛋白参与蛋白的磷酸化或酰基化或糖基化(protein phosphorylation or glycosylation or acetylation)以及DNA复制(DNA replication);PO1f 中部分蛋白参与氨基酸转运(amino acid transport)以及WSH-Z06中部分蛋白参与氧化压力响应(response to oxidative stress)等特定生物过程。以上结果表明不同菌株中的特有基因一部分具有相同的分子生物学功能,参与类似生物过程;同时也存在一部分基因发挥各自特定的功能。

图7 不同解脂亚罗酵母中特有基因的GO功能分类

A:细胞成分(cellular component,CC);B:分子功能(molecular function,MF);C:生物过程(biological process,BP)。

2.2.4 碳水化合物活性酶比较分析

为探索不同解脂亚罗酵母对碳水化合物利用潜力的差异,对基因组中的CAZymes进行分析。结果显示,解脂亚罗酵母中碳水化合物活性酶数量范围为108~166个,包括糖苷水解酶类(glycoside hydrolases,GHs)、糖苷转移酶类(glycosyltransferases,GTs)、碳水化合物结合模块类(carbohydrate-binding modules,CBMs)、碳水化合物酯酶类(carbohydrate esterases,CEs)和辅助模块酶类(auxiliary activities,AAs) (表3)。其中,碳水化合物酶数量最多和最少的菌株分别是CA20和IBT 446。根据功能的不同,GHs、GTs、CBMs、CEs和AAs分别可细分为26个、28个、6个、8个和6个家族(图8,A和B)。不同家族酶在不同菌株中的分布存在明显差异,如GHs中的GH3、GH16、GH17、GH72和GH81,CBMs中的CBM18、CBM19和CBM21,AAs中的AA1、AA2和AA6,以及GTs中的GT1、GT4和GT39等,预示着不同解脂亚罗酵母对不同碳水化合物的利用潜力存在差异。

表3 不同解脂亚罗酵母中碳水化合物活性酶的数量

GHs:糖苷水解酶类;GTs:糖苷转移酶类;CBMs:碳水化合物结合模块类;CEs:碳水化合物酯酶类;AAs:辅助模块酶类。

相比于其他解脂亚罗酵母菌株,菌株CA20含有更丰富的GH4、GH9、GH109、GH158、CBM19、CBM32、CBM43、AA1、AA2、AA4、GT28、GT34、GT90、CE1、CE3、CE4、CE9、CE10、CE12、CE14、CE16,其中GH4、GH9、GH109、GH158、GT28、GT90、CE3、CE10、CE12、CE14、CE16只存在于CA20中(图8)。基因注释显示,GH4为α-葡萄糖苷酶,参与淀粉水解;GH9为β-葡萄糖苷酶,参与纤维素水解;GH109为α-N-乙酰氨基半乳糖苷酶;GH158为内切-β-1,3-葡聚糖酶,参与细胞壁β-葡聚糖水解。在酯酶类中,CE10、CE12、CE14和CE16分别为芳香基酯酶、果胶甲酯酶、几丁二糖脱乙酰酶和乙酰酯酶,参与果胶及几丁质的降解等过程。综上可知,解脂亚罗酵母CA20含有更丰富的碳水化合物活性酶,可能具有更好的底物水解能力。

图8 解脂亚罗酵母中碳水化合物活性酶的家族分布

A:GHs,CBMs和AAs的数量;B:GTs 和CEs的数量。

2.2.5 赤藓糖醇代谢途径中关键酶的比较分析

解脂亚罗酵母主要利用葡萄糖为底物通过磷酸戊糖途径代谢合成赤藓糖醇。研究中选取和葡萄糖转运、葡萄糖代谢、赤藓糖醇合成直接相关的蛋白进行序列比较分析,包括6个葡萄糖转运蛋白(YHT1-YHT6)、葡萄糖激酶和己糖激酶(GK和HK)、葡萄糖-6-磷酸脱氢酶(ZWF1)、6-磷酸葡萄糖酸内酯酶(PGLS)、磷酸葡萄糖酸脱氢酶(GND1)、核酮糖磷酸 3-差向异构酶(RPE1)、核酮糖-5-磷酸异构酶(RPI)、转酮酶(TKL1)、转醛酶(TAL1)、赤藓糖-4-磷酸激酶(E4PK)、3个赤藓糖还原酶(ER10、ER25和ER27)、赤藓糖醇脱氢酶(EYD1)、赤藓酮糖激酶(EYK1)、赤藓酮糖-1-磷酸异构酶(EYI1)和赤藓酮糖- 4-磷酸异构酶(EYI2)。结果显示,除HK、YHT6和TAL1以外,其他蛋白在解脂亚罗酵母中高度保守,序列相似度达100% (图9)。HK和YHT6编码基因分别在菌株DSM 3286和PO1f中发生缺失;来源于W29、IBT 446和H222的转醛酶(TAL1)和CA20中的TAL1相比相似度<85%。以上结果说明,除小部分菌株外,本文所选取解脂亚罗酵母均具有代谢合成赤藓糖醇的潜在能力。

2.3 解脂亚罗酵母CA20和WT5性能差异分析

2.3.1 菌株CA20与WT5合成赤藓糖醇性能的比较

根据之前菌株筛选结果,原始菌株WT5的赤藓糖醇产量显著低于菌株CA20[17],然而其罐上发酵性能差异待分析。本研究首先比较菌株CA20和WT5发酵产赤藓糖醇的性能差异。整个过程在10 L发酵罐中进行,发酵周期6天。结果显示,在生长前24 h,菌株CA20培养液的OD600高于菌株WT5,24 h后两株菌的生长无明显差异,72 h后培养液OD600逐渐稳定(图10A)。发酵144 h后,培养基中葡萄糖浓度接近于0,菌株CA20的赤藓糖醇产量达190.97 g/L,显著高于菌株WT5的128.61 g/L (< 0.001,图10B)。此外,菌株CA20利用葡萄糖合成赤藓糖醇的得率为0.65 g/g,产率为1.33 g/L/h,均显著高于菌株WT5的0.47 g/g和0.92 g/L/h (<0.001;图10,C和D)。以上结果表明,菌株CA20和WT5在发酵产赤藓糖醇的性能上存在明显差异。

图9 赤藓糖醇代谢途径中关键酶的比较分析

YHT1-YHT6:glucose transporter (XP_501516.1,XP_501621.1,XP_505610.1,XP_504302.1,XP_500382.1,and XP_500566.1); GK:glucokinase (VBB78679.1);HK:hexokinase (XP_501216.1);ZWF1:glucose-6-phosphate dehydrogenase (XP_504275.1);PGLS:6-phosphogluconolactonase (VBB78832.1);GND1:phosphogluconate dehydrogenase (XP_500938.1); RPE1:ribulose phosphate 3-epimerase (QNP96251.1);RPI:ribulose-5-phosphate isomerase (XP_500588.1);TKL1:transketolase (XP_503628.1);TAL1:transaldolase (XP_505460.1);E4PK:erythrose-4-phosphate kinase;ER:erythrose reductase [ER10 (XP_502540.1),ER25 (XP_501796.1),and ER27 (XP_505585.1)];EYD1:erythritol dehydrogenase (XP_504870.1);EYK1: erythrulose kinase (XP_504868.1);EYI1:erythrulose-1-phosphate isomerase (XP_504867.1);EYI2:erythrulose-4-phosphate isomerase (XP_504869.1);P:phosphate。

2.3.2 菌株WT5基因组重测序分析

为在基因组水平阐明菌株CA20和WT5之间性状差异的原因,对菌株WT5进行基因组重测序分析,并比较CA20和WT5的基因组序列差异。结果显示,菌株CA20基因组序列中存在278个SNP和370个Indel,位点突变产生15个非同义突变氨基酸,5个同义突变氨基酸以及5个移码变异基因(图11)。同时,CA20中的染色体结构变异包括9个染色体之间的易位(inter-chromosomal translocation,CTX)、6个插入(insertion,INS)、25个缺失(deletion,DEL)、1个倒位(inversion,INV) 和9个染色体内部的易位(intra-chromosomal translocation,ITX)。对这些突变位点所在基因进行功能注释,结果如表4所示。其中,值得注意的是,5个移码变异基因在菌株WT5中为移码缺失,碱基位点的缺失或替换导致读码框改变及引入终止密码子。CA20中这5个基因能够完整表达,分别编码假设蛋白(RMI98785.1和VBB88313.1)、蛋白激酶(SEI32238.1)、YALIA101S09e01662g1_1 (SEI35917.1)和YALI0F18458p (CAG78388.1)。结构域分析表明,RMI98785.1含有F-BAR (cd07651)、SH3 (smart00326)和PHA03247 (cl33720),可能参与细胞分裂;VBB88313.1含有Rad2 (cl36701),参与DNA剪切修复过程;SEI35917.1为功能未知蛋白;CAG78388.1为转录因子,参与转录调控;SEI32238.1是PKc_like类蛋白激酶,参与细胞信号传递。序列比较分析发现,上述5个基因所编码蛋白序列在其他解脂亚罗酵母中高度保守(相似度> 99%,除了IBT 446的SEI35917.1,图12)。

A:菌株WT5和CA20的生长曲线;B:菌株WT5和CA20的葡萄糖消耗及赤藓糖醇合成曲线;C:赤藓糖醇得率;D:赤藓糖醇产率。“***”代表两组数据间差异显著(<0.001)。

发生非同义突变的蛋白中,几丁质转糖基化酶(VBB85253.1)和几丁质酶(VBB88398.1)与细胞壁的合成相关;支架蛋白VBB85012.1含有Ecm29结构域,参与稳定胞内蛋白酶体,与胞内蛋白质的降解稳定维持相关;假设性蛋白VBB85808.1含有Vps54结构域,参与胞内蛋白质的转运过程;假设性蛋白B0I72DRAFT_135086 (RDW34205.1) 含有PH_Scd1 (cd13246)、CDC24 (pfam06395)、RhoGEF (pfam00621)和PB1(smart00666)结构域,参与调节胞内Rho蛋白的信号转导过程;蛋白RDW34848.1、RDW40799.1、VBB79189.1和SEI34914.1参与胞内蛋白质的合成、修饰和稳定等过程。综合以上结果可知,菌株CA20赤藓糖醇产量较高的原因可能与一些重要基因的移码变异和突变有关,这些基因参与细胞信号传递、细胞分裂、细胞壁合成、蛋白质合成及稳态维持。此外,诱变所引起的非同义突变可能带来对应蛋白活性的改变,这可能是影响细胞代谢合成赤藓糖醇的重要因素。

图11 菌株CA20和WT5的比较基因组分析

A:样本突变圈图,由外至内依次为基因组信息、SNP在基因组上的密度分布、Indel在基因组上的密度分布、SV在基因组上的密度分布;B:SNP和Indel的位点数量;C:位点变化引起的非同义突变(nonsynonymous mutation,NSM)、同义突变(synonymous mutation,SM)和移码变异(frameshift mutation,FSM)基因数量;D:染色体结构变异数量,包括染色体之间的易位(inter-chromosomal translocation,CTX)、插入(insertion,INS)、缺失(deletion,DEL)、倒位(inversion,INV)、染色体内部的易位(intra-chromosomal translocation,ITX)。

表4 SNP和Indel突变所引起的蛋白编码序列变化

图12 移码变异基因的序列比较分析

3 讨论

解脂亚罗酵母是目前工业发酵生产赤藓糖醇所使用的唯一菌种,优良菌株的分离和选育是降低赤藓糖醇生产成本的基础[7]。多年来,基于诱变选育技术,研究人员不断获得解脂亚罗酵母优良菌株[13,14,20]。然而,对于诱变引起性状改变的潜在机制尚不清楚,不同菌株之间性能差异的原因仍待探索。诱变所引起的基因位点的突变是菌株性状改变的重要因素。因此,基因组水平的比较分析有助于理解和挖掘新的和菌株优良性状相关联的位点。

本研究对赤藓糖醇高产菌株解脂亚罗酵母CA20进行全基因组测序,结果表明CA20的基因组大小及GC含量与数据库中的8株解脂亚罗酵母较接近,在20 Mb左右,预示着他们可能具有较近的进化距离。全基因组ANI分析显示包括CA20在内的9个菌株具有高度同源性,进一步验证了这一猜想。Walker等[21]对解脂亚罗酵母菌株CLIB122、CBS7504、YB567、YB566、YB420、YB419和YB392的基因组进行比较分析,发现这些菌株的基因组高度相似。该结果与本研究所获结果类似。此外,虽然基因组序列高度同源,但全基因组进化树分析表明菌株CA20和菌株H222以及IBT 446具有更近的亲缘关系。菌株H222和IBT 446分离于泥土和奶酪,而其他菌株大都分离于废水(表1),表明生存环境对解脂亚罗酵母的遗传进化具有一定影响。类似结果也发现于先前研究中,如Liu等[22]发现菌株PO1f的基因组序列虽然和CLIB122高度相似,但PO1f基因组中存在大片段序列的缺失。此外,基因组共线性分析以及基因突变位点分析数据表明菌株H222、IBT 446和CA20具有较好的基因组线性关系。同时,对比于CA20基因组,H222和IBT 446中SNP和Indel带来的基因缺失数量均少于其他菌株。综合可知,解脂亚罗酵母基因组进化相对保守,不同生存环境可能是引起基因组序列变化的主要因素。

在基因组水平,不同解脂亚罗酵母之间的性能差异可能与特有基因的存在有关。泛基因和核心基因分析表明不同菌株含有各自特有基因,数量在50~70个(除菌株CLIB122外)。然而,这些特有基因的功能大部分未得到注释,其可能在各菌株中发挥特定作用,具体需要今后更深入的研究。在已注释的特有基因中,不同菌株中基因的功能和参与的生物过程存在差异,如CA20中较多基因所编码蛋白具有氧化还原酶活性,参与蛋白转运和定位的基因数量远高于其他菌株,预示着CA20可能具有更强的蛋白质合成和代谢能力。此外,对于碳水化合物的利用能力是评价菌株性能的重要指标。解脂亚罗酵母具有较广泛的底物谱,可利用烷烃、烯烃、有机酸、脂肪酸、甘油三酯、葡萄糖、甘油和果糖等[23]。本研究发现解脂亚罗酵母基因组中含有丰富的碳水化合物活性酶,包括糖苷水解酶类(GHs)、糖基转移酶类(GTs)、碳水化合物结合模块类(CBMs)、碳水化合物酯酶类(CEs)和辅助模块酶类(AAs),这与其具有较广泛底物谱相呼应。其中,菌株CA20、W29、DSM 3286和CLIB122具有更丰富的GHs、GTs、CBMs和AAs。GHs主要参与纤维素、半纤维素等多糖化合物的降解;CBMs可与其他家族的酶结合提高其催化活性;AAs与木质素的降解相关[18,24]。因此,这4个菌株可能具有更强的多糖降解能力。然而,需要指出的是,虽然解脂亚罗酵母基因组中含有丰富的与纤维素降解相关的GHs,但是其并不能直接利用纤维素[6]。这可能归因于相应糖苷酶未被激活或是相关代谢途径中关键元件的缺失[25,26],因此,如果能有效激活和纤维素及半纤维素降解有关的糖苷酶以及补充缺少的元件,则可加速实现以富含纤维素的农作物废弃物为原料生产赤藓糖醇,降低生产成本。另外,值得注意的是,菌株CA20的碳水化合物活性酶数量(166个)远高于其他8个菌株,其中AAs中的AA1和CEs相对于其他菌株更为丰富。AA1为漆酶 (laccase),参与催化取代酚、苯胺和芳香族硫醇等酚类物质的氧化过程,已被用于去除木质纤维素水解液中的酚类物质,消除其对马克斯克鲁维酵母()的抑制作用[27]。基因组中丰富的AA1预示着菌株CA20对酚类物质具有较好的耐受能力。CEs可参与半纤维素、果胶和几丁质的降解过程[28,29],菌株CA20中丰富的CE1、CE4和CE9,以及特有的CE10、CE12、CE14和CE16可能和其分离环境有关,同时也预示着其具有更强的底物分解能力。综合可知,基因组中特异基因的存在及碳水化合物活性酶的多样性可能是不同解脂亚罗酵母性能差异的主要原因。

得益于良好的高渗压耐受性和安全性,解脂亚罗酵母已被广泛用于赤藓糖醇的发酵生产。然而,不同菌株的产量差异明显[1]。赤藓糖醇的代谢途径已得到揭示,除了赤藓糖-4-磷酸激酶(E4PK)以外,代谢途径中其他酶的序列可从数据库中下载。本研究对葡萄糖转运、磷酸戊糖途径及赤藓糖醇降解等过程中关键酶的序列进行比较分析。针对葡萄糖转运,先前研究表明解脂亚罗酵母中葡萄糖转运蛋白主要有6个(YHT1-YHT6),其中YHT1和YHT4发挥主要作用[30,31]。本研究发现,6个糖转运蛋白在9株菌中均高度保守(除了YHT6在PO1f发生丢失以外)。在赤藓糖糖醇合成途径中,除转醛酶外,其他酶均高度保守(图9)。此外,在赤藓糖醇降解途径中,相关酶同样高度保守。这些结果预示着已知的解脂亚罗酵母均保留完整的赤藓糖醇代谢与合成潜力,不同菌株间赤藓糖醇合成能力的差异可能并非来自关键酶的突变或缺失。需要指出的是,本研究所选取的8株菌中,只有菌株W29和PO1f用于赤藓糖醇合成研究[1,8,31],其他文献中报道的赤藓糖醇高产菌如解脂亚罗酵母M53[20]、解脂亚罗酵母CGMCC7326[32]、解脂亚罗酵母BBE-17及[13,33]和CICC 1675[34]的基因组序列尚未公开。因此,未来通过分析这些高产菌株的基因组差异可进一步揭示赤藓糖醇产量差异的机制。

高产菌株和原始菌株基因组序列的比较分析有助于阐明和赤藓糖醇积累有关的机制。先前预测诱变可能导致藓糖醇代谢途径中关键酶的突变,从而改变酶的活性,进而引起产量的变化。然而,本研究发现,诱变并未引起相关酶编码序列的变化,预示着CA20中赤藓糖醇的代谢受到其他因素调控。进一步分析发现,菌株CA20中5个基因发生移码变异,其中值得关注的是蛋白激酶SEI32238.1,含有PKc_like 结构域。蛋白激酶主要参与胞内信号传递过程,研究表明PKC(protein kinase C)-MAPK (mitogen-activated protein kinase)信号通路主要参与调控酵母细胞细胞壁的稳定性和修复过程,与细胞从压力环境恢复生长过程中肌动蛋白细胞骨架的复极化密切相关[35~37]。酵母细胞代谢合成赤藓糖醇需要高渗环境,细胞壁的稳定性与细胞在高渗环境中生存密切相关。因此,蛋白激酶SEI32238.1可能参与调控细胞在高渗环境中的生长和代谢,进而影响赤藓糖醇的合成。序列比较分析发现SEI32238.1在其他解脂亚罗酵母菌株中高度保守,间接说明其对于酵母细胞代谢生长的重要性。此外,虽然赤藓糖醇代谢途径已得到揭示,但是该途径的调控机制仍有待研究。本研究发现菌株CA20发生移码变异的基因中含有1个转录调控因子(CAG78388.1),该蛋白的功能未知,是否参与调控胞内赤藓糖醇代谢需要进一步试验验证。除移码变异外,本研究发现菌株CA20中存在众多的非同义突变蛋白。虽然这些蛋白的突变位点只有1个,但仍有可能造成蛋白活性的变化,从而引起胞内代谢网络的改变[38]。值得注意的是,发生非同义突变的15个蛋白中,大部分参与细胞分裂、细胞壁合成、蛋白质合成及稳态维持等过程,表明胞内环境稳态的维持对细胞合成赤藓糖醇具有重要影响。综合可知,诱变处理引起的非同义突变所带来的细胞稳定性的提升可能是促进细胞合成赤藓糖醇的重要因素,其中蛋白激酶SEI32238.1可能发挥重要调控作用。

综上所述,这些结果表明:(1)解脂亚罗酵母基因组在进化过程中保守,生存环境的不同是导致不同菌株基因组序列差异的主要因素;(2)基因组中CAZymes数量差异可能是不同解脂亚罗酵母性能差异的重要因素,而菌株CA20具有更丰富的碳水化合物活性酶,具备更强的工业应用潜力;(3)赤藓糖醇代谢途径在不同解脂亚罗酵母中保守,不同菌株产量差异可能并非只来自代谢途径中有关酶的突变,同时与代谢途径的调控有关;(4)菌株CA20高产赤藓糖醇与其细胞结构及内环境稳定性的提升有关,蛋白激酶SEI32238.1可能是重要的调控因子。未来可通过转录组及代谢组学的研究进一步阐明解脂亚罗酵母高产赤藓糖醇的机制,为优良菌株的定向选育提供新思路。

[1] Liang PX, Cao MF, Li J, Wang QH, Dai ZJ. Expanding sugar alcohol industry: microbial production of sugar alcohols and associated chemocatalytic derivatives., 2023, 64: 108105.

[2] Liu FM, Zhao XQ, Sha RY, Xia K, Huang J. Advances in microbial production of erythritol., 2022, 20(2): 195–205.刘芳美, 赵学群, 沙如意, 夏凯, 黄俊. 赤藓糖醇微生物合成研究进展. 生物加工过程, 2022, 20(2): 195–205.

[3] Erian AM, Sauer M. Utilizing yeasts for the conversion of renewable feedstocks to sugar alcohols-a review., 2022, 346: 126296.

[4] Daza-Serna L, Serna-Loaiza S, Masi A, Mach RL, Mach-Aigner AR, Friedl A. From the culture broth to the erythritol crystals: an opportunity for circular economy., 2021, 105(11): 4467–4486.

[5] Chinese Institute of Food Science and Technology. Scientific consensus on erythritol., 2022, 22(12): 405–412.中国食品科学技术学会. 赤藓糖醇的科学共识. 中国食品学报, 2022, 22(12): 405–412.

[6] Liu XY, Yu XJ, He AY, Xia J, He JL, Deng YF, Xu N, Qiu ZY, Wang XY, Zhao PS. One-pot fermentation for erythritol production from distillers grains by the co-cultivation ofand., 2022, 351: 127053.

[7] Zhang Y, Xu S, Wang N, Chi P, Zhang XY, Cheng HR. Construction and characterization ofstrain with reduced foaming ability., 2022, 62(11): 4165–4175.张悦, 徐硕, 王楠, 池萍, 张馨月, 程海荣. 发酵产泡性能降低的解脂耶氏酵母菌株的获得及其评价. 微生物学报, 2022, 62(11): 4165–4175.

[8] Zhang L, Nie MY, Liu F, Chen J, Wei LJ, Hua Q. Multiple gene integration to promote erythritol production on glycerol in., 2021, 43(7): 1277–1287.

[9] Mirończuk AM, Biegalska A, Dobrowolski A. Functional overexpression of genes involved in erythritol synthesis in the yeast., 2017, 10: 77.

[10] Liang PX, Li J, Wang QH, Dai ZJ. Enhancing the thermotolerance and erythritol production ofby introducing heat-resistant devices., 2023, 11: 1108653.

[11] Wang N, Chi P, Zou YW, Xu YR, Xu S, Bilal M, Fickers P, Cheng HR. Metabolic engineering offor thermoresistance and enhanced erythritol productivity., 2020, 13: 176.

[12] Mirończuk AM, Rakicka M, Biegalska A, Rymowicz W, Dobrowolski A. A two-stage fermentation process of erythritol production by yeastfrom molasses and glycerol., 2015, 198: 445–455.

[13] Qiu XL, Xu P, Zhao XR, Du GC, Zhang J, Li JH. Combining genetically-encoded biosensors with high throughput strain screening to maximize erythritol production in., 2020, 60: 66–76.

[14] Liu XY, Yu XJ, Lv JS, Xu JX, Xia J, Wu Z, Zhang T, Deng YF. A cost-effective process for the coproduction of erythritol and lipase withM53 from waste cooking oil., 2017, 103: 86–94.

[15] Ghezelbash GR, Nahvi I, Emamzadeh R. Improvement of erythrose reductase activity, deletion of by-products and statistical media optimization for enhanced erythritol production frommutant 49., 2014, 69(2): 149–157

[16] Song B, Li XF, Shi ZY, Li CT, Fu YP, Li Y. Breeding of newstrain by mutation with60Co-γ irradiation., 2019, 59(11): 2155–2164.宋冰, 李雪飞, 史泽宇, 李长田, 付永平, 李玉. 钴60诱变选育平菇新菌株的研究. 微生物学报, 2019, 59(11): 2155–2164.

[17] Liu FM, Xia K, Peng YT, Zhao XQ, Sha RY, Huang J. Breeding ofstrains with improved erythritol production by combined mutation and optimization of fermentation process., 2023, 37(5): 907–916.刘芳美, 夏凯, 彭艳婷, 赵学群, 沙如意, 黄俊. 复合诱变选育高产赤藓糖醇解脂亚罗酵母及其发酵工艺优化. 核农学报, 2023, 37(5): 907–916.

[18] Feng JY, He JK, Sun JY, Fu XZ, Yuan JA, Guo HP. Genome sequencing and comparative genome analysis ofGO2, a strain producing bioflo­cculant with lignocellulosic biomass., 2023, 63(2): 786–804.冯嘉茵, 何继堃, 孙嘉怡, 符学志, 袁佳骜, 郭海朋. 利用木质纤维素类生物质产微生物絮凝剂GO2的全基因组测序及比较基因组学分析. 微生物学报, 2023, 63(2): 786–804.

[19] Xia K, Han CC, Xu J, Liang XL. Toxin-antitoxin HicAB regulates the formation of persister cells responsible for the acid stress resistance in., 2021, 105(2): 725–739.

[20] Liu XY, Yu XJ, Xia J, Lv JS, Xu JX, Dai BL, Xu XQ, Xu JM. Erythritol production byfrom okara pretreated with the in-house enzyme pools of fungi., 2017, 244(Pt 1): 1089–1095.

[21] Walker C, Dien B, Giannone RJ, Slininger P, Thompson SR, Trinh CT. Exploring proteomes of robustisolates cultivated in biomass hydrolysate reveals key processes impacting mixed sugar utilization, lipid accumulation, and degradation., 2021, 6(4): e0044321.

[22] Liu LQ, Alper HS. Draft genome sequence of the oleaginous yeastPO1f, a commonly used metabolic engineering host., 2014, 2(4): e00652–14.

[23] Park YK, Ledesma-Amaro R. What makeswell suited for industry?, 2023, 41(2): 242–254.

[24] Silva JP, Ticona ARP, Hamann PRV, Quirino BF, Noronha EF. Deconstruction of lignin: from enzymes to microorganisms., 2021, 26(8): 2299.

[25] Celińska E, Nicaud JM, Białas W. Hydrolytic secretome engineering infor consolidated bioprocessing on polysaccharide resources: review on starch, cellulose, xylan, and inulin., 2021, 105(3): 975–989.

[26] Ryu S, Hipp J, Trinh CT. Activating and elucidating metabolism of complex sugars in., 2015, 82(4): 1334–1345.

[27] Moreno AD, Ibarra D, Fernández JL, Ballesteros M. Different laccase detoxification strategies for ethanol production from lignocellulosic biomass by the thermotolerant yeastCECT 10875., 2012, 106: 101–109.

[28] Sánchez C. Lignocellulosic residues: biodegradation and bioconversion by fungi., 2009, 27(2): 185–194.

[29] Peng MF, Li PJ, Shan Y, Chen YQ, Yang DJ, Lei LC, Huang ZH, Yu KX. Comparative genome analysis of carbohydrate activity enzymes zymogram ofGuangxi pickle., 2021, 47(4): 68–73.彭明芳, 李培骏, 单杨, 陈玉秋, 杨岱峻, 雷丽嫦, 黄芝辉, 余孔新. 比较基因组揭示广西酸菜乳杆菌碳水化合物活性酶谱. 食品与发酵工业, 2021, 47(4): 68–73.

[30] Lazar Z, Neuvéglise C, Rossignol T, Devillers H, Morin N, Robak M, Nicaud JM, Crutz-Le Coq AM. Characterization of hexose transporters inreveals new groups of sugar porters involved in yeast growth., 2017, 100: 1–12.

[31] Hapeta P, Szczepańska P, Witkowski T, Nicaud JM, Crutz-Le Coq AM, Lazar Z. The Role of hexokinase and hexose transporters in preferential use of glucose over fructose and downstream metabolic pathways in the yeast., 2021, 22(17): 9282.

[32] Cheng HL, Wang SQ, Bilal M, Ge XM, Zhang C, Fickers P, Cheng HR. Identification, characterization of two NADPH-dependent erythrose reductases in the yeastand improvement of erythritol productivity using metabolic engineering., 2018, 17(1): 133.

[33] Qiu XL, Gu Y, Du GC, Zhang J, Xu P, Li JH. Conferring thermotolerant phenotype to wild-typeimproves cell growth and erythritol production., 2021, 118(8): 3117–3127.

[34] Yang LB, Zhan XB, Zheng ZY, Wu JR, Gao MJ, Lin CC. A novel osmotic pressure control fed-batch fermentation strategy for improvement of erythritol production byfrom glycerol., 2014, 151: 120–127.

[35] Dickson RC, Sumanasekera C, Lester RL. Functions and metabolism of sphingolipids in., 2006, 45(6): 447–465.

[36] Caspeta L, Nielsen J. Thermotolerant yeast strains adapted by laboratory evolution show trade-off at ancestral temperatures and preadaptation to other stresses., 2015, 6(4): e00431.

[37] Li B, Liu N, Zhao XB. Response mechanisms ofto the stress factors present in lignocellulose hydrolysate and strategies for constructing robust strains., 2022, 15(1): 28.

[38] Caspeta L, Chen Y, Ghiaci P, Feizi A, Buskov S, Hallström BM, Petranovic D, Nielsen J. Altered sterol composition renders yeast thermotolerant., 2014, 346(6205): 75–78.

Mechanism and evolutionary analysis ofCA20 capable of producing erythritol with a high yield based on comparative genomics

Kai Xia, Fangmei Liu, Yuqing Chen, Shanshan Chen, Chunying Huang, Xuequn Zhao, Ruyi Sha, Jun Huang

Combined mutagenesis is widely applied for the breeding of robustused in the production of erythritol. However, the changes of genome after mutagenesis remains unclear. This study aimed to unravel the mechanism involved in the improved erythritol synthesis of CA20 and the evolutionary relationship between differentby comparative genomics analysis. The results showed that the genome sizeofCA20 was 20,420,510 bp, with a GC content of 48.97%. There were 6330 CDS and 649 ncRNA (non-coding RNA) in CA20 genome. Average nucleotide identity (ANI) analysis showed that CA20 genome possessed high similarity (ANI > 99.50%) with otherstrains, while phylogenetic analysis displayed that CA20 was classified together withIBT 446 andH222. CA20 shared 5342 core orthologous genes with the 8 strains while harbored 65 specific genes that mainly participated in the substrate and protein transport processes. CA20 contained 166 genes coding for carbohydrate-active enzymes (CAZymes), which was more than that found in other strains (108-137). Notably, 4, 2, and 13 different enzymes belonging to glycoside hydrolases (GHs), glycosyltransferases (GTs), and carbohydrate esterases (CEs), respectively, were only found in CA20. The enzymes involved in the metabolic pathway of erythritol were highly conserved in, except for transaldolase (TAL1). In addition, the titer and productivity of erythritol by CA20 were 190.97 g/L and 1.33 g/L/h, respectively, which were significantly higher than that of WT5 wherein 128.61 g/L and 0.92 g/L/h were obtained (< 0.001). Five frameshift mutation genes and 15 genes harboring nonsynonymous mutation were found in CA20 compared with that of WT5. Most of these genes were involved in the cell division, cell wall synthesis, protein synthesis, and protein homeostasis maintenance. These findings suggested that the genome ofis conserved during evolution, and the variance of living environment is one important factor leading to genome divergence. The varied number of CAZymes existed inis one factor that contributes to the performance difference. The increased synthesis of erythritol byCA20 is correlated with the improvement of the stability of cell structure and internal environment. The results of this study provide a basis for the directional breeding of robuststrains used in erythritol production.

; erythritol; comparative genome; frameshift mutation; protein kinase

2023-06-08;

2023-08-11;

2023-08-23

浙江科技学院科研启动基金(编号:F701103L11),研究生科研创新基金项目(编号:2021yjskc11)和国家大学生创新训练项目(编号:202211057026)资助[Supported by the Research Start-Up Foundation of Zhejiang University of Science and Technology (No. F701103L11), the Research Innovation Foundation of Postgraduate (No. 2021yjskc11), and the National Training Program for College Students’ Innovation (No. 202211057026)]

夏凯,博士,讲师,研究方向:微生物遗传与育种。E-mail: xiakai05@zust.edu.cn

黄俊,博士,教授,研究方向:蛋白质分子设计和定向进化以及合成生物学。E-mail: huangjun@zust.edu.cn

10.16288/j.yczz.23-139

(责任编委: 高海春)

猜你喜欢
赤藓糖醇酵母
代糖“赤藓糖醇”真的安全吗?
异麦芽酮糖醇在卷烟增香保润中的应用
发酵产赤藓糖醇研究进展
甘露糖醇结构及热稳定性研究
解脂耶氏酵母利用甘蔗渣发酵产赤藓醇
酵母抽提物的研究概况
酵母魔术师
人CyclinD1在毕赤酵母中的表达
布鲁菌赤藓醇代谢研究概况
生物量高的富锌酵母的开发应用