基于高通量测序的平均核苷酸一致性在1株弗朗西斯菌鉴定中的应用

2017-08-17 10:04张磊郑敏玲王亚柴海云邓光远朱庆义陈茶屈平华
临床检验杂志 2017年7期
关键词:弗朗西斯亚种菌种

张磊,郑敏玲,王亚,柴海云,邓光远,朱庆义,陈茶,屈平华

(1.广州金域医学检验中心有限公司微生物室,广州 510330;2.广州中医药大学第二附属医院/广东省中医院检验医学部,广州 510006;3.泽塔生物科技(上海)有限公司,上海 201203)

·临床实验研究·

基于高通量测序的平均核苷酸一致性在1株弗朗西斯菌鉴定中的应用

张磊1,郑敏玲2,王亚3,柴海云1,邓光远2,朱庆义1,陈茶2,屈平华2

(1.广州金域医学检验中心有限公司微生物室,广州 510330;2.广州中医药大学第二附属医院/广东省中医院检验医学部,广州 510006;3.泽塔生物科技(上海)有限公司,上海 201203)

目的 对一溺水性肺炎患者血液标本中分离的弗朗西斯菌(编号Wenzhou1)进行菌种鉴定。方法 采用Illumina二代测序平台2000/miSeq系统对实验菌株进行高通量测序,MicrobeTrakr Plus软件对测得的全基因组草图进行序列拼接。在GenBank数据库中,对实验菌株的16S rRNA基因、mdh基因、rpoB基因和sdhA基因序列进行NCBI BLAST分析,获得与实验菌株遗传关系接近的近缘菌种信息。Java 8运行环境,OrthoANI软件对实验菌株和近缘菌种进行全基因组序列NCBI BLAST搜索和全基因组平均核苷酸一致性(average nucleotide identity,ANI)分析。结果 测得的弗朗西斯菌Wenzhou1的基因组大小为1.96×106bp,含74个重叠群(contigs)。基因组G+C mol%为32.1%,与其他弗朗西斯菌和另弗朗西斯菌一致。GenBank数据库NCBI BLAST分析结果显示,Wenzhou1的16S rRNA基因、mdh基因、rpoB基因和sdhA基因序列与西班牙弗朗西斯菌FSC454和“土拉弗朗西斯菌新凶手亚种”3523最为近缘。ANI分析显示,实验菌株Wenzhou1与西班牙弗朗西斯菌FSC454的ANI为97.8%,与“土拉弗朗西斯菌新凶手亚种”3523的ANI在97.5%~97.6%之间,而与土拉弗朗西斯菌的4个亚种的ANI在91.3%~91.5%之间。结论 基于全基因组序列的ANI分析是一种准确和有效的菌种鉴定方法。Wenzhou1可明确鉴定为西班牙弗朗西斯菌。

西班牙弗朗西斯菌;平均核苷酸一致性分析;菌种鉴定

近年来,随着后基因组计划的执行和高通量测序(high-throughput sequencing)技术的进步,已测序的全基因组数量正在快速增长,其中大多数与人类疾病相关的病原微生物均完成了全基因组测序。虽然合格发表(valid-published)的菌种数量不多,但就弗朗西斯菌(Francisella)而言,截至2017年4月,在GenBank数据库中存放的基因组仍达139个,其中以土拉弗朗西斯菌(F.tularensis)为主,为109个;其他包括蜃楼弗朗西斯菌(F.philomiragia)9个、船城弗朗西斯菌(F.noatunensis)8个、波斯弗朗西斯菌(F.persica)和西班牙弗朗西斯菌(F.hispaniensis)各2个、弗朗西斯菌内生体(F.endosymbiont)和广州另弗朗西斯菌(Allofrancisellaguangzhouensis)各1个。上述已测序的全基因组数据为系统评价弗朗西斯菌和相关菌种的种内、种间差异奠定了坚实的基础。本研究采用高通量基因组测序技术和基于全基因组平均核苷酸一致性(average nucleotide identity,ANI)分析,最终鉴定了1株从溺水性肺炎患者血液标本中分离的西班牙弗朗西斯菌,报道如下。

1 材料与方法

1.1 菌株 实验菌株由温州医科大学第一附属医院馈赠,其来源于1例溺水性肺炎患者血液标本,菌株编号为Wenzhou 1,前期已测序其16S rRNA基因、苹果酸脱氢酶(malate dehydrogenase, mdh)基因、RNA指导的RNA聚合酶亚单位β(DNA-directed RNA polymerase subunit beta, rpoB)基因和琥珀酸脱氢酶亚单位α(succinate dehydrogenase subunit alpha, sdhA)基因,递交GenBank数据库后获得的登录号(accession numbers)分别为KU507069、KU507070、KU507071和KU507072。

1.2 细菌的全基因组测序和组装 按细菌基因组试剂盒(大连TaKaRa公司)说明书提取实验菌株的基因组DNA,随机霰弹式打断构建DNA文库,采用2000/miSeq系统(Illumina公司)二代测序平台进行测序。取1 μg的基因组DNA,利用喷雾法(Nebulization)打断成约800 bp的片段,纯化后接上PE接头,然后进行双向测序。全基因组测序由军事医学科院微生物流行病研究所完成。在去除接头以及一些质量值较低的读码序列后,用MicrobeTrakr Plus软件(上海泽塔生物科技公司)进行从头拼装(de novo)[1]。

1.3 核酸序列的NCBI BLAST搜索 在GenBank数据库中运用在线的NCBI BLAST搜索(http://blast.ncbi.nhn.nih.gov/Blast.cgi),对实验菌株的16S rRNA基因、mdh基因、rpoB基因和sdhA基因进行分析,以获得实验菌株的属的地位和亲缘关系临近的相关菌种信息。

1.4 全基因组ANI分析 根据核酸序列的NCBI BLAST搜索结果,下载相关菌种的全基因组序列,Fasta格式保存。Java 8运行环境中下载ncbi-blast-2.2.30+程序和对应操作系统的OAT程序(http://www.ezbiocloud.net/tools/orthoani),加载实验菌株和相关菌种的全基因组序列信息,并进行全基因组ANI分析[2]。

2 结果

2.1 核酸序列的NCBI BLAST搜索 16S rRNA基因全序列比对结果显示,实验菌株与西班牙弗朗西斯菌、土拉弗朗西斯菌和波斯弗朗西斯菌等均高度近缘,其16S rRNA基因序列相似度均大于99.0%,其中与“土拉弗朗西斯菌新凶手亚种”3523的序列相似度为100%。mdh基因、rpoB基因和sdhA基因等3个管家基因序列比对结果亦显示,该实验菌株最近缘的菌种为西班牙弗朗西斯菌FSC454和“土拉弗朗西斯菌新凶手亚种”3523。见表1。

2.2 基因组序列的基本信息 实验菌株和相关菌种的全基因组序列基本信息见表2。从组装结果来看,实验菌株Wenzhou1的重叠群数达74个,其基因组的完整性一般。

2.3 基因组ANI分析结果 实验菌株和相关菌种的ANI分析结果见表2。从分析结果来看,基于全基因组共有序列ANI和直系同源基因ANI(Orthologous average nucleotide identity, OrthoANI)基本一致。按全基因组ANI > 96%作为同一菌种的判定依据[3],实验菌株Wenzhou1与西班牙弗朗西斯菌FSC454(CP018093)和“土拉弗朗西斯菌新凶手亚种”(Francisellacf.novicida)3523(NC_017449)为同一个种。基于直系同源基因的OrthoANI距离构建的系统发育树亦显示,菌株Wenzhou1、“土拉弗朗西斯菌新凶手亚种”3523和西班牙弗朗西斯菌在同一个进化枝内(见图1),即Wenzhou1可鉴定为西班牙弗朗西斯菌,而“土拉弗朗西斯菌新凶手亚种”3523(NC_017449)的分类信息则应该更正为西班牙弗朗西斯菌。

表1 实验菌株的NCBI BLAST核酸序列搜索的相似度结果(%)

表2 实验菌株与相关菌种的基因组ANI分析结果

注:除实验菌株Wenzhou1外,其余的相关菌种均为完整的基因组序列。

注:线段大小代表2%的基因组OrthoANI距离。

图1 基于直系同源基因的OrthoANI距离构建的系统发育树

3 讨论

基因组学在细菌分类学研究中的一个重要应用是建立了细菌基因组DNA的电脑模拟杂交方法。研究发现,95%ANI值与经典的70%DNA-DNA杂交关联度的种鉴定标准具有良好的相关性[4]。从原理上说,ANI分析是一种电脑模拟的杂交实验方法,需要将基因组打断为1 020 bp大小的片段后,再进行两两比对,因此,基因组的完整性对于ANI分析结果没有影响,从而大大地降低了高通量测序后续序列组装和信息分析难度。故与传统的细菌DNA-DNA杂交实验相比较,ANI分析的数据结果客观、稳定,且不需要基因组注解步骤,被认为是菌种界定的一个新的“金标准”[5],且可以提供基因组G+C含量(%)的鉴定信息。

本研究采用高通量测序技术以及基于全基因组ANI分析,最终将我国温州一溺水性肺炎患者血液标本中分离的病原菌Wenzhou1和2003年Whipp等[6]在澳大利亚一患者腿部伤口中分离的“土拉弗朗西斯菌新凶手亚种”3523(NC_017449)鉴定为西班牙弗朗西斯菌,这也是2010年西班牙弗朗西斯菌命名[7]以来,全球仅有的3株鉴定明确的临床分离株。就鉴定结果来看,基于全基因组序列的ANI分析非常适用于特定的新发现的病原菌,尤其是菌株数量少、生化反应不活泼和不明确的新发现病原菌的快速鉴定。

基于高通量测序和全基因组序列ANI分析方法,能克服传统的核糖体RNA基因序列分析分辨力不足的缺陷,甚至直接将菌株鉴定到种、亚种甚至亚群的水平[8]。在本研究中,实验菌株Wenzhou1的16S rRNA基因与西班牙弗朗西斯菌、土拉弗朗西斯菌和波斯弗朗西斯菌等菌种的序列相似度均大于99.0%,且与“土拉弗朗西斯菌新凶手亚种”3523(NC_017449)的16S rRNA基因序列相似度为100%;故采用16S rRNA基因序列分析,无法对上述菌种进行有效鉴别。而用mdh基因、ropB基因和sdhA基因等管家基因序列分析的方法,则可能由于“土拉弗朗西斯菌新凶手亚种”3523(NC_017449)分类信息错误而被错误鉴定为土拉弗朗西斯菌新凶手亚种。而3523被错误分类为土拉弗朗西斯菌新凶手亚种,可能与两菌的表型特征相近且16S rRNA基因高度同源等特性有关。然而,基于全基因组ANI>96%作为同一菌种的判定依据,可将Wenzhou1和3523准确鉴定为西班牙弗朗西斯菌,并明确排除土拉弗朗西斯菌。

基于高通量测序和全基因组序列ANI分析方法,还能指导建立新的菌种鉴定方法。鉴于16S rRNA基因推导的系统发育树仅仅为“百分之一”进化树[7],且与其他单个基因推断的系统发育关系可能存在冲突,故建议基于全基因组的多基因系统发育趋势,寻找能够代表全基因组的系统发育趋势且分辨力高于16S rRNA基因的单基因标志物[8-11]。就本研究中的弗朗西斯菌鉴定而言,mdh基因序列相似度与基于直系同源基因的OrthoANI值在总体上是一致的,且菌种的鉴别能力明显优于16S rRNA基因,故可以作为弗朗西斯菌及相关菌种的鉴定的一个重要的靶基因。总之,随着高通量测序技术的进一步成熟,基于全基因组测序的分析方法,将在病原微生物的鉴定、分类和流行病学研究中发挥更大的应用价值。

[1]Li B, Yang X, Tan H,etal.Vibrioparahaemolyticus, O4:K8 forms a potential predominant clone in southern China as detected by whole-genome sequence analysis[J]. Int J Food Microbiol, 2017, 244:90-95.

[2]Lee I, Kim YO, Park SC,etal. OrthoANI: An improved algorithm and software for calculating average nucleotide identity[J]. Int J Syst Evol Microbiol, 2016, 66:1100-1103.

[3]Konstantinidis KT, Tiedje JM. Genomic insights that advance the species definition for prokaryotes[J]. Proc Natl Acad Sci U S A, 2005, 102(7): 2567-2572.

[4]Goris J, Konstantinidis KT, Klappenbach JA,etal. DNA-DNA hybridization values and their relationship to whole-genome sequence similarities[J]. Int J Syst Evol Microbiol, 2007, 57(Pt1): 81-91.

[5]Richter M, Rosselló-Móra R. Shifting the genomic gold standard for the prokaryotic species definition[J]. Proc Natl Acad Sci U S A, 2009, 106(45):19126-19131.

[6]Whipp MJ, Davis JM, Gary L,etal. Characterization of a novicida-like subspecies ofFrancisellatularensisisolated in Australia[J]. J Med Microbiol, 2003, 52(Pt9):839-842.

[7]Huber B, Escudero R, Busse HJ,etal. Description ofFrancisellahispaniensissp. nov., isolated from human blood, reclassification ofFrancisellanovicida(Larsonetal. 1955) Olsufievetal. 1959 asFrancisellatularensissubsp.novicidacomb. nov., and emended description of the genusFrancisella[J]. Int J Syst Evol Microbiol, 2010, 60(Pt 8): 1887-1896.

[8]Zeigler DR. Gene sequences useful for predicting relatedness of whole genomes in bacteria[J]. Int J Syst Evol Microbiol, 2003, 53(Pt6):1893-1900.

[9]Dagan T, Martin W. The tree of one percent[J]. Genome Biol, 2006, 7(10):118.

[10]Puigbò P, Wolf YI, Koonin EV. Seeing the tree of life behind the phylogenetic forest[J]. BMC Biol, 2013, 11:46.

[11]Delsuc F, Brinkmann H, Philippe H. Phylogenomics and the reconstruction of the tree of life[J]. Nat Rev Genet, 2005, 6(5): 361-375.

(本文编辑:刘群)

Identification of a newly reportedFrancisellaspecies by average nucleotide identity based on high-throughput whole genome sequencing technology

ZHANGLei1,ZHENGMin-ling2,WANGYa3,CAIHai-yun1,DENGGuang-yuan2,ZHUQing-yi1,CHENCha2,QUPing-hua2

(1.MicrobiologyLaboratory,GuangzhouKingmedCenterforClinicalLaboratoryCompanyLimited,Guangzhou510330,Guangdong; 2.DepartmentofLaboratoryMedicine,theSecondAffiliatedHospitalofGuangzhouUniversityofChineseMedicine,GuangdongProvincialHospitalofTraditionalChineseMedicine,Guangzhou510006,Guangdong; 3.ZetaBiosciense(Shanghai)CompanyLimited,Shanghai201203,China)

Objectives To identify theFrancisellastrain isolated from blood of a patient with drowning-associated pneumonia. Methods The whole genome of the strain, designated Wenzhou1, was sequenced using the high throughput sequencing technology by 2000/miSeq system of Illumina platform, and the obtained genome draft was assembled by MicrobeTrakr Plus software. The phylogenetic neighbors of Wenzhou1 were obtained by NCBI BLAST analysis from GenBank database for the gene sequences of 16S rRNA, malate dehydrogenase(mdh), DNA-directed RNA polymerase subunit beta(rpoB) and succinate dehydrogenase subunit alpha(sdhA). The average nucleotide identity(ANI) between Wenzhou1 and its phylogenetic neighbors was analyzed by the software OrthoANI using NCBI BLAST search under the Java Runtime Environment Version 8. Results The genome size of Wenzhou1 was 1.96×106bp, containing 74 contigs. The genomic G+C mol% of Wenzhou1 was 32.1%, which was similar to the other species of genusFrancisellaandAllofranicella. Based on the analysis of NCBI BLAST of GenBank for the similarities of 16S rRNA gene,mdhgene,rpoBgene andsdhAgene sequences, Wenzhou1 was most closely related toF.hispaniensisFSC454 andFrancisellacf.novicida3523. The ANI of Wenzhou1 was 97.8% toF.hispaniensisFSC454, 97.5% to 97.6% toFrancisellacf.novicida3523, but only 91.3% to 91.5% to the four subspecies ofF.tularensis. Conclusion ANI analysis based on whole genome sequence should be an accurate, effective method for bacterial identification. Wenzhou1 could be identified asF.hispaniensisby ANI with high-throughput whole genome sequencing technology.

Francisellahispaniensis; average nucleotide identity; bacterial identification

10.13602/j.cnki.jcls.2017.07.05

国家自然科学基金(31300004)。

张磊,1982年生,女,主管技师,大学本科,主要从事临床微生物检验工作。

屈平华,副主任技师,硕士研究生导师,E-mail:ququtdr@163.com。

R446.5

A

2017-04-07)

猜你喜欢
弗朗西斯亚种菌种
亚沉茶渍亚洲亚种Lecanora subimmersa subsp. asiatica Zahlbr.的订正研究
[法国]弗朗西斯·皮卡比亚作品5幅
珍稀蝴蝶的亚种分类问题及保护意义:以喙凤蝶属为例
蚂蚁琥珀中发现新蘑菇菌种
盘羊新亚种
——和田盘羊
原始的拼贴——弗朗西斯·戴维森
小体格,大能量!鑫中渔用9年玩转超浓缩菌种
长双歧杆菌婴儿亚种的快速区分
大哲学家买鱼
大哲学家买鱼