本期“生物信息”专栏评述

2022-11-25 20:43本期生物信息专栏主持人
电子科技大学学报 2022年3期
关键词:测序编码精度

本期『生物信息』专栏主持人 陈 伟

评“DBEncRNA:细菌必需非编码RNA 数据库”黄 健

诺贝尔化学奖获得者沃特·吉尔伯特不仅发明了DNA 的化学测序方法,他在自然杂志上的雄文“TowardaParadigmShiftinBiology”也吹响了计算机科学改变生物学研究的号角。此外,他还是著名的“RNA 世界”假说的提出者。从此之后,RNA 尤其是非编码RNA 相关的实验与生物信息学基础研究,一直是生物医学领域的前沿与热点。目前mRNA 疫苗与RNA 干扰药物的应用研究也已成果累累,相关疫苗与药物纷纷上市,正在对现有生物医药产业产生革命性的影响。

在这篇论文中,作者重点关注细菌的必需非编码RNA。这些RNA 不仅是合成生物学中最小基因组等基础研究的重要对象,也是抗菌药物开发等应用研究的新型靶标。对于如此重要的数据,当然需要一个专门的数据库来有效组织、存储与管理,DBEncRNA 应运而生。该数据库目前有来自20 株细菌的884 条记录,包括了ncRNA 序列、物种、类别、培养条件等一系列相关的基础与实验信息。该数据库也集成了BLAST 数据库搜索比对、RNA 二级结构预测与可视化等一系列生物信息学工具。此外,所有数据可以免费一键下载。相信这样的一个好的数据资源将极大助力相关研究人员开发出高效的细菌必需非编码RNA 的计算机识别方法,进一步助力最小基因组与抗菌药物开发等基础与应用研究。

评“基于Profile 比对的改进星比对算法”陈 伟

多序列比对是识别未知基因功能、基因间保守区域的有效方法。随着基因测序技术的快速发展,基因序列数据的快速增长,现有比对算法和软件已不能有效解决大规模的多序列比对问题。该文对传统的星比对算法做了比对精度上的改进,通过引入Profile 比对模式,并结合树比对的指导树比对方法,为星比对构造出了一个特殊的“链”式结构,在一定程度上改善了星比对的比对精度。在此基础上,通过简化中心序列的选取,即将最长的序列作为比对的中心序列,降低了比对的时间。

该研究为星比对算法的改进提供了一种新思路,但仍有改进空间。虽然采用的链式比对指导树结构减少了比对时间,但在一定程度上降低了比对精度。未来可以对链式结构进行进一步改进,以提高比对精度,同时进一步改进profile 比对的高时间复杂度问题。

猜你喜欢
测序编码精度
基于不同快速星历的GAMIT解算精度分析
数字化无模铸造五轴精密成形机精度检验项目分析与研究
HEVC对偶编码单元划分优化算法
新一代高通量二代测序技术诊断耐药结核病的临床意义
宏基因组测序辅助诊断原发性肺隐球菌
住院病案首页ICD编码质量在DRG付费中的应用
生活中的编码
生物测序走在前
基因测序技术研究进展
近似边界精度信息熵的属性约简