基于融合数据库的快速查询方法研究与应用

2020-06-07 04:53梁铭

电脑知识与技术 2020年35期

关键词：数据库传感器性能

梁铭

摘要：本文详细介绍了合并数据库条件下数据库查询技术的特点，分析了数据关系复杂、数据管理困难的信息系统，提出了一种方便快捷的数据库查询方法，以提高数据库信息管理系统的性能，提高数据库应用系统的运行效率，并集中精力实现该方法的关键技术。

关键词：融合数据库;快速查询

中图分类号：TP311 文献标识码：A

文章编号：1009-3044（2020）35-0023-02

开放科学（资源服务）标识码（OSID）：

1 引言

随着院校系统的扩展和数据的不断扩展，各种大型数据库在院校以及数据库查询成功与否中扮演着非常重要的角色，起到了关键作用。近年来，关于如何提高数据库性能的问题，提出了许多关于如何提高数据库性能的方法和理论。但是，当今的传统方法在很大程度上依赖于添加硬件或提高硬件质量来增强数据库性能。这种优化措施不仅增加了院校的成本，而且效果较差。但是，从硬件角度来看，仅调整数据库的性能是不够的[1]。基于上述问题，本文提出了一种新的方法来优化数据库查询，主要是从软件角度来最大化地提升数据库性能。本文中的方法不会给院校增加负担，它可以在院校原始硬件设施的基础上完成数据库的优化，它具有很强的效率和经济效益。

2 基于融合数据库的信息存储架构

2.1融合数据库

实时数据库是将数据库和实时系统结合在一起的新型数据库，它负责管理数据和限时对象。整个系统的效率不仅取决于逻辑结果，还取决于产生逻辑结果所花费的时间。Talk-DB是Zhongke Qixin开发的实时数据库系统，数据库系统识别哪些传感器是标签，哪些标签是最小的控制单元。将多个标记划分为逻辑“设备站”组，以便于管理。系统引入了“数据注册”的概念，通过主动单击信息表，用户可以获取指定标签的最新值，而无须索取。用户可以通过“历史查询”查询由指定标签生成的历史数据，考虑到感觉数据的特征，ThinkDB提出了一种ChinQuery自定义查询语言，该语言具有特殊的查询功能，例如查询组件：一次查询标签数据[2-4]。其能够统查询计数、最小值、最大值、总数、平均值等特定时间段内的标签数量。

HBase是基于HDFS分布式文件系统的分布式开源数据库，Hadoop已被广泛用于开源，透明的基本部件，低成本的硬件分发和易于扩展。HBase是用于面向列、分散和连续存储的多维地图输入板。在HBase中，具有相同列族的数据存储在一起，这使得可以在读写操作期间有效地删除I / O磁盘，并且还能够使数据更加压缩[5]。数据仅约为原始数据的1/4，从而节省了大量物理空间。HBase旨在存储从TB到PB的大规模数据，可以在数千台常规计算机上使用，并且可以由大型用户高速读写。HBase的上述功能使其在存储大型传感器的历史数据方面具有强大的优势。

2.2 数据库快速查询的标准

对于标准数据集，主要基于以下两个因素来测试数据库查询的性能。

（1）程序性能：性能是程序在应用程序过程中完成任务的时间与完成的任务数之比，该比率反映了目标系统。以下公式用于解释吞吐量的含义：性能=任务完成/任务完成时间。

（2）数据收集程序在收到用户指令后运行所需的时间：通常，此处的时间是指用户指示应用程序或使用的时间操作和应用在处理时间上均符合“关闭时间”的指示。从计划的开始到计划的结束的时间是在收到使用说明后处理数据收集程序所需的时间[6]。这与程序的性能有一定的关系。假设提高了效率，该过程所需的时间将减少。

2.3 数据存储与查询

如图1所示，实时数据库分布在不同的单元中，传感器生成的数据在特定时间存储在该单元中。存储系统根据注册信息向注册的实时数据库发送“数据注册”请求，实时数据库以主动推送形式将传感器生成的实时数据发送到存储系统，传感器产品组合的差异使数据结构更加多样化。首先，存储系统将根据传感器目录对数据进行分类，然后将分类的数据存储到缓冲区中。

数据存储服务的精确设计将在将大量数据写入HBase并将该区域分为两部分的过程中实现站点分离。在转换过程中，HBase将锁定该区域，并且访问该区域的请求将被锁定。HBase在此区域中的旋转将导致区域服务器上的区域分布不均匀，并触发HBase区域操作。此过程将保留离线区域。客户如若仍在离线网站上记录大量数据，会引起异常。因此，HBase的寫入性能仍存在不稳定的问题。为了解决上述问题，本设计引入了多媒体数据缓冲区操作模块。

RowKey设计的HBase索引基于RowKey序列键。用户需要尽可能将信息或查询大小放在序列键中。包含结构信息的所有单元格都称为键值，并在存储时通过按顺序键从左到右顺序存储。例如，序列键为：0100、0070、1000、3310，序列为0070、0100、1000、3310。在HBase中，当数据量增加时，表将被分为多个区域。它的数据存储区域从StarKey到EndKey，多区域服务器维护和管理这些区域。

如图2所示，为了允许租户将系统用作实时数据库，添加了SinQuery查询单元以用于特殊的查询方法，例如“历史查询”和“统计查询”。例如，在查询“选择ID，名称，站点，值，CHINRTCMDHISTORYQWHEHREStart_Time = 1321243200，End_Time = 1321243220，VALUE> 28，TYPE ='temp'”中，查询的不同含义始于开始时间28。首先，特定查询单元验证ChinQuery语法，在验证后分析标签，然后验证用户是否已注册温度传感器数据集并发送查询请求。验证后转到查询界面。查询控制器确定基本HBase数据库和OraCle数据库之间的差异。由于有关传感器的元数据信息和历史数据分别创建在Oracle和HBase中，因此Oracle会查询用户有权访问的传感器的元数据信息。同时从HBase群集请求这些传感器，即历史数据VALUE > 28，将根据查询进行合并和打包，最后返回给用户。

3 融合数据库快速查询方法

3.1调整实例内存参数提高数据库性能

通常，在安装了与数据收集相关的应用程序之后，所有相关变量均为默认值。大多数数据库用户不会更改这些导致数据库性能的变量。您可以通过数据库内存更改相关系数，从而在数据收集期间提高应用程序的处理能力，并提高数据收集的性能。对于DB2数据集，存在三个相关系数，包括实际使用的系数，数据集中使用的系数以及DB2注册组件使用的系数。这三个因素是使用数据库的基础。在更改相关系数之前，首先确定DB2的构造方法。

在此数据集中，所有子组数据（包括子组数据）均以实用方式进行管理。可以使用一种实用的方法来管理大量数据项。因此，数据生成方法分为训练过程中可以共享的存储器和数据收集中可以共享的存储器。用于每个练习的数据集是可以在练习期间共享的内存。此存储器在数据管理器的开始处获取，并且在数据获取控制结束时将不再可用。这种类型的较小集合通常用于诸如监视和审计之类的练习。此内存也是可以提高性能的重要区域。在日志的内存和缓冲区中设置数据收集的缓冲区可以提高数据系统的性能。

3.2 合理设计索引提高数据库查询性能

在工作计划中，索引也很重要，创建适当的索引也可以提高数据收集的性能。索引是连续数据项的序列。该索引可以方便、准确地获得数据收集并确保所需信息的唯一性，从而提高了信息收集和索引的条件性效率。在上下文数据收集中可替换。根据实际条件构建索引可以提高数据收集的性能，尤其是在查询功能方面。在DB2数据集中，B +树用于存储索引，DB2数据集和orory数据集都包含以集中形式构建的索引和以分散形式构建的索引。

通过以上分析，我们可以知道，以中央格式构建的索引在搜索数据时可以搜索某些页面，然后根据以下内容从数据集中提取相关数据：页数。索引以中央格式组织。搜索数据时，将按页数在数据集中检索要搜索的适当页数和相关内容。因此，在构建用于数据收集的索引时，可以构建以中央形式构建的索引，并且许多索引以非中心形式构建。

3.3 创建集群索引以提高查询性能

在数据集中按顺序使用序列来创建中心索引。 DB2数据库管理器根据该系列的内容存储许多相关的页面。集中索引可以在搜索数据时快速轻松地获取位置信息。页数或数据集中有新数据时，DBA的内部存储核心将为同一数据类型存储新添加的数据。这样，用户可以基于同一功能快速有效地找到新数据。因此，为数据集创建中央索引可以显著提高系统性能，但是在插入相关数据时，内部存储库核心将使用集中式索引来验证正确定位插入数据，从而降低了插入或更新行为的实用性。

3.4 创建未排序的索引以提高查询性能

数据集可以对应于许多类型的非中心索引，但是索引的数量不一定与系统的性能成正比。换句话说，索引越多，系统的相对性能就越高。非中心索引用于按顺序复制数据集中的内容。创建非托管索引时，已排序的行可以同时包含已归档页数和与数据相关的索引页。表格的索引可以检索编号以进行搜索。

数据的相关内容和索引的相关内容。因此，需要大量的存储空间。添加新数据时，还需要在分布式表单索引中添加相关内容。假设数据集的顺序已更新，则必须同时检索更新内容的数据库页面和索引页面。因此，如果分散索引超出合理数量，则将降低插入或更新数据的效率。

4 结论

随着信息技术的飞速发展，人們希望通过计算机实现快速高效的数据信息管理。当前，各行各业对数据库管理系统都有很高的要求，因为好的管理系统将大大减少人员工作量并提高工作效率。此外，计算机数据库的管理系统在管理大量数据方面具有无与伦比的优势。因此，寻求一种快速有效的查询方法是提高数据库管理系统性能的关键。

参考文献：

[1] 王凡. 基于众包的信息查询处理方法研究与应用[D].西安：西安石油大学，2017.

[2] 程飞.基于云计算的图书数据库查询方法研究[J].计算机光盘软件与应用，2013，16（7）：36-36，38.

[3] 刘珂.基于Hadoop平台的大数据迁移与查询方法研究及应用[D].武汉：武汉理工大学，2014.

[4] 逯冰.基于词计算的数据库模糊查询技术研究与应用[D].中南大学，2012.

[5] 张星云.基于多数据库并行调度的复杂方法研究与仿真[J].计算机仿真，2015，32（6）：378-381.

[6] 宋宇峰.一种基于DB&IR的融合查询机制的研究与实现[D].南京：南京农业大学，2010.

【通联编辑：李雅琪】