浅谈分布式数据库中P2P技术的使用

2009-06-21 04:36刘晓天顾大明
中小企业管理与科技·下旬刊 2009年12期
关键词:客户机数据库系统分布式

刘晓天 顾大明

摘要:在分布式数据库系统中采用当前比较流行的P2P(Peer-to-Peer)技术后,可以解决C/S模式中的瓶颈等问题,提高数据库中的各种资源利用率和查询的效率。文中介绍了P2P技术、现有P2P系统的特点、数据库中的信息查询以及P2P技术在数据库系统中的应用等问题。

关键词:P2P分布式数据库查询

0引言

在当今,分布式数据库已广泛应用于各行各业,如各大企业,集团。公司。银行等。分布式数据库系统就是把这些组织中的数据信息联系在一起,提供桥梁的作用。下面主要介绍了分布式数据库系统中如何使用P2P技术以及怎样高效的实现数据的查询。

1P2P技术

P2P是(Peer-to-Peer)缩写,意为点对点,对等网络计算,或称为对等联网。简单说,P2P就是点对点通信。可以定义为网络中的各计算机之间通过直接交换信息共享计算机资源和服务,对等计算机兼有客户机和服务器的功能。在这种网络中每个节点的计算机地位相同,可直接互连实现各种资源的共享,不需要依赖集中式服务器支持。近来P2P技术正日益受到重视,在大型分布式数据库中采用此技术比采用C/S技术具有很多的优点,如节省投资,更高的文件共享率等。

如今,对等网络技术正逐渐成为计算机网络的一个热门。随着互联网的普及和宽带技术的飞速发展,P2P技术在加强网络上人们的交流、信息交换、分布计算等方面大有前途。网络上现有的许多服务都采用了P2P的技术,它越来越受到网络用户的关注和喜爱。比如即时通信系统ICQ、MSN以及国内广泛使用的QQ是最流行的P2P应用。每年都有新的P2P软件出现,吸引网络用户的使用。在人们的使用中,其实最多的还是对数据信息的查询,采用P2P技术,是网络的计算模式从集中式向分布式偏移,处理的数据从中央服务器转向各个终端客户机。即使某个或某些节点的数据库出现问题,也不会影响其它节点问的通信。

2基于P2P技术的数据库系统

最初的分布式数据库管理都是基于客户服务器架构的,通过一个功能强大的服务器为组织内成员提供协作。而现在的大型数据库系统采用P2P技术,让人们通过互联网直接交互,人们在网络上进行信息的沟通更直接、更实时。网络中如果各节点间的数据服务是对等的,就构成了P2P数据系统。

传统的C/S、B,s模式,采用的是一种集中的手段,所有数据资料都存放在大型服务器上,每台客户机都要被动地从服务器上读取信息,并且客户机之间不具有直接交互能力。在这样的集中式数据库中,对服务器配置的要求很高;一旦服务器或者某个终端出现问题,将有可能影响整个网络的运行。其实,C/S模式下的数据查询完全依赖于中心节点服务器,没有服务器,网络就没有任何意义。而在对等网络中,每个节点的地位都是相同的,具备客户端和服务器双重特性,可以同时作为服务使用者和服务提供者。这使人们在Intemet上的共享行为被提到了一个更高的层次,使人们以更主动深刻的方式参与到网络中去,每个人都能为网络的资源和功能扩展做出自己的贡献。总之,P2P的技术在数据传输与文件共享,分布式运算等方面应用很广泛。

当今企业。尤其是那些地理位置分散而管理又需集中的大集团,使用分布式数据库系统符合它们的管理思想和经营方式。在这些全国或全球性的公司,数据通常就已经是分布了。这种情况下,对于处理复杂大型的问题可以分别由各终端的部门完成,最后再汇总。然而整个信息是分离的,需要解决信息的共享问题。P2P技术的出现使企业中各部门信息的通信变得更容易了。

3数据库中的查询问题

随着网络技术的飞速发展,对数据通信也提出了更高的要求。在人们使用网络的过程中,应用最多的其实就是信息查询。归根结底,就是对数据库中的数据进行查询。数据库中使用P2P技术可以使数据更有效地分布到网络边缘,提高资源利用率。由于传统数据库系统的资源利用率低,各节点是静态定义的,它们的数据虽然可以共享,但没有预先的规则,而且扩展性、灵活性较差,这给查询带来了一定的困难。

在数据库系统中引入P2P技术不需要功能强大的中心服务器的支持,而是对等点之间通过直接互连实现信息资源、处理器资源、存储资源的全面共享。

P2P网络结构基本可分为纯P2P系统、中心文件目录,分布式文件系统、有中间服务器三种不同的结构。P2P技术是一种基于网络环境的技术,所以针对这一特性,主要考虑以下几个方面的问题。首先,P2P应用是对于互联网上众多计算机的,所以要考虑那些低端的不具备服务器那样强的联网能力的普通个人电脑。其次,在P2P技术中需要有关于数据描述和交换的协议。第三,构造一个合适的网络拓扑结构能快速准确地发现对等点。如何从网络中的海量数据库信息中快速地查找到需要的信息是一个看似简单其实很困难的事情。P2P网络模式中节点之间的动态对等关系是高效搜索信息的有力保证。它可以保证搜索的实时性,达到令人惊叹的搜索深度。除了以上三点,还有数据库的管理机制、数据的安全等问题。

不妨将整个的查询过程简洁地用两个步骤四个字来概括,即“搜索”,“定位”。搜索中尽量减少经过的节点数可以提高速度;同时引导数据流向“有用的区域”。这里所说的”有用”是相对的,不同的信息搜索“有用的区域”也不一样。根据不同的情况,可不同程度的采用宽度优先或深度优先的策略。高效的搜索方法可以减少请求服务和信息处理的时间。查询也有很多方式,最常见的是关键宇查询。对普通的计算机用户而言,上网的过程中经常使用这个方法。合适的关键宇对查询结果起到决定性的作用。其实,合适的关键宇可以引导查询走向“有用的区域”。对于专业的编程技术人员,在程序中对数据库进行信息查询使用最多的就是查询语言了,比如结构化查询语言SQL(Structured Query Language)。SQL是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。SQL同时也是数据库脚本文件的扩展名。由于它的嵌入性,在程序中使用的非常多。

4总结

把P2P技术引进传统的分布式系统,很好地克服了传统分布式系统的部分缺点,在数据查询中可以向相邻节点发送查询请求,减少中心节点开销,避免服务器带来的瓶颈问题,但也存在一些缺陷,如怎样避免数据库中大量数据的冗余,网络出现问题时的数据一致性等方面还有待进一步的研究。

猜你喜欢
客户机数据库系统分布式
数据库系统shell脚本应用
微细铣削工艺数据库系统设计与开发
实时数据库系统数据安全采集方案
核反应堆材料数据库系统及其应用
基于DDS的分布式三维协同仿真研究
西门子 分布式I/O Simatic ET 200AL
瘦客户机:安全与便捷的选择
升腾瘦客户机借神码翱翔“云端”
基于Web数据提高访问速度的方法