数字图书馆的发展及关键技术

2012-08-27 13:55
海峡科学 2012年12期
关键词:检索数据库文献

郑 沁

数字图书馆的发展及关键技术

郑 沁

福建省图书馆

数字图书馆作为未来图书馆的发展方向,涉及到图书情报、计算机和通讯科学领域的理论和技术。该文主要论述数字图书馆的概念及特征,研究发展数字图书馆的关键技术以及代表未来发展方向的云计算技术。

数字图书馆 信息技术 网络环境 云计算技术

1 数字图书馆的概念及特征

1.1 数字图书馆的概念

数字图书馆是以现代信息技术进行构建,以大型、多种文献信息资源数据库为依托,以网络为传输手段,以方便、快捷地为读者提供数字文献信息服务为目标的网络虚拟图书馆。它产生于传统图书馆的基本模式,实际上并不占用太大的物理空间,也不受时间的限制,它的存在方式是将文字、图像、声音等信息进行数字化处理并高倍压缩后,以数据库的方式存储,并通过网络传输,从而做到文献信息资源的网上共享和快捷服务。

1.2 数字图书馆的特征

1.2.1文献信息资源数字化

文献信息资源数字化主要利用现代信息技术, 对传统的文献信息进行数字化处理。它不仅包括个体文献信息的数字化, 而且包括整体文献信息资源的数字化, 它需要采用信息转换技术、信息识别技术、信息压缩技术、信息储存技术和信息保护技术等。

1.2.2文献信息资源共享化

数字图书馆建设并不是某一个或某几个图书馆之间的事情, 它涉及整个文献信息领域。建设数字图书馆的主要目的在于实现全社会对文献信息资源共享。

1.2.3信息传播网络化

文献信息传播途径的改变是数字图书馆建设的一个重要方面。也就是说, 如果不能实现文献信息传播的网络化,就失去了数字图书馆建设的本来意义。从美国数字图书馆的发展实践看,应先从建立局域网开始,进行局部信息资源传播与共享,然后向广域网推进,很明显就是逐步实现文献信息资源社会化。

1.2.4文献信息中心的虚拟化

通过建设数字图书馆, 读者逐步减少进入文献信息中心的次数, 而通过网络进行信息查询、知识获取和信息利用等。由此,读者的角色发生变化, 即由传统意义上的读者向网络终端用户转变。

1.2.5文献信息工作的产业化

数字图书馆建设过程不是一个简单的文献工作过程, 既涉及一般文献信息工作, 也涉及信息技术工作,既涉及信息整序工作, 也涉及信息产品的创造工作,既涉及信息网络工作, 也涉及网络咨询工作等, 数字图书馆建设充分体现了产业化的特征。尽管学术界仍对信息产业化问题持不同的看法, 但信息产业化是历史发展之必然。美国学者认为, 未来数字图书馆馆员将逐渐成为网络信息导航专家和信息咨询专家。

1.2.6文献信息提供智能化

在数字图书馆时期, 信息工作者主要从事两个方面的工作: 一是在对文献信息进行数字化的同时, 进行数据库的开发研究, 建立不同门类的数据库,进行学科前沿信息的整理分析, 建立学科前沿数据库,进行地方特色文献信息研究, 建立地域特色数据库等。二是进行信息传播和咨询工作。网络信息的提供将不再是文献提供, 而是知识提供。如果文献信息中心不进行连续不间断的知识创造和建造大量的知识资源库, 终将会被淘汰。

2 数字图书馆的关键技术

2.1 数字图书馆集成技术

数字图书馆系统集成主要包括图书馆内部的业务自动化和网络化, 包括信息资源搜集整合系统、知识提取与揭示系统, 各类信息资源数据库系统、跨库检索系统、信息交互系统、网络门户系统以及办公系统等。同时, 图书馆外部的馆与馆之间、图书馆与用户之间的网络系统互连,图书馆与广大用户的实时信息咨询服务等也是数字图书馆的重要内容。

数字图书馆系统集成的重点在于内容集成, 主要包括信息源集成、业务过程集成和服务集成。信息源集成主要指数字化、网络化正式与非正式出版的科技信息源, 以及各类载体的开放获取信息源。业务过程集成包括业务管理、进程模拟以及综合任务、流程、组织和进出信息的工作流, 还包括业务处理中每一步都需要的工具。服务集成主要应采用国际通信标准协议, 如SOAP标准协议等实现。集成的方式包括:①点对点集成,主要是应用程序之间通过应用程序接口(API) 进行点对点的数据和信息交换;②结构集成,采用中间件工具来统一实现和控制数据的传输和交换;③流程集成,主要是业务流程得到集成, 提高业务工作效率;④外部集成,即与合作伙伴进行外部集成, 帮助用户建立业务处理过程,达到系统间高效通信与交流的目的。

2.2 数字图书馆学科信息导航技术

数字图书馆学科信息导航技术主要体现于学科信息门户( Subject Information Gateway, SIG) 技术,SIG 概念的最早提出人之一T.Koch 将SIG归纳为: ①一种联机服务, 提供对其它若干站点和文档的链接。②通过人工选择和筛选信息。③智能产生包括注解和评论在内的内容描述信息( 比如元数据),可能的话,提供信息的分类和主题标引。④智能地构建分类浏览结构。⑤至少支持部分和手工构建单个信息资源的元数据。学科信息门户是提供专门学科领域信息资源导航、专题报道、科技新闻、信息检索、个性化服务、专家论坛、用户留言等服务,参与Internet信息资源开发的有效途径之一。它可以方便快捷地集中整合某一专题的各方面资源,供有关用户群体利用,使用户减少网络查询时间,节约成本,提高信息资源利用效率的作用。

2.3 数字图书馆信息推送技术

随着网络的发展和推送技术的进步, 人们将过去使用的“push”技术进一步发展, 而以RSS(Really Simple Syndicate) 来替代“推送技术”这一概念。用户只要在自己的计算机上安装很小的RSS件, 就可以周期性地接收来自诸如CNN、The NewYork Times 等RSS信息提供者的最新消息, 成为人们最新推崇的推送技术的代表。

2.4 数字图书馆智能代理技术

智能代理技术可模仿人的行为执行一定的任务,而且在执行这个任务时不需要或很少需要人的干预与指导, 因此, 智能代理最初就具备主动提供信息的功能。智能代理的主要功能包括:①管理个性化的信息代理库。②信息自动发布。当信息用户指定了特定的信息需求之后, 智能代理能够自动探测到信息的变化和更新, 进而将其下载到的数据存储起来, 同时智能代理能将该信息自动地提交给用户。③浏览导航。信息用户如果愿意在网上“冲浪”, 智能代理能分析到该用户所感兴趣页面的所属领域, 并能向该信息用户建议与该领域更密切的页面或链接。④智能搜索。信息用户在网上搜索信息时, 往往搜索到的信息太少或可用度差, 而智能搜索, 能够根据信息用户的特定需求进行信息过滤,为用户提供更精确的搜索信息。⑤生成动态个性化页面。智能代理能依据所存放的信息,动态地生成网络页面(Web pages) , 给信息用户提供一个适宜而友好的浏览界面。此外, 智能代理还具有监督代理、协调与解决冲突等功能。

2.5 数字图书馆的异构检索技术

数字图书馆的异构检索技术, 也称跨库检索(Cross— Database Search) 、一站式检索(One—Stop Search) 、多数据库检索(Multi—Database Search) 技术等,是借助单一的检索接口,利用统一的检索方法,实现对分布式、异构信息资源的检索。分布式异构信息资源不仅是馆藏的图书、期刊、科学文摘、全文数据库信息, 也可以是来自网络数据库的期刊论文、会议文献、OPAC书目信息、E-print资源等, 甚至是经主题搜索引擎发现的Web网页信息。异构检索技术将数量庞大、内容复杂的信息资源进行集成、整合、处理后, 形成统一的检索结果, 并按用户定制的方式提供服务。

3 云计算技术在数字图书馆中的应用

3.1 云计算技术在数字图书馆中的应用优势

3.1.1大规模的容量,保障图书馆服务器的正常运行

目前, 国内大多图书馆中的数据信息都集中在本馆内的服务器上,随着社会文化事业的发展,各类图书信息急剧膨胀。与此同时,数据安全性正遭受着前所未有的威胁,自然灾害、系统故障、员工误操作和病毒感染都有可能导致数据的破坏和丢失。而数字化图书馆已经把信息化视为正常运营的基础,一旦遭遇数据灾难,运营必然陷入瘫痪,带来的损失难以估量。因此,大多图书馆只能靠不断增加存储容量和备份方式来保障信息安全,但传统的存储和备份方式,由于成本高和技术相对复杂,很难满足相应的数据管理和容灾需求。

3.1.2低廉的建设成本,保障中心服务器具备极高的性能

普通服务器的相关硬件资源都有一定限制,若服务器同时响应用户的数量超过了自身的限制将导致服务器的瘫痪。而应用云计算技术,通过支付少量的费用,图书馆就可获得云模式中百万台服务器提供的服务,用户的请求便可在毫秒的时间内获得响应,从而使图书馆以较低的成本获得较高的效益。

3.1.3更大程度上进行信息资源共享

近年来,我国多数大中型图书馆和部分小型图书馆已经实现了自动化管理,建立了本馆的馆藏书目数据库,为满足本馆读者及更广泛用户的远程检索,各馆都在努力尝试使用共享数据库达到资源共享的目的。我国公共图书馆的经费并不充裕,采用购买共享数据库的方式还不能达到根本意义上的共享目的。为此,采用云计算模式,通过共建共享模式,建立起惠及理论视野各方的数据库使用系统,形成一个庞大的“云存贮”中心,对于单个馆藏资源相对贫乏的中小馆来说,云上共享的资源无疑就是成倍扩展各个馆藏资源的集合体。届时,公共图书馆的资金问题、单个图书馆馆藏能力有限问题、社会效益的广泛发挥等问题都将迎刃而解,图书馆的运行成本在大大降低的同时,效率却大幅度地提高。在“图书馆云”中,通过云计算技术,可以随时获得其它图书馆的资料,极大满足了用户的信息需求。

3.2 利用云计算应注意的问题

云计算将极大地改进数字图书馆的服务方式与服务功能,同时也将给图书馆带来挑战。应从以下几方面引起注意:一是是否把整个图书馆资源放到“云”中;二是数字资源版权问题;三是网络线路的建设及接口问题。

[1] 张永忠.数字图书馆操作与实务[M].上海:复旦大学出版社,2005.

[2] 乐红丽.数字图书馆建设现状及走向[J].云梦学刊,2009,30(1):154-156.

[3] 马文峰,杜小勇.数字图书馆资源整合:理论、方法与应用[M].北京: 北京图书馆出版社,2007.

[4] 王平.云计算关键技术在数字图书馆中的应用研究[J].情报资料工作,2010(5):52-56.

猜你喜欢
检索数据库文献
Hostile takeovers in China and Japan
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
数据库
数据库
专利检索中“语义”的表现
数据库
数据库
国际标准检索