关于图书馆数字资源整合模式的探讨

2010-04-11 11:21
河南图书馆学刊 2010年4期
关键词:资源整合馆藏检索

崔 萌

(河南省图书馆,河南 郑州 450052)

随着数字图书馆的蓬勃发展,全球范围内的数字资源激增,资源的种类越来越丰富,内容越来越细化,数字资源建设已经成为图书馆文献资源建设的重要组成部分。但是,随着科学技术的迅速发展,学科数量愈来愈多,结构愈来愈复杂,学科间的相互渗透、纵横交叉、综合,不仅使得信息量剧增,而且更进一步导致了资源的无序和分散。不同的数字资源又有其物理和逻辑结构,具有各自不同的检索系统和发布系统,检索方式、检索手段各式各样,造成了数据冗余、相互关联程度低,大量的信息孤岛出现,也使用户的检索负担加重。因此,需要有一种手段把这些信息集中、整序、关联起来,把检索系统集成起来,使用户知道到哪里可以找到所需要的信息,怎样去查找这些信息,如何筛选检索结果。本文就图书馆数字资源的整合模式进行分析、综述,以供参考。

1 数字资源的来源和类型

面对种类、数量、形式、品种多样的数字资源,不同学者从不同的角度对图书馆数字资源的来源和类型进行了划分。

1.1 数字资源的来源

(1)自建的数据库。包括图书馆的中外文馆藏数据数据库、中外文献目次库,学位论文及会议论文数据库,教学参考书数据库及馆藏特色数据库等。(2)引进的数据库。根据本单位的实际需要,从国内外数据商购买的联机数据库或网络数据库等商用数据库,类型包括文摘、题录、全文数据库等。如CNKI数字图书馆、万方数据库、重庆维普期刊全文数据库、超星数字图书馆等数据库。(3)光盘资源。包括图书馆购买的大量的多媒体光盘、随书光盘、网络光盘数据库等。(4)图书馆收集的因特网上一些免费的网络数字资源等。

1.2 数字资源的类型

数字资源的类型包括:(1)由未公开出版的著作、学位论文、管理文件、科技报告、学报等“灰色文献”形成的原生数字资源。(2)由图书馆外购的馆藏文献所形成的馆藏书目数据。(3)由本馆或本地区专有文献构成的特色数字资源。(4)由通用性较强的图书、报刊、图片、声像、缩微资料等加工后形成的数字资源。

2 数字资源整合的必要性

数字资源整合方案或系统在一定程度上为用户提供了期望的一站式服务。然而,面对层出不穷的整合系统,用户并没有真正享受到满意的服务和便捷的查询方法。对于图书馆来说,由于数字资源过于分散,为资源整合带来了巨大的障碍。同时,由于缺乏统一的思想认识和相应的标准、规范,以及科学的规划和组织,一些问题愈加突出。

2.1 存在重复建设

目前的图书馆数字资源除部分属自建数据库外,大部分都采用了由不同的数据库商提供的数据库、学术期刊、会议文献等,如CNKI数字图书馆、万方数据库、超星数字图书馆、SpringerLink等资源,内容交叉重复,影响用户对信息的选择与获取,造成了数字资源整合中的重复建设。

2.2 存在冗余信息

多数数据库的资源收录原则是“全”,使得大量使用价值不高的信息进入资源系统,干扰用户对信息的正确获取。

2.3 知识关联程度低

现有数据库资源系统内的数据对象大都孤立存在,无法体现学科知识的内在联系。

2.4 数字资源不同的描述和表达方式

每个数据资源又都有其自身独特的检索界面、查询方法和下载格式。这就需要读者进入到不同的检索界面,采取不同查询方法进行检索,并且需要下载安装不同的阅读器,这就给用户实际利用带来不必要的麻烦。

2.5 数据资源难以融合

由于缺乏规范、统一的标准,不同的数据商开发的数据库在数据结构上、字段上存在互异,并且拥有各自的检索系统,因而在检索上存在着差异,这对实现同一检索平台下的分布式检索造成了困难。同时,在数字化建设过程中,不同的数据格式,不同的数据结构,不同的存储方式,不相同的管理系统,构成了数字图书馆的异构数据源,从而造成信息源数据难以融合等。

3 数字资源的整合模式

数字资源整合应该打破原有资源的体系结构进行纵向或横向重组,再进行去重、归并等过程,形成新的有机体。但是,这并不能简单理解为“库集合”或者“库链接”。根据具体对象及过程的不同,可进行具体的划分。

3.1 基于OPAC系统的数字资源整合

OPAC(Online Public Access Catalog)即联机公共目录检索系统,将MARC记录纳入本馆的OPAC系统,使OPAC真正成为揭示全部馆藏的目录检索系统。根据整合对象的不同,可将基于OPAC系统的资源整合分为馆内整合与馆外整合两种:馆内整合是通过在MARC记录里增加856字段——“电子资源地址与存取”字段,实现在实体馆藏中揭示并链接全文电子文献的目的。馆外整合的实质是实现本馆与不同异构OPAC系统的整合,当前较多的是通过采用Z39.50协议来完成。通过执行Z39.50标准,将所要整合的图书馆的书目数据库先映像成自己专用的模型,再根据本馆要求建立统一的检索接口。因此,基于OPAC的信息数字资源整合可实现馆际馆藏书目数据资源的整合、馆藏图书与随书光盘资源的整合、馆藏图书与电子图书的整合、馆藏期刊与电子期刊的整合以及与其他数据库的整合等。

基于OPAC系统的数字资源整合,充分利用了OPAC系统高访问率的优势,提高数字资源的利用率,在某种程度上起到非常积极的作用。但它也是一种不完全的整合方式,有着先天性的不足:(1)目前很多电子资源尚不能稳定彻底地支持开放链接(OpenRUL)标准,链接地址稳定性差,信息源数据的更新或任何一点地址变动都可能产生死链,导致整合工作不能得到持续有效的保障。(2)整合依赖于图书馆OPAC系统功能的完善程度,如要支持856字段的能力、要有修改书目记录显示字段的功能等,而这些功能的实现往往需要系统开发商的配合。(3)直接利用MARC格式组织电子资源时显得费时费力,不仅数据加工成本较高,而且很难实现批量更新与维护。(4)基于OPAC系统的资源整合实际上是一种目录级的整合,只是对信息源进行加工,并没有涉及到数字资源的内容、结构,因而并没有真正解决数字资源异构、交叉带来的使用问题。

3.2 基于导航系统的数字资源整合

数字资源导航系统是指将数字资源的检索入口整合在一起,建立数字资源导航库,提供按资源名、关键词、资源标识等获取数字资源的途径。它通常按资源类型、学科主题等把数字资源组织起来,通过数字资源的URL,利用超文本链接提供检索入口。按资源类型不同,还可以分别建立电子期刊导航系统、数据库导航系统、电子图书导航系统、电子报纸导航系统和学科专题导航系统等。数字资源导航系统一般都有三个功能:字顺浏览功能、分类浏览功能和关键词检索功能等。这三个功能可以帮助用户迅速找到数字资源,并利用超文本链接提供检索入口,对该数字资源进行检索。

然而,数字资源导航系统同样仅定位在数字资源的形式层,不能提供内容层面上的服务,用户仍需要通过导航系统分别访问每个数字资源系统的检索界面。读者不能按主题、作者查询文献,而且由于数据商、出版商大多没有提供充分的URL信息,数据库不能创立URL,所以数字资源的导航系统只能引导读者进入到所在数据库的界面,读者必须对信息系统进行检索。

3.3 基于链接系统的数字资源整合

利用网络超文本链接性能,将文献的有关知识点链接起来,最终达到将有关的数字资源链接在一起,形成一个具有内在联系的有机整体。链接整合主要有:一是封闭式静态链接系统,所有链接都存在本地数据(封闭式),所有链接都通过专门程序事先计算、并通过嵌入URL来表达(静态链接),链接准确性高。二是开放式静态链接系统,解决如何为链接源中包含的别人拥有的链接对象提供链接。三是开放式动态链接系统,在用户需要链接时才根据一定规则计算链接路径进行链接,可对用户链接前刚出现的链接对象或位置予以链接,也可在链接计算规则中嵌入选择规则实现选择性链接,如OpenURL,SFX,CrossRef/DOI等。

目前使用最多的是开放式动态链接系统SFX。它是由ExLibris公司推出的新的网络电子资源无缝链接整合软件系统,也可以称为上下文敏感参考文献链接解决方案。SFX采用Open URL技术,通过 HTTP请求和元数据传递,对数据进行分析、搜寻,链接到目标信息源,并根据目标信息源的可获取情况,动态地创建链接到全文、摘要、期刊目录等不同的级别,从而使用户能够实现统一界面检索,直接获取目标信息源,真正实现了信息数据库之间的无缝链接。它还能够实现在数据库中点击一篇文章的记录后显示所有能够得到的与这篇文章相关的服务选项列表,实现了在知识整体层面对信息资源进行管理的整合。在实际的应用中也依然存在一些问题:它基于一定的OpenURL协议标准,对于发展比较规范的国外数据库资源比较适用,但是对于早期遗留数据库和资源数据库构建技术不同、标准不统一的国内数据库存在着很大的难度。各个数据库根据OpenURL标准制定的接口依然有很大差异,若要根据自己的需求自行开发依然比较困难。此外,SFX技术对检索数据需要在二次检索的扩展服务中完成“一步到位式”参考链接。

3.4 基于跨库检索系统的数字资源整合

某个学科的文献资料可能包含在多种数据库中,读者要完成某一确定的课题的检索,往往要通过多个数据库进行多次反复检索,才能将与该课题有关的文献搜索查全。而数字资源不同的描述和表达方式,每个数据资源又都有其自身独特的检索界面、查询方法、下载格式、检索式构造规则、检索算符、检索字段等都不尽相同,这给用户的资源检索造成很大的困难。如果能在同一个检索平台下,实现多数据库同时检索,将大大提高用户对信息资源获取的效率。

跨库整合检索可分为两个层次:第一层次是检索界面的整合。许多数字资源检索界面存在一定的相似性,可将这些相似性形成统一的参数表,构成统一的检索界面,共享多个数据库的索引技术和检索技术。第二层次是实现数字资源系统间的分布式异构整合检索。检索界面整合的常见模式是构建中间层,当用户提出检索请求后,其请求被交给服务器端的一个Agent程序,Agent将用户请求转换成相应信息系统的查询语言和检索方法,再将请求发送到各数据库,然后将各个系统返回的命中结果经过筛选、去重、归并等处理后在同一界面上呈现给用户。在不改变现有信息系统的数据组织结构和检索方法的条件下,实现对异构的多数据源的统一访问,即提供“一站式”检索服务。

实现分布异构环境下的跨库检索,情况比较复杂。一是追求对所有资源的跨库检索只是一种理想状态,实际上只能做到兼容尽可能多的资源。二是对几十种以上的资源笼统地实现跨库检索并无实用价值,用户的需求是针对学科范畴、针对文献类型或者针对个性化需求定制而进行的资源检索和导航。因此,就实际情况而言,跨库检索实际上是作为一种关键技术应用在图书馆的“资源门户”中,与开放链接、聚类导航、个性化空间与信息定制、用户认证和权限控制等功能一起构成一个实用的数字资源整合系统。

4 结语

对于从传统向现代逐渐过渡的图书馆来说,数字资源整合是一项复杂的系统工程。因此,无论采用何种整合模式和技术,都要本着“实用为主”的原则,明确本馆的资源状况和目标,将复杂的应用问题转化为简洁、实用、友好的方案呈现给用户,使用户在面对类型各异的大量数据资源时,简便易行,充分发挥图书馆馆藏数字资源的作用。

[1]王辉,康美娟.数字资源的整合探讨[J].情报杂志,2004(8):128-129.

[2]郑红京.论图书馆数字文献资源采集和检索模式[J].河南图书馆学刊,2009(6):78-80.

[3]马文峰.数字资源整合研究[J].中国图书馆学报,2002(4):64-66.

[4]张开选.信息资源整合的原则和方法研究[J].图书馆论坛,2004(5):172-173,147.

[5]陈永选,郑乐丹.基于网络的图书馆信息资源整合模式研究[J].科技情报开发与经济,2008(5):29-30.

[6]刘静香.提高高校图书馆数字资源利用率的技术方法[J].图书馆界,2009(3):68-70,75.

[7]张文德,戴晓翔.信息资源整合系统与技术研究[J].现代图书情报技术,2003(6):72-74.

[8]彭凤兰,朱长菊.论网络信息资源的整合研究[J].高校图书馆工作,2009(2):21-23.

[9]魏来,张蛲林.综合数字环境下信息资源建设的思考[J].图书馆论坛,2009(6):161-165.

[10]龚亦家.数字图书馆的资源整合[J].图书情报工作,2005(7):76-79.

[11]谢玲.论现阶段数字资源整合的实用技术及发展趋势[J].现代情报,2007(8):100-103.

猜你喜欢
资源整合馆藏检索
馆藏
少先队活动与校外资源整合的实践与探索
“五育并举”下家校社资源整合的价值意义
博物馆的生存之道:馆藏能否变卖?
海外并购中的人力资源整合之道
知还印馆藏印选——古印篇
智慧高速资源整合方式实践
专利检索中“语义”的表现
介绍两件馆藏青铜器
国际标准检索