谈浙江高校数字图书馆联合目录的建设实践

2014-06-06 01:44徐芳
卷宗 2014年4期
关键词:数字图书馆

徐芳

摘 要:在信息技术的推动下,传统的文献信息资源收藏和服务模式已经无法满足用户不断提高的使用需求,图书馆资源共建、共享、共知成为必然的趋势,联合目录应运而生。本文主要对浙江省高校数字图书馆(ZADL)联合目录的建设实践进行了具体的介绍,包括工作原理、数据采集、内容与功能、管理与维护等几个方面,并对ZADL联合目录的特色进行了总结。

关键词:数字图书馆;ZADL;联合目录

随着信息技术和互连网络的迅速发展,图书馆的“馆藏”内容不断扩展, “读者”数量迅速增加,传统文献信息资源收藏和服务模式遭受着严重的冲击。任何一个组织机构想凭借一己之力收藏全部的文献资源,都是不可能的。图书馆资源共建、共享、共知成为必然的趋势,联合目录系统也在这种环境下应运而生。

联合目录通过反映各成员馆的文献收藏,揭示和报道多个文献收藏单位的文献目录,使图书馆能够得到准确的馆藏分布信息,以便对资源进行有效的协调配置;使读者能够实现跨库搜索定位资源,为资源利用和增殖服务奠定基础。联合目录是其它资源共享的基础,对于图书馆来说,联合目录的建设提供了充分发掘各个图书馆馆藏文献的机会,文献保障体系从单个图书馆的保障逐步过渡到区域性保障甚至全国保障。

1 浙江省高校数字图书馆联合目录建设概况

浙江省高校数字图书馆(Zhejiang Academic Digital Library,简称ZADL),是在浙江省教育厅领导下,由全省各个高校图书馆共同参与建设,服务于全省高校的数字化文献保障服务体系。ZADL联合目录是浙江省高校数字图书馆的核心部分,旨在建设浙江省高校图书馆文献资源目录数据库和目录导航,全面整合和揭示全省高校图书图实体印刷型书刊文献和虚拟数字资源的收藏、建设状况,提高全省书目数据标准化著录水平,方便各馆进行文献交流和馆际互借,最终实现全省高校文献资源共建、共知、共享。

目前联合目录的整体框架建设已基本完成。截至2014年初,ZADL已经汇集了大量数据信息 ,图书方面,汇集了浙江省50多家高校图书馆的127万多种图书的书目信息,其中大部分为本科院校,亦有少量高职院校;期刊方面,汇集了浙江省24所本科高校的161个期刊数据库的 56701万种期刊;数据库方面,汇集了浙江省高校图书馆的547个数字资源库,其中中文数据库208个,外文数据库257个。ZADL联合目录数据库服务体系由1个省级服务中心和5个高教园区分中心组成,向浙江省高校广大师生提供联合目录的导航和检索服务。

2 ZADL联合目录的工作原理

ZADL联合目录平台以CERNET为依托,各高校图书馆通过对CERNET的连接来实现互连互通。省中心网络通过千兆链路与校园网的主干相连,分中心以百兆上连到CERNET,采用TCP/IP网络协议和星型拓扑结构,确保数字资源共享带宽。为保证各中心的共享数字化资源服和能够为各高校合法用户使用,访问权限可以用软硬件通过IP地址控制来实现,省中心负责向CERNET申请IP地址,用于各中心资源服务器的对外服务,并通过硬件防火墙将数据中心分隔,根据相应的安全策略来控制数据访问,防止非法访问。关键的核心设备组网冗余连接,关键部件冗余配置,核心设备的配置能够实现如组播、IPv6等多样化的业务,网络设备及网络环境实行智能管理和监控。各分中心为ZADL在当地高教园区的统一汇集点以及信息资源的分发点。

在这样的网络技术保障下,ZADL联合目录采用集中管理的模式,即来自各成员馆的数据汇集在一个数据库中。基于z39.50协议或HTTP协议,成员馆将各自的数据库中的数据转换成OAI(Open Archive Initiative)元数据,并通过Web方式进行发布,数据中心利用元数据收割机(Metadata Harvester)获取这些数据,整合建库,加工清理之后提供服务。采用自动收割的方式有效地解决了集中式联合目录不能动态反映各成员馆的馆藏情况的难题,基本保证了中心库和各成员馆数据库之间的数据同步。

3 ZADL联合目录数据的采集

ZADL联合目录数据的采集分为三个部分,即图书书目数据的采集,期刊数据的采集和数据库数据的采集。

3.1 图书书目数据的采集和处理

图书联合目录采用两种格式;即ISO格式和MARC格式。中文采用CNMARC格,西文采用CNMARC格式和USMARC格式或LCMARC格式。书目数据著录标准与规范采用CALIS推荐的《中文文献著录原则》和《西文文献著录原则》,或国家图书馆推荐的中西文著录规则。

3.1.1 OPAC书目数据的采集和处理

ZADL联合目录对OPAC数据采用自动采集的方式,由系统对OPAC中的数据进行自动收割。OPAC数据的采集功能支持支持aleph,innopac,ilas,汇文,金盘,图创, 北邮等各类浙江高校图书馆自动化系统。

OPAC数据的采集:对于具有Z39.5开发接口的opac系统或具有查询接口的opac系统,可以直接自动采集;对于无接口无直接读取权限的opac系统,则可以采用页面分析法,监控opac系统的最新更新榜单,实现自动采集;对于具有MARC数据库读取权限的系统,可以通过自动采集程序直接将MARC数据导出;自动采集程序可以设定每日实施采集更新的时间,一般设置在凌晨1:00-5:00之间,以避开系统访问的高峰期。

OPAC数据的处理:通过导出程序得到的MARC数据首先要进行解码,通过接口采集的数据无需解码,解码后的数据先进入到预处理数据库;通过对预处理数据库进行过滤和清洗工作,去除多余信息和编码错误信息;与图书书目总库进行合并筛查处理,对于来源于不同图书馆相同版本的图书书目进行合并根据书目总库的图书价值评分系统对图书进行权重标识,按照分词建立搜索索引。endprint

猜你喜欢
数字图书馆
我国医学数字图书馆研究的文献计量分析
互联网思维下数字图书馆个性化服务建设研究
谈图书馆资源与小学数学教学有效整合
充电者的知识殿堂——数字图书馆
高校图书馆的未来发展模式刍议
浅析“互联网+”时代的图书馆管理
基于云计算的数字图书馆建设与服务模式研究
刍议数字图书馆计算机网络的安全技术及其防护策略