图书馆集成系统发展趋势研究*

2013-02-22 05:44王新筠南开大学图书馆
新世纪图书馆 2013年6期
关键词:书目本体开源

王新筠(南开大学图书馆)

1 引言

自20 世纪80年代至今,ILS(Integrated Library System图书馆集成系统)经历了一个从无到有、从模块单一到功能健壮的发展过程。但现今商业ILS 数据封装严密、不能进行个性化定制;知识组织体系趋于传统,跟不上语义网的发展;OPAC 与读者互动不强、更无法让读者与读者之间进行交流;大型ILS 硬件配置需求高,制约中小型图书馆的发展。本文通过分析当前ILS 存在的问题和解决对策,结合信息图情领域前沿技术,提出了未来ILS 的发展方向,希望能对图书馆同行在引进和使用ILS 过程中有所启发。

2 云计算ILS

使用ILS 的图书馆会有这样的体会,硬件水平永远赶不上软件的增速。数据量的增长,软件版本的升级,总是需要更高级别硬件环境支撑,需要更多经费投入。中小图书馆受经费限制,在自动化设备方面的投入不会很高,这在一定程度上制约了中小馆自动化进程。大型图书馆即使有充足的经费,但高价购入的设备,几年之内就得升级换代,也是很大的资源浪费。云计算的出现,会为ILS 的发展方向打开一些思路。

2.1 云计算ILS 概述

云计算的核心思想是通过网络把多个计算实体整合成一个具有强大计算能力的系统,并借助SaaS(软件即服务)、PaaS(平台即服务)、IaaS(基础设施即服务)把这种计算能力分布到终端用户手中。SaaS 为用户提供直接可用的应用软件,PaaS 为用户提供自主开发应用程序的平台。而IaaS 为用户提供更底层的接近于直接操作硬件资源的服务接口。

云计算使用户以更便捷经济的方式获得海量存储空间和计算能力,这在任何一个图书馆自己搭建的ILS 环境中,都是无法实现的。它可以让图书馆脱离硬件环境限制,将更多经费和精力投入到系统应用方面,更好的为本馆业务和读者服务。到目前为止,已有一些ILS 供应商提供了云计算服务。SirsiDynix 的SaaS 环境中已有600 多个ILS 实例,这些实例的正常运行时间大于99.99%,说明其安全性是有保障的。2009年OCLC 推出的“Web-scale Management Services”可以说完全基于云计算,它把系统软件、数据、服务都融合在这个Web 级的ILS 中,从初步推出的编目到后续的用户、采购、流通数据,传统ILS 能做到的它都能做到,B/S 架构也使之更便捷易用。

2.2 Paas 与SaaS 融合-云计算ILS 的趋势

当前部分云计算ILS 为SaaS 模式,笔者认为这种模式为图书馆带来便捷的同时,也阻碍着图书馆人信息素养的提升和图书馆对系统进行个性化定制的程度。基于PaaS 的ILS会有效避免这一现象,它能够提供图书馆进行定制化研发的、涵盖了数据库和应用服务器的中间件平台,用户基于PaaS 平台可以快速开发自己所需要的应用,虽然不能接触底层代码,但通过这种方式可以对系统设计理念和架构、甚至代码习惯有所了解,促进了用户对IT 的嗅觉敏锐度。同时,用户会将开发经验、意见或成果提交ILS 研发者,敦促其对软件版本的改进,这是一个相互学习和双赢的过程,也会加快SaaS 的发展。

3 新型知识组织技术的使用

3.1 新旧知识组织体系对比

传统ILS 以分类法和主题词表为知识组织工具,在MARC 层面描述和组织数据,只支持受控语言检索,缺乏对自然语言的理解,导致其检索机制不能深入到资源内容层面,也不能揭示数据和数据之间的关联关系,极大制约了ILS 的发展。随着新一代互联网——语义网概念的提出,一批新的知识组织技术诞生,本体与关联数据是其中的佼佼者。应用新型知识组织工具会克服传统ILS 资源组织和描述的局限性,促使其书目组织体系向语义化方向发展,会有效扩充ILS 的功能。

3.2 本体

3.2.1 本体技术应用于ILS 的优点

本体是知识组织的重要手段。它是一个关于某些主题的、层次清晰的规范说明。其词表中的术语全是某一专业领域相关的,词表中的逻辑声明全部是用来描述那些含义和术语间关系的。与传统知识组织工具相比,本体具有更丰富的语义关系和强大的推理功能。对ILS 原有知识组织体系进行本体化改造,会提高系统对自然语言的可读性,书目检索功能也从词组短语检索上升为语义检索,提高了检索的有效性,为ILS 数据和知识的互操作提供了可能。

3.2.2 当前图情领域本体技术研究成果

近些年国内外图书情报领域的本体研究取得了一定成果。欧盟研究人员构建了MarcOnt 本体,美国国立医学图书馆构建了医学本体UMLS,国内学者,曾新红提出了用0WL表示中国分类主题词表的方法,王军构建了基于RDF 描述规范的KVision 本体……

3.2.3 本体化ILS 的制约因素与展望

现有本体构建研究均独立于ILS 之外,单独构建本体库,方法各不相同,规范和标准也不统一。现在W3C(World Wide Web Consortium 万维网联盟) 编制的OWL(Web Ontology Language 网络本体语言)已经成为W3C 的推荐标准,如果推荐标准成为正式标准或唯一标准,将对本体化ILS 起到重要的推动作用。

3.3 关联数据

3.3.1 关联数据概念

关联数据的概念由Tim Berners-Lee 于2006年首次提出,它区别于现在万维网的文件互联,从一个全新的角度-“数据互联”来重新定义和发现资源,即通过网络把以前没有关联的相关数据连接在一起,允许用户发现、关联、描述并再利用各种数据。Tim Berners-Lee 提出了关联数据的四个原则[11]:(1)使用URI 作为事物名称。(2)使用HTTP URI 使人们能找到这些事物。(3)当人们查找URI 时,通过RDF、SPARQL 的形式来提供URI 的有用信息。(4)包含指向其它URI 的链接,以使人们能发现更多信息。从图1 和图2,我们可以看到关联数据的发展速度。两年时间发展如此迅速,实在令人吃惊。

图1 2007年5月的关联数据集

图2 2009年3月的关联数据集

3.3.2 关联数据应用于ILS的意义

关联数据是互联网的发展趋势,也是图书馆实现资源深度发现的有效方法。ILS 作为图书馆资源建设的的重要平台,理应重视这一新技术。将ILS 中每一个书目数据发布为关联数据,可以使WEB 上任何一台电脑通过HTTP 的形式来访问书目记录,而无需首先登录OPAC,这使得外部世界能更方便快捷的了解馆藏资源。同时,书目数据携带的指向其它URI 的链接,又可以扩展书目信息,将读者视角引向更广阔的信息资源,这些资源可以是异构数据库中的电子书、电子期刊、学位论文、新闻资讯等,只要它们有UR 就可以访问得到,真正实现了跨平台、跨系统之间的通信,提高了ILS的资源发现功能。

3.3.3 书目数据关联化研究现状

传统ILS 的书目数据存储于关系型数据库中,需要将MARC 格式转换为RDF 三元组,才可以作为关联数据发布,这是一个复杂的过程。白海燕、乔晓东利用开源软件D2R 的关联数据构建机制,将关系型书目数据转换为虚拟的RDF数据,实现了MARC 书目数据向关联数据的转型,是传统ILS 书目数据改造方法的有益借鉴。国外图情领域,瑞典国家图书馆已将所有书目数据发布为关联数据,美国国会图书馆采用SKOS(简单知识组织系统)使整个LCSH(美国国会图书馆分类法简表)全部成为关联数据,使其在web 上开放、共享、可引、可关联。

关联数据向我们敞开了更加深层的互联网空间,基于关联数据的ILS 会带领人们发现更多更精彩的数据世界。

3.4 ILS 知识组织体系的发展趋势——多种知识组织工具共存

传统ILS 的设计理念和架构基于几十年累积的成熟的分类法、主题词表体系,这种固有的思维模式,不仅属于领域专家,也属于ILS 研发者。新型知识组织工具会极大颠覆这种传统,但笔者认为要改变不是一朝一夕的事,未来很长一段时间,ILS 内核都有可能是多种知识组织工具共存的状态。在不能完全抛弃MARC 著录的前提下,多种知识组织工具如何兼容,是需要考虑的问题。

4 加入社会化网络(SNS)元素的OPAC

4.1 现有OPAC 的局限

作为ILS 子系统的OPAC,承担了ILS 面向读者服务的重要功能。传统OPAC 更倾向于成为馆藏资源揭示平台,而读者服务方面做的还不够。虽然近几年OPAC 也在这方面做了些努力,如SirsiDynix 的Ilink、Elibrary 有读者荐书、意见征集等,但模式略显简单。它只注重图书馆与读者的简单交流,而缺乏读者与读者的互动。

4.2 SNS-OPAC 功能强化的基石

让读者之间顺畅沟通是图书馆提高读者忠诚度的有效方法,也是图书馆资源建设的重要依据。加入社会化网络(SNS)元素的OPAC,正是这种交流的良好平台。社会化网络是以个人为中心,通过一系列工具形成其个人的网络关系群。加入SNS 的OPAC,可以在用户查询图书的同时提供撰写书评的空间,可以让用户建立自己的好友圈,使有同样阅读兴趣或相同研究领域的读者聚合起来,交流读书心得,推荐优秀图书,这种类似书友会的读者圈的形成,会聚拢更多读者,使他们主动去了解馆藏资源,积极向图书馆推荐好书,这是图书馆提高读者忠诚度的有效方法。同时,图书馆根据这些读者的知识结构、学科方向和阅读兴趣,制定对某一知识领域图书的购买策略,又提升了图书馆文献资源的建设效益,这是一个良性的循环过程。

5 开源ILS

5.1 商业ILS 缺陷

商业ILS 容易使用户对软件供应商产生过度依赖,其源代码不公开,数据封闭严密,用户意见反馈大多收效甚微。即使有开发商提供API,也并未深入到源代码层面,出于商业赢利的考虑,某些关键接口也不公开,这使得图书馆不能按照自己的需求修改系统功能,一定程度上阻碍了图书馆的个性化发展。

5.2 开源ILS 特性与使用

开源ILS 是软件发行时,在包含编译形式的同时也包含程序源代码,用户可以自主参与到代码的编辑当中来。当前主流的开源ILS 有新西兰的Koha、美国的Evergreen、法国的PMB 系统,它们除具备传统ILS 的功能外,还包含客户化定制、开源OPAC、目录整合等功能,图书馆可根据自己的需求对系统量身订做。

使用开源ILS 需要注意以下几点:(1)本地化。本地化可能存在翻译不准确、跨语言转换内码出现的乱码问题,所以本地化工作初期就应该提出相应预案。(2)图书馆技术人员的配备。技术人员应熟练掌握开源ILS 源代码语言,为日后修改程序、个性化定制提供保障。(3)安全性。开源使用户接触底层代码和数据的机会更多,用户不会像研发者一样极熟练的使用编程语言,代码错误也在所难免,系统应提供较完备的安全、容错和灾备机制。

6 结语

本文提出的一些技术手段,可能只是未来ILS 发展的一部分,希望新一代ILS 能融合更多的现代化的信息技术,成为图书馆适应不断发展的互联网时代的重要保障。

1 范并思.云计算与图书馆:为云计算研究辩护[J].图书情报工作,2009(11):5~9

2 李景.本体理论在文献检索系统中的应用研究[M].北京:北京图书馆出版社,2005.3

3 怒放的关联数据: 你为什么应该关注.[EB/OL].http://www.20ju.com/content/V90795.htm,2009-05-19.

4 Tim Berners-Lee.Linked Data[R/OL].http://www.w3.org/DesignIssues/LinkedData.html,2006-07-27.

5 白海燕,乔晓东.基于本体和关联数据的书目组织语义化研究[J],现代图书情报技术,2010(9):18~27

6 曾蕾. 关联的图书馆数据[EB/OL].http://202.114.9.60/dl6/pdf/26.pdf,2010-02-22.

7 杨晓东.基于Web3.0 的OPAC 构想[J].大学图书馆学报,2010(6):98~101

猜你喜欢
书目本体开源
推荐书目《初春之城》
继齐韵往昔,以今声开来——思考自五音戏主奏乐器的演变、本体及延伸
校园武术“学、练、赛”一体化实践探索
眼睛是“本体”
五毛钱能买多少头牛
2019(第十四届)开源中国开源世界
2019开源杰出贡献奖
一种新型水平移动式折叠手术床
Care about the virtue moral education
《全国新书目》2009年1月荐书榜