网格数字图书馆:何时才能走近普通读者

2010-03-22 15:20赵培云辽宁工程技术大学图书馆辽宁阜新123000
图书馆理论与实践 2010年5期
关键词:网格数字图书馆

●赵培云(辽宁工程技术大学 图书馆,辽宁 阜新 123000)

图书馆第一代数字化建设是基于MARC的书目管理系统为核心特征的自动化建设。它通过对图书描述信息进行数字化并加以运用,满足了图书馆对于业务管理自动化机制的需求。其主要不足在于只能针对纸本图书提供指引性信息,而不能提供电子化一、二次文献。图书馆第二代数字化建设是以对大量通过互联网提供的分布式电子文献信息资源的应用为主要特征的。这一代数字化以电子化和网络化的一、二次文献为基础,提供包括全文检索在内的各种信息利用技术,在一定程度上,还实现了不同类型信息的统一利用和基于内容的信息链接功能,并且针对特殊的信息资源需求,实现了多种模式的信息数字化机制。其主要不足在于:(1)缺乏管理。由于互联网实行的是所谓域管理及分散管理机制,缺乏统一的网络管理神经中枢,在网上发布信息几乎没有任何限制,所以导致基于网络的整个数字图书馆处于无序状态。(2)信息资源分散。不同的图书馆由于拥有的信息资源侧重面不同,所以只能提供一部分信息,这就导致了读者要想查看所关心的信息,需要奔忙在不同的图书馆网站之间,造成大量时间浪费。(3)缺乏统一标准。一是库结构内容不规范。如大多数单位所建设的资源库,缺少使用其资源的帮助信息,书目数据著录根本不考虑主题标引,不考虑建立规范档,甚至不遵循MARC格式。二是没有统一的检索端口和阅读平台,导致遍地都是信息“孤岛”,难以实现互操作。(4) 网络带宽不足。由于带宽限制,任何一个图书馆都由于规模、资金等方面的原因,无法及时响应大量并发读者的请求,使得读者不能享受到好的服务。(5)服务器处理能力有限。像全文检索这种需要很高计算能力的服务就往往由于读者人数多,导致响应速度很慢;而绝大多数时间,访问读者很少,所有资源则又处于闲置状态,仅有5%—10%被真正利用。(6) 体系结构多数都是一个整合的中央控制系统,即当一个用户应用图书馆时,只能由这个图书馆提供服务。不能动态地联合其他图书馆为用户提供服务,同时,用户也不能动态提供自己的图书资源。[1](7) 读者查询到的是信息而非知识。在现有数字化图书馆建设目标下开发的信息资源,本质上还只是一本本“堆积”起来的数字化书刊。读者从中获取的还仅仅是一篇篇文献,而不是一个个针对特定问题的解决方案,即知识。

1 图书馆第三代数字化——基于网格数字图书馆的特点

1.1 网格对现有互联网进行了非常好的管理

网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库等融为一体,使人们能够按需获取所有信息。它把分散在不同地理位置的资源虚拟成为一个空前强大的信息系统,实现计算资源、存储资源、信息资源、软件资源、知识资源和专家资源等的全面共享。

1.2 有利于数字图书馆海量数据处理

网格能很好地解决海量数据的计算处理和分析问题。网格计算可以智能地分配计算资源,能够优化现有的计算资源,更快地解决数字图书馆设计和利用问题;能够将应用程序的每个部分调整到最适合它的系统中去,从而以更短时间、更低的成本解决有关应用问题,满足用户对高效互联网信息服务的要求。

1.3 突破了存储能力大小的限制

存储网格将存储的可扩展性和效率提升到了一个全新水平,它由一种协作式的标准基础设施、模块化的构件块组成,并通过集中平台进行管理,来实时供应、部署现有的和重新部署新的信息存取服务。它可以实现大容量信息存储,而没有信息冗余。一是具有很强的可升级性,这有助于采用低廉的成本来增加图书馆存储容量;二是可以实现单一地址访问、不间断数据转移等功能,简化了管理,提高了效率;三是面对发展和变化均非常迅速的用户需求,它能快速应变,以满足用户不断变化的存储需求。

1.4 实现信息服务集成

由于信息网格能够让用户通过一个单一的入口访问所有的信息,因而可以有效地解决网络信息资源分散性与网络环境下信息需求集成性的矛盾,从而实现了网格环境下信息服务的集成。网格已经发展成为连接和统一各类远程异构资源的重要途径。

1.5 实现资源全面共享

网格把分散在不同地理位置的资源虚拟成为一个空前强大的信息系统,这些资源形成一个整体后,用户可以从中享受一体化的、动态变化的、可灵活控制的、智能的、协作式的信息服务,获得前所未有的方便性和超强能力。其中,第一层次是实现资源共享,第二是实现协作协同。

1.6 大大提高资源利用率

一是由于网格中采用的是单一信息源,也即任何信息在信息空间中只占据一点,信息空间是非冗余的,这样就有效地减少了信息资源的冗余度,提高了网络信息资源开发与组织的效率。二是负载平衡。三是共享政策丰富。

1.7 实现互操作

信息网格具有互操作性是指信息网格的多个结点上信息的存储和表示可以多种多样,但从用户行为角度看都可以互操作。在信息网格的内核之上,用户看不到本地结点和网格结点的区别,也看不到异构的系统和数据。这种互操作性,可允许我们在组织与开发网络信息资源时,将各种信息源无差别地组织在一起,充分满足用户对不同类型网络信息资源的需求。

1.8 可实现知识服务和创新

网格能根据用户的要求自动地生产知识,在知识生产过程中,高性能计算机能将数据源中得到的原始数据,通过特定网格程序软件加工成信息知识。[2]当用户提出请求或查询时,网格将会自动处理分析,并把有关结果传送到用户登录的节点上,而且这一功能是完全由网格本身完成而不需要人为干预。另一方面,网格可以将整个科学分类体系立体分布在网格结点上,通过不同的结构链接方法使诸多交叉学科体系由隐性知识转化为显性知识或创造出新的学科研究领域,达到知识创新的目的,从而使得网格数字图书馆服务更加完善。

2 网格数字图书馆走近普通读者任重而道远

2.1 网格的基础研究还很薄弱

这方面国际上还很少有成果发表。究其原因:一是在今天的计算机体系结构下发展起来的计算模型能不能适应明天的网格,如何映射到动态生长的网格环境中;二是计算数据在网格中如何分布组织,如何在网格中高效地寻址和访问数据,如何对网格存储空间实施有效管理;三是在高度异构的环境下的信息如何表示及编码,在大地域分布的异构环境中如何无阻碍地交换信息,如何有效地标示信息的位置,从而实现信息的高效获取,这些问题都有待探讨。

2.2 信息网格和知识网格还几乎是空白

目前国外的研究集中在计算网格、数据网格、商业网格三个方面,在P2P(对等网络) 和Access Grid方面也有很多工作,但在信息网格、知识网格方面工作很少。尽管GGF(全球网格论坛)已有了Semantic Grid的一些工作,但还缺乏内容。中国科学院计算机所在织女星知识网格方面的研究工作在国际同行中处于领先位置,但要产生关系数据库这样的有影响的成果还需要做大量工作。

2.3 网格操作系统还不完善

网格系统软件是网格研究界投入最多的领域,但目前它仍有很多不完善的地方。比如:网格文件系统还几乎是空白,网格资源定位还是个难题,网格用户身份还没有定论,网格授权与访问控制的工作还处于初级阶段等。

2.4 支持网格的超级服务器的需求尚不清楚

高性能计算机如何支持网格?它的体系结构和操作系统该如何改变?这些问题目前还没有答案。

2.5 网格调度技术仍存在问题

既然网格数字图书馆的各种资源可被大量的共享应用,那么如何使得这些应用获得最大效能,就是调度所要解决的问题。网格具有如网格资源的动态变化性、资源的类型异构性和多样性、调度器的局部管理性等一些独有的特征,因此网格调度技术要比传统高性能计算中的调度技术更为复杂。[2]网格的调度需要建立随时间变化的性能预测模型,充分利用网格的动态信息来表示网格性能的波动。在网格调度中,还需要考虑移植性、扩展性、效率、可重复性以及网格调度和本地调度的结合等一系列问题。

2.6 尚没有统一标准

标准是网格应用成功与否的关键,构建网格需要对标准协议和服务进行定义。目前GGF、W3C及Globus等标准化团体都开始了筹划工作,加快了全球大网格(GGG)标准的制定。开放源代码网格标准组织——Globus正致力于开发标准的网格架构。在核心技术上,相关机构已达成共识。由美国有关机构开发的Globus Toolkit已成为网格计算事实上的标准。因此,如何把数字图书馆标准和网格标准更好地结合起来,使网格数字图书馆发挥更好的作用是值得研究的问题。

2.7 数字版权管理及安全问题仍没解决

由于在网格环境下信息资源共享程度极大提高,知识产权问题更加突出。只有解决数字版权管理才能为网格环境下数字图书馆资源共享打下基础,而这在图书馆第二代数字化建设中就没解决好。网格将彼此毫不相关的资源提供者和使用者联系起来,既要确保他们之间的依赖关系,保证关键性应用在网格环境中的安全,又要在促进共享的同时保护用户的机密和商业利益,这需要一种成熟的网格计算安全模型和体系结构,而现在还没有。与此同时,由于网格的节点位于不同地域,节点数字图书馆间如何安全地共享数据资源,如何保证共享数据的完整性,在构建完善的安全机制的同时,如何避免安全验证耗资过多的系统资源,也是要着重解决的问题。

2.8 系统改造问题

网格系统平台建好后的应用移植是网格技术走向应用的最大障碍。网格技术要求用户将原有的系统应用标准化,并平移到新的系统之中,而实际上很多现有数字图书馆应用系统如果将其推向网格环境,将面临重新编写应用代码的问题。虽然目前有一些相关的工具已经开发出来,但仍有许多技术问题需解决。

2.9 对网格认知度低

据Oracle最近发布的第四次网格指数调查结果显示:中国的总体网格指数在15个被调查国家中排名第九位,处于中下游,应用指数偏低(1.7)。[3]这表明中国用户对网格还没有真正接受,从认知到接受再到购买可能还需要一个过程。

2.10 合适的运营机制尚没有建立

由于资源的分散性和部门所属性,网格数字图书馆是由一家还是几家数字图书馆公司运营,它的经济模型和盈利机制是什么,如何通过引入投资机制建立网格数字图书馆的运营服务业并完善计费、管理、调控的一系列策略和机制,如何用有效的利益机制来促进其共享,仍有待进一步探讨。

3 中国的网格数字图书馆应着重解决的问题

3.1 加大投入

据调查,我国图书馆IT应用现状分为3个层次:(1)初级层次,图书馆已配置了计算机等相关设备,但只是应用于部分业务(如编目),占76%;(2) 中级层次,图书馆已实施了网络集成系统,全部业务能实现计算机化、网络化处理,占18%;(3) 高级层次,图书馆已进入数字化阶段,可以向读者提供数字信息资源的加工、检索服务,占6%。[4]很显然,有3/4的图书馆有可能被网格大潮抛弃。为此,绝大多数图书馆应加大投入进行网格技术改造。

3.2 数字资源的存储

数字资源的存储结构在网格结构与P2P结构的基础上进行整合,目的在于数字图书馆管理系统能够访问存储在具有不同操作系统的结点的数字资源;能够提供对内容存储结点和外部内容提供者的透明访问,并管理更新、生成、复制、分离新对象等;能够管理元数据的描述并丰富由内容管理服务提供的新的数字对象;能够为获取的元数据的互操作性提供代理,注重内容存储和分发的安全,并对数字对象进行注视管理(主要是多媒体对象)。

3.3 资源联合共享的数据管理

基于现有网络状况及数字图书馆资源和信息的分布,需要解决数字图书信息的可靠存储与高速传输,保证不同区域用户的响应均衡。针对数字图书馆服务机构中数据源异构、自治、广域分布的特点,需要研究数据库联合技术,为不同类型数据库系统提供统一的访问接口,提供针对各种异构数据库的联合查询处理功能,并提供数据库联合查询的性能优化技术以及一系列的良好联合数据库配置、调优和管理工具。

3.4 信息表示标准化

基于国内数字图书馆领域中的资源信息标准化、规范化技术,需要解决基于网格技术的文献信息表示标准和文献信息交换标准,以及科技文献信息组织、信息整合、信息关联及信息存储的规范技术,通过提供科技文献信息检索和注册的规范化技术,为科技文献资源的共享、集成和内容揭示等提供标准化基础。

3.5 科学管理数字版权

网格数字图书馆是开放式的存取环境,网格中信息的复制性、全球的传播性和变幻莫测的交互性给著作权保护带来了空前的震撼和挑战。因此,做好整个网格范围的资源利用的管理和控制,掌握读者对网格资源的使用情况,尽量提高网格资源的免费率,严控收费的范围和力度,研究收费的方法,限制信息由授权使用方传送给非授权使用方、使版权所有人能够掌握其作品被使用情况,是普及应用网格数字图书馆必须解决的问题。

3.6 资源联合共享的元数据检索及更新

未来数字图书馆建设需要解决资源联合共享的元数据检索和注册的标准化,同时为元数据的检索和注册提供规范化、灵活的手段。针对各种不同类型的元数据更新软件,提供其数据规范输出的接口,实现元数据的标准化输出。另外,需要解决联合共享元数据目录的自动更新问题,保证元数据的更新一致性。

3.7 个性化的用户访问

利用虚拟组织(VO)的机制,把用户和资源在数字图书馆环境下连接在一起,使用户、团体能够创建自己的临时数字图书馆。允许用户指定一套所期待的数字图书馆的特征标准,根据标准确定这些特征和功能所需的服务和信息源,最终创建自己的数字图书馆。

3.8 资源联合共享的安全控制

针对各数字图书馆服务机构安全管理的异构和复杂特征,需要解决资源联合共享的安全体系结构、分布式信任管理、面向用户群体的安全管理、异构安全环境集成、安全策略的一致性、科技文献资源的安全接入、用户访问的单一登录等。[5]针对用户对文献资源的访问提供灵活的授权和访问控制机制,并满足权限管理的可扩展性要求,减少权限管理开销,同时提供一套合理的数字图书馆资源和信息访问控制和计费机制。

3.9 培养图书馆核心竞争力——知识的组织能力

网格数字图书馆能对域内资源进行一定程度上的整合和挖掘,但这是远远不能满足读者需求的。图书馆应利用馆内的专业人才,对人类已有的知识进行有针对性的组织、深层次的挖掘和整合,大力建设自己的特色数据库与地域特色文献数据库。[6]同时应将图书馆员逐渐培养成为网络信息导航专家和信息咨询专家。唯有如此,图书馆才能在未来的广域网格中争得一席之地。

[1]李亮先.网格技术在数字图书馆的应用[J].情报科学,2004(6):703-706.

[2]谷斌.网格技术与网络信息资源的组织与开发[J].情报科学,2004 (8):979-980.

[3]董慧,等.数字图书馆网格应用模型研究——2005信息化与信息资源管理学术研讨会论文集[C].武汉:湖北人民出版社,2005.

[4]金海.数字图书馆及其网格应用的发展[J].现代图书情报技术,2005(9):1-5,13.

[5]韩毅,等.国外基于网格技术的数字图书馆内容与应用的比较研究[J].情报学报,2006(2):221-230.

[6]邱锋祥,汪晓兰.图书馆应用网格技术的几点思考 [J].图书情报工作,2009 (1):105-108.

猜你喜欢
网格数字图书馆
用全等三角形破解网格题
反射的椭圆随机偏微分方程的网格逼近
图书馆
答数字
重叠网格装配中的一种改进ADT搜索方法
数字看G20
基于曲面展开的自由曲面网格划分
去图书馆
成双成对
数字变变变