从计算机角度谈数字图书馆技术

2016-01-15 00:16
中文信息 2016年1期
关键词:编码方法检索多媒体

程 萌

(1.武汉大学信息管理学院,湖北 武汉 430072;2.铜川图书馆,陕西 铜川 727031)

数字图书馆是用数字技术处理和存储各种图文并茂文献的图书馆,实质上是一种多媒体制作的分布式信息系统。它把各种的不同载体、不同地理位置的信息资源用数字技术存储,以便于跨越区域、面向对方的网络查询和传播。它涉及信息资源加工、存储、检索、传输和利用的全过程。也就是说,数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心。

一、数字图书馆概述

数字图书馆是一门全新的科学技术,也是一项全新的社会事业。简而言之,数字图书馆是一种拥有多种媒体内容的数字化信息资源,能够为用户提供方便、快捷、高水平的信息化服务机制。数字图书馆不是图书馆实体,它对应于各种公共信息管理与传播的现实社会活动,表现为各种新型信息资源组织和信息传播服务。它借鉴图书馆的资源组织模式、借助计算机网络通讯等高新技术,以普遍存取人类知识为目标,创造性地运用知识分类和精准检索手段,有效地进行信息存储,使人们获取信息消费不受空间的限制,也不受时间的限制。

“数字图书馆”从概念上讲可以理解为两个范畴:数字化图书馆和数字图书馆系统,涉及到两个工作内容:一是将纸质图书转化为电子版的数字图书;二是电子版图书的存储,交换,流通。

二、数字图书馆产生背景

随着信息技术的发展,需要存储和传播的信息量增大,信息的种类和形式更加丰富,传统图书馆的机制显然不能满足现在需求。因此,人们提出了数字图书馆的设想。数字图书馆是一个电子化信息的仓储,能够存储大量各种形式的信息,用户可以通过网络访问它,方便获得这些信息,并且其信息存储和用户访问不受地域的限制。

数字图书馆随着信息时代的发展,它不但包含了传统图书馆的功能,向社会公众提供相应的服务,还融合了其他信息资源(如博物馆、档案馆等)的一些功能,提供综合的公共信息访问服务。也可以说,数字图书馆将成为未来社会的公共信息中心和枢纽。信息化、网络化、数字化,这一系列的名词符号其根本点在于信息数字化;同样电子图书馆、虚拟图书馆、数字图书馆,不管用什么样的名词,数字化也将是图书馆的发展方向。

三、从计算机领域的研究角度出发,数字图书馆的研究和开发的若干关键技术如下

1.数字图书馆系统结构模型

数字图书馆是一个相当复杂的系统,必须有统一、规范和系统化的模型作为研究和开发数字图书馆的理论指导和前提。对数字图书馆模型的研究,根据建模侧重点不同,可以将系统模型分为:结构模型、框架模型、动态模型、过程模型和功能模型。这五种模型各有所长,如何将其结合和统一,形成对数字图书馆的相对完整刻画,还需要做更多的研究。

2.数字图书馆资源管理

数字图书馆研究和建设的迅速发展,系统资源和信息资源已显得非常更加重要,如何有效、合理地管理和利用有限的系统资源和信息资源满足数字图书馆的各种需求,是资源管理研究的主要内容。其中包括资源管理的机制和策略、管理模型和优化算法等。

3.分布式多媒体同步

在数字图书馆的通信中有时不仅需要实时、等时地传输多媒体数据,而且需要各种媒体对象间保持时间和空间的同步约束。实时性、等时性和同步性是多媒体通信的基本特点,也是实现多媒体通信的关键技术和基础。同步性要求各种媒体在传输后仍然保持原来时间和空间上的制约关系。目前国际上关于多媒体同步模型的研究可分为时间线模型、层次模型和参考点模型三大类。各种媒体信息时态关系的研究也是多媒体同步中的重要组成部分。目前多媒体同步模型的研究较深入,人们提出了很多模型,但还没有一种比较完善的、能够满足数字图书馆通信要求的分布式多媒体同步模型。

4.多媒体数据库

多媒体数据库技术是以有效管理大量多媒体数据和相关信息为目标的数据库系统,它是开发数字图书馆的关键技术之一,是多媒体、图像处理和识别、人工智能和数据库技术相结合的产物。数字图书馆的媒体资源内容的组织方式将与传统的方式不同。其内容将按照用户需求挑选的高价值知识内容,经过分类、编辑、整理、加工,变成需用者易于接受的形式。它是一种有很大增值、有序的知识库,会出现新的知识产权关系。数字图书馆将资源分为元数据和对象数据。对象数据是指数字化的文本、图像、声音、影像等,元数据则是那些描述和管理对象数据的数据。对象数据呈分布式存放在各地的资源点内,元数据则有必要集中在数字图书馆中心的超大规模服务器上,用户查询时,中心调度系统通过元数据调度各对象数据库数据以提供服务。

5.基于内容的信息检索

基于内容的检索技术是多媒体数据库的重要组成部分,是目前数字图书馆研究的最新热点。所谓基于内容的检索是指根据媒体对象的语义和上下文联系进行检索。特点在于:从媒体内容中提取信息特征。即对图像、视频、音频进行分析和特征提取,利用这些内容建立特征矢量作为索引进行检索;是一种基于媒体多维特征进行的近似性匹配,是一种信息检索技术。该技术将支持从数字图书馆的多媒体数据库中以用户可以接受的相应速度查询到所要求的信息。

6.数据压缩

该技术是信息科学的关键技术及基础理论问题,同时也是建设数字图书馆系统的关键技术。压缩编码的理论基础是信息论。从信息论的角度看,压缩就是删除信息中的冗余,即保留不确定的信息,去除确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。编码方法可以分成三类:(1)考虑图像信源的统计特性。采用预测编码方法、变换编码方法、矢量量化编码方法、子带-小波编码法、神经网络编码法等。(2)考虑人眼视觉特性。采用基于方向滤波的图像编码法、基于图像轮廓-纹理的编码法。(3)考虑图像传递的景物特征采用分形编码方法、基于模型的编码方法。

[1]胡述兆、王梅玲合著(民92)。图书信息学导论。台北市;汉美。

[2]顾敏(民90),站点图书馆:数字媒体与网域服务环境下的图书馆新型态。信息传播与图书馆学。

[3]罗剑丽(民93)。传统图书馆与虚拟图书馆功能比较。绍关学院学报。

猜你喜欢
编码方法检索多媒体
借助多媒体探寻有效设问的“四度”
可变摩擦力触感移动终端的汉语盲文编码设计
2019年第4-6期便捷检索目录
多媒体在《机械制图》课中的应用
毫米波大规模MIMO系统中低复杂度混合预编码方法
专利检索中“语义”的表现
多媒体达人炼成记
适切 适时 适度——说说语文课堂的多媒体使用
一种新的星载InSAR直接地理编码方法
浅析公路工程物资的分类及编码方法