大数据在图书馆工作中的应用研究

2018-11-25 18:21菏泽学院图书馆庞凤展
办公室业务 2018年17期
关键词:原始数据图书馆资源

文/菏泽学院图书馆 庞凤展

如今图书馆收集和存储着海量的数据资源。馆藏资源的最初目的是为了帮助科研人员和社会读者能够查阅到他们所需的信息。然而随着社会的发展及科技水平的提高,图书馆数据量变得越来越庞大,数据格式也变得越来越多样,这种情况对图书馆信息的使用效率产生了一定的影响。

一、大数据概述

2001年,美国学者Doug Laney在他的研究报告中首次提出了“大数据”的概念,从三个角度定义了数据增长的机遇与挑战,即3V理论:数量(volume)、速度(volocity)、多样(variety)。近几年,大数据研究的重要意义已经得到了广泛认可:大数据技术可以使我们对数据作出更深入、更有价值的挖掘和理解,从而帮助我们更及时有效地作出决策。

二、 图书馆数据是否属于大数据

随着大数据技术的日渐传播和发展,图书馆也加入了应用大数据技术的行列,以便为研究人员与读者提供更高效的服务。但是有一部分学者对图书馆数据是否属于大数据存有疑问。本文将参照最为权威的3V理论,来探究一下这个问题。

(一)数量(volume)。根据维基百科的定义,大数据是由数量巨大、结构复杂、类型众多的数据构成的数据合集,是基于云计算的数据处理与应用模式,通过数据的整合共享,交叉复用形成的智力资源和知识服务能力。然而数据的实际大小并没有一个准确的定义,它的大小取决于实际应用场景。在另一方面,数据模型可以从馆藏文献中创建。

(二)速度(volocity)。图书馆数据中同样可以找到大数据所具有的速度特征。各个图书馆的服务器上管理着大量的文件,分布在不同的地理位置,图书馆存在着各种内部的或者外部的文件移动。随着更多研究的开展,越来越多的研究数据被动态地写入图书馆数据库。

(三)多样(variety)。图书馆拥有各种形式的数据:书籍、期刊、报告、笔记等。其中有些形式的数据是缺少组织性的,非结构化的。此外,用户在使用图书馆的系统和服务时,图书馆会收集用户的使用习惯和交互数据。因此,在图书馆数据中也可以找到大数据所具有的多样特性。除了以上三种特性外,图书馆数据还具有一些其他的属性。

(四) 数据缺乏组织性。在大部分人看来,图书馆中的书籍和期刊都组织得很有条理,用户使用类目就可以方便检索到他们需要的资源。然而,图书馆中存储的研究数据的情况却是不同的。这些研究数据杂乱无章,缺乏系统的组织和描述,并且很难被长期重复使用。

三、图书馆大数据所面临的问题

不同于商业机构、医疗机构等,图书馆大数据的研究相对而言还处于起步阶段。因此在数据转化、管理及分析的过程中,可能会面临一些困难。另外,图书馆所应用的大数据技术如数据存储、软件应用、人员操作上都与其他领域不尽相同。以下是图书馆大数据研究的一些常见问题:

(一)数据分析人员紧缺。当前各个行业中,数据分析人员都严重紧缺。图书馆行业面临着一样的境遇。数据分析人员不仅需要精通统计学和计算机的相关知识,同样还需要拥有知识管理和项目协作的能力。图书员处理大数据信息的能力是目前大数据在图书馆应用所面临的主要挑战。

(二)大数据采用能力较低。大数据产生于社会各个领域,但是目前很多的组织及机构并没有做好应对大数据时代来临的准备。图书馆的大数据研究比其他学科进展更慢。

(三)预算问题。虽然越来越多的人已经意识到大数据分析和应用的巨大价值,但是巨大的IT投入却一定程度上阻碍了大数据的发展。因为预算问题,绝大部分的图书馆管理人员并没有进行大数据研究与应用的想法。目前国内外很多图书馆开始引入大数据技术,但是我们需要认识到目前存在的挑战与问题,如预算问题、技术问题等。

四、图书馆大数据的应用

大数据是近年来热门的话题,那么大数据可以怎样运用到图书馆信息服务中呢?首先,图书馆的信息化建设使数字资源与日俱增,尤其是爆发增长的非结构化的原始数据,如音频影像等流媒体数字资源、学术文献的各种原始数据图表等,这将会促进数据资源采集处理模式的优化,及图书馆系统架构的优化配置,以克服现有的数据信息中心不能适应海量及复杂的非结构化原始数据获取、存储和处理方面的不足。

五、 结语

面临大数据时代,图书馆数据理所应当的属于大数据的一部分。由于资金和技术问题,大数据在图书馆的实际运用还面临着诸多挑战。但毫无疑问,大数据会帮助图书馆提高服务效益,加快升级创新。

猜你喜欢
原始数据图书馆资源
我给资源分分类
资源回收
做好绿色资源保护和开发
图书馆
论航空情报原始数据提交与应用
对物理实验测量仪器读数的思考
激活村庄内部治理资源
去图书馆