大数据时代图书馆的挑战及其应对策略

2016-03-07 08:52由薇波
黑龙江科学 2016年24期
关键词:数据量架构挑战

由薇波

(黑龙江省社会科学院文献信息中心,哈尔滨 150018)

大数据时代图书馆的挑战及其应对策略

由薇波

(黑龙江省社会科学院文献信息中心,哈尔滨 150018)

随着时代的发展及互联网进程的加速,数据量已经呈现出直线上升的趋势。基于此背景,首先分析了大数据的基本特征及其内涵,然后指出大数据在图书馆工作中所占的重要性,重点分析大数据在以下几个方面所带来的便利:数据管理、数据存储、数据挖掘等。从这几个方面入手,提出了相应的应对策略,希望对相关单位的从业人员有所帮助。

大数据时代;图书馆;数据管理;数据存储;数据挖掘;挑战;策略

随着科学技术的不断发展,互联网时代进程的不断加快,数据量也呈现出直线增长的态势。拿Facebook来举例,它每天的日志数据产出量就有300TB之多。此外,还有Google每个月的数据处理量,也超过了400PB。根据国际数据公司IDC在2011年所公布的数据,可以了解到,当时全球信息总量每过2年,就会增长1倍,预计到2020年,全球所产生的数据量会达到35ZB之多。这说明“大数据时代”已经来临,而且是大数据在云计算以及物联网等领域又一个伟大的变革创举。在这样的背景下,如何以“大数据”为基础,使其更便捷快速的为用户提供信息服务,如何根据用户的不同特征,实现个性化定制信息资源。这不仅是科技方面所要考虑的事情,而且也是图书馆所面临的问题,更是今后我国图书馆发展的整体方向。此次主要是基于大数据的相关特征以及图书馆与大数据之间的关系,对在大数据时代下,图书馆如何抓住新的机遇和挑战进行了较为深入的分析,希望对有关部门的研究人员有所帮助。

1 大数据的定义及基本特征

都说“大数据时代”已经来临,那么何为“大数据”?到目前为止,不同的公司和机构对大数据的定义不同,但还没有一个较为简洁、权威的定义。IBM公司认为,所谓的大数据应该具备“3V”特征,即速度快、种类多、容量大。IDC公司则认为,应该具备“4V”特征,即海量、高速、易变、多样。但不管是IBM所认为的“3V”,还是IDC公司所认为的“4V”,我们都可以得到大数据以下的几个基本特征:其一,大数据必须具备数据量大的特性,所谓的“大”,一般要求数据量要达到10TB以上。其二,大数据的“大”,还应该占据样式全面的特性,这些种类类型包括有结构数据和非机构数据两种。其三,流动性快和价值密度低。随着时代的进步,科学技术的快速发展,也许昨天刚兴起的技术,在今天已经变得落后。而且由于数据量大,其中的信息资源可能会参差不齐,可用的、有价值的密度自然不会很高。

2 图书馆与大数据之间的关系

随着科学技术的快速发展,全球化进程的不断推进,图书馆如今的发展不仅包含有大量的数字资源、电子资源,而且随着云计算、语义网、社交网站等的普及,给图书馆带来了广泛的数据资源。所以图书馆应该紧跟时代步伐,面对大数据时代带来的机遇和挑战。

2.1 海量的电子资源为图书馆提供了海量的数据

据不完全统计,每年全球生产出来的信息含量以每三年翻一番的速度在增长,而这些信息数据基本上都是以数据的形式存储的。而且汉语在国际上影响力不断加深,使得中文网页等不断普及,在2011年年底,我国电子书的总量就已经超过了115万种之多,单独出版的数字报也达到了700份以上。仅针对清华图书馆机房来说,光服务器就有100多台以上,而国家图书馆的总资源量也是达到了500TB以上,这些资源都是分布在不同的系统当中,并且以不同的形态、组织样式进行存储,其中不仅包括有传统的文献,还包括有多媒体资源、电子资源等,它们给图书馆提供了海量的数据。

2.2 云计算、语义网、社交网站的不断发展给大数据提供了广泛的来源

云计算的出现有效打破了传统图书馆的发展局限性,并运用强大的数据处理能力,通过对不同数据的整合,真正实现了资源的动态配置,然后通过利用RFID技术,实现了图书资源的自动借还机制,完成了数据资源自动整合功能,创造出绝佳的用户体验。而随着科技的进步,各种语义网、社交网站的普及,使信息的传播发生了翻天覆地的变化,如今所谓的“知识爆炸时代”也由此而来。这些都给图书馆提供了海量的数据,为图书馆提供了高速、便捷的信息来源通道,实现了图书馆的创新、突破。

3 大数据时代下图书馆所面临的挑战

信息时代的发展,大数据时代的到来,为图书馆提供了绝佳的机遇,为图书馆今后的发展指明了道路。但机遇与挑战是并存的,图书馆要想把握机遇,就必须面对很多的挑战:其一,图书馆传统的网络架构不适于“大数据”时代。传统的网络结构,一般是以用户端向服务端发送请求,然后根据请求在做出响应。但在大数据时代,由于数据存储广泛,存储地域不同,所以传统的构架难以满足大数据的要求。其二,大数据下呈现的最大特点就是“大”,由于数据量大,其中不仅有机构网的数据,还充斥着各种非机构化的数据,这导致了图书馆的数据中心面临极其巨大的挑战。其三,如何更好地实现用户体验,让用户更快更便捷的获取数据也是一个难题。

4 创建图书馆大数据架构

大数据技术主要是指从各种各样的类型以及数据信息中,及时有效的获取有价值的技术手段,解决大数据问题的核心就是大数据技术。在运作大数据的时候,技术前倾才是关键。研究人员要将大数据作为一项系统性的工程来看待,从数据采集、数据存储以及数据处理等多个方面进行考虑,而构成图书馆大数据架构如图1所示。

图1 图书馆大数据架构图Fig.1 Big data architecture diagram of library

5 大数据时代下图书馆挑战的应对策略

5.1 实现管理分层,实现标准统一

大数据存在信息量大,资源动态等特性,根据这些特性必须建立相应的运行机制,要有专人负责数据管理,对数据进行标准化划分,实现数据获取、使用、管理、分析一体化、标准化。如此有利于数据库的管理、推介,方面为用户提供服务。

5.2 构建大数据架构,解决数据采集、存储等问题

在大数据时代下,图书名面临的一个重要问题就是基本架构不能适用在大数据之上,因此要建立大数据架构,解决数据的采集、存储、处理等问题。要将大数据中不同格式的数据进行统一、融合,使数据的结构表现得更清晰明了。要满足数据库高可扩展和高可用性的需求,可以采用云计算的分布式存储技术,保证对图书馆数据的统一整合。

5.3 培养高素质的数据管理人员

图书馆要想抓住大数据时代的机遇,就必须具有这方面的人员,这些人员要具备图书馆管理的能力,还应该具备图书馆数据服务需求这方面的素质,要成为学科信息资源的传播者和教育者,为图书馆事业提供有效的帮助,为图书馆的发展而不断的做出努力。

[1] 李凤念.大数据时代高校图书馆受到的挑战及其发展对策[J].农业图书情报学刊,2014,(03):144-145.

[2] 王晴.云计算大数据时代图书馆的挑战与机遇——兼论公共图书馆的应对策略[J].公共图书馆,2013,(01):189-190.

[3] 韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012,(05):131-132.

[4] 周和平.加快实施推广工程建设覆盖全国的数字图书馆服务体系——在数字图书馆推广工程馆长培训班上的讲话[J].国家图书馆学刊,2012,(05):175-176.

[5] 丛培民,龚立武.基于云计算的网站群架构及安全性设计与实践[C]//第26次全国计算机安全学术交流会论文集.2011.

[6] 张文华,冯凯,胡光林,等.云计算及其在图书馆中的应用现状和面临的障碍[J].图书情报工作,2010,(07):165-166.

[7] 熊筱熙,赵欣艳.商业视角的云计算服务研究综述[C]//宽带中国战略与创新学术研讨会(30)论文集.2012.

[8] 苑桂萍,杜慰纯,冯花朴,等.基于云计算图书馆面临的挑战与服务创新[C]//图书馆联盟建设与发展.2012.

Challenges and countermeasures of library in the era of big data

YOU Wei-bo

(Literature and Information Center, Heilongjiang Academy of Social Sciences, Harbin 150018, China)

With the development of the times and the acceleration of the Internet process, the amount of data has shown a linear upward trend. Based on this background, this paper firstly analyzes the basic characteristics and connotation of big data, and then points out its importance in library work. It mainly analyzes the convenience brought by big data in the following aspects: data management, data storage, data mining and so on. Corresponding coping strategies are put forward, hoping to make help for related practitioners.

Big data age; Library; Data management; Data storage; Data mining; Challenge; Strategy

G252

B

1674-8646(2016)24-0150-02

2016-09-22

由薇波(1965-),女,学士,副研究馆员。

猜你喜欢
数据量架构挑战
基于FPGA的RNN硬件加速架构
基于大数据量的初至层析成像算法优化
功能架构在电子电气架构开发中的应用和实践
高刷新率不容易显示器需求与接口标准带宽
宽带信号采集与大数据量传输系统设计与研究
基于云服务的图书馆IT架构
WebGIS架构下的地理信息系统构建研究
第52Q 迈向新挑战
固定资产管理系统对物流管理的促进和发展