大数据服务模式下图书馆服务面临的挑战与思考

2014-03-31 10:47陆定军
湖北科技学院学报 2014年11期
关键词:数据处理图书馆服务

陆定军

(贵州理工学院 图书馆,贵州 贵阳 550003)

随着社会经济的高速发展,科学技术的进步使得网络的进程不断加快,各种信息数据的数量也呈现出了前所未有的递增趋势。国际数据公司IDC 于2011 年发布的统计数据显示,当前,每隔两年,全球信息的总量就会增长一倍。数据的爆炸式增长,极大地超出了人们的想象,也标志着大数据时代的到来。图书馆受到大数据发展的影响是十分巨大的,面临着十分严峻的挑战。因此,对于图书馆管理人员而言,要正确认识大数据带来的环境变化,利用大数据实现图书馆服务能力的提升,从而推动图书馆事业的发展。

一、大数据概述

大数据(Big Data),也称巨量数据,指数据量极其巨大,无法通过现有的主流数据处理软件,在合理时间内进行采集、管理、处理的资讯。从另一个方面来看,所谓的大数据,是需要全新的数据处理模式才能进行处理的信息资产。

大数据是继移动计算、物联网、云计算等信息技术之后的又一个新兴事物,是随着信息技术的发展而产生和发展起来的。从技术上看,大数据与云计算存在着十分密切的关系。由于数据自身的庞大无法通过单一一台计算机进行处理,需要采用分布式架构。大数据的特色在于,以云计算的分布式处理、分布式数据库和云存储、虚拟化技术等为依托,对海量数据进行分布式数据挖掘。

对于大数据的特征存在着很多不同观点,就目前而言,主要包括IBM 公司提出的“3V”特点,即种类(Variety)多、速度(Velocity)快、容量(Volume)大,以及以IDC 为代表的业界归纳出的“4V”特征,即海量性(Volume)、多样性(Variety)、高速性(Velocity)、易变性(Variability)。对其进行综合分析,可以看出,无论何种观点,都认为大数据包含有以下特征:

1.数据体量巨大:这里的“大”指的是数据的规模,由TB 跃升到了PB 的级别(1PB=1024TB=1046576GB)。

2.数据类型繁多:在互联网技术和信息技术不断发展的影响下,当前的数据类型已经不再是单一的文本形式,还包含有大量的网络日志、视频、图片、邮件等大量的半结构化和非结构化数据。

3.价值密度低:大数据中并不是所有的数据都是有用的,或者可以说大部分信息都可以归纳为垃圾信息,只有一少部分有用的信息隐藏在大数据信息中。

4.处理速度快:大数据中包含有许多实时数据,如微博、SNS 等,需要进行即时的分析和处理,因此数据的处理速度极快,遵循相应的1 秒定律。

二、大数据时代图书馆面临的挑战

(一)数据处理的复杂性

在大数据时代,数据处理的复杂性主要表现在三个方面:

1.数据类型复杂

信息技术的发展和应用,使得数据产生的途径不断增加,数据的类型也在不断更新。这就需要开发出相应的数据采集、存储和处理技术。从图书馆方面分析,计算机信息技术的应用,使得电子图书馆逐渐兴起,各种图片、音频、视频数据不断涌现,给数据的管理工作带来了很大的困难。

2.数据结构复杂

传统意义上的数据对象都存在相应的结构,可以在关系数据库中分类存储。但是,在大数据的影响下,数据生成方式的多样化使得半结构数据和非结构数据成为数据的主流形式,其自身的异构性和可变性也给数据的分析和挖掘工作带来了更大的挑战。

3.数据模式复杂

数据规模的增大,使得数据描述和刻画工作的工作量也随之增大,数据的内在模式呈现出复杂化的趋势。一方面,数据类型的多样化决定了数据模式的多样化;另一方面,非结构化的数据中存在着更多的无用信息,在对数据进行处理时,需要采取更加有效的方法,从中提取有用的信息,也使得数据的处理更加困难。

(二)大数据的不确定性

大数据自身的不确定性主要表现在以下几个方面:

1.数据信息

数据本身的不确定性主要体现在原始数据的不准确、数据采集力度、应用需求、展示方式等方面。数据的不确定性会对数据的研究、整理和应用造成很大的困难,传统的数据处理方法无法对不确定性数据进行有效处理,需要对图书馆的数据处理模式进行更新。

2.数据模型

对于不确定数据的处理和建模,一般都是采用“可能世界模型”的观点。这种观点认为,在一定的结构规范下,应该对数据的每一种状态进行详细刻画,以反映数据的实质。该方法存在一定的可行性,但是模型过于复杂,无法以一个相对统一的模型结构,满足实际应用的需求。因此,我们一般会采用简化的模型,对不确定性数据的特征进行刻画,以降低数据处理的难度。

3.数据学习

一般情况下,数据模型需要学习模型参数,需要对其最优解进行求解。在大多数情况下,最优解的求解是十分困难的,只能通过近似的、不确定的方法求出一个相对不错的解。但是,在大数据背景下,这种学习方法存在着许多的问题,如数据处理的速度、处理质量等。对于数据管理人员而言,如何对这种学习方法进行拓展,使其可以充分满足大数据处理的客观需求,是需要重点研究的课题。

(三)资源利用的有效性

如何对资源进行合理有效的利用,是大数据时代图书馆服务面临的重要挑战之一。一方面,传统的网络架构无法适应大数据的需求。传统网络架构属于垂直结构。这种网络架构面对不同地域、不同类型且分布广泛的服务器,无法发挥应有的效果,需要进行改进和更新;另一方面,资源的查找和利用困难。在大数据时代,用户面对众多的数据资源,无法方便、快捷、准确地找到自己需要的数据资料,从而给用户带来很大的困扰。

三、大数据时代图书馆服务体系的变革

(一)创新管理模式

大数据时代并不仅仅是单纯指数据量的巨大,而是可以用数据来表现世界的众多层面,换言之,在大数据背景下,一切皆可量化。维可托·迈尔舍思伯格这样形容:“数据的真实价值就像是漂浮在海洋中的冰山,第一眼只能看到冰山的一角,但是绝大部分隐藏在表面之下”,同时提出了大数据价值链的三大构成部分及数据本身、技能以及思维。以此为依托,可以对图书馆的管理模式进行创新,形成三种不同的大数据图书馆类型。

1.基于数据本身的图书馆,拥有大数据的特征,同时还可以根据实际需要,对数据进行大量收集。

2.基于技能的图书馆,掌握有相应的专业技能、专业性较强,但是并不一定拥有数据,也不一定会对数据进行有效应用。

3.基于思维的图书馆,对此类图书馆而言,无论是数据还是技能,都不是最重要的,图书馆功能的发挥,主要是依靠其创新思维,对数据的新价值进行挖掘。

(二)变革服务理念

大数据对于图书馆的服务造成了巨大的影响,引发了服务理念的变革和创新。大数据时代,图书馆追求更加个性化的服务。一方面,图书馆的服务除了传统服务和数据存储、数据获取服务外,还包括更深层次的数据分析和数据应用。在当前以客户为中心的服务理念下,图书馆的服务不仅需要保留传统的被动式服务,还必须向客户提供主动推送式服务,以确保图书馆功能的充分发挥,提升图书馆的整体服务水平;另一方面,在大数据的影响下,每一个人接受到的数据信息都是个性化的。依靠数据分析,图书馆能够更好了解客户动态信息,了解客户的实际需求,从而进行更具针对性的目标定位,确保每一个客户都可以享受到个性化、立体化的优质服务。

(三)明确馆员定位

在大数据时代,图书馆员的角色也在悄然发生变化。首先,要重视馆员与客户之间的交流和活动。馆员要充分认识到自身的工作特点,加强与客户之间的沟通交流,通过数据分析等方式,了解客户的动态信息,实施一对一的定制服务,使得图书馆员可以充分发挥自身的能力;其次,图书馆员可以在互联网上,建立相应的网站和平台等,对各种组织结构发挥的服务信息和数据需求等进行整理和汇总,并对其进行实时更新,不断扩展图书馆的业务范围;然后,馆员可以通过数据分析的方式,及时发现特定信息需求的客户群,主动提供相应的信息推送服务,以提高图书馆的知名度,提高图书馆的经济效益和价值效益。

(四)创新服务内容

在大数据背景下,图书馆的竞争不仅是资源数量的竞争,更是数据质量、数据类型、数据结构等方面的竞争。在当前信息化时代,图书馆的用户信息具有相当大的价值,如用户的行为数据等,对于图书馆的发展有着巨大的作用和意义。但是,目前许多图书馆服务只有通过对大量用户数据的挖掘和分析,才能得出相应的决策参考,在一定程度上影响了数据应用的效率。因此,图书馆需要积极开展大数据分析服务业务,充分发挥大数据的价值,利用先进的信息技术,对数据分析的方法进行创新,对网络社交等信息行为产生的大量非结构化数据以及半结构化数据进行采集和利用,提高个性化数据服务的精度,从而不断提高图书馆的服务水平。

四、结语

总而言之,大数据已经深入到了我们生活的方方面面,受到了学术界的广泛关注。大数据的发展,对图书馆服务提出了新的更加严峻的挑战,因此,图书馆管理人员应该及时转变观念,充分重视大数据的影响,努力迎接挑战,对图书馆的服务模式进行改进和创新,对其服务体系进行重构,以确保图书馆的持续健康发展。

[1]王元卓,靳小龙,等.网络大数据:现状与展望[J].计算机学报,2013,(6).

[2]孙琳.大数据时代图书馆服务体系创新研究[J]. 理论观察,2013,(4).

[3]刘琼.大数据环境下图书馆面临的影响与挑战[J]. 理论观察,2013,(8):112 ~113.

[4]张学军.大数据视野下图书馆的新走向[J].山东图书馆学刊,2013,(6):32 ~36.

[5]韩翠峰.大数据带给图书馆的影响与挑战[J]. 图书与情报,2012,(5):37 ~40.

猜你喜欢
数据处理图书馆服务
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
图书馆
招行30年:从“满意服务”到“感动服务”
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用
Matlab在密立根油滴实验数据处理中的应用
去图书馆