基于大数据技术的高校数字图书馆资源建设研究

2016-08-11 16:33史少凡杜友君
出版广角 2016年8期
关键词:资源建设数字图书馆大数据

史少凡 杜友君

【摘要】在大数据技术已被广泛应用于生产生活各个领域的今天,本文着重讨论数字图书馆作为高校图书馆领域中最贴近信息和互联网技术的面向,在自身资源建设过程中,如何与大数据技术结合,并进一步探讨大数据时代高校数字图书馆资源建设的发展路径,以及依托大数据技术进行高校数字图书馆资源建设过程中需要注意的问题。

【关键词】数字图书馆;大数据;资源建设

【作者单位】史少凡,河北农业大学图书馆;杜友君,上海体育学院体育新闻传播与外语学院。

【基金项目】河北省高等学校人文社会科学研究项目“数字图书馆服务性建设及其对于先进农村文化建设的意义”研究成果之一。

自1995年正式引进以来,数字图书馆在我国已经走过20多个年头。随着信息和互联网科技的推陈出新,数字图书馆作为一种网络环境下的信息资源组织和服务方式,不断地吸纳和融合新技术、新应用,加快资源建设的步伐。

大数据技术是信息及互联网科技衍生出的新概念和新的数据服务形式。维克托·迈尔-舍恩伯格和肯尼斯·库克耶在《大数据时代》一书中为其概括了“4V特点”,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。在笔者看来,撇开艰涩的理论概念,通俗地说,大数据技术就是基于分析处理(移动)互联网、信息领域日常运作中累积下来的海量数字信息资料,来发现和形成新的服务形式的技术。

如今,大数据技术已被广泛应用于生产生活各个领域,数字图书馆作为高校图书馆领域中最贴近信息和互联网技术的面向,在自身资源建设过程中,必然要与大数据技术结合。本文对此展开初步的探究,以期达到抛砖引玉的目的。

一、“猜你喜欢”——高校数字图书馆在大数据时代的个性化服务

我们在浏览网页或网购商品时,不时可以看到信息提供商推送的“你可能喜欢的商品”“你可能喜欢的视频”等等链接或模块,这些链接或模块往往暗合网民的心意,让人有意想不到的惊喜,这便是时下网络盛行的“猜你喜欢”,其内在的机理正是大数据技术。

“猜你喜欢”的运作机制并不复杂,网络内容提供商依据网民访问网页、搜索商品时留下的种种“痕迹”进行大数据分析,进而对网民的喜好做出“猜测”,并将结果推送给网民。网民访问和搜索的频率越多,“猜测”所依据的数据样本越多,统计学意义上的计算越准确。

如今高校数字图书馆的学生和教师通过网上借阅、搜索、阅读已经十分平常,读者会在访问数字图书馆时留下“痕迹”,久而久之便形成了数字图书馆的大数据。以往,这些“痕迹”大多数被视为无用的垃圾信息,被定期清空甚至根本不做保留“痕迹”的设置,以至于让这些“金子”还没来得及“闪光”就白白浪费掉。但在已经进入大数据时代的今天,保存和分析高校数字图书馆在运行期间留下的大量大数据信息,在认知和技术上已经不存在任何障碍。

大数据给高校数字图书馆提出了新的课题,即大数据分析的目的是什么。一言以蔽之,就是为读者、客户提供个性化的服务,套用时下流行的网络语言就是“猜你喜欢”。

其中的道理其实不言自明,如今阅读工具日益丰富化,阅读习惯日益个性化,数字图书馆使用渠道日益多元化,数字图书馆已经很难满足所有读者的需求。尤其是高校数字图书馆,由于内容提供方面的局限性,在满足互联网时代师生的信息需求方面,捉襟见肘。如何充分开掘自身信息资源、有效绑定读者群,对现在的数字图书馆来说十分有必要。这方面只有一个办法——满足师生的个性化阅读需求,有针对性地提供个性化服务。

了解海量读者的个性化需求,猜读者的喜欢,需要海量的数据计算。在以往单纯依靠人力的时代,这几乎是不可能完成的任务,但基于大数据技术,一切变得简单起来。因此,数字图书馆的资源建设要与时俱进,迎接大数据时代的到来。

二、从内容提供者到问题解决者——大数据时代高校数字图书馆资源建设的发展路径

大数据技术虽已诞生数年,但与臻于成熟的互联网科技相比,只能算是初出茅庐,不过其气场已经昭示出不可限量的发展空间,人们津津乐道的“互联网+”概念,就处处离不开大数据技术。那么,在大数据技术广泛浸入现代生活的当下,理想中的高校数字图书馆应该是什么样子的?换句话说,高校数字图书馆资源建设的发展路径应该是怎样的,如何与大数据技术结合?我们不妨在这里初步探究一下。

为读者提供内容服务,这是包括数字图书馆在内的形形色色的图书馆天经地义的工作职能。但是在自媒体、云计算、大数据技术已经相当普及的今天,仅仅被动地提供内容服务、被动地反馈读者需求,显然远远不够。大数据时代的数字图书馆资源建设,首先需要的是一场“观念革命”,即由被动接受反馈转变为主动提供服务,从过去的“内容提供者”转变为新时期的“问题解决者”。

在展开讨论前,我们有必要厘清数字图书馆信息资源建设所包含的范畴:一是指与数字图书馆活动有关的各类文字、数字、音像、图表、语言等一切信息的总称;二是指数字图书馆主体利用现代技术手段已经收纳或者可以收纳的所有信息[1]。下文中,笔者就在这一范畴内来阐述基于大数据技术的数字图书馆信息资源建设,主要是基于两个“面向”。

1.面向科研教学提供支撑服务

高校图书馆的一个基本职能就是支持科研和教学。在这方面,基于大数据技术的数字图书馆应主动汇总、收集教学科研人员的阅读需求,进而将收集的数据融入图书馆资源建设和系统开发中,以教学科研人员的需求为指针,依据学校科研特色,着力挖掘数字化图书馆的内容资源,开展更有特色的、全面的、有针对性的服务,为学校科研教学工作提供有力的支撑,让更多的有用资源脱离冰冷的书架,让教师在电脑、手机等终端上能更容易地发现和阅读它们,进而将它们与教学和科研工作结合。

2.面向学生提供差别化服务

学生是高校的主体,某种程度上说也是数字图书馆的使用主体。既要依据学校专业特色为培养学生专业型技能提供支撑,又要根据学生生理和心理年龄提供全面的通识教育,是图书馆资源建设面对的重要课题。基于大数据技术的数字图书馆可以说为解决这一难题另辟了蹊径,只要对学生的专业、兴趣、借阅习惯甚至个性癖好进行大数据分析,就不难对整体和个别学生的阅读进行甄别,从而为图书馆资源建设提供依据。当下,越来越多学生“足不出户(宿)”访问学校图书馆、24小时全天候打开手机阅读等行为习惯,勾画出一幅丰富多彩的高校“热点图”。这类似春运期间一些门户网站制作的城市人群出行轨迹图,图书馆应对此善加利用,制作属于学生群体的“热点图”,再“按图索骥”,主动完善数字图书馆内容服务,让学生随时打开手机和电脑,都能得到合心意的个性化内容服务。

三、依托大数据技术的高校数字图书馆资源建设过程中需要注意的问题

1.保护隐私

所谓道高一尺,魔高一丈,大数据技术日新月异,给人们带来一个个不可思议的服务样式,但与此同时,其带来的安全隐患、特别是海量信息收集造成的个人隐私泄密风险,同样要引起我们高度重视。2015年发生的苹果iCloud系统性泄密事件可以说是一个前车之鉴,其所导致的公众人物个人私密信息大规模泄露事件,震惊了世界[2]。

高校数字图书馆应用大数据技术是大势所趋,其所收集到的读者个性化信息正日渐丰富和细致,但同时也面临越来越高的泄密风险,稍有不慎就会被黑客或者别有用心者利用。所以,高校数字图书馆面临的一个重要课题就是保障读者个人信息的安全,可以说信息安全建设重于泰山。

对致力于发展大数据技术并提供相关服务的高校数字图书馆来说,做好信息安全保障工作,一是要积极采用互联网安全方面的最新科技成果,构筑符合自身系统特点的网络防火墙。在这方面,国内已经有相当成熟的系统性解决方案,如北京邮电大学为数字图书馆开发的网络安全系统等。二是要积极延揽网络安全方面的人才。目前,大多数高校数字图书馆技术部门的人才构成仍偏向于内容建设和系统搭建,未来,除了在上述方面继续发力,高校图书馆应考虑逐步向系统搭建与信息安全并重的方向推进,甚至应对安全性有所倾斜,以适应越来越复杂的网络信息安全环境。

只有在硬件(网络信息安全系统及防火墙)和软件(网络安全人才)都相对完备的基础上,基于大数据技术的高校数字图书馆才能建构一个牢靠坚实的平台,防患于未然。

2.增强互动

如前文所述,基于大数据技术的高校数字图书馆可以“猜你喜欢”,可以提供差别化的服务,但即便是能够满足这些条件的数字图书馆,其内容服务水平也可能差距很大,产生差距的关键主要在图书馆(内容/服务提供方)和读者(内容/服务接收方)互动性的强与弱上。

钟情于移动互联网和数码科技的用户,对小米公司近5年来从诞生到迅速崛起的故事应该有所了解,小米快速成长的基础就是所谓的“粉丝文化”。粉丝既是小米产品和服务的消费者和使用者,反过来又对小米公司改进产品和服务提供意见反馈。在一来一往中,双方形成了一种良性的互动,即公司在不断的用户反馈中持续改进服务,用户在服务的不断改进中得到使用上的满足。

事实上,让用户参与“服务改进计划”是很多公司都在进行的工作,但对这项工作特别看重和真诚投入的,恐怕就没有几家了,这也是小米区别于其他公司取得成功的关键。

依托大数据技术,高校数字图书馆可以相对轻松地了解师生的基本信息,如学历、年龄、兴趣爱好等,但对细微的个人情感、阅读习惯的把握却很难精准。这个时候,我们需要借鉴小米公司的经验,将大数据技术和移动互联技术紧密结合,并与用户充分互动。

首先,数字图书馆非常有必要建立自己的社交账号和平台,如微信公众号、官方微博账号等,这是在移动互联时代与师生沟通的基本渠道。数字图书馆既可以在社交媒体上及时发布自己的信息,如活动安排、推荐书单等,也可以开放留言,让师生充分参与到数字图书馆的资源建设中,对图书馆内容或服务建言献策。传统的论坛、留言本等网络平台也不妨保留,对一些有着较深图书馆情怀的老读者而言,这是他们发言的空间。

其次,有条件的高校数字图书馆可以着力开发自己的手机和平板电脑客户端(App),供学生下载使用。如今社会已经步入移动互联时代,从2015年开始,中国手机上网网民数量历史性地超过了电脑,高校师生无疑是领风气之先的群体,因此,高校数字图书馆在这方面必须与时俱进,跟上移动互联网的技术浪潮。高校数字图书馆可以针对安卓和苹果两大主要手机操作系统开发App,技术成熟之后还可以针对iPad等平板电脑开发App,甚至可以与Kindle等电子阅读平台合作。此类客户端开发和运营成本并不高,但效果却是显而易见的,一方面,可以随时随地给师生提供精神食粮,大大方便他们阅读,另一方面,师生只需动动手指就可以轻松地把自己的想法反馈给图书馆,图书馆再根据师生的反馈信息,利用大数据技术进行批次处理,将结果细化到后面的服务中,从而形成一个“图书馆—师生”的双向、良性互动格局。这样美好的图景并非纸上谈兵,只要高校数字图书馆及时行动起来,用心经营,就不难实现。

大数据技术可以说是为互联网特别是移动互联网而生,在人类社会已经步入移动互联网时代的今天,高校数字图书馆势必要与时俱进,拥抱这个朝阳般的技术,并活化运用到自身的资源建设中来。高校图书馆运用大数据技术,不仅可以在同业竞争中处于领先地位,更重要的是可以随时随地为师生提供一流的内容服务,更好地服务于日常的教学和科研工作。

[1]黄俊. 加强数字图书馆资源建设的思考[J]. 河南图书馆学刊,2013(2):86.

[2]腾讯财经. 美国多位女星私密照遭泄露 iCloud遭质疑[EB/OL]. http://tech.qq.com/a/20140901/028072.htm,2014-09-01.

猜你喜欢
资源建设数字图书馆大数据
保定旅游资源建设现状及存在的问题研究