大数据时代数字图书馆面临的机遇和挑战

2019-12-26 03:54冯海英赵秀敏
文化创新比较研究 2019年9期
关键词:结构化图书馆数字

冯海英 赵秀敏

(吉林省社会科学院图书馆,吉林长春 130033)

随着互联网信息技术的快速发展,学术资源网络建设得到大大提高,削弱了传统数字图书馆的优势。在新形式背景下,图书馆要想实现持续健康、稳定的发展,有必要树立起大数据思维,依托于现代化科学技术条件不断拓宽自身的资源范畴,提高服务品质,以充分满足读者提出的多样化需求,实现在当代社会更好更快地发展。

1 大数据时代的定义和基本特征

目前,国内外学术界尚未针对大数据的概念给出统一定义,各个行业领域基于自身发展视角,对大数据的内涵做出了相应的解释。Gartner认为大数据是一种大容量的、多样化的信息资产,需求新的处理方式,以提高洞察能力和决策优化能力。维基百科关于大数据的定义则显得要相对简单明了一些:大数据是指无法在一定的时间内利用传统的硬件工具、软件或IT技术对其内容进行获取、收集、处理、服务等操作。简而言之,所谓的大数据即是指一种“复杂类型”的“海量数据”,通常涉及两种及以上的不同数据形式,其基本特征包括以下四个方面:

第一,数量大。大数据时代下,数据的量级已然由TB跃升至PB乃至ZB,根据中国云计算调研数据显示,目前我国有超过50%的企业每天生成的数据量超过1TB,有10%的企业每天数据生成量会达到10%以上,这其中便包括图书馆的信息资源数量。

第二,类型繁多。大数据包含多种形式的数据资源,除了传统的文本数据以外,还包括音频、视频、数据库、历史检索记录等信息。大数据时代下,可以是同一个知识存在于不同的数据源中,也可以是同一个数据源分别支持一个或多个的知识、智慧,这就使得大数据时代下数据信息的分析结果存在一定的交叉性。开发者在决策过程中需有意识地对这些数据源进行融合,揭示出不同数据、信息之间的内在联系。

第三,处理速度快。在开放式的大数据环境下,一方面,非结构化的数据增多,增大了数据分析处理的难度;另一方面,这些数据是随机动态产生和实时变化的,需要分析人员以更快的速度进行处理分析,部分数据则更是要求实时分析或准实时分析。

第四,高价值。数据资源本身也是一种资产,通过科学的技术手段对大量数据进行筛选、融合、分析,可以从中挖掘出许多有价值的知识、智慧,将其应用于现代生活与生产领域中能够收获巨大的成果并创造出更多新的价值。

2 大数据技术在数字图书馆的应用

2.1 读者管理

新时期背景下,数字图书馆应与时俱进,利用新媒体技术重新整合读者接触点,由过去的以藏书为中心逐渐向以读者为中心的服务模式过渡转变。借助于大数据分析平台,图书馆能够通过邮件、博客、终端设备、社交网络等途径收集用户的半结构化数据信息,并对其进行分析处理,从而准确了解读者用户的业务需求和阅读动机。此外,图书馆还可以利用聚类分析的方法对读者用户进行分类筛选,甄别出优质读者、一般读者、潜在读者和有流失倾向的读者。例如,在对有流失倾向的读者用户进行分析时,可以通过大数据平台收集其诚信记录、投诉记录、借阅频次等信息,从而对这类读者的行为与心理特征进行分析定位,以便在用户流失前采取相应的挽留措施,维系好图书馆与读者用户之间的关系。

2.2 营销管理

大数据技术应用背景下,图书馆通过大数据平台能够快速、方便地对读者用户的借阅记录、个人身份、搜索方式等数据信息进行宏观全面的分析、跟踪和挖掘,将不同类型的读者进行聚类处理,有助于图书馆人员更加清晰地了解不同类别读者的知识结构、阅读习惯、服务诉求等信息,从而有针对性地推出相应的知识产品服务,打破传统营销模式下无差别、被动化的服务方式。大数据技术在图书馆的应用,不仅大幅度地提高了图书馆信息服务快速营销的水平,还能有效增强读者用户对图书馆服务的满意程度。

3 大数据时代下数字图书馆面临的机遇

3.1 产品多样化

对于数字图书馆而言,提高其自身服务质量水平最简单也是最为有效的方法便是扩大拥有的数字图书馆资源。大数据时代的来临,使得传统数字图书馆的产品变得多元化,不再仅仅是以单一化的文献类型资源为主,而是根据读者用户需求为其提供不同的产品,如教育类资源、智能资源等。同时,大数据分析技术结合多媒体技术的应用还能够根据用户平时的阅读习惯主动为其提供各种科普教育产品或者智库产品,从而为广大读者带来舒适化、人性化和智能化的产品服务,对于提升数字图书馆的核心竞争力而言有着十分重要的意义。

3.2 产品高端化

大数据时代的到来,令未来信息数据的处理过程变得更加繁琐、复杂和难以被利用,但对于数字图书馆而言,也不失为一种机遇。如果图书馆能够准确把握并深入挖掘这些资源的价值特色,了解自身资源库建设中存在的不足之处,并且针对用户的阅读习惯和行为信息进行有针对性地分析,科学合理地分配现有的图书馆资源,使不同层次水平的用户都能够充分使用所需资源,以达到提高图书馆信息服务智能化水平的目的,打造高端化的图书馆产品,使数字图书馆与一般的学术资源商区分开来,得到用户的广泛认可与信任青睐,同时也为将来的创新发展提供无限可能的机会。

3.3 产品服务智能化

大数据技术的应用使得未来数字化图书馆的产品服务更加地智能化。传统服务模式下,数字图书馆提供的服务一直都比较地被动化和僵硬化,难以给读者带来良好的用户体验。用户面对海量的资源信息常常会觉得无从下手,无法及时获取自己所需的信息。大数据时代背景下,对于数字图书馆而言,也是一个重要的发展机遇。图书馆如果能够利用大数据技术对用户的阅读习惯、行为信息进行分析,为其量身制定特色化的产品服务,既能够充分满足用户需求,还能给他们带来良好的服务体验。同时,数字图书馆还应充分把握这一机遇,不断丰富自身的咨询服务方式,主动增进与用户之间的沟通交流,将人工智能回答与专家在线咨询两种服务方式相结合,为用户提供智能化、便捷化的产品服务,从而在用户群体中树立起良好的品牌形象,提高新老用户对图书馆的信任感与忠诚度。

4 大数据时代下图书馆发展面临的挑战

4.1 未来图书馆更倾向于数据分析

数字图书馆存储了大量的结构化、标准化数据,随着网络资源建设渠道逐渐渗透至移动终端、社交网络等媒介,大量隐含在读者用户行为信息中的一些非结构化数据的资源价值正在等待被挖掘。图书馆应充分发挥自身优势,将一些可信度高、专业性强、具有科研借鉴价值的非结构化数据进行有效的整合分析,提高其可行性和经济高效性,进而达到促进知识体系结构横向扩展的目的,满足人们日益增长的知识服务需求。大数据时代背景下,数字图书馆要想提高自身的服务能力和资源建设能力,不能只是单纯地依靠数据更新、资源共享、服务创新等内容,而是要主动利用大数据对收集到的用户信息进行深入分析,挖掘其中隐含的知识规律和潜在价值,并根据分析结果及时调整图书馆相应的服务策略。

4.2 未来图书馆发展更倾向于数据挖掘

数据挖掘是对已发现知识进行有效组织或重构的一种重要方式,也是任何一种类型的信息分析机构所必须面临的课题之一。现阶段,传统数字图书馆的知识服务内容大多还停留在信息检索、收集、分析、传递等层面,只能够对这些数据或信息资源进行简单的利用。尽管如今绝大多数的数字图书馆均已配备了云计算、图书馆2.0等技术以推动图书馆知识服务朝着人性化、结构化与个性化的方向发展,但也只是简单地根据用户的结构化数据来分析其具体表现出来的服务需求和行为习惯的差异性。数字图书馆作为大数据技术的开发者、提供者和直接的使用者与受益者,理应主动深入挖掘资源价值,不仅要根据用户的结构化数据分析其当前的服务需求,还要能够从半结构化、非结构化的数据中挖掘更多的信息,对用户潜在的需求进行预测分析,以便图书馆找到更为先进的服务模式,以有效应对大数据时代发展所带来的严峻考验。

4.3 图书馆服务需求专业化的大数据分析人才

大数据时代下对数据信息的处理分析要求与传统的数据信息处理分析存在较大的区别,过去图书馆所采用的数据仓库、智能分析等方法手段已然难以适应当今社会大数据技术应用发展的需求。就目前大数据技术在数字图书馆的应用情况来看,由于大数据技术需集成语义引擎、人工智能、数据管理、数学算法、可视化分析等多个学科领域的科学技术成果,这就对分析人员的综合素质提出了较高的要求,除了要具备较强的业务理解能力和数据统计能力以外,还应掌握清理、组织大数据的能力。这是因为,在大数据时代背景下,许多数据都是碎片化、非结构化的,缺乏相对固定的模式且价值密度较低,但也正是这些非结构化的数据最能够体现读者用户的实际需求。因此,在未来图书馆发展中需求这样一批精通大数据分析技术的专业化人才,能够深入挖掘读者用户的隐形诉求,将半结构化、碎片化的数据转化为决策支持数据,从而全方位地提高数字图书馆的服务质量水平。

5 结语

综上所述,大数据时代背景下,不仅给数字图书馆的发展带来了新的机遇,同时也使其面临着一系列严峻的挑战。随着大数据技术的广泛普及和深入应用,数字图书馆要想实现持续健康发展,首先应正确认识到自身存在的不足之处,并且要灵活运用大数据技术对已有的资源优势进行整合,不断提高图书馆知识产品服务的质量水平,取得广大用户的信任与支持,从而有效增强自身的综合竞争实力。

猜你喜欢
结构化图书馆数字
改进的非结构化对等网络动态搜索算法
深度学习的单元结构化教学实践与思考
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
图书馆
答数字
数字看G20
去图书馆
成双成对
数字变变变