大数据时代图书馆服务平台建设研究

2019-12-12 02:26郑光凤
河南图书馆学刊 2019年11期
关键词:隐私保护图书馆服务数据处理

关键词:大数据;图书馆服务;数据处理;隐私保护

摘 要:文章简述了大数据的内涵,分析了大数据给图书馆带来的机遇和挑战,提出了图书馆建设大数据服务平台的思路。

中图分类号:G253文献标识码:A文章编号:1003-1588(2019)11-0053-03

1 背景

全球已经进入大数据时代,互联网上的数据量每两年会翻一番。大数据作为信息时代新的财富增长点,受到国内外众多知名信息企业的青睐,对大数据的研究与应用层出不穷。2011年5月,麦肯锡公司在《大数据:创新、竞争和生产力的下一个前沿领域》中首次提出了大数据的概念,并指出数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。2012年3月22日,奥巴马宣布美国政府投资2亿美元启动大数据研究和发展计划,将大数据研究上升为国家战略。2017年5月14日,习近平在“一带一路”国际合作高峰论坛讲话中提到,要坚持创新驱动发展,加强在数字经济、人工智能、纳米技术、量子计算机等前沿领域的合作,推动大数据、云计算、智慧城市建设,连接成21世纪的数字丝绸之路。党的十九大也明确提出推动互联网、大数据、人工智能与实体经济深度融合。大数据研究已逐渐上升为我国国家战略。

2 大数据的内涵

大数据是结构化数据、半结构化数据和分结构化数据的综合,其特点主要体现在以下几点:①数据集合规模不断扩大。②数据类型繁多、数据多样化。③数据传输速度快。④数据多以数据流的形式动态产生,具有很强的时效性。人、机、物的高度融合引发数据规模的爆炸式增长和数据模式的高度复杂化,全球已进入网络化的大数据时代。大数据的增长来源主要包括:一是对以数据为中心的传统学科(如基因组学、蛋白组学、天体物理学和脑科学等)的研究所产生的数据,尤其是互联网的发展使实验室之间大量传输的数据呈几何级增长。二是互联网。互联网与人们的生活紧密联系,由此产生的数据呈爆炸式增长。《2017年全球数字报告》显示,全球各种社交网络的总用户规模为30.28亿人,全世界有40%的人口在使用社交网络,庞大的互联网用户群产生的数据量是惊人的。IDC发布的《数据时代2025》白皮书预测,2025年全球的数据量将达到163ZB,是目前的10倍。三是传感器和物联网行业的蓬勃发展。智能家居、智能交通、智能电网、智能工业、智能农业等的蓬勃发展都在网络上产生了大量的数据。

3 大数据给图书馆带来的挑战和影响

大数据的“大”不仅体现在存储数据多,更体现在对海量数据的挖掘和应用上。大数据之“大”,并不仅仅指“容量大”,其意义更在于通过对海量数据的交换、整合和分析发现新的知识、创造新的价值,带来“大知识”“大科技”“大利润”和“大发展”。因此,图书馆在数据化进程中一定要以用户为中心提高数据的使用效率,并通过分析用户习惯实现数据的精准推送。

3.1 大数据的质量是图书馆不可回避的问题

大数据时代,图书馆的数据来源呈现多样化,数据量不断增加,图书馆要实现数字到数据的转变必须解决数字资源的合理配置和利用,最终提升其服务质量。图书馆将数字化资源转化为可利用的数据资源,不仅可以方便用户获取,同时还能避免出现“数字孤岛”。近年来,随着我国图书馆事业的发展,数字化、网络化、智能化等服务已成为图书馆服务的主要内容,国家数字图书馆工程、中国高等教育文献保障系统(CALIS)、大学数字图书馆国际合作计划(CADAL)等数字资源建设共享项目及自建特色数据库、机构库等都丰富了我国图书馆的馆藏数字资源,为图书馆拓展服务提供了资源基础和机制保障。相关调查发现,目前我国图书馆的数字化服务还是以数据库和纸质资源的数字化为主,大多为结构化数据,对后期数据处理及信息挖掘的可利用性不高,不能满足数据分析的要求。

3.2 大数据的处理和挖掘是图书馆提升服务的基础

大数据时代,图书馆面临向知识服务和知识共享转型的挑战。用户对知识和服务的精准化需求,促使图书馆构建以互联网信息搜索和查询为基础的知识信息服务模式。不论是简单的知识信息服务还是集信息检索、组织、分析等高级业务素养的知识信息服务,都是图书馆以数据为基础开展的服务。图书馆不仅需通过结构化数据了解用户的当前需求,同时更需利用大量的非结构化数据、半结构化数据对用户的未来需求进行挖掘、分析和预测,从而提供更好的服务模式。

3.3 大数据时代用户的隐私信息保护问题

大数据时代,图书馆若想提供精准化的服务,就不可避免地需要掌握用户的身份、阅读偏好等个人数据信息。用户数据信息采集的完整性、挖掘的深度及分析利用的程度在一定意义上决定了图书馆服务的准确性和易接受性。图书馆通过用户个人信息采集、传感器采集、用户社交网络互动及与其他数据平台资源共享等方式获得用户的隐私数据,且多是图书馆主动采集、用户被动接受,用户隐私数据的所有权、使用权、控制权和监督权等都十分模糊,给读者隐私安全带来隐患。因此,图书馆不能为了追求服务质量和个性化服务效果而忽视对用户数据信息的保护,应加强对用户数据信息的使用目的和方式的监管,并保证用户对使用其隐私数据的知情权。

4 图书馆大数据服务平台的设计

4.1 泛在化设计理念

泛在化服务是一种面向用户提供全方位、智能化的无处不在的服务理念和模式,倡导用户在哪里服务就在哪里。泛在化服务理念对图书馆的信息资源建设和组织提出了新的要求,图书馆要有效利用现有资源,强化特色资源建设,积极实现资源共享,构建多元立体的资源利用体系。用户的满意度和认可度是图书馆建设的最终目标,“互联网+”、物联网及传感器技术等可帮助图书馆实现面向用户的精确推送和个性化服务,其泛在化服务应始终以用户为中心。因此,图书馆的大数据平臺设计应坚持“用户至上、需求推动服务”的理念,用技术满足需求,以发展提升服务。

4.2 基础平台设计

大数据作为一种新兴技术,目前尚未形成完备的标准技术体系。笔者结合图书馆与大数据的融合方式提出了图书馆大数据建设的参考架构,该参考架构由八个层面、两大体系及外部支撑构成。其中,八个层面由平台基础设施层、数据源层、数据集成层、数据存储层、数据管理层、数据应用层、展示层、用户层等组成;两大体系包括标准规范体系和安全管理体系。

从构成上看,该参考架构是由不同概念层级的逻辑构件组成,这些逻辑构件被划分为三个层级,从高到低依次为角色、活动和功能组件。最高层级的逻辑构件是角色,包括系统协调者、数据提供者、大数据应用提供者、大数据框架提供者、数据消费者等;第二层级的逻辑构件是每个角色执行的活动;第三层级的逻辑构件是执行每个活动需要的功能组件。一方面,图书馆应加强大数据平台的硬件建设,提升数据采集和存储能力。硬件建设是图书馆大数据平台的基础工程,负责处理与数据提供者的接口和数据引入,实现与用户及相关网站的资源交互,保障平台的稳定性和流畅性。另一方面,图书馆应建设满足大数据应用和符合大数据技术特点的数据中心,利用ETL、实时数据采集、云计算、云存储、HADOOP体系架构等技术构建数据集市和数据仓库,实现数据的快速获取与应用,为大数据应用提供技术支撑。同时,图书馆还应构建满足大数据应用的数据资源管理体系,加快数据匹配与对外接口的数据融合,实现数据资源的共享;加快数据资源整合,促进数据共享,形成统一规范的数据定义,消除“信息孤岛”;建立数据资产处理制度、数据资产分析规则及数据资产元数据标准,规范数据资产说明;建立和发布数据资产目录及数据资源管理与服务机制等。此外,图书馆还需开展数据应用提升服务质量,通过对数据的挖掘分析为大数据应用提供经验;积极探索数据利用的标准化,提升数据的利用效率;加强外部数据的获取和应用,拓展数据渠道,全方位、多渠道利用相关数据为用户提供有效服务。

4.3 安全与隐私保护

图书馆构建大数据管理平台时,需根据相关的法律法规和行业规范制定合理、有效的用户隐私保护制度和策略,明确用户数据采集的范围、目的和方法,保证用户隐私数据采集合法透明;设立专门的监督机构,对用户隐私数据的采集和利用进行管理和监督;告知用户采集数据的内容、目的及使用范围等,保障用户的知情权。此外,图书馆构建大数据管理平台还需从数据层和应用层两个方面强化用户的隐私保护。在数据层方面,数据库作为大数据服务平台的信息主体,存储着大量的用户信息,图书馆既要防范来自外部入侵者的威胁,也要杜绝来自系统内部人员的窥探,如未授权的数据查看、不正确的数据修改以及数据的不可用性等。因此,图书馆保证数据库安全需加强物理安全、操作系统安全、DBMS安全以及数据库加密等。云存储作为大数据存储的主要手段,应在云计算的各个环节做好数据加密、身份认证、访问控制等隐私保护措施。在应用层方面,用户的隐私信息不仅包括个人信息,也包括交流信息。因此,图书馆要想实现信息的保护,必须保证大数据平台采集的信息是用户知晓并同意的,同时保证只有被用户授权的人才可以获取相关信息。

5 结语

图书馆作为社会信息服务中心,正逐步向信息共享、服务共享的方向发展,其在大数据时代应以数据为推动服务的引擎,实现高效精确的服务,以“互联网+图书馆”的深度融合激发图书馆强大的发展动力。

参考文献:

[1]涂子沛.大数据[M].桂林:广西师范大学出版社,2012:54-58.

[2]王天泥.大数据视角下图书馆的发展对策[J].图书馆学刊,2013(3):42-44.

[3]韓翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(5):37-40.

[4]马晓婷,李凌.基于大数据的图书馆用户个性化隐私保护策略[J].现代情报,2014(3):60-62.

[5]初景利,吴冬曼.论图书馆服务的泛在化:以用户为中心重构图书馆服务模式[J].图书馆建设,2008(4):62-65.

[6]刘雅辉,张铁赢,靳小龙,等.大数据时代的个人隐私保护[J].计算机研究与发展,2015(1):229-247.

(编校:徐黎娟)

收稿日期:2019-10-10

作者简介:郑光凤(1985— ),南京图书馆助理馆员。

猜你喜欢
隐私保护图书馆服务数据处理
电容式传感系统数据处理电路的设计
基于ARCGIS 的三种数据处理方法的效率对比研究
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
视频大数据处理的设计与应用
“国际视野中的大学图书馆发展研究高端论坛”综述
大数据环境下用户信息隐私泄露成因分析和保护对策
大数据安全与隐私保护的必要性及措施
浅谈工匠精神在高校图书馆服务中的传承
浅谈阅读推广活动的探索与实践