基于档案用户小数据的精准化档案信息服务探析

2018-09-10 07:22李财富余林夕
档案与建设 2018年8期

李财富余林夕

[摘要]精准化档案信息服务是在传统档案信息服务模式的基础上,利用档案用户小数据能精准反应其个体特征的特点所提出的一种服务模式。论文从小数据、档案用户小数据和精准化档案信息服务的概念出发,对该种服务模式进行了可行性分析,阐述了精准化档案信息服务的特点和所需关键技术,并提出了实现精准化档案信息服务的业务流程:包括对档案用户小数据的采集、存储、分析、挖掘、利用以及档案用户的评价和反馈,最后提出精准化档案信息服务过程中应注意的问题。

[关键词]个体资料智能数据挖掘隐私保护资源建设用户画像

[分类号]G273.5

Analysis of Precision Archives Information Service Based on Small Data of Archives Users

Li Caifu,Yu Linxi

(Management School of Anhui University,Hefei,Anhui,230601)

Abstract: Precision archives information service is a new service model based on the traditional archive information service model,which uses the small data of archives users to precisely reflect the characteristics of individual user characteristics. This article starts with the concept of small data,small data of archives users and precision archives information service,and analyzes the feasibility of this kind of service model,elaborates the features of the precision archives information service and the key technologies required,and proposes the business process of realizing precision archives information services: including the collection,storage,analysis and mining of small data of archives users,the use of small data and the evaluation and feedback of archives users. Finally,this paper puts forward issues that should be noted during the precision archives information service.

Keywords: Personal Data; Intelligence; Data Mining; Privacy Protection; Resource Construction; User Portrait

大數据具有大规模、高速度和多样性等特点,利用大数据能快速发现用户的需求变化并预测市场的发展趋势。然而,档案部门利用大数据对档案用户的信息需求分析并非完全准确。与大数据相比,小数据更能准确反映个体需求,从而为档案部门提供精准化档案信息服务提供了依据。因此,探讨基于档案用户小数据的精准化档案信息服务有着重要意义。

1相关概念界定

1.1小数据与档案用户小数据

小数据又称个体资料,是个体的全方位数据,包括个体的身份特征、知识结构、信息需求、行为方式和心理倾向等方面的数据。通过对小数据的分析可以实现对个体行为和需求等各方面的分析和预测。德波哈尔·艾斯汀教授最早认识到小数据的重要性,认为通过个体的行为数据能总结出个体行为规律[1]。

档案用户小数据是指不同类型的档案用户在利用档案信息资源的过程中产生的能展现用户行为需求等特征的各种数据的集合,根据档案用户小数据的特点和利用行为过程可将其种类划分为三种类型:档案用户个体特征数据、档案用户行为数据、档案用户社会化及共享数据[2]。

1.2精准化档案信息服务

目前,对精准化档案信息服务的概念尚无统一界定。本文在图书馆学领域精准化信息服务概念的基础上,对精准化档案信息服务做出如下定义:精准化档案信息服务是根据档案用户个体化档案信息需求的特点,贯彻“以人为本”的服务宗旨,建立起以档案用户个性化需求为导向并提供针对性和差异化服务的一种服务模式[3]。因此,精准化档案信息服务是在传统档案信息服务的基础上,以提供个性化服务为核心,把研究方向由用户的共性特征转变为用户个体的行为特征,采用科学的方法和相应的技术,利用档案用户小数据为其提供具有针对性的个性化服务,以达到精确服务的目的。

2精准化档案信息服务的可行性

2.1档案信息服务观念的转变

随着档案事业社会化的发展,人们认识到传统的档案信息服务受到时间和空间的局限,必须转变档案信息服务观念,打破被动、单一、封闭的服务模式。如今的档案信息服务倡导以用户需求为中心、变被动为主动、实现更大范围信息资源共享的服务观念,这与精准化档案信息服务是以根据档案用户小数据的个体化需求从而提供精准服务的目标相契合。因此,如今档案信息服务观念的转变为实现精准化服务提供了可能。

2.2档案部门服务条件的改善

档案信息服务的日益发展使得档案部门规模不断扩大,实体和虚拟相结合的馆藏资源体系逐步建立起来。档案部门在基础设施条件上也加大资金投入,相关档案信息网站、检索工具都更加人性化,方便用户检索。此外,档案部门重视人才队伍建设,制定规范的业务流程,提高了档案信息服务效率。

2.3现代信息技术的支持

在网络环境下,各领域深层次的发展都离不开现代信息技术的支撑,档案部门得以应用信息技术提供更加完善的档案信息服务,比如用户画像技术能对用户个体特征进行准确定位分析;数据挖掘技术能深层次挖掘有效的档案用户小数据;此外,还能追踪用户操作性信息,根据用户需求主动提供推送服务等。这些信息技术能更好地满足用户信息需求,是档案部门提供精准化档案信息服务的重要保证。

3精准化档案信息服务的特点及关键技术

3.1精准化档案信息服务的特点

(1)提供个性化服务是精准化档案信息服务的核心

如今,用户的服务需求和心理诉求日益多样化,档案信息服务也朝着个性化的方向发展。精准化档案信息服务的核心是在精准分析档案用户需求的基础上向用户提供个性化服务,因此需要对为用户提供的服务环境、服务过程和用户小数据的特征进行深入的研究,而这些研究都可以作为制定个性化服务的依据,最终建立起“用户至上”的精准化档案信息服务模式[4]。

(2)精准化档案信息服务具有主动性

精准化档案信息服务与传统档案信息服务的区别是主动的感知和获取不同类型用户的信息需求。其主动性主要表现在以下方面:一是通过跟踪和预测用户潜在的档案信息需求和关注方向等,主动向用户提供能满足需求的针对性服务;二是抓住精准化服务的核心,根据不同的用户在档案信息需求中的差异性,分别提供不同的服务方式和内容,一对一进行服务。

(3)精准化档案信息服务具有智能性

由于档案用户的知识背景不同,并非每个人都具备专业的检索技能和相对丰富的检索经验,因此,有时档案用户检索到的信息并不能真正满足其需求。精准化档案信息服务的智能化表现在利用现代信息技术提供智能化服务,比如:智能代理技术能够对用户的小数据进行跟踪并实时捕捉用户的兴趣偏好,我们从中可以分析出用户的意图,再结合智能化推荐、过滤等服务方式进一步提高服务方式的智能性[5]。

(4)精准化档案信息服务具有高效性

精准化档案信息服务,使用户能够高效、快捷地获取所需的档案信息资源,提高了用户检索的查全率和查准率,也让档案部门的服务方式与时俱进,使现代的档案部门真正成为了信息服务部门[6]。此外,精准化服务提供的个性化资源推荐和差异化的路径选择也提高了各档案服务机构的服务效率。

3.2精准化档案信息服务所需的关键技术

(1)用户画像技术

用户画像就是给用户贴标签,是某个用户所有信息标签的集合,能为精准快速地分析用户的社会属性、行为趋势、兴趣爱好等提供数据基础。用户画像通过用户真实的数据将个体虚拟化,这些真实的数据就是档案用户的小数据。用户画像技术能为用户提供一个符合用户心理倾向、知识结构的精准化服务环境,满足用户的特定需要,使其能够准确快速地获得所需的档案信息。

(2)数据仓库技术

数据仓库概念创始人W.H. Inmon在《建立数据仓库》一书中将数据仓库定义为面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中的决策制定过程[7]。数据仓库技术将提取、整理、分析得来的大量数据集成于相关的数据结构中,既可以方便用户对信息资源的访问,也可以方便对用户的历史数据进行分析,从而了解用户的行为趋向。在精准化档案信息服务中运用数据仓库技术对档案数据资源进行整合,可以实现档案信息资源的合理和高效运用。

(3)数据挖掘技术

档案部门在精准化档案信息服务中利用数据挖掘技术,从用户的信息中提取出具有潜在价值的信息,了解用户的特征。需要注意的是,挖掘的数据来源必须是用户真实的数据,并且是大规模,含有噪声的数据。挖掘出的数据是用户感兴趣的且能为满足用户需求提供服务的数据。

(4)智能代理技术

智能代理技术发展于人工智能领域,后也被应用于其他的信息服务业。在精准化档案信息服务中,智能代理技术一方面可以和数据仓库技术一样对档案馆的信息资源进行集成化管理;另一方面可通过对用户小数据的分析了解用户的行为日志、评价反馈信息等,智能代理技术根据这些信息表达出用户的信息需求,制定科学的信息服务方式和策略,向用户提供精准化的信息和服务。

4精准化档案信息服务的业务流程

精准化档案信息服务就是在采集、存储、分析、挖掘档案用户小数据的基础上,预测和确定不同类型档案用户的差异化档案信息需求,使服务更加精确化、深入化、细致化、差异化,提升用户满意度,从而提高档案部门的服务能力。

4.1档案用户小数据的采集

档案用户小数据的采集是精准化服务的第一步。随着科学信息技术的发展,无论是在传统档案部门获取所需信息的实体档案用户还是在数字档案馆上获取信息的虚拟档案用户,档案部门都可以方便、安全、经济采集相关用户的个体特征数据。而这些数据都是用户在实体或虚拟空间上接受各种服务时产生的能够全方位、全过程反映读者表达和行为感知的所有可利用原始数据,可分为用户个体特征数据、用户体验数据、社会化及共享数据这三个层次内容[8]。

用户个体特征數据主要来源于档案部门网站、集成服务系统等。它包括用户进入档案部门办理的各种登记信息,比如姓名、性别、年龄、联系方式等;还包括用户的社会关系特征数据,比如职位、职称等。用户体验数据主要来源于服务监控设备、传感器网络等。它包括用户登陆系统、选择检索路径、查询关键词、调卷、复制摘录等的信息[9]。此外,还包括用户的参考咨询和服务满意度评价的信息。对社会化及共享数据的采集来源于虚拟的网络平台,如档案用户在利用微信、微博等社交媒体发布档案信息资源时,要首先登陆个人账号和密码,在浏查、利用、传播档案信息资源的过程中会产生、遗留用户利用的数字痕迹[10]。从这些数据来源中都可以采集到所需的档案用户小数据。

4.2档案用户小数据的存储

采集到的数据应存储到特定的用户专用数据库中,其准备工作包括如下几点:一是为了保证采集和存储的档案用户小数据的质量,需要对信息进行加工,对数据进行过滤,去除数据中的噪音;二是应将不同档案需求的用户数据存储在专用的虚拟数据库,从而方便用户进行检索;三是在存储用户数据的时候要遵循有利于数据更新的原则,要方便于用户小数据后续的补充;四是要确保数据安全。对于用户小数据的分析,可能会涉及用户隐私的问题,档案部门应该确保数据的安全合理使用。因此,在进行用户数据存储的时候要对数据库进行加密,有一定的权限限制,保护用户的隐私,更好满足用户需求。

4.3档案用户小数据的分析

档案用户小数据的分析贯穿于整个精准化服务的过程。档案用户小数据是以用户个体作为唯一数据采集、处理、分析和服务的对象。因此,利用小数据提供服务对数据的精准性、个性化和隐私性要求较高,所涉及的内容包括用户的社会关系、工作与生活环境、以及用户个体所处的地理位置、移动路径和检索内容等隐私数据,此外,利用小数据提供精准化服务是档案部门从摆脱传统的主观经验性主义,向“以用户需求为中心”理念指导下服务方式转变的重要依据[11]。用户小数据的分析结果直接决定了精准化服务的质量,因此要综合运用前文所述的用户画像、数据挖掘等技术对同一个档案用户的不同利用数据进行整合,剔除数据杂音,对数据进行优化,提取出能体现出用户需求有价值的信息,便于向用户提供精准化的服务。

4.4档案用户小数据的挖掘

档案用户小数据的挖掘一部分是对用户身份特征数据的挖掘,这部分数据是相对静态的;其次还要对用户行为数据和反馈数据进行挖掘,这部分数据是动态变化的,可以反映用户需求趋势,这是挖掘的重点。具体来说,对档案用户小数据的挖掘可着手于以下方面:对档案用户身份特征数据的挖掘主要来源于档案用户在档案部门登记的信息以及进行档案查询系统时留下的注册信息;而对于用户行为数据和反馈数据的挖掘重点是追踪用户行为痕迹,对用户的检索目录和浏览记录进行统计分析,推测用户兴趣和研究方向,还要统计分析用户检索频率高的关键词,完善和丰富数据库中的关键词和档案资料,提高档案用户的查全率和查准率,此外还可以对用户访问网页时间等信息进行深度地挖掘。

4.5利用档案用户小数据提供精准化服务

对档案用户小数据进行采集、分析、挖掘等的最终目标都是明确档案用户的信息需求,并在向用户提供针对性服务的基础上不断创新档案信息服务内容和方式,提升用户的满意度。向档案用户提供精准化服务主要包括用户权限管理、个性化定制、利用“数字足迹”追踪服务等这几个方面。随着档案部门向数字化的方向发展,用户也越来越多的通过档案系统查询所需要的信息,这样我们可以对档案用户的权限进行管理,除了让用户有正常的查询浏览功能以外,可以为有高级需求的客户设置登录系统功能,让用户在系统中有自己的“个人空间”,可以看到自己以往的检索浏览痕迹,还可以看到自己感兴趣的资源列表及智能预测出自己的研究方向[12]。向档案用户提供个性化定制服务也是精准化服务内容之一,其中包括用户数据库的定制、服务系统的定制、服务界面的定制。以此提高系统搜索引擎的精准度、信息检索的智能化,避免用户操作界面单一等缺陷。档案用户的“数字足迹”是用户在登陆系统、浏览查询、借阅等过程中留下的信息痕迹,而这些痕迹在一定程度上反映用户的偏好和对用户以往查询的记录。对这些真实的数据进行追踪,可以与用户保持持续的联系,为其提供更精准的服务。

4.6档案用户的评价和反馈

档案用户的评价和反馈,是衡量档案部门精准服务质量的重要指标,也是档案部门发展的推动力。精准服务是一个不断发展的动态过程,对精准服务的效果评价是进一步提高服务质量的依据。为此,档案部门要综合各个方面的因素,制定科学的评价标准。档案部门根据档案用户评价的数据指标,能发现在向档案用户提供服务的各环节存在哪些问题并给予解决,最重要的是能根据不同用户的评价内容为其进行精准服务[13]。用户把对档案部门提供精准化服务的感受、意见进行反馈,档案部门再根据反馈的信息不断进行服务方式和内容的调整,既能更好地满足用户的需求,也能促进档案部门的发展。因此,建立用户的评价体系和反馈机制,是精准化档案信息服务的过程中不可或缺的一部分。

5精准化档案信息服务应注意的问题

目前,基于档案用户小数据的精准化档案信息服务尚处于理论探讨阶段。总体而言,在实施精准化档案信息服务过程中应注意以下几个问题。

5.1用户信息安全与隐私保护

精准化档案信息服务是根据对用户小数据的分析而提供有针对性的精准服务,在精准化档案信息服务业务流程的各个环节都涉及档案用户个人信息,这些信息与用户切身利益息息相关,因此,用户的信息安全和隐私保护是重点工作内容。为此,档案部门要应用保护用户隐私的安全技术,既要对用户身份进行安全认证,对不同等级的档案用户设置相应的使用权限,也要对用户信息进行加密,防范用户信息被窃取造成用户信息的泄露,保障用户的隐私安全。

5.2提高档案工作者的综合素质

如今的档案服务越来越专业化和智能化,档案工作者在提高精准化档案信息服务质量过程中发挥着重要的角色。档案工作者不仅要有服务意识上的转变,由被动的档案保管者转变为主动的档案服务参与者,改变传统机械的工作方式,积极探索用户潜在的信息服务需求,而且更要在精准化档案信息服务中成为主导者,提高专业技能的同时丰富知识结构,全面提高档案工作者的业务能力和综合素质。

5.3加大档案信息资源建设

精准化档案信息服务旨在向用户提供针对性精准化服务,档案部门要建设高质量完备的信息资源体系,切合实际档案服务的需要,也为基于档案用户小数据的精准化档案信息服务提供信息资源保障。档案部门要在实体资源建设的基础上,加大对数字资源的开发。档案部门还要根据自身条件和馆藏情况,建立以用户需求为中心的特色专题数据库,提高用户利用档案资源的积极性,最大限度地满足用户的档案信息需求。

参考文献

[1][9][10]马双双.基于小数据的我国档案信息资源个性化服务研究[J].图书馆学研究,2018(4):86-91.

[2]吕元智.基于小数据的数字档案资源知识集成服务研究[J].档案学通讯,2016(6):47-51.

[3]牛勇.图书馆精准服务研究[J].图书馆学研究,2016(5):50-52.

[4]唐斌.图书馆精准服务:内涵、机制与应用[J].图书馆工作与研究,2017(5):9-13.

[5]唐佳欣.数字档案馆个性化服务研究[D].武漢:华中师范大学,2017.

[6]张笑宇.以用户需求为导向的档案信息服务研究[D].保定:河北大学,2012.

[7]卞昭玲,赵文博,谢海洋.数据仓库技术与数字档案馆建设[J].兰台世界,2010(10):17-18.

[8]刘庆麟.基于小数据的图书馆精准服务研究[J].图书馆工作与研究,2017(5): 45-50.

[11]陈臣.基于小数据决策支持的图书馆个性化服务[J].图书与情报,2015(1):82-86.

[12]郭萃,陆姗姗.数字档案馆个性化信息服务模式探究[J].信息系统工程,2017(1):58-59.

[13]裘惠麟,邵波.图书馆精准服务研究现状及发展策略[J].图书馆学研究,2017(16):2-7.