基于小数据的图书馆个性化服务研究

2016-02-13 02:50王昊
图书馆学刊 2016年6期
关键词:个性化图书馆分析

王昊

(辽宁省图书馆,辽宁 沈阳 110015)



基于小数据的图书馆个性化服务研究

王昊

(辽宁省图书馆,辽宁 沈阳 110015)

[摘要]在现阶段,大数据研究正在对各行各业在企业管理决策、组织和业务流程优化起着重大作用,提出了将小数据应用于图书馆管理决策中,构建个性化服务体系,并对基于小数据的图书馆个性化服务策略进行了深入地探讨。

[关键词]大数据个性化服务小数据应用

在互联网技术高速发展和智能终端广泛普及的今天,行为数据、生活数据、金融数据以前所未有的速度迅速积累,基于这个生态链条孕育而生的大数据(Big Data)研究正在对各行各业在企业管理决策、组织和业务流程优化起着越来越重要的作用。

在我们看到大数据应用价值的同时,应该注意到大数据开发、保存和分析需要耗费大量的资源和巨大的成本,以及面临大数据结构复杂、存储成本高、数据处理庞大、隐私外泄和信息安全威胁等实际问题[1]。从而,小数据(small data)的研究应运而生,小数据是以个人为中心的全方位数据,它是基于个体的数字化信息的一类新兴数据,若将小数据的研究应用于图书馆,并以单个读者作为研究对象,对读者借阅等行为数据的采集和其他维度数据的分析和挖掘,对图书馆智慧化服务实现互联、高效、便捷管理将产生重要的推动作用。

1 小数据及其现状

1.1小数据及其特征

美国康佘奈尔大学Estrin教授于NIPS2013(智能信息处理国际)会议上,做了一篇题为《Small,n=me,Data》的报告。她提出使用者在使用移动设备过程中会产生了大量用户行为数据,通过对这些广泛并具有个性化的行为数据分析可以从中提取出反映个体行为的个体数据,为总结个体行为模式规律提供了可能。将这些具有某些特定范围内的用户行为数据称之为大数据时代的“小数据”[2]。其具有以下特征:

1.1.1小数据以个体为中心,在特定事务中具有很强的针对性。小数据是对个体的行为信息和动机信息通过不间断持续地收集而产生的,这些信息受个体多层维度的影响,包括社会关系、民族信仰、家族背景、教育程度、社会地位、行为习惯、性格特点、个人喜好、财务状况等等。通过对行为数据的捕捉、采集、分析和应用,可以实现以个人为主体的数据系统的建设和实施,并为差异化服务与行为指引提供了决策依据。

1.1.2低成本,高收益。相比于大数据而言,小数据无需更广维度的数据总量,但针对特定事务场景的数据描述并未随之下降。由此产生的小数据应用即在信息采集系统和资源的低成本配置下,亦可实现较深入的数据采集层次,在数据处理过程中也无需为了满足复杂的优化算法和数据部署逻辑而投入过多的硬件及高额的研发费用,因此越来越多的组织及个人都开始尝试使用小数据分析进行管理提升和服务升级。

1.1.3安全性更高,可避免隐私性数据泄露。小数据分析是对用户基本信息和生活行为信息的分析,对内是个人数据的多维集合,对外是个人数据的整体表现。任何对外展示的数据,都须通过预先设定的授权手续方可将分析结果输出,绝不会涉及到个人的行为信息和基本信息的信息安全问题。可以这么说,小数据有效地保护了用户信息安全,杜绝了大数据对个人信息进行无止境地监测和采集。从而避免了隐私性数据泄露的可能。

1.1.4小数据与大数据互为映射、相得益彰。近年来,随着大数据应用的迅速发展,与之相伴出现了一些应用弊端和伴生问题,为了能够规避这些弊端并解决这些问题,小数据的应用才应运而生。从规模上看小数据的数据体量远远小于大数据,但并非是大数据的缩微处理,更多的是对大数据信息的专项延伸与补充,二者互为映射,相得益彰。另外,二者在诸多属性上也是对称的,比如小数据的价值密度更高,但受数据噪音的影响较大,易被忽视。而大数据则反之。

1.2小数据应用现状

小数据主要以个体作为研究主体,通过对某方面深入准确的挖掘,它是大数据的某个侧面维度。事实上,对于个人而言,这个所谓的侧面完全有可能是特定个体的全面。目前,小数据被广泛应用于数字医疗、运动检测、环境监测等行业和领域。

Emily Waltz曾在IEEE Spectrum的撰文指出,目前佩戴在运动员身上的生物传感器,正在使运动员的训练方式发生着改变。这些装有传感器的装备,可以实时提供运动员的生理机能参数,可让运动员更有韧性,可穿戴装备能更有针对性地帮助运动员提高成绩并避免身体受伤。传感器每秒能够产生100个感知数据。通过无线连接传导到个人量化分析软件中,对运动特征和特定位置进行分析监控,专家系统中的算法,可以剖析出运动员在运动过程中做对了什么、做错了什么,基于此信息,教练员可以给出更加具有针对性的训练。

还有,医疗单位利用电子病历系统记录的患者的症状、接受的检查、医生的诊断及处方、患者的治疗、后期护理等多种就诊信息,及对并发症等发生规律进行总结归纳,进行相关的诊疗处理,提升了医生对患者病情的了解程度,提高了治愈效率,降低了医患纠纷等优点;通过对该患者病例、生活习惯的分析,再对于该疾病的易发人群进行有效预防,减少发病机率。快速有效的治疗方法,通过例证加以传播,为科研和教学提供了丰富的材料[3]。

2 基于图书馆小数据应用研究的可行性

2.1基于小数据特点提供服务

图书馆小数据应用以读者为中心,由图书馆数据分析人员对读者在馆期间发生的行为数据进行采集、挖掘、分析等工作。小数据关注于读者个性化阅读和服务方式的重构,对读者群或单个读者进行研究,分析其以往阅读行为、个性化需求的数据,从而得出读者未来阅读需求内容且优化图书馆个性化服务体系。

2.2小数据有利于过滤数据“噪声”

在基于数据的分析与预测活动中,能否有效过滤数据“噪声”,关系到数据分析的准确性与指引决策的科学性。在图书馆内通过加设传感器网络、服务器监测设备、个人移动终端和可穿戴设备等数据监测记录设备,对读者阅读频率、阅读习惯、社会背景与交往等读者个体小数据资料进行采集,这些小数据具有信息量分散、价值密度低、噪声影响大的特点。因此,如何通过有效过滤噪声来提高数据价值的密度,是关系图书馆小数据应用是否可行的重要问题。图书馆小数据具有数据采集对象有限、结构简单等特点,因此,工作人员更易于处理数据的采集及分析出现的各种问题,避免数据”噪声”与价值信息被同时采集,汇总在一起。通过人工整理的方式降低了数据“噪声”的不良影响,从而可以将数据“噪声”快速剔除,提取出有价值的读者小数据信息。

2.3小数据可以提高数据质量

在数据决策中,数据的体量是重要的,但绝不是衡量数据价值的唯一标准。数据的获取途径、价值准确性、信息的完整性和数据采集有效性,是影响所采决策数据质量的关键要素。图书馆进行的小数据提取是针对读者信息开展的信息采集、数据系统分析和分析结果采集决策的系统性操作,通过这些操作才能保证为读者提供个性化阅读服务。小数据在图书馆中的应用从新的视角取代原有僵化的信息采集途径,采用新的信息分析和管理决策的模式,为读者提供更具针对性、指向性的服务。另外,图书馆小数据不同维度之间具有较高的关联性和融合性。因此,基于该小数据基础构建的图书馆个性化服务模型,相比原有的服务模式服务针对性更强,可利用率更高。同时,基于图书馆小数据集汇总的数据仓库将使多维的数据信息更加统一、准确,有利于图书馆获取高效信息,在对读者阅读行为加以记录的前提下,构建图书馆小数据的“归因模型”,以实现对读者阅读行为过程科学的因果解释和推论。

2.4小数据具有高安全性

小数据较大数据而言对读者个人隐私可有效地进行保护,随着无线设备、移动终端和智能传感器技术的高速发展,图书馆完全可以使用该类技术对读者阅读行为、阅读习惯、阅读方向和个人信息进行可持续、全面地数据采集。这些行为数据在指引管理人员为读者提供差异化服务和科学决策的条件下,也使读者的生活行为被监测,导致隐私泄露和侵权的风险。

2.5小数据应用系统对硬件设备和系统资源要求较低

小数据以读者行为数据为采集核心、可用于读者个性化服务和指引科学决策的高价值信息。与大数据相比,二者在数据处理、分析决策过程中,对硬件的运算性能、算法的优化设计、数据体量的要求有着很大的区别。

3 基于小数据的图书馆个性化服务策略

3.1小数据在电子文献选购的应用

对于图书馆来说,电子文献的选购是一项需要科学配置的工作。选购的电子文献可谓是种类繁多,其中包括国内的、国外的,不同学科的、不同层次的、不同价位的,要将这些因素与本图书馆学科设置、阅读喜好层次、接受能力等情况相结合来取舍决定。首先,决策者必须要清楚本单位借阅人群状况。一个电子文献不管多有名,应用多广泛,如果不适合本单位读者群就不是一个好的选购对象。例如,图书馆对于医学博士论文库的采购往往都是要斟酌再三的,因为除了少数几个专科学术(如医学)外,多数专科的学术很难达到这一高度,如果购买势必会造成曲高和寡、无人问津的局面。再如,读者群如果外语水平尚未达到可无障碍地阅读外国文献的水平,那就不能大量采购外文电子文献。其次,还要考虑选购的电子文献的相似性和重复性。另外,还可以根据浏览的读者人次数、人员类型和时间,来判断一种电子文献的应用前景和读者接受的程度,最终决定是否购买。不合理的选购一方面会导致资源浪费,另一方面又会使合适的电子文献因缺乏资金而失去未被选择的机会。以上这些都要通过对小数据的精心分析才可能有最终正确的选择[4]。

3.2小数据在读者群体分析中的应用

图书馆工作中看似毫无计划性的安排,如果要想安排得当其背后基于对小数据的分析必不可少。如每个图书馆基本上都有在固定时间闭馆的规定,往往是根据连续几个月中读者到馆人次最少一天的数据统计来分析得出的,这样既可使图书馆进行了休养生息又将闭馆给读者群带来的影响降至最小。再如,智能系统为图书馆工作采集到了全面的实时数据,其中,闸机系统对于进入图书馆的读者进行了实时跟踪,我们可以从这些人员的属性,包括单位、专业,甚至性别来进行分析,从而得出我们需要的结论并加以应用。另外,还可以通过查看图书馆自身馆藏资源来判断相关服务是否科学。利用这些小数据加以分析有利于图书馆工作很好地开展,既兼顾了读者利益,也使图书馆工作安排提高了效率,这些应用都是小数据统计的一种主动选择。

3.3小数据在信息服务中的应用

信息检索部门的服务很多时候属于小数据的服务内容,为个别读者提供具有针对性的个性化服务,通常为被动形式的服务。有需求的读者会提出检索范围、主题等服务要求,信息检索部门的工作人员会根据这些信息,提供检索、查询、推送等服务。因为这种小数据服务产生于个性化的需求,因此信息检索部门结构往往体现于多样化,以满足更多读者个性化借阅的需求。工作人员将通过OPAC系统进行图书荐购,向读者推荐自己认为有阅读价值的书籍;一些图书馆会将读者所选书目订单作为图书采购的一部分;如果书商在本地,甚至还可以邀请部分读者随同采购;此外,通过对读者借阅情况的小数据分析,以确认图书采购中是不是忽略了某些专业图书,或者遗漏了某些读者群的需求。这些措施的采用将会更大限度地发挥读者的阅读兴趣。重视小数据的反馈,体现了对个体读者的尊重,求同存异,让任何一个有阅读爱好的读者均可在图书馆找到属于他的那本书。

4 结语

小数据作为大数据时代的重要组成部分,将以更加简单、更有针对性、更易操作实施等特点,通过对读者知识需求变化的分析为图书馆的建设发展带来了依据,也对图书馆管理和业务研究指出了新的方向,对图书馆服务提升起到指向性作用。小数据精准挖掘数据资源,为图书馆决策提供满足个性化需求且高质量的小数据,深层次分离读者信息及服务方向,确保图书馆服务更具价值,降低图书馆管理成本,并根据个性化需求及时调整图书馆发展格局。可以说,小数据的应用将为图书馆的发展带来了一个大的机遇。

参考文献:

[1]王碧琴,等.数字图书馆用户信息隐私的安全威胁分析[J].图书馆学研究,2015(10):34-36.

[2]孙红蕾,郑建明.小数据思维驱动下的数字文化治理路径探析[J].图书馆学研究,2015(18):39-43.

[3]张小光.支持医疗过程管理的电子病历系统研发及有意义应用研究[D].浙江:浙江大学,2012:43-45.

[4]陈臣,马晓亭.基于小数据的图书馆个性化推送服务与服务质量保证研究[J].情报理论与实践,2015(38).

王昊女,1979年生。研究生学历,硕士,馆员。

[分类号]G252

收稿日期:(2016-03-27;责编:徐向东。)

猜你喜欢
个性化图书馆分析
隐蔽失效适航要求符合性验证分析
坚持个性化的写作
电力系统不平衡分析
图书馆
上汽大通:C2B个性化定制未来
电力系统及其自动化发展趋势分析
同桌宝贝
满足群众的个性化需求
去图书馆