“互联网+”背景下档案信息个性化服务研究

2021-03-18 12:22中原工学院计算机学院高艳霞李娟
办公室业务 2021年3期
关键词:档案馆个性化互联网+

文/中原工学院计算机学院 高艳霞 李娟

新时代背景下,实现“互联网+智能+档案”成为我国档案行业的战略目标。《全国档案事业发展“十三五”规划纲要》明确指出,要深化和拓展档案利用服务,提高档案公共服务能力,提高档案馆公共服务的认知度和用户满意度,档案利用服务模式创新和档案信息开放要取得实质性进展。这给传统的档案利用管理提出了新的挑战。

一、当前档案服务存在的问题分析

(一)服务观念相对陈旧。当前,随着档案信息化的持续进行,各大档案馆的硬件设备已有很大改进,也基本完成了纸质档案的数字化,加之原本的电子档案,数字档案馆的雏形基本具备,但是由于档案管理人员受传统档案服务影响根深蒂固,还停留在“以档案信息为中心”的“等客上门”的被动服务模式阶段,没有主动对海量的档案数据进行挖掘研究,没有切实从用户的角度研究其真实需求,因此存在用户需要的档案资源得不到,档案馆里却存有海量的档案资源,但大多都成为沉积海底的“死档案”的现象。

(二)对档案资源的挖掘力度不够。各大档案馆基本都对档案资源编排索引,可以提供目录查询,少部分可以原文查询,但缺少档案资源的编研产品,没有形成知识单元,因此档案资源质量不高。而现在用户对档案的需求已不仅仅是原始档案,更需要进行深度加工和分析后的档案知识单元,因此陷入档案资源丰富,但知识匮乏的境地。

(三)对用户需求研究不够。数字档案馆建设的目的是利用先进的数字化技术为用户利用提供方便,毋庸置疑,应该以用户为中心,但长期以来受“重馆藏,轻利用”的影响,虽然数字档案馆建设取得了长足的发展,积累了海量的数字档案资源,但缺少对用户的研究,例如,用户的分类过于简单,没有根据用户的需求组织档案知识单元,造成了档案资源与用户需求的严重脱节。“互联网+时代”,人们已不满足于传统的档案资源呈现方式和获取手段,因此数字档案馆要把“以人为本”作为档案工作的核心,根据用户需求、量体裁衣,提高用户效率,增强服务效果。

二、档案信息个性化服务的概念及特征

(一)档案信息个性化服务的概念。关于档案信息个性化服务的概念,黄夏基定义为“根据用户的特性提供具有针对性的信息内容”。廖倩概括为“根据利用者的特定需求为目标,借助各种渠道对馆藏资源进行加工、整合、优化,为客户推送相关信息,以满足其特殊需求”。田伟更是将档案个性化服务的基本特征形象地比喻成“量体裁衣”。综合来说,档案信息的个性化服务是档案馆通过各种途径对资源进行收集、整理和分类,主动向用户提供和推荐满足用户个性化需求的相关信息。

(二)档案信息个性化服务的特征。档案信息的个性化服务是“互联网+智能”时代的必然产物,能够促进档案服务转变服务理念,也为数字档案馆的建设指明了方向。具有如下明显的特征:

1.主动性。与传统“人找档案”的被动服务相比,个性化服务是“档案找人”,体现的是档案服务部门主动服务于档案需求者。根据收集到的用户的基本特征及用户的浏览历史和行为,感知用户的信息需求,从档案数据库中检索出用户需要的档案信息及时主动地推送给用户。

2.可定制性。对档案用户的基本信息和浏览行为进行深度加工挖掘,分析用户的特征、兴趣、爱好、行为、习惯等信息,不断细化档案用户,有针对性地提供更符合用户心理倾向、知识结构和行为方式的信息需求框架和内容,建造“量身定制”的个性化服务。

3.智能性。对于有档案需求但不具备检索经验和专业知识的用户,要准确检索到自己需要的档案信息往往非常困难,经常出现“提供的不需要,需要的找不到”的尴尬境地,智能性可以很好地解决这个问题。运用智能算法通过跟踪和捕获用户的兴趣偏好,获取用户的真实需求,构建用户模型,结合智能过滤和推荐算法提升档案信息的推送质量,真正做到按需服务。

(三)获取档案用户需求。深入分析用户的信息需求是档案个性化服务的关键,本质上来说,只有精准分析用户的特征、需求和行为,才能结合用户需求设计高效的档案个性化服务模式,因此准确获取用户需求是档案个性化服务的核心问题。主要从以下几方面开展:

1.用户注册信息。因为档案信息不是公开性的网络资源,只有注册用户才可以获取档案信息,在设计用户注册信息时,除用户名、密码、邮箱等基本信息外,可以包含能够刻画用户基本特征的信息,如年龄、职业、学历、关注主题等。

2.用户浏览信息。用户在浏览网页时会产生很多数据,如在浏览某一页面时哪些超链接点击了哪些没有点击,哪些页面停留的时间长,哪些页面被用户多次重复访问,这些浏览页面的操作行为反映了用户的兴趣和关注度,可以运用WEB挖掘技术,挖掘用户的浏览日志等相关信息,准确了解用户的喜好、行为,建立用户兴趣模型。

3.用户交互行为。用户在档案信息服务平台可以人机互动查阅资料,也可以参与话题讨论,还可以在利用档案过程中进行讨论、分享和反馈等,用户输入的查阅主题、参与讨论的观点等这些信息可以反映用户的特征、偏好、需求,有利于精准把握用户的实际需求,是建立推荐模型的基础。

4.用户收藏、分享等行为。用户在浏览档案网页信息结束时,没有直接关闭网页,而是将网页链接收藏,甚至将链接转发给别的用户,形成信息分享行为,反映出用户对相关档案主题内容兴趣浓厚,认为非常有用。通过收集用户的收藏、分享信息,有利于了解用户的信息需求及偏好、专业等信息,便于构建用户信息需求模型。

三、构建档案个性化服务模型

对档案用户群进行精准细分。根据用户的注册信息、浏览历史、交互行为和收藏分享行为,收集用户的特征、需求偏好、档案利用次数、频率分布,以及对档案利用的内容等方面进行分析,深入挖掘了解用户的需求,建立用户的分群模型和多维度分析知识库。

对档案数据按照内容主题和分类进行标识。运用主题模型进行分类处理,发掘档案知识单元之间的链接关系,并进行深度加工编研,通过知识单元的关联聚合将不同主题属性、不同类别的档案资源形成可供用户利用的知识网络。

运用数据挖掘、机器学习及自然语言处理技术,构建基于用户需求的档案信息个性化服务模型,为用户量身定制个性化的数据服务,主动向用户推荐其感兴趣或者需要的档案对象。

在档案个性化服务模型中,推荐引擎是其中的核心,可以采用关联规则、协同过滤等相关技术,其中协同过滤技术最为常用。协同过滤技术是个性化推荐的一种实现方式,通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品位相似的物品。协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法和基于物品的协同过滤算法。当前,协同过滤在图书、电影、音乐、电子商务等领域得到较好的应用,很多领域已采用协同过滤技术来实现智能服务。这里可以将两种算法结合使用,来提高推荐的精度。

图1 档案个性化服务模型

四、结语

“互联网+”环境下,各地档案馆都在尝试档案信息资源共享服务,同时对档案利用提出了更高的要求和挑战,如何从体量大、类型多、更新快的大数据资源中,为用户提供智慧型、个性化的信息服务,并能够挖掘档案资源的价值,推荐公众感兴趣的档案信息,成为一大难题。本文探讨了档案个性化服务的概念、特征,提出了获取用户需求的方法及个性化服务的模型,使档案工作更贴近档案利用者的需求,为传统档案的服务模式改变提供了一定的参考。

猜你喜欢
档案馆个性化互联网+
关于智慧档案馆与数字档案馆的关系探讨
坚持个性化的写作
同桌宝贝
when与while档案馆
北京市第三届“档案馆日”活动预告
科隆档案馆突然坍塌
校本课程开发的个性化问题探讨
呼唤雕塑家创作的个性化