面向高校图书馆精准知识服务的用户画像建构

2022-11-24 03:32贺幸阳高明泽
科技资讯 2022年20期
关键词:画像标签图书馆

贺幸阳 高明泽

(湘潭大学 湖南湘潭 411105)

泛在信息环境下,高校用户不再满足于图书馆被动的传统文献服务模式,多元的信息需求正推动着知识服务向精准化、个性化的方向发展。因此,高校图书馆不仅需要在日常业务中熟悉自身资源优势,更应对该单位用户现实需求、潜在需要有系统的了解。早在1998 年,交互设计之父Alan Cooper 就已提出“用户画像”这一概念。近年来,这一精准营销技术被广泛应用于各行各业,在勾画用户、捕获需求方面取得了相当不错的成绩[1]。当前语境下,用户画像技术通常是指将采集来的用户数据抽象化并深度挖掘(聚类、关联等)获得可视化图形的信息处理过程[2]。国外学者认为通过引入用户画像技术,可以发现读者阶段性的阅读偏好与行为规律,从而解释不同用户群体间的行为差异,以此为突破口实现知识服务模式的转型升级。目前,我国高校图书馆,尤其是以湖南省为代表的中西部地区高校尚在智能化转型过程中,数据容量与数据分析处理能力相对较弱,故而,该研究立足高校图书馆“小数据”的当前特点[3],秉承数字生态的系统理念,制订出高效率、差异化的数据采集方案,将模型体系的数据预处理层、标签建模层、用户画像生成层环环紧扣,使信息得以被各个环节高效利用。通过成功的用户画像体系实时跟进高校图书馆用户画像,并在此基础之上,设计建构出针对个体读者、群体用户的不同服务模式,改善高校图书馆服务环境与知识服务使用率,提升用户体验感与满意度,促进高校学科发展。

1 高校图书馆用户画像模型的可行性与意义

1.1 可行性分析

1.1.1 需求之维

高校图书馆面向本单位广大知识人才,提供着高质量的教学科研服务,在日常工作中不仅需要保证一定的时效性,同时也需要满足用户主体多方位、高层次的专业需求并对馆藏资源就内容与结构做出阶段性的反馈、优化。采取用户画像技术根据用户的检索记录、兴趣范围等,对其个性化的知识需求做出高效、客观的预判,从而针对性地输送知识服务,及时满足高校用户丰富需求,极大程度上改变当前知识供需不平衡的窘境,有效推动“互联网+”时代高校图书馆服务质量转型升级。

1.1.2 技术之维

用户画像技术的基础理论、系统框架已经十分成熟,广泛应用于企业营销、行业研究、产品效率优化事业,这为高校图书馆勾画精准用户“肖像”提供了有力的理论支持与参考经验。针对不同结构化程度的馆藏信息资源,通过多种算法的协同调用,可以形成分布式平台对数据进行收集与统一,从而为分层标签、分群标签再到个性化标签这一深度细化过程提供客观依据,最终获悉用户的现实知识需求、潜在信息需要。与此同时,多数高校图书馆已经具备实时获取并保存用户行为数据的能力[4],这为构建全面、真实的用户画像提供了数据基础与保障。

1.2 应用于高校图书馆的意义

1.2.1 了解个性需求,提升用户体验

近年来,高校图书馆信息资源系统不断叠加,用户往往需要在浩如烟海的内容中检索出极少数相关的部分,这为广大用户带来了不小的干扰。通过用户实时行为数据的积累,利用关联和聚类算法构建用户画像,能够及时、有效地对用户需求及偏好做出预判,实现需求的“可视化”、服务的主动性,优化知识获取效率,提高用户满意度、忠诚度。

1.2.2 助力学科服务,发挥高校优势

通过对用户需求偏好的挖掘,高校图书馆可以将碎片化、特质化的微知识实现精准推送,这对于提高高校图书馆信息资源利用率起到了桥梁作用[5]。与此同时,对用户画像系统的反馈结果进行解读分析,有效减少了长期存在的重复建设问题并对现有学科服务体系的缺失做出及时的填补、完善。凭借微知识服务推送平台,高校图书馆用户的学习与科研兴趣被大大激发,碎片化的启发逐渐向系统性研究过渡,高校图书馆馆藏资源优势、用户群体力量得以充分发挥。

2 用户画像模型的主要数据来源与类别

2.1 数据主要来源

根据相关性原则与适度性原则,综合考虑到小数据迭代快、维度高等特点[6],高校图书馆并不需要处理全部的用户信息,这样既规避了多余数据的干扰,又保证了用户画像良好的价值密度。因此,及时、精准的多维度用户数据是成功构建用户画像的重要前提。在基本的数据预处理后,时效性强、准确性高的数据集能够对用户的差异化标签进行清晰的描述。在高校图书馆业务中,图书馆门户网站、学校图书检索平台、科研成果管理系统、门禁系统数据库、用户社交平台等构成了用户数据的主要来源,通过上述渠道,高校图书馆可以有效获取用户的个人基本信息、实时行为数据、研究偏好信息等[7]。目前,高校图书馆一般采取用户一卡通账号作为登录端口,构建用户画像的数据基础。

2.2 数据构成类别

目前高校图书馆所能收集并充分利用的用户信息主要包含以下四类:用户基本信息数据、用户行为日志数据、用户社交网络数据、用户科研成果数据。其中,用户基本信息数据囊括高校图书馆用户的姓名、年龄段、专业、教育层次、职称等,其作用在于初步还原用户的自然属性及社会属性;用户行为日志数据是由图书检索平台、移动阅读终端等记录的数据构成,主要包括:访问时间、订阅渠道、下载频次、登录频率、检索途径、停留时间、移动终端设备、内容收藏、检索速度等。除此之外,图书馆综合管理系统数据库会记录下用户的借阅次数、归还状态,门禁系统也会保存用户个人的刷卡信息;用户社交网络数据则是用户通过慕课平台、微信、QQ进行的转发分享、业务咨询等组成;用户科研成果数据是用户学术研究成果的记录,由科研成果管理系统、机构数据库获取,包括用户科研项目、发表学术论文、出版专著、引用文献等,反映了高校图书馆用户的研究主题与脉络。

3 高校图书馆用户画像模型建构规划与流程

3.1 模型构建的基本规划

笔者基于生态系统能量传递的相关理论,仿照生态系统中的各主要元素对高校图书馆用户画像模型架构进行基本规划。由此构建出如下的数据传递生态模型:实时的用户信息流(数据采集层)作为最初的“能量”,提供着模型建构的基础依据;合理的信息组织及处理(数据预处理层)如同“植被”一类的生产者,将海量无序的信息固化为具有较高价值密度的规范化数据集;数据的存储与分析(数据标签建模层)发挥着初级消费者的作用,使得数据可以更为轻松地被下一层级“利用吸收”;数据的可视化(用户画像生成层)作为二级或三级消费者,生成可供直接使用的模型结果。在此期间,各层级间信息的反馈如同分解者,再次促进信息的流动。综上,数据采集层通过实时更近用户信息,获取可靠数据来源,数据预处理层完成数据的基本梳理工作,数据标签建模层进一步优化其价值密度,最终由用户画像生成层获取可视性成果。

3.2 用户画像模型的建构流程

3.2.1 数据采集层

数据采集层由图书馆用户管理系统、高校图书馆信息门户网站、社交网络平台、检索系统、科研成果管理系统等共同组成,作为用户画像模型构建的基础设施层,起着沟通用户、设施与管理系统的重要作用。程真提出图书馆可以依据年龄、职业、教育背景等社会属性对用户进行初步分类,使用户的知识需求、价值取向呈现出较小的组内差异与较显著的组间差异[8],再依据各自需求特点,对用户进行大致分层,继而针对不同层次的用户采取最适宜的数据收集方案,这将大大提高建模的效率与适用性。鉴于高校图书馆面向用户的特定性,该文将用户主要划分为通识导向型用户与专识导向型用户两类[9]。通识导向型用户是以获取非专业、非职业性知识为主要需求的用户,大量分布于本科低年级学生中;专识导向型用户则是以获取专业性、职业性知识信息为主要需求的用户群体,主要分布于高校教师、科研人员、本科高年级学生与研究生群体。通过图书馆管理系统,可以轻松获取高校读者的属性信息数据集。由于在较长时间内用户的属性信息基本稳定,故而设计重心应是对不同群体的行为信息采取有差异的收集方案。基于对以上两类群体的访谈调研与大量文献阅读,笔者认为通识导向型用户的数据维度应聚焦于行为日志数据、社交数据,而专识导向型用户的数据采集应当考虑科研成果的更新。

3.2.2 数据预处理层

数据预处理是针对数据采集层所获得的原始数据进行分组前必要的审核、筛选、排序。就目前高校图书馆数据集成与管理状况来看,数据格式不齐、不规范乃至缺失等一系列问题仍然广泛存在,这一方面是涉及多系统平台的参与,另一方面实则是海量数据下操作不规范、系统bug在所难免。因此,对原始数据进行预处理就成为了高校图书馆建构用户画像模型的必要环节。在数据预处理层,将逐一完成数据的清理、集成、变换和归约。这些必要的处理操作大大提高了数据资料的价值密度,进一步确保了数据挖掘工作的效率。与此同时,规范、完整、格式适用的数据集合,也为用户画像模型平稳运行筑起了一道“数据长城”。

3.2.3 数据标签建模层

构建用户画像的核心工作是对用户属性数据与行为数据提取特征因子并做出标签化的自然语言描述,继而形成一套兼具准确性与泛化性的多层分类标签体系。首先,鉴于高校图书馆自身资源特性,在标签粒度的关键问题上既要防止粒度过粗缺乏区分度,又要避免由于粒度过细影响实用性。结合对相关文献的阅读,本文将标签体系设计为精细的多层架构。其中,每类一级标签经过细化衍生出若干二级标签、三级标签,通过对三级标签进行赋值,使信息关联到用户数据,成为用户的事实标签。接着,通过对事实标签进行数据挖掘获取关键的特征标签。目前,用户画像技术主要有人工方式、计算机方式两类方法完成对用户特征的提取。其中,人工提取的方法对研究人员的知识、经验背景具有较高要求,其结果也具有较强主观性,故而该研究主要探讨计算机方式下的用户画像建模。计算机提取方法是通过机器学习的方式,自动获取用户特征因子,主要利用了决策树、神经网络、K均值聚类算法、逻辑回归、支持向量机等常用算法,具有高效快速、实时跟进的特点,更能适应信息体量不断膨胀、用户范围日益扩大的现状。例如:高校图书馆需要在短时间内了解该单位用户的主要研究方向时,就可以调用科研项目名称和参与人员、科研论文题目与合作者、出版专著题名及合著者等事实标签,再结合兴趣衰减法给予相应权重,快速获取用户研究方向的特征标签。

3.2.4 用户画像生成层

在完成数据标签体系构建后,通过对用户标签的深度处理可以形成直观、生动的可视化图形。在此基础上,高校图书馆可以从微观层面完成用户需求的合理预测。此外,对本单位全部用户的个人数据(如专业信息、文献下载等)进行关联分析、相似度分析、降维处理(聚类)后,系统可以构建出交叉关联的群体用户画像,这在中观层面实现了协同过滤、优先排序的个性化推荐,并在宏观的角度上为用户群体划分、服务定位等战略决策提供易于理解的依据。值得注意的是,在实际应用中,根据特定场景的需要,用户画像可视图在表现形式上也具有相当大的灵活性,常用的形式主要包括词云图、人物头像搭配个性化标签、扇形图、雷达图等。

4 基于用户画像的高校图书馆精准知识服务模式

4.1 个体用户服务模式

从服务对象的维度看,基于用户画像技术的精准知识服务模式主要分为:个体用户服务模式和群体用户服务模式两类。个体用户服务模式是依据个体画像,开展一对一的个性化知识资源推送与学科服务跟进,实现对其文献资源需求、学科服务需求的精准识别、快速匹配。针对个人用户,服务主要包括线上推荐与线下咨询两种。线上推荐模式作为个体用户获取服务的主要途径,通过在线个性化推荐系统将个人用户画像与本馆文献资源库、学科服务数据库进行实时匹配,调用协同过滤推荐算法列出用户所需的“Top N”目录,从而实现高效、快速的个性化知识服务,缓解了高校图书馆人力资源不足与服务需求激增的重要矛盾。线下咨询模式具有更高知识价值,主要针对部分专识导向型用户的特殊知识、情报需求,对高校图书馆人力资源条件有一定限制,适用于特定情境下的学科服务推荐、学科信息咨询。

4.2 群体用户服务模式

由于高校图书馆面向用户的局限性,使其可以根据用户院校专业、所在年级、参与项目经历等不同条件划分出若干相对独立的群体。群体用户服务模式便是通过挖掘具有共同特征因子的读者需求,了解其整体需要的时序特性,按照所得规律展开精准、及时的文献资源输送、学科服务推送等。与个体用户服务模式不同,由于群体数量相对较少且易于集中,线下推荐的模式通常能够得以推广。在基础的专业文献资源推荐、学科服务项目推广之外,学科馆员通过与二级学院合作,可以有效地展开针对性的学术交流会、信息资源利用讲座,解决读者在科研选题、资料收集、研究实验、论文撰写等不同阶段的迫切问题;同时针对院校科研团队在项目申请、验收鉴定及成果申报中的需求,制订个性化的知识服务方案,为高校学科发展保驾护航。

5 结语

面对当前日益复杂的用户需求,如果不能准确全面地洞悉读者相关信息,精准化的知识服务将缺乏客观依据,从而导致方案适应性不强、用户活跃度不高等一系列棘手问题。为此,该研究将用户画像技术与图书馆精准知识服务结合,首先在需求与技术两个维度上论证了用户画像技术应用于高校图书馆精准化知识服务的可行性,并提出通过用户画像技术的引入,高校图书馆可以更好地提升读者体验、助力学科发展。继而在数据来源、模型建构规划与流程上进行详细说明。在模型建构中保持着“生态一体”的理念,设计了高效、差异化的数据采集方案,将其后的数据预处理层、标签建模层、用户画像生成层环环紧扣,使信息得以被各个环节高效利用。最后从服务群体维度,展开对服务模式的探讨、建构,为高校图书馆利用用户画像技术实现全面精准化知识服务提供参考。

猜你喜欢
画像标签图书馆
威猛的画像
画像
图书馆
不害怕撕掉标签的人,都活出了真正的漂亮
画像
让衣柜摆脱“杂乱无章”的标签
科学家的标签
科学家的标签
去图书馆
潜行与画像