场景五力视角下智慧图书馆科研服务创新研究*

2023-02-22 03:46
图书馆学刊 2023年1期
关键词:画像检索标签

周 聪

(徐州医科大学图书馆,江苏 徐州 221004)

1 引言

智慧图书馆是智能设备及新一代信息技术在图书馆的应用实践,能够智能感知用户行为,预测用户真实需求,为用户提供智慧化知识服务的新形态。它强调以用户为核心的管理、服务及决策的智慧化,使用户在享受智慧服务时突破了传统图书馆的物理时空限制,支持用户的创意探索和技术创新,可以为用户提供高效、精准、全方位的沉浸式服务体验[1]。如何借助新一代信息技术,融合精准服务的先进理念,重构智慧服务体系,推动图书馆的转型升级,是智慧图书馆研究的新课题[2]。

杨文建[3]提出智慧图书馆能够利用传感器和定位系统准确获取用户的历史行为信息与即时情境信息,对用户的需求进行更为准确的预测与判断,通过融合情境感知提升用户服务、空间服务、资源服务等方面的效能。陈丹[4]提出以用户画像连接用户和资源,构建图书馆智慧服务模型框架,为用户提供知识性、场景性、主动性的个性化智慧服务。孙守强[5]认为智慧图书馆充分利用物联网技术,充分采集用户的情景数据,建设准确全面的用户画像,将其应用于智慧图书馆个性化服务,有利于驱动智慧图书馆创新发展。

综上所述,情景感知和用户画像技术在智慧图书馆都得到了一定的应用,可以更好地感知用户信息,描摹用户画像,结合情景信息实时预测用户的需求和行为偏好,主动提供个性化、智能化和场景化的智慧服务。但情景感知和用户画像并未充分融合,应用场景挖掘不够充分,并且用户大多关注学生和教师等一般用户群体,针对科研人员用户画像的研究成果较少,智慧服务应用深度不够,缺乏精准性和前瞻性,未能给高校的“双一流”建设和学科发展提供技术支撑。

2 场景五力引入智慧图书馆科研创新服务体系

“场景五力”包括移动设备、定位系统、大数据与大数据计算、传感器和社交网络。运用这5类技术原力实现用户情景的智能感知,并与用户动态画像技术充分融合,精准预测科研用户的真实需求,提供场景化智慧科研服务[6-7]。利用移动设备、定位系统、传感器等对科研用户的静态属性(姓名、专业、研究方向、科研项目等)和动态属性(在线检索、信息订阅、专题追踪、位置、状态等)进行自动智能精准收集,实现情景智能感知;利用大数据技术对收集到的信息进行清洗、关联、挖掘和聚合,发掘科研用户的个人行为偏好,预测科研用户的真实需求,精准匹配科研服务场景;通过智能移动平台或者App客户端为用户提供科技查新、参考咨询、智能化精准检索、学科前沿追踪、科研选题评估、研究工具在线支持和知识产权分析等科研服务,实现覆盖科研项目全生命周期的场景化智慧科研服务[8]。构建以场景五力为抓手,科研用户动态画像为核心,场景化服务为特色的智慧图书馆科研创新服务体系,提供高效、精准、全方位的场景化科研服务,该体系的架构分为情景感知层、智慧分析层和场景应用层(见图1)。

图1 智慧图书馆科研创新服务体系

情景感知层不仅包括图书管理系统、图书馆门户、商业数据库和机构知识库等管理系统和数字资源,还包括了场景五力的社交网络、移动设备、定位系统和传感器等智慧设施,实时精准采集个人基本信息、内容偏好信息、互动信息、情景信息和科研项目信息等,是课题研究数据采集的基础[8],具有全面、动态、精准的特性。

智慧分析层将从情景感知层中采集的各系统和资源数据进行数据清洗、关联和挖掘,生成科研用户画像的静态数据标签,结合场景五力实时采集的情景数据生成科研用户动态画像,通过大数据技术实时精准预测科研用户的需求[9];构建基本信息标签(作者、出版社、出版时间、资源分布等)、媒体类型标签(文档、图片、PPT和视频等)、内容属性标签(概要、知识主题和研究领域等)和资源热度标签(热度值、权重系数和衰减系数等)四维度体系的图书馆资源画像库。资源画像库通过对资源的聚合分析,自动生成知识图谱,为科研用户提供高阶知识服务[10]。

场景应用层包括智能化精准检索服务、全景式多维情报分析和动态嵌入式科研服务。场景应用层设计基于以下几点:①科研用户更偏重于WOS,Scopus和CNKI等商业数据库文献资源的检索与利用。基于科研用户动态画像实现检索情景感知,按场景适配率、主题匹配率、热度、发表时间、期刊等进行排序,输出给科研用户,实现智能化精准检索服务,并结合检索结果集的内容和用户的行为反馈进行智能推荐,以提高检索效率[11]。②研究前沿是“研究前沿”+“新兴前沿”+“隐性趋势”[12],由研究前沿引导高校科研立项决策,结合科研用户动态画像实现学科发展方向的调整、人才引进策略的完善和跨学科联合攻坚团队组建及团队成员推荐等决策支持[13]。③动态嵌入式科研服务覆盖科研项目的全生命周期,例如项目申请前的参考咨询科技查新、项目实施中的研究工具支持、项目结题前的情报分析与论文投稿指导和项目完成后的成果鉴定与申报奖项辅助等,真正实现全生命周期动态嵌入式科研服务[14]。可见以场景五力为抓手,科研用户动态画像为核心,场景化服务为特色的智慧图书馆科研创新服务体系,为图书馆打造智慧科研服务提供一种新的思路,为智慧图书馆建设提供新动能。

3 场景五力助力科研用户动态画像构建

智慧图书馆整合了相关系统与商业数据库的科研用户数据,并辅以动态感知的情景数据,融合成科研用户的全量数据信息,通过对全量数据信息进行聚类分析获取基本信息标签、内容偏好标签、互动标签、情景标签和科研项目标签5大类标签,建立科研用户标签体系,描摹科研用户动态画像。科研用户动态画像概念模型如图2所示。

图2 科研用户动态画像概念模型

从图书管理系统、机构知识库、门户网站、移动图书馆和科研知识社区等平台中利用网络爬虫和网站日志挖掘等技术抓取科研用户的各类数据,如姓名、学历、专业、职称、研究领域等基本数据,线下借阅的书目、线上浏览的文章和电子资源、线上检索的关键词和预约或续借的书目等内容偏好数据,科研知识社区的点赞、评论、咨询、合作等互动数据,申请、立项、结题、获奖等科研项目数据,经过预处理、聚类分析、关联挖掘、深度学习,从海量数据中提取关键特征信息,由此提炼出科研用户标签,完成标签分类建模,勾勒出科研用户的画像轮廓。然后关联科研用户的动态场景数据(定位轨迹、实时活动、社会关系等)和情境数据(时间、地点、温度、湿度等)进行动态画像的深度刻画[15]。

根据场动力理论可知,用户行为会受到内在需求和外在情景的双重驱动。所以科研用户动态画像是指特定情景下的实时画像。某个科研用户某个情景下的实时动态画像如图3所示。

图3 科研用户实时动态画像模型

实时动态画像:①基本信息标签,用户董老师ID为19920100**,学位为博士,职称为教授、主任医师,研究领域围术期信息化管理和神经外科学。②内容偏好标签,发现其访问数字图书馆PC端82次(P82)和移动端135次(M135),更倾向于移动端访问;访问知网和万方等中文数据库76次(C76),访问WOS,PubMed等英文数据库125次(W125),更倾向于外文数据库资源;其最近一次借阅的书目是《围术期管理理论与实践》,最近的一次关键活动是预约Uwb:Theory and Applications书目,其近期关注的领域是围术期信息化管理,检索关键词组为围术期、UWB和手术行为管理,所以用户画像标签关联的互动标签和项目标签的数据全部是医疗信息化专业的,开头用“X”标识。③互动标签,其在科研知识社区里发表观点、分享知识、讨论、点赞与评论的次数较多,并且观点立意新颖,见解独特深刻,属于活跃型高端知识用户;与研究生或同事合作发表围术期安全管理方面的文章7篇。④项目标签,其医疗信息类项目有5项,已结题4项,获奖两项,取得软件著作权15项,实用新型专利10项(授权10项),合作申请手术室人员定位和资产管理相关发明专利4项(授权两项),作为通讯作者或第一作者发表过医疗信息化类论文12篇。⑤情景标签,当前时间是2021年8月6日上午9点25分,通过定位系统发现董老师在主校区图书馆四楼阅览室,与自己的两个研究生(其中魏某,19级医学信息学研究生)一起在工业技术大类书架附近停留,通过分析董老师的信息化科研项目,发现其《围术期管理与关键技术的研究》省卫生厅科研项目尚未结题,结合其现有的信息类科研成果和具体情景分析,系统预测董老师是在结合未结题的科研项目给学生魏某遴选毕业设计题目,并借阅围术期管理关键信息技术研究方面的书目。

实时智能感知科研用户的动态画像,结合馆藏书目信息(书名、作者、出版社、内容简介、目录、分类号及书架位置)和电子资源(相关专业论文的题名、作者、期刊及内容简介)直接推送到手机端,方便用户董老师查找书目和资源,提高效率。也可以通过手机端进一步查看相关电子资源信息知识网络,为魏某的毕业论文的选题和书写提供指导。

4 智慧图书馆场景化科研服务

科研服务是贯穿在整个科研项目全生命周期的服务,其各个阶段都需要图书馆人员将科研服务嵌入到科研一线,主动与科研骨干团队深度融合,提升团队的跨学科科研联合攻关能力。

4.1 智能化精准检索

基于科研用户动态画像,结合数字资源网络,实现智能化精准检索服务。科研用户动态画像既可以了解科研用户的知识结构、学科背景,洞察其行为特征和内容偏好,还可以结合情景感知敏锐捕获科研用户的隐性需求和心理活动,结合以往检索历史精准预测科研用户的实时检索需求,结合当下主题匹配度高、热度高的数字资源和知识网络进行初步过滤(资源类型、资源质量等),得到初始结果集。初始结果集再匹配科研用户的检索情景,按情景与需求契合度和资源质量进行排序,得到更符合当时检索情景和需求意图的结果集反馈给科研用户,实现智能化精准检索服务。

持续追踪科研用户检索结果集返回后的行为信息,并不断细化检索意图进行智能推荐。科研用户享受检索服务的同时,系统追踪科研用户对检索结果集的行为信息,建立检索结果反馈机制,动态调整检索模型和算法。通过评估科研用户对结果集的满意程度,并结合科研用户动态画像,进行契合主题和情景的二次智能推荐,实现检索服务的智能扩展,不断深入感知科研用户需求,细化检索意图。检索和二次智能推荐可以循环往复,所有反馈信息都更新到科研用户动态画像,后台通过大数据分析不断地优化其构建模型,建立科研用户动态画像和智能化精准检索服务的动态融合机制,为智慧图书馆精准检索服务建设提供参考。

4.2 全景式多维情报分析

笔者认为,研究前沿是权威机构的“研究前沿”,是近两年的多渠道文献主题关键词突显的“新兴前沿”和近一年科研社区高影响力学者“隐性趋势”的融合。权威机构的“研究前沿”选取ESI的研究前沿,用网络爬虫两个月一次定期更新。ESI是基于引文分析的,具有一定滞后性,并且ESI收录范围有一定的局限性,辅以WOS,Scopus和中国知网等商业数据库近两年的数据,用CiteSpace工具进行关键词共现和关键词突现分析,得到“新兴前沿”。结合科研社区中高影响力学者的隐性知识梳理,挖掘整理出“隐性趋势”。建立研究前沿模型,融合“研究前沿”“新兴前沿”和“隐性趋势”,建立研究前沿库。科研服务团队根据研究前沿库,定期整理成全景式多维度的《研究前沿报告》,以便应用于智慧科研服务之中,提高科研服务的前瞻性和创新性。

科研用户通过《研究前沿报告》,发现专业领域科学研究的热点、前沿和新兴趋势,预测其演变过程,确定项目申报的关键技术难点和创新点,确保立项的可行性和新颖性,不断充实科研立项依据。科研管理人员通过《研究前沿报告》预见新的科研立项规划,提供政策导向,引导科研立项决策。院系领导可以根据《研究前沿报告》梳理各学科结构,结合各学科的科研用户动态画像,掌控各学科的人才结构和研究热点前沿与发展趋势,确立新的学科发展方向,科学调整学科人才引进和评估策略。决策者面对国家重大战略需求和重大前沿科学课题,可以通过科研用户动态画像获取本机构相关主题的科研水平和科研人才储备,组建重大项目跨学科团队,推荐团队负责人及成员名单,指定科研管理人员和学科馆员,合力攻坚,打造学科高峰,支撑高校一流学科建设。

4.3 动态嵌入式科研服务

大数据背景下结合科研用户动态画像实现全生命周期嵌入式智慧科研服务,包括项目立项前的参考咨询与科技查新、项目实施中的研究工具支持、项目结题前的情报分析与论文投稿指导和项目结题后的成果鉴定与申报奖项辅助等。笔者重点以一位科研用户在图书馆活动的情景为例,自动感知科研用户的需求,提供论文题目推荐、投稿指导和专利合作推荐等服务,实现动态嵌入式科研服务,为智慧图书馆创新科研服务建设提供路径参考。

系统根据董老师的实时动态画像,预测董老师在结合未结题的科研项目给研究生魏某遴选毕业设计题目,并结合科研项目信息(名称、研究方向、现有成果、考核指标等)综合分析出此项目结题还需要1篇北大核心期刊论文和1项发明专利。

结合科研用户动态画像的课题论文指导。系统结合董老师最近的检索关键词组(围术期、UWB和手术行为管理)和预约的UWB技术类书目,为董老师推荐硕士研究生毕业设计论文题目《基于UWB技术的手术行为管理系统的研究与设计》。此毕业论文衍生的小论文《基于UWB技术的手术行为管理系统的构建与应用》,可以投北大核心期刊,便于学生毕业和项目结题。系统根据知网期刊综合影响因子和有无信息类或主题相关的投稿栏目进行排序,依次推荐《中华医院管理杂志》《中国医院管理》和《中国医院》3家北大核心期刊。系统把这些论文指导信息实时推送到手机端,请董老师进行参考和相关评价。

结合科研用户动态画像的专利合作推荐。系统结合董老师的动态画像信息,推荐申请UWB定位算法的发明专利,并通过匹配全校的科研用户画像,给董老师推荐两位可以合作的科研用户(胡老师和吴老师)。胡老师近5年作为第一发明人授权6项发明专利,其中《一种医院复杂环境室内定位系统及定位方法》的主题和应用场景与董老师的专利较为吻合。吴老师近5年作为第一发明人授权17项发明专利,其中7项是算法类研究。系统将这些专利合作信息实时推送到手机端,并请董老师进行相关查阅、评价和反馈。

5 总结

笔者将场景五力引入智慧图书馆的科研服务体系,利用移动设备、传感器、社交网络和定位系统感知科研用户的行为习惯和内容偏好,并结合具体情景深度刻画科研用户动态画像,通过大数据技术精准预测科研用户需求,提供场景化科研服务。深入分析了科研用户动态画像概念模型,细致地勾勒了董老师某个情景下的科研动态画像,形象地展示了画像内容。重点描述了融合智能推荐的精准检索服务,依托研究前沿的全景式多维竞争分析和覆盖科研项目全生命周期的动态嵌入式科研服务,为智慧图书馆科研服务体系建设提供一个全新思路和实现路径。

猜你喜欢
画像检索标签
威猛的画像
“00后”画像
画像
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
专利检索中“语义”的表现
标签化伤害了谁
科学家的标签
潜行与画像
国际标准检索