《山西医科大学学报》审稿专家精准化推荐系统的应用

2022-06-26 07:11贺亚辉吴胜男李军纪
山西医科大学学报 2022年5期
关键词:检索界面稿件

贺亚辉,吴胜男,李军纪*

(1 山西医科大学管理学院,太原 030001;2 山西医科大学学报编辑部;*通讯作者,E-mail:junji2003@163.com)

目前,《山西医科大学学报》编辑部的审稿专家遴选机制主要通过以下几种方式获取审稿专家信息:在学报编辑部的学术关系网内获取、从来源稿件的参考文献作者中寻找;根据文章题名和关键词等关键字段信息从中国知网、Web of Science、专家库、专家所在单位的官网获取;从作者及其研究团队已发表成果中获取相关资讯信息等[1]。最后,期刊编辑综合自身知识素养及编辑部的审稿专家数据库信息进行最终的审稿专家选用与优选。随着新兴医学学术领域的不断涌现和学术领域的不断融合交叉,医学领域期刊的来稿量愈发增多[2],如网络问诊[3]、基因组学[4]等,学术期刊的同行评审负荷不断增加。此外,同行评审专家由于学术视野和学缘结构的约束,难以准确地判断某些新领域的学术趋势和动向,难免会在学术论文的评判中出现偏倚[5]。势必会影响学术期刊编辑的审稿效率和期刊的出版质量[6]。本文对《山西医科大学学报》预应用的信息检索网页平台进行功能介绍,评价其对期刊编辑审稿专家遴选工作的支持作用,以期提高期刊编辑工作的效率与质量。

1 信息检索网页平台介绍

本文介绍的系统是基于Django框架之上建立的信息检索网页平台。Django框架是一种使用Python语言开发的Web应用框架,通过开发服务端来提供服务,提供了强大的后台管理系统,最初于2005年发布,应用于新闻行业网站[7],非常适用于内容管理系统类型的应用。数据库为MySQL数据库[8],服务器端建立在VMware虚拟机上,操作系统为Linux系统,期刊编辑可通过输入IP(Internet Protocol,网际互连协议)地址直接访问平台系统的操作界面。

目前,该服务器端数据库约有95名左右审稿专家信息,数据库数据更新时间截止至2021年11月。数据库数据包括审稿专家发表文献特征信息、文献的基金信息、文献被收录期刊来源及期刊复合影响因子、h指数等内容数据,基本涵盖了审稿专家学术领域特征。当有来源稿件需要分配审稿专家时,网页平台即可利用具有审稿专家遴选逻辑功能的评价体系算法对数据库的审稿专家信息进行分析,获取与来源稿件相关的审稿专家排序信息,通过进一步对审稿专家与来源稿件相关的数据库数据二次分析及可视化,即可将审稿专家与来源稿件相关的学术领域特征通过人机交互界面展现给期刊编辑。

具有审稿专家遴选逻辑功能的评价体系算法由关联度评价、传播效应评价、专长吻合度3个指标利用目标优化矩阵法[9]联合而成。关联度评价指标评价了来源稿件与审稿专家发表文献之间的文本关联度高低;传播效应评价指标则评价了审稿专家发表文献在分享和传播过程中形成的影响力高低;专长吻合度评价指标则评价了审稿专家在与来源稿件相关的研究领域的擅长程度高低。

网页平台的人机交互界面分为三级界面,分别为信息检索层、检索结果层、信息展示层。在信息检索层可以由期刊编辑输入期刊来源稿件的关键字段信息进行加密检索,平台经评价体系算法的编码逻辑,判断来源稿件与数据库中审稿专家的匹配度高低,赋予审稿专家不同的分值,即可得到审稿专家从高到低的排序结果,并将其回传至检索结果层;检索结果层则对审稿专家排序结果进行了展示,通过点击检索结果层的审稿专家姓名即可跳转到信息展示层;在信息展示层展示该审稿专家发表文章中与来源稿件关联度最高的前10篇文献信息、时间-发文量柱状图、词云图、LDA聚类交互式可视化界面共4个功能模块。

本文以“慢性肾衰竭伴甲状旁腺激素升高的相关因素分析”标题字段进行检索为例,对平台功能进行展示。

1.1 检索结果层

在网页平台的信息检索层界面进行上述标题字段检索,在检索结果层界面可得到共计45名审稿专家排序结果,表明在当前审稿专家数据库中,有45名审稿专家涉足肾衰竭等肾脏疾病领域方向。由于界面中显示的审稿专家结果过多,在对患者敏感信息进行处理的基础上,仅显示排名前8位的审稿专家姓名(见图1)。点击审稿专家姓名后,即可跳转到信息展示层。

图1 检索结果层的审稿专家推荐结果Figure 1 The results of recommended peer reviewer in the retrieval result layer

1.2 信息展示层

前10篇文章信息是按照关联度评价指标对审稿专家的相关发表文献进行评分,然后按照评分从高到低排列。排名第一的审稿专家的前10篇发表文章与肾衰竭紧密相关,并且文献来源于《中国中西医结合肾病杂志》等专注于肾脏疾病研究的期刊和学会(见图2)。说明在目前的审稿专家数据库中,该审稿专家在肾衰竭等肾脏疾病领域有一定的权威性。

图2 按与来源稿件文本关联度从高到低排列的审稿专家前10篇文献信息Figure 2 Information of the top ten literatures of the peer reviewers ranked from high to low according to the correlation degree with the source manuscript

时间-发文量图则展示了该审稿专家文档集中与来源稿件关联的文献数量随发表时间的变化情况,展现该审稿专家在该研究领域的发文状况。排名第一的审稿专家共计有48篇文献与检索词相关。自2001年起,该审稿专家就首次进行了与肾脏疾病相关的研究,2008年以后进行了持续研究,2016年发表量达到峰值,表明该审稿专家对肾衰竭领域的相关研究日渐深入;近年来,该审稿专家在肾衰竭领域的相关研究减少(见图3)。

图3 审稿专家与来源稿件相关的发文量的时间序列Figure 3 Time series of peer reviewer’s publications related to source manuscripts

词云图展示了该审稿专家与来源稿件相匹配的文档集的关键词字段的频次高低信息。信息检索平台利用排名第一的审稿专家的48篇文献的关键词频次构建了词云图,其中,慢性肾衰竭、慢性肾脏病、糖尿病肾病、结肠透析等文献特征词最为突出(见图4),表明了该审稿专家的重点研究方向。

图4 与来源稿件相关的审稿专家文献集关键词的词云图Figure 4 Construct Word cloud graphs of keywords from reviewer literature related to source manuscripts

LDA聚类交互式可视化界面则是对审稿专家文献中与来源稿件相匹配的文献的标题、关键词、摘要字段信息进行LDA算法计算得到的聚类结果。通过文本聚类可以有效地降低文本中存在的噪声,进行信息融合,得到文本内在的知识结构,可以让期刊编辑对审稿专家的学术方向有着更加精准的认知。该界面因整体界面大,单一图片无法完整展示信息,因此分图进行叙述。该界面共分为两大部分:第一部分为文档主题关联度可视化界面;第二部分则展示了选中的主题内,特征词与主题关联度的可视化界面。

第一部分内容信息见图5。在这个界面中,圆圈代表不同的主题,圆圈之间的距离越远,代表主题之间的相似性越低;圆圈之间有重叠,代表主题彼此的关键词有交叉;圆圈越大,圆圈内的数字越接近1,表明该主题越能代表该审稿专家的研究主题。在排名第一的审稿专家的LDA聚类图中,共计展示了21个主题,其中主题1圆圈最大,并且与其他主题保持较远的距离,与其他主题相似性低,最能代表该审稿专家的研究主题。

图5 与来源稿件相关的审稿专家文献集的聚类分析Figure 5 Cluster analysis of reviewer literature related to source manuscripts

图6显示了主题1中按权重占比从大到小排序的前30个特征词,30个特征词占该审稿专家48篇文献所有特征词的24%权重。蓝色的部分代表该特征词占该审稿专家48篇文献所有特征词的权重,红色的部分代表该特征词在这个主题中的权重,通过调整λ值,30个特征词从上至下的排列顺序随之发生变化,λ值越靠近0时,排名越靠前的特征词与该审稿专家的关联度越高,λ值越靠近1时,越靠前的特征词与该主题的关联度越高。其中,DN、糖尿病肾病、TSP、肾间质纤维化、终末期肾脏病、肾组织、终末期、免疫炎症等特征词与该审稿专家48篇文献所有特征词和主题1的关联度均很高。无论是在文本内在的知识属性还是在词云图表明的文本特征词频次上,表明该审稿专家在肾衰竭领域的研究有着一定的广度和深度。

图6 主题1内的前30个特征词可视化界面Figure 6 Visual interface of the top 30 characteristic words in topic 1

经过对与检索词相关的、排名第一的审稿专家学术领域外在特征和内在知识架构的分析及描述,可得出,在目前的审稿专家数据库中,与检索词相关的、排名第一的该审稿专家在肾衰竭的肾脏疾病研究领域有着一定的权威性。

2 讨论

面对信息化全域赋能的趋势,为了弥补编辑部应用的勤云采编系统审稿专家获取和优选功能的缺失,提高期刊同行评审机制的效率与质量,本文着重对具有审稿人遴选功能和审稿人信息展示功能的信息检索网页平台功能进行了介绍。面对来稿量激增和学科领域不断交叉融合的现状,该网页平台在审稿专家数据库完善的前提下,可以为期刊编辑提供具有参考价值的审稿专家推荐结果,并可对与来源稿件相关的审稿专家学术领域特征属性进行二次分析,将分析结果以文字、图片等可视化界面展现给期刊编辑,提高了期刊编辑获取审稿专家学术领域信息效率,有助于加强期刊编辑对该审稿专家的认知。尤其在面对新兴的医学领域投稿时,该网页平台可以突破期刊编辑在学术视野和学缘结构上的局限性,对学报编辑部的审稿专家遴选机制起到辅助决策的作用,有助于推进科技期刊的集群化建设。

猜你喜欢
检索界面稿件
不同截面类型钢管RPC界面粘结性能对比研究
征集汽车电子类稿件
整合品牌栏目 征集优秀稿件
微重力下两相控温型储液器内气液界面仿真分析
整合品牌栏目征集优秀稿件
CNKI检索模式结合关键词选取在检索中的应用探讨
国企党委前置研究的“四个界面”
瑞典专利数据库的检索技巧
英国知识产权局商标数据库信息检索