HistCite Pro在文献统计分析中的运用
——以国际“宽恕”研究为例

2021-07-07 13:44刘国庆
内蒙古科技与经济 2021年10期
关键词:文件夹参考文献可视化

芦 晓,刘国庆

(1.贵州师范大学 图书馆;2.贵州师范大学 心理学院,贵州 贵阳 550025)

1 HistCite Pro软件介绍

HistCite(History of Cite),意为引文历史,或者叫引文图谱分析软件。该软件系SCI的发明人加菲尔德开发[1],能够用图示的方式展示某一领域不同文献之间的关系。这是一款非常强大的引文分析工具,可以快速绘制出某个研究领域的发展脉络,快速锁定某个研究方向的重要文献和学术专家,还可以找到某些具有开创性成果但无指定关键词的文献。 HistCite软件是Thomson Reuters公司开发,和WOS是同一家公司,所以HistCite只支持WOS数据库,原版本已长时间不更新,且操作复杂。中国科学技术大学大王庆老师利用Python开发了一个方便使用的脚本,一个以HistCite源程序为核心的精简易用免安装版本由此诞生,即HistCite Pro版本。由于HistCite源程序只支持Windows系统,所以Pro版本也只能在Windows系统下运行[2]。HistCite Pro软件只要下载就可以直接使用,不用安装。对于从WOS上导出的txt数据文件,不用做任何修改,只要把全部的txt数据文件放到TXT文件夹里面,然后双击main.exe即可一键完成加载,非常方便。

图1 HistCite Pro文件

2 利用HistCite Pro下载及分析“宽恕”研究文献

HistCite Pro软件的使用大体可分为三个部分,分别是From WOS、To Analysis及Output the Results,下面利用HistCite Pro下载及分析国际对“宽恕”的研究文献。

2.1 From WOS

即在Web of Science平台搜索下载文献。打开Web of Science网页,如图2所示。

图2 web of Science界面

选择数据库“Web of Science核心合集”;检索条件可以根据自身研究设定,本例为Title=forgiveness、Time Span=1998-2018;然后点击检索。会出现如图3所示的搜索结果,发现符合搜索条件的文献有1 896篇。选择点击“保存为其他文件格式”,出现图3中的对话框,WOS默认最多可下载500条数据,选择“记录1至500”,记录内容选择“全记录与引用的参考文献”,文件格式选择“纯文本”,点击“发送”。WOS会发送含此500条文献记录的“savedrecs.txt”文件至指定文件夹,HistCite软件分析时要求将此.txt文件全部放入图1中的“TXT”文件夹,此处可直接保存至此文件夹。

图3 下载WOS文献至TXT文件夹

因符合搜索条件文献有1 896篇,每次最多可下载500篇文献,故需重复四次上述过程,即“记录数”分别为1~500、501~1 000、1 001~1 500、1 501~1 896,最后将4个“savedrecs.txt”文件全部存入图1中的“TXT”文件夹。至此,文献下载过程结束。

2.2 To Analysis

即用HistCite Pro软件对2.1导入的数据进行分析。这时双击图1 HistCite pro文件中的“main”程序,出现图4窗口的上半部分。为解决部分计算机的兼容性问题,HistCite Pro软件采用Python的多线程实现了ADV模式[3],如没有兼容问题,确认将所有“savedrecs.txt”文件已放入.TXT文件夹,则可直接输入“YES”。按“Enter”键,则会出现图4窗口的下半部分:显示HistCite Pro软件运行了在WOS数据库下载的4个.txt文件。

图4 HistCite运行窗口

这时,程序会自动打开一个浏览器窗口,将分析结果显示在浏览器窗口,如图5所示。若没有自动打开浏览器,也可通过手工输入,网址:http://127.0.0.1:1925/来实现。需要注意:在整个数据分析过程中此窗口不能关闭[4]。

2.3 Output the Result

通过上述分析,HistCite Pro软件会将分析结果在浏览器网页中打开,如图5所示。至此,文献的下载及分析过程结束,后续就是对分析结果的解读。

图5 HistCite Pro分析界面

3 利用HistCite Pro分析“宽恕”研究现状

从HistCite Pro软件对以往文献的分析结果可以得出关于某领域的研究作者、文献发表时间、发表期刊、关键词及文献引用和被引用频次的可视化分析[5]。此外,还可以将文献有选择地导入EndNote软件,为后面的论文写作做准备[6]。下面以国际对“宽恕”的研究为例,依次介绍。

3.1 “宽恕”研究发表时间、作者、期刊、关键词

在图5窗口下点击Analysis→Yearly Output,或者直接点击图5区域2的Yearly Output,则会出现图6(左),可以看到每年的文献总数(RECS)、每年文献的本地引用频次(TLCS)和总引用频次(TGCS)。再点击Histogram,则得到图6(右),为每年“宽恕”研究总文献量的柱状图。从图6中可以看出,近二十年来“宽恕”研究逐年增多,“宽恕”研究热潮仍在继续。

图6 “宽恕”研究的发表时间情况

图7 “宽恕”研究的发文数前15位作者

点击Analysis→Authors,或者直接点击图5区域2的Authors,则可得到图7界面。是对所有的文献作者按发文数进行排序:1 896篇“宽恕”研究文献共有2 714位作者,图7截取了前15位。通过此分析,可以快速了解“宽恕”研究领域内的重要研究者[7],也就是大家俗称的此领域内的“专家大牛”。

点击图5区域1的Analysis→Journals,也可直接点击图5区域2的Journals,可得到图8界面。图8是对所有文献发表期刊排名,通过此分析,可以看出哪些期刊发表“宽恕”研究的文章较多,研究者可在此领域论文发表选择期刊时参考此分析[8]。

图8 “宽恕”研究的发文期刊前15位

图9 “宽恕”研究的前15位关键词

点击图5区域1的Analysis→Words,也可直接点击图5区域2的Words,可得到图9界面。图9是对所有文献中的关键词进行排序,通过此分析可以看出“宽恕”的研究方向,与“宽恕”联系紧密的领域等。如本例中通过此分析可知,与“宽恕”研究最为紧密的有自我、和解、人际关系、公平、角色、健康等概念。

此外,通过HistCite Pro还可以对“宽恕”研究领域的语言、国别、研究机构等进行分析,方法与上述类似。

3.2 “宽恕”研究文献的引用和被引用频次指标及其可视化分析

可视化分析能将问题直观化,是众多统计分析方法的目标[9]。HistCite Pro就可以对文献引用与被引用的关系进行可视化呈现,让研究者对众多引文间的关系尽快明了,在海量的文献中有选择性地详览重要、关键文献,近而用最短的时间了解此领域。下面先介绍文献引用和被引用的几个指标。

①GCS(global citation score),即总引用频次,它表示这篇文章被整个WOS数据库中所有文献引用的次数。②LCS(local citation score),即本地引用次数,它表示这篇文章在当前数据集中被引用的次数。在此例中,即被导入的1 896篇文献引用的次数。因为导入的文献是“forgiveness” 的搜索结果,所以如果一篇文章的 LCS 值高,意味着它是“宽恕”研究领域内的重要文献。③CR(cited references),参考文献数,它表示这篇文章的参考文献在整个WOS数据库中的数量。此指标针对比较新的文献,刚刚发表还未被其他文献引用,但可以从新文献对以往文献的引用分析其重要性。④LCR(local cited references),本地参考文献数,它表示这篇文献的参考文献在当前数据集中的数量,即这篇文献引用他人的情况。如果一篇文章的LCR值高,意味着它引用了大量的“Forgiveness”领域内文献,极有可能是较新的综述性文章。

简而言之,LCS和LCR 更重要,它们分别代表了与本领域相关联的被引用数和引用数,LCS值高的文章一般是重要的新发现或者新解释,LCR 值高的一般是综述类文章[10]。下面主要运用LCS和LCR对较重要的文献进行可视化分析。

点击Tools-Graph Maker,在跳出界面上点击Make Graph,会出现图10界面。图10是将LCS值最高的30篇文献进行作图分析:上侧为菜单,可以直接打印、保存关系图;左侧菜单为关系图的设置菜单,包括以LCS或以GCS为参照、图中文献的数量、设置成圆圈还是方框、圆圈的大小、序号的位置及大小、箭头的朝向及大小等,重新设置后要点击“Make Graph”才会重新作图;右上侧即为基于LCS或GCS的关系图,圆圈大小代表引用或被引用的频次,箭头方向可以设置为引用或被引用[11],如图中箭头指向是被引用的文献,点击圆圈内的文献序号会弹出新的网页为此篇文献的作者、题目、摘要等详细信息;下侧则为30篇文献的出版信息。在此例中,发表于1999年的49号文献被引用较多且较早,有可能为“宽恕”研究领域的开山之作;217、237、199等文献也被引用较多,可能为特别重要关键的文献,如想熟悉“宽恕”的研究情况,这几篇文献需要详细阅读。

图10 Graph Maker界面

3.3 选择文献导入EndNote

EndNote软件也是研究不可或缺的工具之一,其功能集文献搜索、下载、阅读、论文写作于一体,文中不作详细介绍。HistCite Pro中的文献可以有选择地导入EndNote软件,这样就使科学研究中的文献分析、文献阅读、论文写作等环节可以无缝对接[12],具体操作为:在图5界面依次点击Tools→Mark & Tag,则会出现图11界面。

图11 Mark & Tag界面

图11中点击右侧LCS,则所有文献按照LCS由高到低排序,如想选择LCS前十位的文献导入EndNote,则点击前十篇文献序号右侧的方框,方框中出现“√”,点击右侧的“mark”按钮,这时上侧的“Marks”处会出现“10”,表明这时已“Mark”了10篇文献。当然还可以考虑其他条件继续进行Mark:如点击LCR,可以标记LCR排名前十的文献,点击右侧的“mark”按钮,这是上侧Marks处应该出现全部被标记的文献数量(这时不一定是20,因为LCS前十与LCR前十的文献有可能重合)。且这时点击上侧的“marks”,被标记的全部文献则会出现在页面。

全部选择完欲导出的文献后,依次点击File→Expor→Records,则会生成一个“HistCite export file.hci”的文件,注意这时需要将后缀.hci改为.txt,保存此文件,打开EndNote软件导入此文件,则将上面所选文献全部导入了EndNote软件。

4 结束语

HistCite软件对于研究人员、图书馆员、教师、编辑人员等都非常有用,其发明者尤金·加菲尔德强调,HistCite软件可以让你快速知晓某个研究领域的历史和现状[1]。软件可直接从汤森路透官网下载,特别是经过国内研究人员改进的HistCite Pro版本,使用非常方便快捷,是研究人员把握某领域研究现状、研究趋势的一把利器。但需要指出的是,再快捷的工具永远替代不了阅读文献,特别是对于某领域的新进研究者,阅读文献的数量是基本保证,HistCite Pro软件只不过是帮助研究者筛选出这些应该阅读的重要、关键文献。

猜你喜欢
文件夹参考文献可视化
基于CiteSpace的足三里穴研究可视化分析
自然资源可视化决策系统
思维可视化
自然资源可视化决策系统
Fast Folders,让你的文件夹四通八达
The Muted Lover and the Singing Poet:Ekphrasis and Gender in the Canzoniere*
摸清超标源头 大文件夹这样处理
调动右键 解决文件夹管理三大难题
Study on the physiological function and application of γ—aminobutyric acid and its receptors
不容忽视的空文件夹