基于引文分析的高校教研人员文献需求与数字馆藏保障调研

2015-02-19 01:14彭丽文

彭丽文

(杭州师范大学图书馆,浙江 杭州 311121)

基于引文分析的高校教研人员文献需求与数字馆藏保障调研

彭丽文

(杭州师范大学图书馆,浙江 杭州 311121)

摘要:建设以读者需求为导向的数字馆藏,已成为高校图书馆日益重视的一项工作.以杭州师范大学2013年SCI发文的文后参考文献为研究样本,运用引文分析法,分析该校教研人员文献需求和数字馆藏保障情况,提出在数字馆藏建设中学科配置、文献类型、新增剔旧、学科服务等方面的建议.

关键词:引文分析;数字馆藏;文献需求

引文分析法(citation analysis),就是利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用和被引用现象进行分析,以便揭示其数量特征和内在规律的一种文献计量研究方法[1].引文分析精确、可靠[2],利用引文分析法是进行用户研究的一种重要途径[3].《科学引文索引》(Science Citation Index ,SCI)为最早问世和杰出的引文索引系统[4],SCI数据库选择收录的是理工类各学科领域中高影响力的期刊.SCI发文及其引用的参考文献能够充分揭示科学研究的脉络,较强反映出读者的文献信息需求.

随着近年杭州师范大学(后文简称“杭师大”或“HZNU”)人才队伍建设力度的加大,教研人员通过网络获取图书馆数字文献资源的需求大幅增加,如何在有限的文献采购经费条件下,兼顾众多学科的教研人员类型读者(后文仅用“读者”指代)的文献需求,保障数字馆藏的数量与质量,已经成为图书馆的一个重大课题.本文即以杭师大2013年SCI发文及其文后参考文献为研究样本,应用引文分析法较为科学、直观、准确地获知读者的文献需求,分析数字馆藏的保障情况,并对数字馆藏建设提供有力的依据.

1 数据来源

检索时间:2014年2月22日;检索平台:Web of Science;

检索式:AD=(Hangzhou Norm* Univ*) AND PY=2013 精炼依据: DOCUMENT TYPES: (ARTICLE OR REVIEW);

检索库:Scientific Citation Index Expanded(SCI-EXPANDED);

检索出杭师大2013年发表ARTICLE 或 REVIEW 类型SCI论文591篇(施引文献,后文简称“发文”),其文后参考文献共23 960篇(引证文献,后文简称“引文”).

2引文分析与读者文献需求

2.1 学科领域的引文数

参考文献将591篇SCI发文记录按“研究方向”、“数”字段进行统计,发文20篇以上的研究方向及其篇均引文数如表1所示. 从杭师大2013年SCI发文及文后分析教研人员的文献信息需求,并对比该校数字馆藏保障情况,提出如下结论与建议.

表1 发文量较多的研究方向及其篇均引文数

注:在Web of Science中,同一篇SCI发文可能归类于多个研究方向.

表1显示:物理、化学、数学等是杭师大发文较多的学科;对比检索到的SCI数据库中“国家/地区”为“PEOPLES R CHINA”同期各研究方向的发文占比,神经科学、植物学、农学、天文学与天体物理学应该说是杭师大比较有特色的学科.不同学科的篇均引文数差别较大,篇均引文较多的有神经科学、生物化学与分子生物学、化学、植物科学等,最多的是神经科学,篇均引用57篇参考文献,可见该领域的研究需要更多文献的支持.

2.2 引文年代分布

在23 960篇引文记录之中,1753—1967年的有296篇,2013年当年的有473篇,缺少发文时间字段的有33篇.

首先,取1968—2012年之间的引文记录共23 158篇,以5年间隔为单位,分析引文的时间分布情况.图1能让我们从较长时期考察,读者对文献的需求更多地集中在近5年,对回溯文献需求的年代分布呈指数曲线趋势变化.

图1 引文篇数年代总体分布Fig. 1 The total distribution of citation numbersper 5 years from 1968

再对1994-2013年20年间的引文,以自然年度为单位,得到引文篇数时间序列分布图.如图2所示,读者引用的参考文献高峰年度是2011年,即往前第二年,其后依次是前第三年、前第一年、前第四年,这无疑与普赖斯提出的“科学论文发表后的两年才达到被引用的最大值”[5]相吻合.

图2 1994-2013年间引文篇数年代分布Fig. 2 The total distribution of citation numbers per years from 1994

2.3 引文文献类型分析

除去741篇由于字段不全而无法确认的引文记录,对余下23 219篇引文的类型进行统计.表2显示:读者对文献类型的需求是多样化的,特别是期刊占绝对的优势,总占比达到了95.62%;其次是图书,占比明显较小;再次是会议论文,从206篇会议论文的来源来看,读者尤其对IEEE和ACM的会议文献关注度较高;在能够甄别出为开放获取的73篇文献中,有59篇来自arXiv.org预印本网站.同时,读者对专利、学位论文、标准、未公开文献也有一些需求.

表2 各类型的引文数

2.4 引文的来源期刊

对表2中所述的22 201篇期刊类引文进行分类汇总,得到来源期刊4 415种,按被引频次分段统计期刊种数,如表3所示.

表3 来源期刊的被关注情况

一般我们认为,被引越多的期刊被读者关注的程度越高[6].表3显示:被引50次以上的期刊共有69种,占期刊总数的1.56%,此处称其为读者非常关注的期刊;被引10次以上的期刊共有362种,占期刊总数8.20%,此处称其为读者经常关注的期刊.有趣的是,有79.16%的引文(17 582篇)来源于被引次数大于5次的675种期刊(占来源刊总数的15.29%),即读者引用的大部分文献仅集中在少数期刊,也印证了E.Garfield曾提出的“引文集中定律”[7].

对被引用50次及以上的69种期刊,通过检索Web of Science 2012年JCR(Journal Citation Reports),对每种期刊记录中学科属性的第一项进行学科归类,得到各学科期刊占比.从图3可见,杭师大2013年SCI发文的引文来源期刊主要集中在化学综合、有机化学、物理综合、神经科学、应用数学等领域,由此也可推断出读者研究较为活跃的学科.

图3 被非常关注的期刊学科分布

2.5 被高度关注的期刊

对于被引次数大于200的11种期刊,此处称之为读者高度关注的期刊,其被杭师大读者引用的文献篇数、施引的杭师大SCI发文篇数,以及期刊所属学科(取2012年JCR记录中学科属性的第一项)及其在学科内影响因子(impact factor,IF)排名见表4.

Fig. 3 The subject distribution of the main source journals

施引文献数体现了该期刊被关注的广度,表4显示《SCIENCE》被最多的发文所引用,说明被较多的读者所关注;篇均引文数能反映读者对期刊关注的深度,有57篇发文引用了《PHYS REV B》的载文共519次,篇均引用达到9.1次之多;而《PHYS REV LETT》被读者关注的广度和深度都在前列.

另外,此11种被读者高度关注的期刊,IF排名大多数都不在所属学科的前三名之内.究其原因,笔者认为:一方面,同一学科内不同期刊收录的文献在研究方向上会有偏重;另一方面,与文献的可获取性有关系,即使是研究领域TOP 1的期刊,因缺藏而无法获取全文则会直接阻碍读者使用该刊的载文,例如,《PHYS REV B》所属学科“PHYSICS, CONDENSED MATTER”,经查IF排名第一的《NAT MATER》是缺藏期刊,其引文数仅40篇.

3馆藏数字资源保障分析

3.1 馆藏文献类型分析

目前,杭师大馆藏学术类数据库按文献类型分,购买情况见表5.对照表1所示物理、化学、数学、植物学等杭师大优势学科,学科领域比较知名的专业数据库都有建藏,但目前缺少神经科学专业数据库,不过该学科IF排名前五的期刊都有电子馆藏.对照表2所示读者的文献类型需求分析,目前缺藏外文的会议论文、报纸数据库,以及中外文的专利数据库、标准数据库.

3.2 读者非常关注的电子期刊

读者非常关注的69种期刊,有电子现刊的共59种(包含了读者高度关注的11种),无电子现刊的共10种.馆藏电子现刊主要来源于:Science Direct 16种、ACS 11种、Wiley 10种、APS 6种、RSC 4种,Oxford、AIP、IOP 各2种,Springer、Nature、Science、PNAS、Taylor、APA各1种,满足率为85.51%.无电子现刊的10种刊主要涉及化学、生物、物理学科,其中有1种订购了纸质刊.

表5 馆藏学术数据库

3.3 读者高度关注的电子期刊

读者高度关注的期刊虽然全部都有电子现刊,但由于数据库购买年限的问题,有些回溯文献是不能下载全文的,从其引文篇数的满足率来看保障情况,如表6所示.

表6 读者高度关注的电子期刊文献满足率

注:部分期刊在馆藏的JSTOR、EBSCO等集成数据库中能够找到回溯文档,此处暂未计入文献满足率.

4读者需求与馆藏保障总结及建议

4.1 把脉学科,按需分配

学校理工类优势学科为物理、化学、数学等,篇均引文最多的是神经科学,读者非常关注的期刊主要集中在化学综合、有机化学、物理综合、神经科学、应用数学等领域,图书馆应以此作为合理配置学科资源、做好文献信息资源采购规划的重要依据,在学校学科规划基础上和有限的经费条件下,取得资源广度和深度上的最佳平衡点[8].

4.2 丰富种类,优化结构

读者对文献类型需求具有多样化的特点,其中期刊论文以95.62%的比例占绝对优势,这与电子期刊能够承载快速创新的知识而电子图书出版迟滞且阅读仍然存在障碍有关[9],因此数字馆藏结构应以电子期刊为主,同时根据不同学科需求兼顾图书、学位论文、会议、专利、标准等各种类型的学术文献资源.

4.3 新增剔旧,讲究策略

要建立一套数据库和电子期刊试用、评估、新订、续订、停定的一整套工作规范与机制,摒弃只新增不剔旧的做法.在购买策略上灵活多样,例如按专辑购买、单刊购买等.根据对读者所关注的电子期刊的分析,非常关注的电子现刊种数满足率为85.51%,其中高度关注的电子现刊种数满足率为100%.但表6显示被高度关注期刊的数字文献总体满足率仅为82.19%,这主要是由于其回溯年限较短的关系.对于如此重要的缺藏或缺少回溯的期刊,图书馆应该考虑单刊购买,这是在数字资源蓬勃发展而采购经费增长相对较慢的历史趋势下,越来越多的文献机构所采用的方法.例如,麻省理工学院图书馆近年就对Science Direct等数据库不再进行整库购买,而是较多采用单刊购买的方式精选数字馆藏.同时应做好已购资源的使用监测,对于利用率低的数据库和期刊,可以在征求读者意见的基础上及时停购.

4.4 深入学科,按需服务

图书馆的馆藏都是有限的,也无法满足所有读者的需求,而图书馆可以通过服务来弥补这一缺憾.首先,图书馆要做好已有馆藏的揭示和网络免费资源的导航工作,使读者能充分了解馆藏、方便快捷地获取文献;其次,图书馆应加强文献传递服务,充分利用CALIS(中国高等教育保障系统)、CASHL (中国高校人文社会科学文献中心)、ZADL(浙江省高校数字图书馆)等文献保障系统帮助读者获取所需文献,提高本校的文献保障率;再次,图书馆要建立有效的学科服务的工作机制,深入学科与读者保持良好的沟通与互动,及时了解读者需求和推送信息.例如,有一些重要期刊被收录在不常用的馆藏数据库中,学科馆员可以通过RSS订阅等方式将文献主动推送给读者.通过学科服务,学科馆员甚至可以与教学科研人员建立长期的联系,详细地了解其信息需求,提供更多的有针对性的服务.

[1] 邱均平.文献计量学[M].北京:科学技术文献出版社,1988:289.

[2] 王崇德.社会科学研究方法要论[M].上海:学林出版社,1990:111.

[3] 倪波.文献学概论[M].南京:江苏教育出版社,1900:298.

[4] 邱均平.二次情报资源的开发与利用研究:《中文自然科学引文索引》的综合开发与统计分析[J].武汉大学学报:社会科学版,1989(4):121-129.

[5] 王崇德. 文献计量学教程[M]. 天津:南开大学出版社,1990:261.

[6] 赵大良. 科研论文写作新解:以主编和审稿人的视角[M].西安:西安交通大学出版社,2011:145.

[7] 邱均平.文献计量学[M].北京:科学技术文献出版社,1988:323.

[8] 焦坤,夏秋菊,李正龙.面向学科的SCI论文的引文数字资源保障分析[J].情报杂志,2012(7):72-75.

[9] 莫建华.基于引文分析的科研人员文献需求透视:以浙江工业大学人文社科省级重点学科为例[J]. 情报探索,2013(11):31-33.

The University Staff’s Document Requirements and Digital Collections

Guarantee Based on the Citation Analysis

PENG Liwen

(Library, Hangzhou Normal University, Hangzhou 311121, China)

Abstract:It is of great importance for the university library to build the digital collections according to the readers’ requirements. The article makes a citation analysis based on the published SCI articles from Hangzhou Normal University in 2013, and analyzes the researchers’ literature requirements and digital collections guarantee. And the suggestions of subject setting, document type, increasing and weeding as well as subject service are also provided.

Key words:citation analysis; digital collections;literature requirements

文章编号:1674-232X(2015)01-0107-06

中图分类号:G25

文献标志码:A

doi:10.3969/j.issn.1674-232X.2015.01.020

通信作者:彭丽文(1977—),女,馆员,硕士,主要从事图书馆信息咨询研究.E-mail:pengliwen@hznu.edu.cn

收稿日期:2014-07-22