基于SCI的国外“数字图书馆”研究文献计量分析

2011-11-17 01:25陶蕾
现代情报 2011年6期
关键词:文献计量分析数字图书馆

陶蕾

〔摘要〕基于SCI数据库对1995-2010年国外有关“数字图书馆”的研究论文,从文献增长、地区分布、出版机构分布、学科分布、作者等方面采用文献计量的分析方法,揭示了近十几年来国内外“数字图书馆”在该学科领域取得的巨大进步。

〔关键词〕数字图书馆;SCI;文献计量分析

收稿日期:2011-03-28

作者简介:陶 蕾(1977-),女,馆员,硕士,研究方向:图书馆资源建设,发表论文6篇。

DOI:10.3969/j.issn.1008-0821.2011.06.028

〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2011)06-0107-06

A Quantitative Analysis of Digital Library Research Articles Based on SCI

Tao Lei

(Library,Shanghai University,Shanghai 200444,China)

〔Abstract〕Based on the research results titled with digital library retrieved from SCI,author made a quantitative analysis from different aspects including papers increasing,area distribution, publication distribution,discipline distribution,authors etc.We can learn the research situation of digital library and the huge progress has made in this field all over the world during past several years.

〔Key words〕digital library;sci;literature quantitative analysis

“数字图书馆”概念一经提出就得到了世界广泛的关注,纷纷组织力量进行探讨、研究和开发,进行各种模型的试验[1]。笔者对cnki中国知网进行检索发现:目前“数字图书馆”相关文献的计量分析结果,只揭示了国内研究的文献规律,国外该类文献并未进行揭示,而发达国家对数字图书馆的研究非常活跃,因此使用其他研究工具对国外期刊该类文献进行计量研究是非常必要的。

1 研究工具和数据来源

本文选择Web of Science的著名产品SCI为主要研究工具,它收录了10 000多种世界权威的、高影响力的学术期刊,每一种期刊都是根据其所属学科领域的影响而选择的[2]。利用SCI的分析功能再加上EXCEL电子表格的图表功能,对国外1985-2010年有关“数字图书馆”研究的论文,从多个方面进行文献计量研究。

进入SCI数据库,搜索该数据库内所有有关“数字图书馆”的论文,检索式为:主题=(electronic librar*)OR 主题=(virtual librar*)OR 主题=(digital librar*)入库时间=所有年份.数据库=SCI-EXPANDED.精炼依据:文献类型=(ARTICLE)入库时间=1985-2009.数据库=SCI-EXPANDED.共检索出数字图书馆的相关论文3 498篇(截止2010年12月27日),本文将以此3 498篇论文作为来源数据展开分析,揭示“数字图书馆”研究的文献发展规律。

2 文献增长计量分析

2.1 按出版年的文献情况

国外数字图书馆早在1991年启动和实施:1991年俄亥俄州政府做出了启动俄亥俄网的决定,该网络定名Ohio LINK;1993年美国国家科学基金会、国家宇航局和国防部高级研究署联合公布了《数字图书馆启动计划》,领导、组织和资助美国的数字图书馆研究和开发;1994年在美国得克萨斯召开了第一次数字图书馆的理论研究会议,会议的议题是“第一届数字图书馆理论与实践年会”;同年11月美国国家图书情报科学委员会又主办召开了“第七届国际情报新技术大会”,对“全球数字图书馆”问题展开了较为深入的讨论;1995年在比利时布鲁塞尔召开了全球信息社会讨论会,这次讨论会被视为西方主要发达国家在社会信息化进程中的一个重要里程碑[3]。表1是SCI数据库中有关“数字图书馆”研究的论文发表情况:

表1 SCI数据库中“数字图书馆”研究的论文数量(1995-2010年)

由表1可以看出,国外“数字图书馆”的研究论文从1995年开始出现在SCI收录的期刊中,15年来该领域论文一直保持增速,从1995年的6篇迅速增加,到2010年论文数量达到了顶峰371篇。

2.2 文献增长曲线

(1)对于文献的增长规律,用指数曲线来拟合,得到著名的普赖斯指数增长模型,具体见图1:

图1 SCI数据库中“数字图书馆”研究的论文数量指数增长模型(1995-2010年)

从图1看出:1995-2004年10年间,论文数量和普赖斯指数增长模型拟合较好,2005年以后,文献数量的发展开始趋缓,这是由本身普赖斯曲线的局限性造成的:若依据预测学中的趋势外推法,利用普赖斯曲线来预测未来某个时候科学文献的总量,而预测期长于10年以上,则很难期望得到可靠的结果[4]。

(2)对于文献的增长规律,用线性曲线来拟合,得到文献线性增长模型,具体见图2:

图2 SCI数据库中“数字图书馆”研究的论文数量线性增长模型(1995-2010年)

科学文献线性增长模型不仅适用于描述某些知识领域或某些类型的文献增长,而且科学文献未来的发展将更多地倾向于直线模型[4]。从图1和图2可以看出:1995-2004年论文数量呈指数增长,而2004-2010年间,论文数量和线性增长模型拟合得非常好,正如勒希尔所指出:我们将从文献指数增长的过去,迎向线性增长的未来[4]。

3 国家地区论文分布

在有关“数字图书馆”的3 498篇论文中,除了有56篇不含国家地区字段的数据,其余的3 442篇论文通过SCI的分析功能,分布在91个国家地区,其中分布论文最多的前20位国家地区见表2:

表2 SCI数据库中“数字图书馆”研究的论文地区分布

从表2可以看出:论文发表的国家地区分布非常集中,美国、英国、德国等发达国家的论文数量处于名列前茅,其中美国的论文数量更是达到41.42%,这是因为在20世纪90年代,美国、加拿大、英国、法国等发达国家对数字图书馆的研究非常活跃,相继出台了一系列数字图书馆重点建设项目:美国国会图书馆国家数字图书馆项目、加拿大数字图书馆先导项目、英国elib项目、法国国家数字图书馆项目等,并投入了巨大的人力、物力,取得了许多重要的成果[5]。

值得注意的是:我国被收录的数字图书馆领域的论文数量排名第五,达到了196篇,其中183篇是英文投稿。从1997年开始,SCI数据库开始有中国地区的论文记录,1997-2000年,国内数字图书馆研究比较缓慢,2000年后开始蓬勃发展,许多数字图书馆的研究课题也是在1999或2000年之后才真正形成[6]。SCI数据库每年收录国内论文的情况如表3,指数增长模型如图3:

表3 中国地区论文情况

续表3

图3 国内论文指数增长模型

4 出版机构分布

4.1 出版机构论文发表情况

SCI检索出的3 498篇论文里,除了63篇不包含出版机构字段的数据,其余3 435篇论文分散在2 780个出版机构,发文最多的出版机构发表了46篇研究成果,只发表1~2篇的出版机构有2 281家,占所有出版机构的82.1%。具体的数据见表4:

表4 出版机构论文发表情况

4.2 高产出的出版机构

(1)通过SCI的分析功能,得到发表论文超过15篇的出版机构一共55家,具体的出版机构名称见表5:

表5 发表论文超过15篇的出版机构

从表5可以看出:美国的出版机构占绝对优势,55家出版单位中美国包揽35家占64%;其余20家出版机构占36%,分别来自英国(6家出版机构),意大利(3家出版机构),法国、新加坡、加拿大(各2家出版机构),德国、巴西、中国、俄罗斯、澳大利亚(各1家出版机构)。

(2)拿表5和晏尔伽、朱庆华在《1996-2005年SCI—E数据库中数字图书馆研究文献定量分析》一文中的数据对比,数字图书馆历经5年的发展进程,取得了许多重要的研究成果:

①产出量在15篇以上的出版机构由15家,迅速增加到55家,说明数字图书馆作为起初的一个概念已经发展成一个成熟的产业,关于它的研究和应用正在蓬勃开展;

②在晏尔伽、朱庆华《1996-2005年SCI—E数据库中数字图书馆研究文献定量分析》一文中提到的15家高产出机构:美国伊利诺艾斯大学、新加坡南洋理工大学、美国北卡罗来纳大学、美国罗特格斯州立大学、美国马里兰大学、美国亚利桑那大学、美国卡耐基梅隆大学、美国加利福尼亚大学洛杉矶分校、美国加利福尼亚大学圣巴巴拉分校、美国加利福尼亚大学伯克利分校、新加坡国立大学等,参照表5依然是数字图书馆领域的领跑者,排名最前的美国伊利诺艾斯大学(UNIV ILLINOIS)图书信息学院与美国北卡罗来纳大学(UNIV N CAROLINA)图书信息学院,据美国大学2007年Library & Information Studies图书馆和情报研究专业排名,这两所大学的图书信息学院并列为图书情报专业的第一名[7],这里从数字图书馆文献量的角度印证了其研究地位。

③中国科学院在表5中排名第6,已经是世界范围内数字图书馆研究的佼佼者。而5年前晏尔伽、朱庆华在论文中提到的15家高产出机构中,并未包括中国科学院,这说明2005年之后中国的数字图书馆研究蓬勃发展,并且中国科学院成为国内的该学科领域的领头羊。

④无论是5年前还是现在,IBM公司作为企业,一直致力于数字图书馆的研究,其余都是各国的高校研究机构。这说明无论国外还是国外,关于数字图书馆的核心机构主要是高校,公司企业对于数字图书馆的研究较少涉及,这个结论和邱均平在《1999-2008年国内数字图书馆研究论文的计量分析》一文中对国内研究情况的结论是一致的。

5 学科分布

经过SCI的数据分析,这3 498篇论文里,除2篇不包含学科类别字段的数据,其余3 496篇论文分布在180个不同学科领域,其中分布最多的学科领域情况见表6:

表6 数字图书馆论文分布最多的前10名学科领域

从表6可以看出:首先,国外关于数字图书馆的研究论文主要存在于计算机科学、情报科学图书馆科学以及各类交叉学科,其中计算机科学这个学科分布的论文最多,并且涉及了软件和硬件、理论和应用、甚至人工智能等几乎计算机科学的各个分支;其次,生物、化学、医学等学科也占了很大的比例,这是因为这些学科有较大的基础数据库,如基因数据库,分子数据库等,科研工作者往往需要频繁的调用这些数据,这就迫切需要建设这些领域的专业数字图书馆,此外,SCI数据库中的生物、医学类期刊收录的较多也是一个原因[8]。

6 作者分布

6.1 洛氏定律推论杰出科学家

按作者进行分析数据,除了4个ANON(匿名作者)外,这3 498篇论文一共有11 267个作者参与,其中发表论文最多的作者发表了32篇;其次是16篇,具体统计数据见表7:

表7 数字图书馆研究论文作者发文数

根据普赖斯对洛特卡定律的一个重要推论:杰出科学家中最低产的那位科学家所发表的论文数,等于最高产科学家发表论文数的平方根的0.749倍[4]。在本次研究中最高产科学家发表论文数为32,则杰出科学家中最低产的那位科学家所发表的论文数应为4.2篇,取整数为5篇。

普赖斯还曾试图找出全体科学家总数中杰出科学家的比例关系。经过进一步推导和计算,得出杰出科学家人数与全体科学家总数之比,等于0.812除以最高产科学家发表论文数的一半[4]。在本次研究中最高产科学家发表论文数为32,则杰出科学家的比例计算得到为5%。

表7的统计数据表明:发文5篇以上的作者共87人,占总作者数的0.77%;这87名发文5篇以上的杰出科学家共发文652篇,仅占总论文量18.6%,明显低于50%,这说明数字图书馆核心作者群尚未形成[8]。

6.2 杰出科学家的地区分布

在晏尔伽、朱庆华《1996-2005年SCI—E数据库中数字图书馆研究文献定量分析》一文的研究中,发文5篇以上的核心作者中以美国作者居多,占到一半以上,再次说明美国在数字图书馆研究领域的领先地位。另外新加坡南洋理工大学有4位作者发文多于7篇,共发表文献49篇,占到所有新加坡数字图书馆研究文献(58篇)的84.48%,有较高的集中性。发展中国家只有中国清华大学的两位作者发文7篇以上,从侧面说明比起发达国家,发展中国家的数字图书馆研究处于相对滞后的位置[8]。

而2010年检索后,本文的研究结果是:发文5篇以上的核心作者中仍然以美国作者居多,占到34.5%,最多的发文13篇,说明美国在数字图书馆研究领域一直保持领先地位;而中国发文超过5篇的作者有11位,仅次于美国,其中最多的发文12篇;接下来是英国、法国、德国、韩国,各有8位、5位、4位作者发文超过5篇;发文最多的作者在瑞士,共发文32篇。说明发展中国家在近五年来,对数字图书馆投入了高度关注,并且获得了高质量的研究成果,研究能力得到了极大提升,在国际数字化图书馆舞台上也开始占有一席之地。具体情况参见表8:

表8 数字图书馆研究论文发文量超过10篇的作者

7 来源出版物分布

按来源出版物分析,3 498篇研究论文分布在1 120个出版物,其中分布排名前20位的出版物见表9:

表9 论文分布排名前20位的出版物

从表9可以看出,情报科学类的刊物出版的最多,其次是计算机科学类的刊物。根据布拉德福定律的基本阐述,“按某学科载文量等级排列的期刊划分为3个区,使每一个区所包含的相关论文数量相等,即恰好等于全部期刊发表的该学科文章总数的1/3,第一区(核心区)所涉及的文章来自数量不多但效率最高的期刊”[4],依照布拉德福的区域法表9中列出的23种期刊的累积载文百分比为32.76%,所以可以初步确定这23种期刊是研究“数字图书馆”的核心期刊。

8 结 论

本文利用SCI数据库及其分析功能,通过对1995-2010年这15年间的国内外有关“数字图书馆”的论文进行了计量分析,可以看出:近五年来国内外对“数字图书馆”的研究持续蓬勃发展,“数字图书馆”从最早的实验室概念已经变成一种社会工程,并广泛应用于生活、科研与教育的方方面面。我国在这几年间的研究成果是显著的,从榜上无名到跻身于该学科领域研究的佼佼者之一,说明我国近年来对数字图书馆事业的高度关注和巨大投入。事实上,数字图书馆绝不仅仅是数字化的图书馆,它更应该是文化的传播媒体,是数字资源组织、开发和利用的基础,建设数字图书馆,提高数字信息资源开发利用水平是增强综合国力和国际竞争力的必然选择,符合人民群众不断增长的物质文明、精神文明、政治文明和生态文明的需要,数字图书馆已经成为评价一个国家信息基础设施的重要标志[9]。

参考文献

[1]什么是数字图书馆?[EB/OL].http://www.edu.cn/ruanzjianzyingzyongz1720/20061108/t20061108z204163.shtml,2011-03-01.

[2]汤森路透[EB/OL].http://www.thomsonscientific.com.cn/productsservices/webofscience,2011-01-01.

[3]国外数字图书馆的启动和实施[EB/OL].http://news.xinhuanet.com/it/2002-05/27/contentz411040.htm,2011-03-01.

[4]邱均平.信息计量学[M].武汉:武汉大学出版社,2007:50,56,105,194-195.

[5]郑淼磊,梁晨.近10年国外数字图书馆重大项目进展研究[J].科技情报开发与经济,2010,(21):8.

[6]熊静,廖建兰.1994-2005年我国数字图书馆论文的计量分析[J].图书馆学刊,2006,(1):50.

[7]有关图书情报专业的美国大学的最新排名情况[EB/OL].http://zhidao.baidu.com/question/71611604,2011-02-18.

[8]晏尔伽,朱庆华.1996-2005年SCI-E数据库中数字图书馆研究文献定量分析[J].情报科学,2005,(12):1825-1826.

[9]郑建明,胡唐明.社会事业视野下的数字图书馆建设[J].情报科学,2011,(1):6,10.

猜你喜欢
文献计量分析数字图书馆
SCI收录上海中医药大学论文的计量分析
我国职业教育师资研究热点可视化分析
浅析“互联网+”时代的图书馆管理
文献计量分析视域下的中国苗族姓名研究现状