科研院所数据库资源使用统计分析与评估
——以北京市科学技术研究院CNKI数据库为例

2018-01-31 05:31凡庆涛
天津科技 2018年1期
关键词:全文检索论文

凡庆涛,杨 萍,杜 赟

(北京市科学技术情报研究所 北京100044)

0 引 言

在信息技术和知识经济飞速发展的今天,信息资源成为科研院所科技资源建设的重要组成部分。为适应科学研究的多元化发展要求,科研院所在采购信息资源的基础上,不断加快自主知识产权数据库的建设。随着信息资源的不断丰富,其使用效率和利用规律研究已经成为大家关注的焦点。对数据库资源使用情况进行统计和分析,可以更加详尽地掌握数据库资源的使用状况,深入分析用户行为,挖掘用户深层次的需求,为数据库资源的培训和推广提供参考。对数据库使用成本进行分析,可以促进电子信息资源经费的合理支出,制定和完善资源采购策略,提高资源使用效率。本文选取北京市科学技术研究院(以下简称“市科研院”)使用频次较高的中国知网(CNKI)数据库进行详细分析。

1 北京市科学技术研究院数据库资源现状

科研院所作为我国科技创新生态体系的重要组成部分,承担着各学科领域的高水平研究工作。为保障各项科研工作顺利开展,在信息资源建设方面进行了相关工作,不仅订购了各类商业数据库,在自主知识产权数据库建设方面也进行了新的尝试。

市科研院围绕北京全国科技创新中心建设的需要,非常重视科技信息资源的规划和建设,致力于自身研究能力提升以及机构转型。为做好信息资源支撑与保障工作,市科研院对数据库资源进行了统一采购与服务,构建了全院信息资源共享共建统一服务平台,建立一个较为完善、高效、资源丰富、可持续发展的信息资源数据系统。除购置了一批商业数据库外,还拥有部分具有自主知识产权的特色数据库,采购数据库资源主要包括万方知识服务平台、中国知网(CNKI)、EI Compendex、SpringerLink全文电子期刊、Emerald等国内外信息资源库及服务平台,类型涉及期刊、图书、学位论文、会议论文、研究报告、专利、标准、报纸、年鉴等,内容全面,学科丰富。

市科研院在信息资源建设方面取得了显著成效,但存在的问题也不容忽视。资源采购往往存在着重复订购、利用率低等问题,造成科研经费浪费,对科研工作的开展也产生不利影响;部分学科专业性不高,部分数据库资源使用效益低;工具类资源未能得到充分利用,信息服务如知识挖掘、个性化服务等没能得到有效推广,这些问题的存在对市科研院的信息资源建设和服务工作提出了更大挑战。

2 电子信息资源的使用与评价综述

对电子信息资源的使用进行分析和评价,可以有效掌握用户资源使用情况,进而对数据库资源使用效益进行有效分析,既能为用户培训提供机遇,又能保证数字资源采购的科学性。

国内学者在电子信息资源的使用与评价方面开展了广泛研究。邵晶等[1]对高校图书馆电子资源的使用开展评价研究,根据数据库的访问、检索、浏览、下载等统计数据,结合电子资源的使用效益,对数据库资源进行对比,确定数据库的优先选择顺序,减少资源重复订购,提高资金使用效率。王素芳等[2]从知晓程度、用户行为、接受度等方面对浙江大学电子书使用情况进行了分析。于洋等[3]基于 CNKI资源使用,分析用户对电子资源的使用现状、规律和需求。曹秀丽、张泸月等[4]选取书生之家和 Springer电子书数据库,分别对中外文电子书的使用情况、学科分布与差异等进行了比较分析。曹秀丽、赵崇荣等[5]以7个外文数据库为例,分析师生使用习惯和规律、篇均使用成本,并对比两个专业化的数据库。宫庆艳[6]对辽宁科技大学中外文教据库的内容和使用情况进行统计分析,核算出部分数据库的使用成本,对购买的主要数据库进行了综合评估。苏敏、胡乃志等[7]对数据库资源的使用情况进行评价研究,围绕统计数据设置评价指标,指标涉及数据库资源、检索类型、培训与推广等。江佳惠、刘方健[8]对现有的在线数据库使用统计指标提出补充和完善的建议。章丽[9]对安徽师范大学图书馆CNKI数据库使用情况进行分析,主要考虑了用户访问量和全文下载量等。

3 CNKI数据库使用统计分析

3.1 CNKI数据库资源简介

中国知网(CNKI)由清华大学、清华同方发起建立,是全球最大的中文数据库,涵盖的数据资源较为丰富,其中文献型资源包括期刊、博硕论文、会议论文、年鉴、专利、标准等;工具型资源有各种字词典、互译词典、专业辞典、术语;阅读型资源有文学、艺术作品等[10]。市科研院根据自身需求,主要采购了期刊、博士学位论文、国际会议、重要会议及工具书等数据库。

3.2 数据来源与统计

本文选取了市科研院使用频次较高的 CNKI数据库资源作为分析对象,借助CNKI数据库商提供的使用数据[11-12],统计了 2014—2016年 CNKI数据库的登录、检索、浏览和全文下载数据。结合采购成本,获取使用成本等相关数据。通过CNKI数据平台检索市科研院相关论文及分布情况相关数据。

3.3 CNKI数据资源使用统计整体分析

本次统计,数据访问方式包括IP直接访问、用户名访问,主要涉及登录量、检索次量、浏览量和全文下载量(见表1)。

表1 2014—2016年CNKI数据库资源使用情况Tab.1 Usage of CNKI database resource from 2014 to 2016

从表l可以看出,2014—2016年CNKI的年登录量、年检索量、年浏览量和年下载量均得到了大幅提升,科研人员对 CNKI相关数据库逐渐熟悉和不断认可。

3.4 分库使用情况对比

结合 2016年度 CNKI数据库使用数据,对CNKI各子库进行了对比分析,如表2所示。

表2 2016年CNKI各分库使用情况对比Tab.2 Usage comparison of CNKI branches in 2016

由表 2可以看出,2016年期刊、学位论文、重要会议和国际会议都保持了较高的检索量,年检索量均在 330,000次以上,但工具书由于资源类型的限制,年检索量仅 3,979次。从浏览量看,期刊库远高于其他 4库,科研人员对期刊论文的需求较学位、会议论文等高出很多,下载量与浏览量的变化趋势极为相似。经对比发现,市科研院用户更多选择使用 CNKI期刊和学位论文库资源,国际会议论文数据库和工具书的需求相对较低。因此,需要加大会议论文及工具书的宣传和推广,充分挖掘会议和工具书等资源的利用价值,更好地满足科研需要。

3.5 用户使用行为和规律分析

3.5.1 月使用情况分析

用户使用数据库的习惯和规律受到用户科研需求、熟悉程度及检索技能等多因素影响,对月使用情况进行统计与对比,可以更好地了解用户的使用习惯与规律,优化数据库资源采购[13]。本文对 2016年各月全文下载情况进行统计,从用户实际获取文献的情况对用户行为进行初步分析。

图1 2016年CNKI数据库全文下载量月度数据Fig.1 Monthly data of full text download of CNKI database in 2016

由图1可以看出,市科研院的科研具有一定的周期性特点,在 3、4月份和年末使用频次较高,这段时间需要为用户提供稳定的网络条件和使用环境,保证网络通畅,同时,电子信息资源的宣传和推广工作要尽量避开使用高峰期;在 1、2月份全文下载量相对较低,可以充分利用这段时间开展培训和宣传工作,提高用户的检索能力和水平。此外,CNKI开通了用户名使用数据资源的渠道,科研人员可以实现在家使用CNKI数据库,大大提高了电子资源利用率。

3.5.2 全文下载学科分布

选取了 2014—2016年 3年来的全文下载量数据,如表3所示,2016主要学科文献下载为80,667次,较2015年增长了26.40%,,2015年较2014年全文下载量增长了 56.52%,,年下载量均保持了较高的增长率,其中,环境科学与资源利用和宏观经济管理与可持续发展两个学科 3年来均保持了较高的全文下载量。2016年,除企业经济、科学研究管理、轻工业手工业这3个学科的全文下载量有所下降外,其他学科较 2015年都保持平稳增长。2015年,主要学科的文献下载量均较 2014年实现了增长,其中,环境科学与资源利用、企业经济、轻工业手工业和科学研究管理等学科增长明显,年文献下载增长率均在 70%,以上。

通过 CNKI数据库文献下载情况的学科分布可以看出,除理工科相关学科下载量较大外,对软科学类的相关学科文献需求也较为强烈,全文下载的学科分布较好地契合了市科研院下属单位的科研领域和研究方向,尤其与北京市劳动保护科学研究所、北京市理化测试分析中心、北京市科学技术情报研究所、北京科学学中心等科研实力较强的公益型科研院所的学科分布密切相关。总体上看,CNKI数据库全文下载量保持了平稳增长,学科分布也更加均衡,数据库资源使用呈现出良好的发展态势。

表3 2014—2016年主要学科文献下载情况对比Tab.3 Comparison of document downloading of major subjects from 2014 to 2016

3.5.3 检索方式

CNKI检索平台提供了简单检索、高级检索、专业检索和句子检索等多种方式,其中专业检索、句子检索归入高级检索。结果显示,简单检索占 68.55%,,高级检索占 31.45%,,说明用户在检索中仍以简单检索为主,但高级检索的占比已经达到 31.45%,,较好地保证了用户的文献查全率和查准率,也反映出科研人员具有娴熟的检索技巧和较高的检索能力,有效保障了科研工作的顺利开展。

3.6 使用成本分析

从采购资金分配情况看,2016年市科研院中文数据库资源采购资金占采购总额的68%,,其中CNKI数据库采购资金占中文电子资源总额的 25.5%,。资源采购与否,与其使用成本密切相关,应当选择使用量高、成本低、能够切实满足用户需求、产生较大效益的信息资源作为采购对象[14]。

表 4显示,从篇均使用成本来看,中国工具书网络出版总库>国际会议论文全文数据库>重要会议论文全文数据库博士学位论文全文数据库>中国学术期刊网络出版总库,工具书与国际会议的文献下载量较低,篇均使用成本较高。期刊库篇均使用成本为2.08元/篇,年下载量达到 124,995篇,需求最为强烈;其次为博士学位论文(5.77元/篇),同样保持了较高的下载量,也反映出科研人员开展科研工作的深度和水平。

表4 CNKI相关数据库使用成本对比(2016.01.01~2016.12.31)Tab.4 Usage cost comparison of CNKI database in 2016(2016.01.01~2016.12.31)

3.7 CNKI期刊论文分学科录用情况分析

笔者分学科统计了2014—2016年市科研院及下属单位论文被CNKI期刊分学科录用的情况,因学科有交叉,部分论文可能重复计算。由表5可以看出,市科研院发表论文主要集中在8大学科领域,其中以工程、基础科学、经济与管理、信息科技领域最为突出,与市科研院的院属单位学科发展和研究方向相吻合。

表5 2014—2016年CNKI期刊录用论文学科分布Tab.5 Paper distribution of CNKI periodicals from 2014 to 2016

3.8 北京市科学技术研究院论文被 CNKI期刊录用分布(按单位)

笔者统计了2014—2016年市科研院及下属单位的论文CNKI期刊录用情况,如表6所示。

表6 市科研院论文被CNKI录用情况统计(按单位分布) Tab.6 Statistics of CNKI papers by unit

4 结论与展望

对数据库资源使用情况进行统计分析是对数据库资源进行定量评价的重要方法,可以为电子资源的采购、续订和删减提供参考。通过分析可以看出,CNKI数据库在市科研院得到广泛使用,但各分库资源使用频次差异较大,部分数据库资源尚未得到充分使用,且使用成本较高,使用效益较低;数据库资源的使用与市科研院下属单位的学科分布与研究领域密切相关,各单位在科研论文数量上差异较大,说明用户对数据库资源需求和利用存在明显区别。

因此,加强数据库资源的宣传和推广,提高数据库资源使用效益,将是未来工作的重点,以下几点需要引起我们注意:要加强数据库资源的宣传与使用培训,提高科研人员使用数据库资源的能力;根据数据库资源的使用情况及用户实际需求,制定针对性强的采购策略;在数据库资源内容建设上,应以市科研院学科建设及用户需求为导向,对数据库进行合理客观的评价与分析,既要有综合类数据库资源,保证大多科研工作者的文献需求,又要有专业类数据库资源,满足部分用户的特色需求,以实现科技信息资源的合理配置;在满足各学科文献需求的基础上,避免数据库资源的重复购买,尤其在中国知网、维普和万方三大中文库选择上可以订购其中 1~2种,不足部分可以通过文献传递等方式获取;定期开展对数据库资源使用情况的对比分析与评估,了解数据库的使用成本和效益,为数据库的续订、删减和新增提供参考依据。

[1] 邵晶,许文华,郑庆华. 对我国高校图书馆引进电子资源后续问题的思考及建议[J]. 大学图书馆学报,2003,21(3):67-69.

[2] 王素芳,白雪,崔灿. 高校学生对电子书的认知、使用和态度研究:以浙江大学为例[J]. 大学图书馆学报,2011(6):19-25.

[3] 于洋. CNKI资源利用统计与高校电子资源推介工作分析[J]. 边疆经济与文化,2013(8):176-177.

[4] 曹秀丽,张泸月,谭英. 高校图书馆电子书阅读和利用统计分析——以四川师范大学电子书数据库为例[J]. 四川图书馆学报,2016(3):70-73.

[5] 曹秀丽,赵崇荣,张俊慧. 高校图书馆电子资源使用统计分析——以四川师范大学外文数据库为例[J]. 四川图书馆学报,2015(3):78-80.

[6] 宫庆艳. 数据库内容评估与使用统计分析的实践与探讨——以辽宁科技大学为例[J]. 情报探索,2011(6):42-44.

[7] 苏敏,胡乃志,盛秋艳,等. 数据库使用评价的实践探索研究[J]. 图书馆理论与实践,2013(12):37-40.

[8] 江佳惠,刘方健. 数据库使用统计及资费研究[J]. 图书馆论坛,2010,30(2):78-80.

[9] 章丽. 数据库资源利用统计分析研究——以安徽师范大学CNKI数据库使用情况为例[J]. 科技情报开发与经济,2011,21(6):122-123.

[10] 中国学术期刊网络出版总库[EB/OL]. (2010-06-21) [2017-11-05].http://acad.odd.net/Kns55/oldnavi/n_Navi. aspx?NaviID=100.

[11] Counter[EB/OL]. (2010-01-09) [2017-11-05]. http:// www.project-counter. org.

[12] ASME-Reports[EB/OL]. (2010-01-09) [2017-11-05]. http://www. scitati-onreports.org.

[13] 郭晶,林皓明,王听. 数据库使用统计与服务评估实践与探讨[J]. 图书馆理论与实践,2006(1):118-120.

[14] 王虹菲. 电子资源的采购与评价[J]. 图书馆学研究,2015(4):67-70.

猜你喜欢
全文检索论文
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
浅议专利检索质量的提升
青年再造
发现“西方中医”
反腐
来信
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登