面向高校机构知识库的灰色文献建设机制研究*

2020-09-12 14:30吴海媛刘莉
新世纪图书馆 2020年8期

吴海媛 刘莉

摘 要 灰色文献具有白色文献所不具有的特殊价值,通过加强高校机构知识库灰色文献的建设,将有利于促进高校机构知识库的可持续发展。文章通过对目前国内高校机构知识库进行调查,在资源类型、存缴率、存缴质量和版权问题几方面进行分析研究。文章在分析高校机构知识库现状的基础上,从灰色文献呈交对策、质量控制和权益保护三个方面提出相关对策。

关键词 机构知识库 灰色文献 建设机制

分类号 G250

DOI 10.16810/j.cnki.1672-514X.2020.08.002

Research on Construction Mechanism of Grey Literature for University Institutional Repository

Wu Haiyuan, Liu Li

Abstract The grey literature has special value that white literature does not have. By strengthening the construction of grey literature, it will be beneficial to promote the sustainable development of institutional repository. Based on the investigation of the university institutional repository in China, this paper analyzes the types of resources, the rate of deposit and payment, the quality of deposit and payment, and the copyright issues. Based on the analysis of the current situation of institutional repository in colleges and universities, this paper puts forward relevant countermeasures from three aspects: the submission of grey literature, quality control and protection of rights and interests.

Keywords Institutional repository. Grey literature. Construction mechanism.

0 引言

灰色文献一般是指未经出版、没有通过正式渠道向公众公开的一类介于经过正式公开的白色文献和进行保密的黑色文献之间的文献。灰色文献至今还没有统一明确的定义,在1997年第三次国际灰色文献会议上,与会者认为灰色文献是指不为营利出版者所控制,而由各级政府部门、学术机构、工商业界等所产出的各类电子和印刷形式的资料[1]。灰色文献的种类繁多,包括非公开出版的政府文献;不公开发行的会议文献、科技报告、技术档案;不对外发行的企业文件、企业产品资料、贸易文件和工作文件;未刊登稿件及内部刊物、交换资料、赠阅资料等[2]。对于高校来说,灰色文献一般包括电子预印本、实验数据、工作记录、教学视频、教学课件、授课讲义、电脑软件等。

灰色文献作为机构知识库内容建设的重要组成部分,对其进行收集、存储有利于完善机构知识库的功能,满足机构成员的知识需求。卞艺杰等人通过对高校机构知识库中灰色文献的特点及存在的质量问题进行分析,利用德尔菲法和层次分析法构建了灰色文献的质量控制机制[3]。李明鑫等人对机构知识库不同阶段所存储灰色文献的数量进行了分析,并设计了机构知识库的发展模型,通过对不同阶段采取不同的质量控制方法来提高机构知识库内容的存储质量[4]。李昆明在高校机构知识库自存储研究中认为机构知识库应该为灰色文献提供展示学术价值的平台,促进灰色文献的开放获取[5]。郎庆华在机构知识库长期保存策略的分析中提出灰色文献将发挥越来越重要的作用,机构知识库有必要对灰色文献进行长期保存,以满足用户需求[6]。张强等立足于知识产权的法律法规对机构知识库中各类文献著作权进行辨析,并建立了机构知识库著作权的解决方案[7]。目前,国内大部分机构知识库的资源建设对灰色文献重视程度不足,存在灰色文献存储量少、存储质量低等问题。学界对机构知识库灰色文献的相关研究也较少,并未将其作为一个专题进行单独研究。对此,本文旨在对国内机构知识库灰色文献存储的现状进行分析,并提出灰色文献建设机制。

1 灰色文献建设必要性

灰色文献是科研人员在從事科研活动的过程中,通过长期的资料收集与积累,以及历经数次研究实验创造出来的成果。灰色文献展现了科研人员在教学科研过程中的教学记录和科研动态[8],凝结了科研人员的智慧和汗水,为人类进一步的创造和研究提供了丰富的经验,是机构知识库建设不可忽视的一部分[9]。随着开放存取运动的发展,科研人员希望通过灰色文献的交流共享获得更有价值的信息,同时也希望将自己的成果分享给他人,以此提高自己在“学术圈”的知名度,机构知识库所倡导的开放存取理念恰好能满足他们的需求。

满足用户对多种文献的需求,提高机构知识库的利用率。灰色文献涉及的文献种类繁多、内容丰富,所包含的信息也较为广泛,相对于已出版的图书、期刊来说,灰色文献更具有及时性、新颖性的特点。将灰色文献存储于机构知识库中,为分布式协同研究提供了丰富的学术资源,改变了传统的科学研究方法,使得科学研究可以不用再从“源头”开始。比如:对于一些成熟的结论,可以直接采用;对于一些失败的结果可以告诫人们不再重蹈覆辙,避免人力和物力的浪费;对于一些实验数据,科研工作者通过对已有数据的重新分析、组织和利用,就可以发现新的问题,产生新的科研成果。在当今开放存储环境下,灰色文献的作用将越来越明显,将灰色文献存储于机构知识库中可满足用户对多种文献资源的需求,同时提高机构知识库的利用率[9]。

满足对教学科研成果的存储及共享的需求。高校在教学和科研的过程中往往会产生格式多样、数量庞大的灰色文献,如一些教学课件、教学参考资料、实验数据等[10],这些资源都各自存储于封闭孤立的空间,限制了更大作用的发挥,上传网站又存在不安全性和不能永久性存储的问题。如果不采取一定的保护措施,这些学术资源将面临着载体版本升级或软硬件过时及遗忘等问题,这就难以为科研交流做出贡献。学术资源也存在着一定的生命周期,如果超出生命周期将会逐渐丧失它们的学术价值。对于灰色文献的监护和管理服务越来越受到人们的重视,麻省理工大学图书馆提供“Data Management and publishing”的数据管护服务,康奈尔大学机构知识库提供科研数据管理服务,清华大学、北京大学等高校通过建立特色资源库的方式加强对灰色文献的收集与利用。但上述存储方式在资源的开放存取方面存在着一定的缺陷,而机构知识库可以为灰色资源的存储和交流提供一个统一的管理平台。

2 国内机构知识库灰色文献建设问题分析

2.1 资源类型单一,存储量有限

机构知识库是实现多种类型科研资源有效管理的重要场所,国内外机构知识库已经实现对科研资源的广泛存储,据Open DOAR统计,截至2020年3月14日,国外机构知识库收录的资源类型有12种,其中包括一些多媒体数据、工作记录、地理信息、研究报告、数据、专利、软件等尚未出版的灰色文献[11]。笔者对Open DOAR收录的47个中国机构知识库的资源类型进行统计发现,目前多数机构知识库实现了对期刊论文的存储,仅West DC未将期刊论文纳入资源收录范围,期刊论文的收录率约为98%。而对灰色文献进行存储的机构知识库较少,其中存储类型最多的灰色文献为未发表的工作报告或文件,而对数据集存储的机构知识库仅有4个,对学习对象进行存储的仅有2个,对软件存储的仅有1个,对其他类型特殊作品进行存储的有9个,通过对这9个站点进行访问发现,其他类型特殊作品主要有演示报告、影像记录、实验材料等。从统计数据看,目前我国机构知识库的资源类型主要以期刊论文、学位论文、会议论文、图书章节为主,数据集、学习对象、软件等灰色文献的数量较少。由此看来,国内许多高校尚未认识到灰色文献的价值,机构知识库中存储的资源绝大部分已公开发表,对于那些未经过公开发表的灰色文献存储量极为有限。

2.2 存缴率低,资源更新缓慢

灰色文献作为机构知识库的重要组成部分,相对于已经正式出版或被商业数据库收录的资源,更具有收藏价值。通过对在Open DOAR收录的我国大陆6所高校机构知识库调查发现,灰色文献的存储数量少,占总资源的比例较低。其中,北京大学机构知识库存储的灰色文献最多,共有18 975条,清华大学机构知识库共有11 245条,西安交通大学机构知识库仅有239条。据调查,这6所高校机构知识库中灰色文献占总文献数量的比例均不超过10%,其中,广西民族大学机构知识库中灰色文献占总文献数量的比例最高(7.57 %),而西安交通大学机构知识库灰色文献占总文献数量的比例较低(0.11%)。究其原因,可能是:科研用户对开放存取理念认知度低,对机构知识库缺乏了解,尚未认识到机构知识库的价值;没有有效的激励政策,尤其当前高校仅对已经正式发表的论文作为科研成果评价的依据;并未将存储在机构知识库中的灰色文献列入科研评价的范畴。

2.3 学术质量难以有效保障

传统的学术交流模式有一系列的质量控制机制和评价指标来确保资源的质量,如通过专家评审制度和同行评议制度,相较于传统的信息交流模式,开放存取还未形成系统的质量控制机制[12]。相对于期刊论文通过了专家评审的质量把关,学位论文经过了导师的精心指导和评委的审核而言,灰色文献未经过公开发表,也未得到专家学者的评审,且灰色文献种类繁多,没有统一的系统检验标准,大多数只经过机构知识库系统的简单审核便被收录存储,因此资源质量得不到有效保障,学术质量参差不齐。对于资源的利用者来说,检索不到自己想要的结果,容易对机构知识库丧失信心;对于资源的提交者来说,不愿将自己的学术成果提交到“鱼龙混杂”的机构知识库中。长此以往导致的恶性循环,使机构知识库资源的数量和质量都得不到有效保障。

2.4 元数据质量把控困难

高质量的元数据是保证资源能够被有效检索的重要条件,是机构知识库进行服务的重要支撑[1]。灰色文献种类繁多,载体格式也有所不同,常见的载体有文本、动画、图形、图像视频等;灰色文献大都散落在个人用户手中,通常通过自主提交的方式进行资源的存储。灰色文献的多样性及提交方式的自主性使得其对元数据进行有效的控制较为困难,学者在进行资源提交过程中输入元数据时各种错误和失误时有发生,导致元数据质量难以控制,如资源内容和属性不符、元数据空缺、数据拼写错误、数据格式混乱、元数据冗余、数据唯一性冲突等。

2.5 版权界定不清晰,用户对成果提交存在担忧

版权问题是机构知识库建设过程中不可回避的问题,也是制约机构知识库发展的重要瓶颈。用户在提交自己作品时常常担心自己的作品版權会受到侵犯,成果遭到剽窃,因此许多用户不放心将自己的科研成果提交到机构知识库中。根据调查显示,89.8%的科教人员都习惯于将自己的科研成果存储于个人电脑或移动硬盘中[13],即使他们愿意将成果进行自存储,也是选择已经发表的文章和著作,而不是未进行公开出版的灰色文献。除了学术环境腐败,担心成果被抄袭和剽窃外,部分研究者害怕别人超越自己而不愿进行成果分享,这种狭隘的学术思想也是造成作者为保护版权而不愿将未发表成果进行自存储的重要原因[14]。

3 高校机构知识库灰色文献存缴问题的对策

3.1 加大宣传力度,提供统一培训

影响灰色文献存缴率的原因主要有两个:一是用户没有清晰认识灰色文献的价值,二是对机构知识库不了解,对开放存储不理解。提高用户对灰色文献的自存档意识,宣传推广是关键。机构知识库的相关建设部门及图书馆应该承担起宣传推广的责任。一方面是让用户认识到灰色文献的价值,了解对灰色文献进行开放存取的必要性;另一方面是让用户对机构知识库有清晰的了解,使用户认识到机构知识库与商业数据库存在的区别及机构知识库所特有的功能,认真倾听科研人员对自存储所存在的疑虑,并及时予以解答。还要通过培训使用户学会如何在学习和工作工程中便捷使用机构知识库,通过召开专题讲座,印发使用手册等方式使用户了解机构知识库的功能,明确资源提交流程。

3.2 完善存缴政策,建立激励机制

合理完善的存缴政策是解决机构知识库资源不足的有效保障,针对当前存储内容以公开发表的科研成果为主、资源类型单一的现状, 高校机构知识库在建设过程中应提高机构知识库存储资源的深度和广度,将科技报告、科研数据、教学课件、实验报告等灰色文献纳入机构知识库的收录范围。要基于国际社会发展的现实需求与演进趋势, 加强对本校优秀教学成果、重点实验室建设资料、重大科研项目等能促进学科发展、体现学校优势的成果的优先存储工作。另外,由于灰色文献无法像已发表的论文、著作那样可以强制存储,只能通过激励政策来鼓励用户自愿提交。因此,机构知识库应建立激励性的存缴政策,通过相应的推广手段,增加学者成果的能见度,提高学者知名度,此外,可与有关部门协商,依据一定评价标准将资源提交者的履职情况及资源使用情况纳入科研评价考核体系,以此提高学校师生和教职工提交资源的积极性。

3.3 简化提交程序,方便用户存储

成本因素包括在自存储过程中额外付出的时间精力,这是影响学者存储积极性的主要原因之一[15]。即使有一部分人愿意提交研究成果,也会受到提交界面繁琐、提交程序复杂等问题影响,因而逐渐放弃成果的自存储。为了提高机构成员灰色文献的存缴率,应遵循便捷性的原则,简化提交程序,减少用户的存储成本,提高存储效率。机构知识库的设计者应站在用户的立场考虑问题,采取多种存储模式,通过加强与各个系统平台之间对接,实现教学系统、科研系统与机构知识库系统之间的有效整合,避免科研工作者重复操作或反复存储同一资源的烦扰。实行免注册机制,实现与校园卡对接,通过学号或教工号直接登陆机构知识库进行资源提交,省去注册和身份认证的繁琐程序。此外,机构知识库还应通过APIs可以实现跨平台的功能调用,实现不同平台之间的数据整合,使用户在一个界面中可以完成多个系统的资源存储和获取。

4 高校机构知识库灰色文献质量控制研究

4.1 学术质量控制机制

灰色文献属于非正式文献,具有种类繁多、质量参差不齐的特点,导致很难进行有效的质量控制,如果对灰色文献实施传统意义上的同行评议策略,将会使得大部分资源被拒之于机构知识库之外,即使通过同行评议的资源,也可能因为复杂的评审机制而错失最好的应用时机,因此现阶段大多数机构知识库对于灰色文献的学术质量一般没有特殊要求。为了不使错误、冗余的信息在机构知识库中无限蔓延,影响机构知识库的使用效果,必须建立灰色文献的控制机制。一是对资源提交人群进行限定。对资源提交者的身份、职位、学术背景等进行认证,设定不同的人群可以将资源提交到不同的模块,例如在教学课件模块设定只有在职老师可以上传,项目研究报告只有承担科研项目的项目负责人可以上传。二是对资源质量进行控制。机构知识库的管理者由于受自身学术知识的限制,无法对所有的资源的学术质量进行审核把关,可以通过委派或任命的方式使所属学科的学科带头人或专家在灰色文献入库时进行学术质量审核。考虑到灰色文献具有多样性,对于不同类型的文献应建立不同的质量考核标准。例如:对于预印本的学术质量审核标准不能与传统的同行评审相一致,要适当的放宽标准,但要保证学术内容应具有价值性、创新性、科学性和完整性,创作格式需具有规范性;对于教学课件需符合科学性、系统性、完整性的特点,对于教学案例应具有典型性、真实性、启发性,对于教学视频应具有清晰性、完整性特点;对于项目研究报告的评审应要求附带项目有关同行评审专家给出的评审意见及评审等级;对于科研数据的审核应要求对数据管理计划质量及数据自身质量进行评审。

4.2 元数据质量控制机制

元数据对提交内容的特征和基本属性进行揭示,可以提供有效的检索和处理功能,为高质量的信息服务做准备[16]。由于灰色文献种类繁多,如果缺乏对其属性、内容和特征的描述,用户很难识别文献资源的专有价值,因此很难检索出想要的资源。美国标准信息组织提出元数据应符合标准、支持互操作、使用权限控制和内容标准来描述对象、包含使用条款、支持长期保存、拥有良好质量等6条原则[17],Brucead Hillman提出元数据质量控制7项原则[18],除上述原则外,灰色文献元数据质量控制还应遵循便捷准确性、智能性、可扩展性和用户需求性的原则。

(1)便捷准确性原则。在资源的提交过程中,元数据的录入会耗散大量的时间,机构成员不愿意将时间浪费在资源提交过程中,因此元数据的质量控制必须对便捷性和准确性进行考量[19]。通过内容自动选择和手动输入相结合的方式有效缩短资源的提交时间,减少数据输入错误,提高元数据的准确性。对于具有固定范围字段的元数据如灰色文献的所属单位、成果类型、语种等可以事先在表单中输入,用户根据提交成果的属性,通過下拉菜单进行选择;对于没有标题、作者、关键词等固定格式的字段可通过用户手动输入进行完善。

(2)智能性原则。提高系统的智能性可以有效提高元数据的输入质量。对元数据进行逻辑分析,对于多值字段,如作者、成果所属单位等,可以通过添加多个输入框进行填写,防止分隔符混乱的现象;完善相关数据字典,如学者字典、机构字典,通过作者的唯一性标识符就能定位作者所属机构并进行相关数据的自动填充;为了减少用户的理解错误,可以在输入框的附近添加相关的文字解释,帮助用户更好地使用系统;最后通过对填写值进行逻辑校验,对于出现数据漏填或者逻辑性错误的现象拒绝进行提交。

(3)可扩展性原则。由于灰色文献资源类型多样,不同类型灰色文献资源的来源和应用范围也有所不同,为了使资源能够得到更好利用,在对元数据标准方案进行设计时,应考虑到灰色文献的特殊性,对元数据的扩展留有适当的余地,允许用户根据上传内容添加相关的修饰词和其他资源属性值,但同时也要注意扩展元素应符合DC元数据标准,以免影响灰色文献在机构知识库中的互操作性。由于不同的灰色文献可能存在不同的特定属性,比如科技报告中的“密级”“使用范围”等元素,音频中的“源载体”元素等[20],由于特殊元素仅适用于特殊文献,因此要根据需求进行适当扩展。

(4)用户需求原则。对灰色文献元数据进行质量控制的最终目的是提高用户的访问质量,满足用户的需求。在对元数据进行设计时应从用户检索习惯和检索需求角度出发,对元数据的描述语言、语法结构、字段取舍进行设计,实现用户与系统的深层次交流,满足用户对资源多层次、多维度的检索。

5 高校机构知识库版权问题控制研究

灰色文献具有信息含量高、情报价值大的特点,但由于灰色文献未经过公开发表,因此流通范围较小,利用率不高,发生抄袭和剽窃行为很难被发现,被侵权的可能性就会更大,灰色文献的版权保护已经成为机构知识库建设不可回避的问题。但灰色文献版权保护具有特殊性,如:主体的多样性与版权归属的复杂性;交流的本位性和侵权不易发现性;受控边缘性和版权状态的难鉴别性;公示薄弱性和取得授权阻碍性等[21],所以如何确保灰色文献的可用性,实现机构知识库、作者及用户之间权益与利益的平衡,这是灰色文献版权控制的一大难题。

5.1 签署授权协议书,赋予机构相关权利

在用户进行资源提交时要求签署授权协议书,在授权协议书中说明用户应授予机构知识库对作品具有格式转换、保存、合理利用、全球开放获取的权利。同时在授权协议书中进一步声明提交内容不侵犯他人的知识产权,要求所提交内容不包含国家机密或商业技术机密,不得侵犯他人的隐私权。同时,为保证资源所有者的合法权益,机构知识库应给予提交者权限设置和更改权利,如对科研数据开放时滞期的规定、对于教学资源传播范围的限定等。还可以在不违反所在机构规定或资助机构相关规章制度的前提下,随时提出删除数据的申请。

5.2 制定知识共享许可协议,让渡部分权利给用户

知识共享许可协议(CCL)是网络数字作品的许可使用的授权机制,通过让渡部分权利给用户实现作者、用户、机构之间的平衡。知识共享协议的授权条款主要有署名、非商业性使用、禁止演绎、相同方式共享四项,在作品进行授权使用时可以根据需求对上述四项协议任意搭配,但许可协议不能同时包含“禁止演绎”和“相同方式共享”两项。机构知识库应根据本机构的资源存缴政策和版权法的规定制定本机构的版权协议,有效平衡作者、机构、用户的利益,减少版权纠纷和侵权行为的发生。灰色文献的著作权一般归作者所有,作者在进行资源提交时可以按照知识共享许可协议选择合适的知识共享许可方案让渡部分权利给用户,使得用户可以享有免费,永久使用作品的权利,同时也保证了作者的署名权和作品完整权。

5.3 进行版权声明,提醒终端用户

由于开放存取运动没有地域性限制,对灰色文献的使用者并非都是本校人员,对于该校开放存取的版权政策可能并不了解。为了使资源能够得到有效的保护,机构知识库可在其主页上发布相关的版权政策,让用户对资源的版权政策有清晰的了解,从而避免侵权行为的发生;同时,在机构知识库的主页明确提出机构知识库所提供或链接的全文数据版权属于作者或资源所有者,用户在使用本库资源时请遵循OA和本库约定的相关法律和规定。

6 结语

随着开放存取运动的发展,机构知识库收录的资源大幅度增加,但绝大部分是已经发表的白色文献,灰色文献的收录情况不佳。机构知识库如果仅收录已经公开发表的文献,那么只是在重复出版和商业数据库所做的工作,无法彰显自身价值。灰色文献具有白色文献所不具有的一些特殊价值,对于机构知识库的建设具有重要的作用。机构知识库应构建灰色文献的建设机制,扩大灰色文献的存储数量,加强灰色文献的存储质量,深度展示高校的学术和科研成果,为高校教学科研注入新的活力。

参考文献:

[ 1 ]顾红,袁红卫,刘嫣.高校图书馆灰色文献资源建设现状调查与思考[J].图书馆学刊, 2017(1):62-66.

[ 2 ]灰色文献[EB/OL].[2019-04-25].https://baike.baidu.com/item/灰色文献/ 7530952?fr=aladdin.

[ 3 ]卞艺杰,马玲玲,梅俊.高校机构知识库灰色文献质量控制研究[J].计算机系统应用, 2013(10):27-32.

[ 4 ]李明鑫,田丹,魏来. 机构知识库发展模型探析[J].情报科学, 2010(12):1778-1780.

[ 5 ]李昆明,喻丽.高校机构知识库自存储研究[J].河北科技图苑, 2015(6):74-76.

[ 6 ]郎庆华. 机构知识库长期保存的策略分析[J]. 情报理论与实践, 2010(5):47-51.

[ 7 ]张强,金涛,曲哲,等. 机构知识库相关著作权法律问题探析[J]. 图书馆理论与实践, 2012(9):36-38.

[ 8 ]郎慶华.机构知识库长期保存的策略分析[J].情报理论与实践, 2010(5):47-51.

[ 9 ]蓝海波.灰色文献的价值:来自政策信息领域的研究与实践[J]. 国家图书馆学刊, 2016(2): 54-59.

[10]汪琴,张建文,张智萍,等.机构知识库可持续发展策略[J]. 情报杂志, 2017(5):164-167.

[11]Directory of Open Access Repositories [EB/OL].[2020-03-14].http://www.opendoar.org/find.php.

[12]万文娟,吴高.我国机构知识库内容建设问题与策略分析[J].图书馆,2013(1):110-113.

[13]曾苏,马建霞.科研机构和高校科研人员对IR认知及态度对比分析[J].情报杂志, 2009(5):23-28.

[14]蔡屏.从心理学角度谈如何促进机构知识库资源建设[J].图书情报工作, 2010(23):84-88.

[15]KIM J. Motivations of faculty self-archiving institutional repositories [J]. The Journal of Academic Librarianship, 2011(37):246-254.

[16]马玲玲,卞艺杰,梅俊.高校机构知识库元数据质量控制问题研究[J].计算机技术与发展, 2014(1):31-34.

[17]NISO.The framework of guidance for building good digital collections[EB/OL].[2020-03-15].http://www.niso.org/publications/rp/framework3.pdf.

[18]BRUCE T R, HILLMAN D I. The continuum of metadataquality:defining,expressing,exploiting[C]//HILLMAN

ND I,WEATBROOKS E L.Metadata in Practice.Chicago:

American Library Association,2004:238-256.

[19]黄晓晖.学术机构知识库质量控制研究.[D].郑州:郑州大学, 2013.

[20]葛洁敏.高校灰色文献描述元数据方案设计探讨[J]. 情报探索, 2013(10):93-95.

[21]王芳.灰色文献资料的版权保护探讨[J].档案, 2010(3): 17-19.