CALIS联合目录数据质量与管理办法探析

2019-03-15 09:20
鞍山师范学院学报 2019年2期
关键词:西文分类法编目

金 璇

(鞍山师范学院 图书馆,辽宁 鞍山 114007)

CALIS联机合作编目中心是中国高等教育文献保障体系的两大服务中心之一,其秉承“共建、共知、共享”的宗旨,致力于CALIS联合目录数据库的建设,并提供相关服务[1].CALIS联合目录数据库建设始于1998年,此后CALIS联机合作编目中心进行了一系列的调研工作,得到众多高校的支持.截至2000年5月共收集到41家图书馆的数据,联机合作编目中心通过预处理,使得CALIS联合目录的初装数据达到 93万条,正式上线提供服务.

如今,CALIS联合目录已经走过二十几个春秋,其规模早已今非昔比.截至2019年3月,CALIS联合目录数据达到700万条,西文三级编目员人数已达314人,西文二级编目员15人.

1 CALIS联合目录数据质量存在的问题

笔者在参与联合编目的实际工作中,偶尔会发现联合目录数据存在一些问题,主要表现在以下几个方面:

1.1 数据重复

CALIS西文编目数据存在重复数据.在查询联合目录时,偶尔会发现有相同的书目记录存在.

这里试举2条联合目录管理中心对笔者反映数据重复问题的反馈信息,内容如下:

(1)您反映的情况挺奇怪的.仔细对比两条相同记录,两条记录的250字段著录不同,所以可能同一条记录两次进入人工干预库的可能性更大.

目前需要做的:

第一步:合并这两条相同的记录(ISBN 0553580221 题名False memory).

第二步:另一条记录(ISBN 9780553583601 题名The alibi man),如果您确认库中没有相同记录,请再提交一条.

(2)这条记录经过与厦门大学核实,确实是页码不同,见附件.我已将您提交的那条记录从人工干预库释放到了正式库中,请查看.

这种国外出版的文献,出版年出版社ISBN全部相同,仅页码不同的情况,还真是比较少见.您这条记录的情况也增加了我对目前外文文献出版新情况的了解.谢谢!

上述2条反馈信息的内容,已经很好地说明了两方面的情况:

(1)数据库中存在重复数据.其原因在于有的书目记录著录项目不全,导致系统将其确认为不同的记录.避免这种错误,需要编目人员更加认真负责,仔细查询核对相关书目数据.

(2)上传重复数据的可能性很小.西文编目员上传数据时,必须先在联合目录数据库中查重,确认不存在相同记录方可上传,如此已经杜绝了上传重复数据的可能.所以编目员个人上传重复数据的可能性非常小,联合编目系统已经对此种可能性做出了很好的预防.

存在的重复数据从入库时间来看,大多是时间较早的数据,并且以2级数据居多,应当是早期大批量上载数据造成的.

1.2 编目数据分类标引误差

CALIS西文编目数据存在分类标引误差.就西文编目的具体操作来讲,真正需要编目员原编的数据是不多的,多半是通过网络,搜寻质量可靠的数据源进行数据套录.作为西文文献,其出版及馆藏书目数据,当然首先由国外出版机构、图书馆来完成,因而套录的书目数据基本可以保证质量,在网络世界的今天,这也是一种普遍可得的有效途径.

有鉴于此,套录数据已成常态,但对套录数据的理解与处理,尤其是上传至联合目录之前的分类标引,必须由编目员根据《中国图书馆分类法》来确定,因而这方面的问题也较多.

以下试举2条联合目录管理中心对笔者反映的著录问题的反馈信息,内容如下:

(1)提交的操作类型:著录反馈.

提交的相关记录控制号:CAL 022012102428.

提交的相关信息:本书内容是介绍各种蔬菜水果和香草的养生保健作用及食疗药理作用,宜入R类.

提交反馈的日期:2018/05/23 09:30.

处理时间:2018/05/28 14:14.

处理结果:提交的修改记录请求被接受,记录已经被修改.

(2)提交的操作类型:著录反馈.

提交的相关记录控制号:CAL 022000854731.

提交的相关信息:本书作者为英国人,分类应为I561.45|25.

提交反馈的日期:2018/05/31 14:07.

处理时间:2018/06/05 10:50.

处理结果:提交的修改记录请求被接受,记录已经被修改.

上述反馈信息说明联合目录编目数据分类标引存在问题.分析原因如下:

(1)简单地将《美国国会图书馆分类法》或者《杜威十进制分类法》的分类与《中国图书馆分类法》的分类相对应,造成错误.以上3种分类法有一定对应关系和内在规律,但具体分类方案还是有差别的.

(2)对在编的西文文献了解不够深入.一般情况下,西文文献的大致分类可以通过简单的书目数据来了解,但涉及两类主题以上的西文文献,其分类标引就需要通过进一步深入了解文献内容来确定.

联合目录系统开发人员曾经试图找出082字段(杜威十进制分类法分类号)或者050字段(美国国会图书馆分类法分类号)与093字段(中国图书馆分类法分类号)的对应转换关系,实现MARC21相关字段的自动转换,结果被证明是不可行的.其主要原因在于,3种分类方法的编制原则不同,国内外的文化背景、社会背景差异、国内外各个学科发展水平不同,使得各个类目无法形成简单的映射关系[2].这种情况也为编目人员发挥个人的知识能力水平、编制高水平的书目数据留出了空间.因而更需要西文编目员提高业务水平,认真了解在编文献的内容,同时参照050字段和082字段,给出尽可能准确的093字段,完成高质量的书目数据编制.

1.3 原著与译著不能同时检出

在实际工作中,发现在CALIS联合目录中,有时不能同时检索到西文原著和与之相应的中文译著,这一结果应当是编目员在对中文译著编目时,没有著录原著书名和ISBN号所致.此外译著与原著的中图分类号偶尔也会出现不同,而这种情况的出现,其原因主要在于编目员没有仔细比对相关原著或译著的书目信息.

2 CALIS联合目录数据的质量管理办法

为了提高目录数据质量,CALIS联机合作编目中心采取了一系列的措施,取得了一些成效.

2.1 完善组织管理制度

2.1.1 建立成员馆分级制度,对不同级别的成员馆赋予不同的权限.成员馆分 B+、B、C、D、R等级别,只有 B+级和B级成员馆拥有提交新记录的权限.其他成员馆可以下载、加馆藏,但不能提交新记录.少数编目力量雄厚的成员馆拥有联机上载数据的权限[3].

2.1.2 集中高校编目专家,成立质量控制组.联合目录成立了质量控制组,成员全部由高校编目专家组成.主要职责包括维护数据质量、制订相关著录规则和标准、解答编目难题、对编目员进行培训等.质控组人员定期进行调整.

2.1.3 制订轮流值班制,遇到问题及时解决.制订轮流值班制,每周有专人负责接听反映问题的电话,处理相关电子邮件,及时回答成员馆的业务咨询.

2.2 软件系统的开发与维护

2.2.1 改进 Z39.50编目客户端功能 Z39.50编目客户端是 CALIS专门为联机编目开发的编目软件,具备支持Z39.50协议、支持跨库检索、支持本地数据库配置等优异功能.

2.2.2 人工干预系统 每条新记录提交时,服务器会自动查重.新记录顺利入库,重复记录拒绝入库.而对于无法确定的数据,则需要人工处理.CALIS专门建立了人工判重库,开发了人工判重软件,由专门人员对服务器无法自动判别的记录进行处理.

2.2.3 重复记录处理系统 CALIS专门开发一个软件工具,可以根据一定的条件,如ISBN号或题名,抽取库中的疑似重复记录,由专人判别标识,最终由服务器统一合并删除.同时,CALIS还在Z39.50客户端增加了记录合并和删除的功能,确保重复记录可以随时被处理.

2.3 数据库系统的维护

2.3.1 数据修改 联合目录要求成员馆在利用数据的同时,对记录进行修改.对于B级和B+级成员馆来说,修改记录是必尽义务.对于C级及以下成员馆,联合目录鼓励他们将有质量问题的记录上报,由值班人员处理.

2.3.2 全域更新 对于数据库中普遍存在且可以由计算机一次性解决的问题,联合目录采取全域更新的方法.

2.3.3 报表处理 联合目录通过各种数据报表来发现问题、解决问题.数据报表分日常管理报表和特定需求报表两种,日常管理报表定期生成,包括新记录报表、下载数据报表、重复记录报表等;特定需求报表指根据一些指定条件特别生成的报表,如指定责任者、指定丛书名生成的报表.另外,还有规范标目处理报表、中文库中日文记录报表等.联合目录中心通过这些报表对数据进行分析,进而更新、修改或删除.

2.4 建立三级编目员考试与培训制度

CALIS为保证中心数据库的书目数据质量,要求编目员先要经过CALIS中心组织的专业培训,然后参加资格认证考试和中心专家的定期测评后,才能取得资格证书.在图书馆中,编目工作是一项技术性很强的工作,编目员需要了解ISBD、AACR2、RDA的国际标准编目规则,熟练掌握编目业务流程中的各项规范,CALIS三级编目员资格认证制度的建立,强化了编目工作的职业准入,使专业培训更具针对性,从而提高了编目人员的职业素养[4].

为配合CALIS联合目录编目员资格认证制度的顺利实施,由CALIS联合目录部提出,CALIS技术中心委托中国农业大学西区图书馆开发了“编目员资格认证考试系统”.2004年6月和2005年4月分别进行了第一次中文和西文三级编目员资格认证考试,标志着CALIS联合目录编目员资格认证制度的突破性进展[4].取得三级编目员认证资格的人员,可以拥有上载编目数据至联合目录的资格,为联合目录建设提供了人才资源方面的保障.

3 提高联合目录数据质量的措施

3.1 编目员应努力提高自身业务水平与能力

西文编目数据,虽然主要采取套录的方式完成,但对西文编目员本身的业务水平要求同样很高.西文编目员应当具备原编的能力和水平,才可以保证对套录数据的正确理解和处理.西文编目员在具体工作中,应当不断积累经验,努力学习,提高自身的业务水平与能力.

(1)熟练掌握编目规则.西文编目员应当熟悉ISBD、AACR2、RDA的西文编目规则,对西文编目规则的发展变化也应当有所了解[5].

(2)熟练掌握一门外语.西文编目员应当熟练掌握一门外语,从而具备深入了解西文文献的能力,进而能够对西文文献进行准确的分类.

(3)通晓计算机基础知识.西文编目员应当熟悉计算机基础知识,从而更加高效顺利地利用计算机及网络,参与联合编目工作.

(4)熟悉各种分类方法.西文编目员应当熟悉《美国国会图书馆分类法》《杜威十进制分类法》和《中图图书馆分类法》各种分类方案,了解各种知识门类的源流与发展,对科学分类体系有一个全面的认识.

3.2 联合目录系统应不断改进,适应新的网络环境

联合目录之所以能创立并发展到今天,与网络技术的出现与发展密不可分.当前网络技术已发展到移动互联时代,联合目录系统理应与时俱进,开发出更多更好的软件平台,充分发挥现代网络技术的优势.

(1)针对联合目录服务,开发更多的适应移动互联时代的应用程序,让联合目录的服务更加方便快捷,丰富多彩.比如,应当考虑将已有的功能移植到诸如手机等移动互联终端,并且保证以后开发的功能都可以同时在固定端和移动端得到应用.

(2)针对联合目录建设,开发具备更多功能的系统,方便西文编目员快捷地从事数据上载等相关业务,为联合目录建设的质量和效率,提供更加完善的保障.同样保证相关功能在移动终端得到应用.

3.3 编目员培训与管理工作应不断改进,适应移动互联时代的发展

CALIS多年来为保障联合目录质量,建立了三级编目员培训考试制度.二十几年来,累计开展培训70余次,培训受众达到8 000余人.截至2019年3月,通过考试取得西文三级认证编目员资格的人数已达314人,二级编目员15人,为编目的人才资源提供了有力的保障.现对西文三级编目员的培训、评价与管理工作,提出以下几点建议:

(1)丰富培训内容,增进业务交流.CALIS三级编目员的培训,在短短的几天之内,进行一次完整的编目知识培训,课程安排相当紧张,如在培训过程中增加一些以业务交流为目的的内容,则更加利于编目员的互相学习,发现编目员共同关心的问题,提高培训的针对性.

(2)修改三级编目员的上载权限.取消上传数据IP地址范围限制,改为实时实名认证,方便编目员进行书目数据上传以及修改.同时有利于明确编目员的责任与义务,将上传书目数据质量责任落实到个人.

(3)调整三级编目员评价标准.对三级编目员的评价,应当结合质量和数量两个方面,以质量为中心,给每一位编目员适当的评价,促进编目员职业素养的提高.

(4)加强业务联系,促进共同发展.建立联合目录业务处理与交流的移动终端平台,方便三级编目员的业务工作,促进编目员相互之间的业务交流,增强编目员群体的凝聚力,提升编目员整体的业务能力.

4 结语

CALIS联机合作编目经历了从无到有,从有到优的发展历程.CALIS顺应网络时代的要求,以书目数据共建为基础,陆续开展文献传递、馆际互借等多种服务.为更好地发挥图书馆在高校的作用,提升高校图书馆的服务水平,CALIS做出了巨大贡献.CALIS改变了整个高校图书馆编目业务模式,朝着依托互联网、共建并共享信息数据的大联合方向发展.最终必将影响和提升传统图书馆各项业务,使图书馆更加适应移动互联的新时代.

猜你喜欢
西文分类法编目
高校图书馆西文古籍开发整理实践及对策探讨
——以河北大学图书馆为例
乐籍西译:五种《乐记》西文译本、译者及其传播
国家图书馆藏四种古籍编目志疑
分类法在高中化学中的应用
粤剧编目整理之回顾与展望
K 近邻分类法在岩屑数字图像岩性分析中的应用
西文图书编目中RDA书目记录使用分析
高等教育英语专业建设回顾
CALIS联机合作编目中的授权影印书规范著录
图书馆集成管理系统在藏文图书编目中的比较研究——以ILASII和GDLIS为例