国家图书馆RDA本地化应用测试分析与展望

2018-05-10 10:54杨恩毅

图书馆研究与工作 2018年5期

杨恩毅蔡丹

（中国国家图书馆北京 100081)

1 测试背景与目的

《资源描述与检索》（Resource Description &Access，简称RDA）自2010年以工具套件的方式正式发布以来，引起了全世界编目界的广泛关注。美国、英国、加拿大、澳大利亚等世界编目领域的领军者，纷纷用RDA进行编目测试，并发布适合各自国情的本地政策声明[1]。德国作为具有深厚而独特编目传统的非英语国家，也以RDA的发布为契机，努力融入编目国际化的浪潮，并联合奥地利和瑞士，共同发布了德语国家政策声明[1]。一时间，RDA浪潮席卷全球。RDA工具套件除英语版外，又先后推出了法语、德语、西班牙语、意大利语和芬兰语版本[1]。宣布实施RDA编目的机构已逾十几家，覆盖北美、欧洲和亚洲的国家图书馆和专业图书馆[1]。

与国际上如火如荼的RDA实施浪潮形成鲜明对比的是，国内在RDA实施方面还几乎是一片空白[2]。这就造成了一线编目员在工作中的两难局面：一方面，外文编目赖以参考的数据源，如美国国会图书馆、OCLC联机编目中心等，均全部采用RDA进行编目，编目员在处理这些RDA的套录记录时感到无所适从；另一方面，原始编目数据也囿于没有RDA本地规则而无法开展RDA的编目。因此，编目员迫切需要一部适合我国外文文献编目国情的本地声明来指导RDA编目工作。

基于上述原因，国家图书馆编制了《国家图书馆外文文献资源RDA本地政策声明暨书目记录操作细则》〔以下简称NLC PS（FLM）〕。然而，在将NLC PS（FLM）应用于实践之前，必须经过实践的检验，RDA本地化测试工作必不可少。首先，通过测试检验新规则的技术适用性，NLC PS（FLM）能否作为编目指南，指导外文各语种、各类型资源的RDA编目；其次，通过测试检验经济的可行性，RDA的实施是否会带来时间、人力等编目成本的激增；再次，通过测试检验编目员的主观体验，编目员对RDA本地规则是否接纳，是否能通过有效的培训尽快掌握其主旨精髓，以便快速提升工作效率，同时，还可以进一步了解编目员对本地政策声明在人本方面的反馈，以便进一步优化，使其成为真正好用的规则指南。综上，国家图书馆进行了RDA本地化应用测试，从技术、经济和人本几个方面考察NLC PS（FLM）的实用性和外文编目实施RDA的可行性，从而为编目工作的未来发展决策提供真实、客观、有效的依据。

2 测试原则

为准确、科学地评估实施RDA对国家图书馆外文编目的影响，此次测试以代表性、广泛性和真实性为原则，力求从测试人员、测试资源、测试方法到测试环境和评估要素都能充分反映国家图书馆外文编目的整体情况，从而使测试结果具有较高的代表性和权威性。

2.1 测试方法客观

此次测试采用的方法与2011年美国RDA测试采用的方法相同。美国开展RDA测试时，创建了原编共同集（Common Original Set，简称COS）、套录共同集（Common Copy Set，简称CCS）、原编附加集（Extra Original Set，简称EOS）和套录附加集（Extra Copy Set，简称ECS）4个数据集[3]。本次RDA测试仅限于国家图书馆，测试规模远远小于美国的RDA测试，因此测试记录的创建仅分为原编共同集和套录共同集两个数据集，由测试者分别对指定资源进行编目，而没有附加集。数据集根据国家图书馆外文编目的业务块分为5个模块：西文图书（西编）、东文图书（东编）、俄文图书（俄编）、国际组织与外国政府出版物（国际组织），以及外文连续出版物（外刊）。不同业务块因所涉业务不同，选定的测试共同集也不同。

对于原编共同集，每个业务块的测试者仅对本业务块选定的共同集资源编目，分别为每种资源创建两条记录，其中一条记录遵循目前所用的编目规则（AACR2规则以及各组现行的本地规则），另一条记录则遵循NLC PS（FLM），然后分别记录编制两条书目记录的时间。

对于套录共同集，每个业务块的测试者仅对本组选定的套录共同集资源编目，分别依据目前规则和NLC PS（FLM）完成对套录数据的修改，并计算使用两种规则套录编目所用的时间。

这种多人分别对相同资源采用不同编目方法进行编目的测试办法，经过美国RDA测试的实践，已被证明能够准确地反映出两种编目方法在编目效率、编目质量和编目员主观感受中的不同，从而体现RDA对编目工作的影响。因此，采用此种测试方法能做到准确客观，测试结果具有较强的说服力。

2.2 测试资源覆盖面广

本次测试所使用的资源数量多、范围广。原编共同集包含50种资源，其中西编10种（含英文、德文、法文、西班牙文）、东编30种（含日文、朝文、泰文）、俄编5种、国际组织5种，外刊无原编共同集；套录共同集包含35种资源，其中西编10种、东编10种（仅日文，无朝文和泰文）、俄编5种、国际组织5种、外刊5种。这些资源几乎囊括了国家图书馆外文编目工作的各个方面：语种包括英文、法文、德文、西班牙文、日文、朝文、泰文、俄文；载体形态包括图书、CD、DVD；出版类型包括多卷书、连续出版物、会议录、书附盘、多文种图书、汇编文献、国际组织出版物；内容类型包括专著、地图资源、音乐资源、视频资源、宗教文献、法律文献等。非RDA规则涉及的编目流程及管理涉及的环节，如分类标引、馆藏记录的创建、单册状态管理等不在测试范围内。如此广泛的测试范围能完整地反映国家图书馆外文编目的整体情况。

2.3 测试环境真实

本次测试在Aleph500系统正式机上进行，测试者如平时工作一样在Aleph数据库中建立和保存书目记录，测试环境即为测试者平时的工作环境，不存在不熟悉编目界面、对操作生疏等干扰因素，由此可以尽可能真实地模拟平时工作。

2.4 测试评估要素全面

此次测试的评估要素以调查问卷的形式向测试者发放并全部收回。问卷中所涉及的问题包括五部分内容：第一部分，测试人员基本情况，包括姓名、年龄、性别、编目文献的类型及文种等信息；第二部分，RDA学习概况/RDA掌握概况，包括测试者开始接触RDA的时间、学习RDA的累计时长及学习方式、学习效果，还包括测试者对RDA的掌握程度；第三部分，测试情况，包括各业务块选定的测试资源的命名、ISBN、题名、测试日期、AACR2耗时（min）、AACR2错误率、RDA耗时（min）、RDA错误率；第四部分，测试体会，包括是否认为RDA更具体现“用户便利性”的优势、是否相对AACR2更加困难、是否对工作量造成巨大的影响等主观感受；第五部分，未来建议。评估要素涵盖了测试的各项环节，对测试结果和测试者进行全方位的主客观评估。

2.5 测试人员代表性强

调查问卷如实反馈了测试者的背景情况和对RDA的掌握程度。参与此次测试的人员均为国家图书馆外文编目的一线编目员，其中西编16人（其中2人为专门的校对人员，不参与测试数据的创建）、东编5人、俄编3人、国际组织2人、外刊3人，共计29人，数量上占全部外文编目人员的一半，各业务块测试者的人数也代表了其在整个外文编目业务中所占的比重。测试者年龄主要集中在31～40岁（占52%），主要为女性（占76%），从事编目工作4～10年的占59%。从测试者从事编目对象的载体形态来看，编目图书的人员最多（27人次），其次是实体电子资源（18人次），再次分别是缩微文献（14人次）、连续出版物（3人次）等。从测试者从事编目的文献语种来看，从事英文编目的人数最多（18人次），其次是其他西文（如德文、法文、西班牙文等，共6人次），然后依次是日文（4人次）、俄文（4人次）和其他东文（如朝文、泰文等，共2人次）。测试者的这种背景状况与当前国家图书馆外文编目人员的整体状况基本相当。

从学习RDA的时间来看，测试者学习RDA的时间各异，但绝大多数测试者的时间在50小时以上（占93%），其中在100小时以上的达到了55%。关于测试者对RDA的掌握程度，调查问卷设计了打分题进行反馈。测试者依据自身与题目描述的符合程度进行打分，以1分为完全不符合，5分为完全符合。每题平均得分见图1。从图中可以看出，测试者平均打分在3分左右，说明其对RDA的掌握程度处于中等水平，这也代表了国家图书馆外文编目人员对RDA的整体认知水平。因此，此次测试所选定的测试者具有很强的代表性，能够客观地反映RDA和原编目规则为实际工作带来的影响。

图1 测试者对RDA的掌握情况图

综上所述，此次测试所选用的测试方法客观得当，测试资源涵盖范围广，测试环境真实，测试评估要素全面，测试人员代表性高。因此，此次测试的结果具有较高的代表性和权威性。

3 测试结果分析

本次测试共收集书目数据816条。根据测试者在调查问卷中对这816条书目数据建立的时间、耗时和错误率的记录，以及测试者的主观体会，我们进行了统计分析，详见表1。

表1 外文采编部RDA本地化应用测试记录数量

3.1 RDA耗时高于AACR2耗时

各业务块编目整体平均耗时情况如图2所示，东编因语言文字的特殊性，分为日文、朝文和泰文分别统计。从图中可以看出，测试者采用RDA编目平均时间均明显高于应用AACR2编目的平均时间，增长比在10%以上。这一方面是由于RDA规则增加了一些著录元素，更注重元素的完整性，实践中的著录元素有所增加；另一方面是由于测试者对RDA规则的熟悉和掌握程度不如现行规则，从而增加了编目耗时。

此外，测试者应用RDA编目平均时间增长百分比在各业务块之间有所不同，其中外刊增幅最低，然后依次是国际组织、西编、俄编、东编日文、东编泰文、东编朝文。外刊的RDA编目平均时间增幅最小，说明RDA有关连续出版物规则的变化最小，对连续出版物编目影响较小。西编和国际组织平均时间增幅均在30%以内，低于东编和俄编。这主要是因为国家图书馆的西文编目（国际组织文献也以西文为主）始终与国际通用规则接轨较好，且日常工作中已接触到大量RDA数据，因此更加适应规则的变化。然而，东文、俄文，特别是泰文、朝文等东文小语种的编目，长期以来并未执行国际已有的通用规则，因此，许多RDA的规则对这些文种的编目来说是全新的，规则变化的强度最大，所以耗时增加明显。

图2 测试者平均耗时图

3.2 应用RDA和AACR2编目的时间差逐渐降低

将每人用两种规则编目每种资源所用的时间差（RDA耗时减去AACR2耗时）按编目先后排序，然后采用对数拟合时间差的变化趋势发现，随着测试者编目测试资源数量的增加，编目花费的时间差逐渐减少。在所有测试者中，有17人的编目时间差呈下降趋势，有6人的时间变化不大，有4人的时间略有上升。个别测试资源用RDA编目的时间反而低于AACR2编目时间，这是因为套录数据是RDA数据，要修改成AACR2数据反而会花费更多的时间。对于时间变化不大甚至有上升趋势的测试者进一步分析后可发现，他们大多将编目难度较大的资源安排在后面，因此越往后用RDA编目的时间差反而有所增加，这在一定程度上影响了真实的时间变化趋势。因此，总体而言，随着用RDA编目数量的增加，测试者对RDA规则更加熟悉，编目效率就会提升。同时统计结果还表明，有些测试资源用RDA编目的时间甚至还低于AACR2编目时间，这是因为套录数据是RDA数据，要修改为AACR2数据反而会花费更多的时间。

3.3 非编目规则型错误占比最高

测试记录中的错误经汇总后划分为不同类型，各类型错误占整体错误的比例如图3所示。从图中可以看出，非RDA和AACR2规则错误，如ISBD标识符错误、MARC规则错误、拼写错误、规范控制错误等，占比最大累计（近60%），这说明更多的错误与RDA规则无关。

图3 测试者整体错误类型占比图

3.4 RDA错误率高于AACR2错误率

从图3测试者整体错误类型可以看出，RDA规则错误占32.5%，明显高于AACR2的错误率（8.5%）。这主要是由于对规则的不熟悉造成的。对RDA规则错误进一步分类，将其分为未如实著录/使用缩写、关系说明语缺失/错误、检索点缺失、术语错误等类型，如图4所示。从图中可知，RDA规则错误最多的是未如实著录/使用缩写和关系说明语缺失/错误，累计占到55.2%；其他错误则主要包括出版地不准确、出版年和版权年的判别、大小写等，由于难以归类，统一记作其他错误，累计占比36.8%。从RDA错误类型及所占比重可以看出，测试者用RDA规则编目所出现的问题仍然集中在较AACR2的变化方面。这从另一个方面也反映出RDA错误率比AACR2高主要是由于对RDA相比AACR2的变化不熟悉所致。

图4 测试者RDA规则错误类型占比图

3.5 测试者对RDA和NLC PS (FLM)接受度和认可度高

调查问卷统计了测试者对RDA本地化测试的体会情况，结果如图5。

图5 测试者测试体会

从图5可以看出，虽然测试者认为RDA可能会影响工作量，但对RDA和NLC PS（FLM）的接受度和认可度高，对掌握RDA很有信心，认为RDA应尽快实施。同时，大部分测试者不认为RDA大幅增加了成本，也不认为使用RDA较AACR2更加困难，这恰恰从另一个方面印证了测试者对RDA的接受情况。

4 结论与展望

目前，国内对RDA的研究已处于从理论走向实践的关键点，如何将RDA理论研究成果转化为实践指南是亟待国内编目界解决的问题。国家图书馆RDA本地化应用测试是一次有益的尝试，为RDA的实施提供了第一手准确详实的数据。测试结果表明，国家图书馆外文编目实施RDA的时机已经成熟。

首先，NLC PS（FLM）能够满足实际编目需要，可作为RDA编目工作的指南。在测试过程中，无论测试对象资源是何语种、载体形态如何，均能以NLC PS（FLM）为指导，顺利完成编目工作。因此，NLC PS（FLM）完全满足国家图书馆外文资源编目的需要，可作为工作指南使用。其次，编目成本虽有所增长，但仍在可控范围内。采用RDA规则，编目平均时间将在实施初期有所增加，但按国家图书馆外文编目现行的工作量计算，仍可在工作时间内完成。并且，随着RDA实施的深入，编目员对规则的掌握愈加娴熟，编目时间还会逐步缩减。再次，一线编目员对RDA的实施与推广充满信心，但仍需要进一步培训。此次测试表明，国家图书馆外文编目一线编目员的技能水平已基本满足RDA的实施要求，测试者也都对RDA在国家图书馆的实施乃至全国的推广充满信心。但测试者对RDA规则并不能熟稔于胸，仍需要持续的学习和培训。

然而，从AACR2跳转至RDA是一项系统性的工作，除编目员的技能满足要求以外，还需要多方面“硬件”的支持，今后尤其需要做好以下工作：①调整编目平台。MARC 21为适应RDA作了大幅修订，增加、删除、修改了大量字段或子字段的定义。为体现这种变化，Aleph500平台也需要与时俱进，以支持RDA化记录的编制和最大限度呈现RDA记录的效果。②设置OPAC显示。RDA以FRBR概念模型为思想基础，而以RDA编目的记录能否体现出FRBR化的“立体式”显示，则有赖于OPAC的功能。因此，需在现有OPAC的基础上，对其进行升级改造，实现跨库检索，以“作品”为核心聚合相关记录，增强OPAC的导航功能。③组织馆内培训和业界推广。国家图书馆外文编目的一线编目员对RDA规则的掌握还有较大提升空间，在馆内开展RDA培训是实施RDA不可忽视的重要环节。与此同时，国家图书馆作为国内编目界的标杆，在馆内实施RDA之后，还应做好对馆外同行的培训和推广工作，使RDA真正落地我国的外文编目。

参考文献：

[1]RDA Toolkit[EB/OL].[2017-05-23].http://access.rdatoolkit.org/.

[2]罗翀.RDA在中国的实施设想[J].国家图书馆学刊,2014(1):52-56.

[3]Reports and Recommendations of U.S.RDA Test Coordinating Committee[EB/OL].[2017-05-23].http://www.loc.gov/bibliographic-future/rda/source/rdatesting-finalreport-20june2011.pdf.