中国人民大学图书馆善本目录整理研究

2018-01-13 01:25朱小梅侯景丽
法制与社会 2017年36期
关键词:元数据数据库

朱小梅 侯景丽

摘 要 本文分析了中国人民大学图书馆古籍善本目录整理中存在的主要问题:著录未做到规范化、书目数据错误,著录单位的粒度未能跟上时代的要求,主题词不规范、影响检索质量等。在分析问题的基础之上,设计了中国人民大学图书馆善本目录整理的工作框架,明确了善本目录整理的目标,即建成完善的善本书目数据、优化整理工作流程、促进善本书目的出版以及建设本馆古籍目录数据库等。

关键词 古籍目录 善本 元数据 古籍书目 数据库

作者简介:朱小梅,中国人民大学图书馆副研究馆员,中国人民大学古籍整理研究所,管理学博士,研究方向:知识组织、文献学;侯景丽,中国人民大学图书馆馆员,研究方向:资源组织和建设。

中图分类号:G647 文献标识码:A DOI:10.19387/j.cnki.1009-0592.2017.12.323

一、前言

古籍是中国悠久历史的见证,是中国文化记忆的载体,也是中华文明的瑰宝。对古籍善本的保护、整理和利用,是当代人传承文明的重要方式。目录整理是古籍保护、开发及利用的基础性工作,历来为古籍藏家和图书馆所重视。目录不仅可帮助我们掌握古籍的基本状况,还可“辨章学术,考镜源流”,揭示图书的真伪、篇目的分合、书籍性质以及阙疑和亡佚状况等,为读书治学指示门径。随着时代的发展,传统手工卡片的目录整理方式被现代化、网络化的整理方式所替代。在这个新旧更替的过程中,目录整理出现了很多的问题,如目录格式、目录的系统导入、目录的共享问题,等等。古籍整理人员需要研究这些问题,探索新的整理方法和整理手段,思考如何利用新系统、新平台、知识链接、知识关联等技术揭示、组织与利用古籍。本文以中国人民大学图书馆(以下简称人大图书馆)善本古籍目录整理为例,探讨当今网络环境下古籍目录整理中存在的问题,希冀为业界同行提供一定的参考和借鉴。

二、善本目录整理的原因和目的

(一)新增善本的著录任务

20世纪90年代,我国各种类型图书馆开启了古籍整理工作,整理和出版了各种类型的古籍目录,其中影响较大的有《中国古籍总目》、《中国丛书综录》、《中国古籍善本书目》、《北京图书馆古籍善本书目》、《北京大学图书馆藏古籍善本书目》和《中国人民大学图书馆善本书目》等。

人大图书馆拥有丰富的古籍资源,数量达到30余万册,其中善本3万余册(人大图书馆将乾隆前刻印出版的图书,以及民国时期的写本或罕见的活字本等界定为善本),为中国人民大学文史哲等学科的教学和科研起到了重要的文献支撑作用。经过图书馆几代人的努力,先后整理及出版了《中国人民大学图书馆线装目录》、《中国人民大学图书馆家谱目录》、《中国人民大学图书馆地方志目录》(1987年)和《解放区根据地图书目录》(1989年)。由于善本具有极高的文献价值、艺术价值和文物价值,1991年人大馆整理出版了《中国人民大学图书馆古籍善本书目》(以下简称善目)。善目收录了善本书目2400余种,2800余部,其中宋元刻本11部、明刻善本1100余部、清刻善本1500余部、明清稿本、抄本和名人学者题跋校本160余种 。善目因其收藏丰富、著录详细、分类科学得到了业界的称赞。善目出版之后,经过长期的古籍整理,人大馆又陆续发现了一些符合善目标准的古籍。2015年9月-10月,人大馆对古籍善本进行了清点,确认新增善本692种,新增善本数量几近原有善目的1/3。对这些珍贵的馆藏进行详细的揭示,是人大图书馆古籍整理工作的一项迫切任务。

(二)古籍目录数据库建设的尝试与探索

古籍目录数字化是古籍再生性保护的有效方法,也是古籍从藏转用的良好方式。2000年后,图书馆界开始建设数字化古籍目录。国家图书馆、上海图书馆和北京大学图书馆等图书馆古籍目录数据库建立,带动了全国各类型图书馆古籍目录数据库的建设。2010年以后图书馆之间的合作加强,陆续建设了一些古籍联合目录,包括CADAL(大学数字图书馆国际合作计划)古籍文献资源、CALIS(中国高等教育文献保障系统)“学苑汲古”高校古文献资源库等。其中,国内外24家图书馆先后加入CALIS“学苑汲古”高校古文献资源库,实现了较大范围内的高校古籍目录资源共享,为图书馆古籍的著录、套录和版本鉴定,以及读者的使用都提供了方便。

人大馆善目出版至今已有26年,期间计算机技术以及互联网技术迅猛发展,人大馆古籍目录整理的方式和工具也经历了巨变。早期目录整理工作以人工卡片和工作单为主,只有大致的标准,没有严格的著录细则,因而著录的详简程度因人而异。20世纪90年代图书馆开始使用图书馆集成系统,但是由于古籍的著录字段较为特殊,人大图书馆集成系统不能进行兼容。因此,图书馆专门购买了古籍数据库系统平台“馆藏古籍书目数据库”,并将工作单大规模人工录入进系统。由于技术上的不成熟,馆藏古籍书目数据库使用很不方便,如不能进行繁简体通用检索、囿于精确检索缺少模糊检索、响应速度慢等;同时,数据录入交由专业性不强的公司人员操作,常出现繁体字错误、数据纰漏的状况。读者使用馆藏古籍书目数据库效果不佳,体验较差。21世纪后,CALIS开启了“学苑汲古”高校古文献资源库项目(以下简称“学苑汲古”),北京大学、清华大学、南开大学、吉林大学以及中国人民大学等20多所高校图书馆先后加入项目。项目开发了“学苑汲古”高校古文献资源库,制定了统一的古籍著录标准。各馆可以在平台上在线著录古籍,也可本地著录再批量上传古籍数据,以实现高校古籍目录资源共享。“学苑汲古”在技术上实现了繁简体切换检索,模糊检索等,检索结果较好。人大图书馆由于本馆的古籍书目数据库使用不佳,遂采用了“学苑汲古”平台进行古籍目录整理和揭示。但是,人大馆自身的古籍目录数据库使用不佳的问题始终存在。在新时代,图书馆亟需重新建设适合本地的、兼容性强的目录数據库,真正满足广大师生乃至全国读者的文献需求。

(三)善本目录整理的目的

人大图书馆馆善本目录的整理和修订是时代和学术发展新形势下图书馆的重要工作,其要达到的目的主要有:一是完成全部馆藏善本的目录整理,建设一套高质量的古籍善本目录数据。订谬旧善本目录,补充新增善本目录,查漏补缺,彰显版本学及目录学之意义。二是促成善本目录出版,展示人大古籍文献的优势和特色。三是建设现代化、高质量的、满足师生需求的中国人民大学图书馆古籍书目数据库。随着技术的不断推进,人大图书馆图书馆集成系统几经升级,克服了不能兼容古籍目录数据的障碍;图书馆还购买了可提供个性化服务的系统平台,可以为古籍编目提供服务。因此,图书馆可以利用此次善目修订的机会,考察图书馆集成系统或购买的系统平台,建设本馆新的古籍目录数据库,替代应用效果不佳的旧版“馆藏古籍书目数据库”。

三、善本书目整理中的问题分析

在长期的古籍目录整理过程中,人大图书馆发现了一些问题。造成这些问题的原因不一而足,有的是人员不专业以及不严谨,有的是管理不规范,等等。主要问题如下:

(一)著录未做到規范化,书目数据错误

2000年后互联网应用广泛,图书馆古籍目录资源共享的需求日益强烈。人大馆采用CALIS“学苑汲古”的元数据著录标准,但是事实上未完全规范化,例如“学苑汲古”存在同一种书有多部,但是著录的详简度不一,著录内容相差较远;丛书的子目按单本著录;个别图书的附录视为另一种书,单做数据;数据存在一定程度的错误,错误类型包括:著录的索书号与实际索书号不符、错字漏字、版本判断错误、函册数据错误、版式错误、未修改套录数据等等。

出现以上问题的原因在于:首先,整理人员专业水准良莠不齐、严谨程度迥异。个别工作人员态度散漫,套录他馆数据但不认真核对实书,或将一条数据拆成两条数据充工作量,造成数据谬误。其次,缺乏有效的目录质量监控。整理人员著录之后,缺乏检查和监督机制,既无专人负责数据核查,也无互校环节,因此数据错误频仍。

(二)著录单位的粒度未能跟上时代的要求

由于古籍版本源流复杂,存在版刻——版印(种)——藏本(部)——册之间的数据层次关系。著录时需要较为清晰的区分版刻、印本、单个本子 。实际上,不同的古籍元数据标准对著录单位的粒度要求不一,应用元数据的图书馆著录单位的级别也有所不同(见表1)。

表1:各单位古籍著录单位情况

独有的MARC对应字段,便于将古籍元数据与MARC数据进行连接。时代不同,对著录单位的粒度要求也不一样。例如,旧版善目的著录基本为种,复本(又一部)信息简单。而当前人大图书馆集成管理系统需要以册为著录单元,用条码一一对应进行管理。由于人大图书馆著录单元的粒度停留在藏本级上,造成了古籍数据与管理集成系统MARC数据的不兼容。此次善目整理,著录单位以(藏本级)“部”为单位,也对每册图书著录登录号标识,并加上了条码号。加配条码号就意味着管理的粒度下探至书册级别,精确体现和揭示每一册书,方便将来数据库的数据兼容。

(三)主题词不规范,影响检索质量

古籍整理人员需要通过对古籍内容的分析,把著录的对象或事物用规范化的主题词概括出来,作为检索标识,以易于用户检索。目前,我国尚无专门的古籍主题词表,而现有的《汉语主题词表》、《中国分类主题词表》都无法全面满足揭示古籍内容的要求。整理人员大都凭借自己的经验给出主题词,主题词标引显得较为随意、不规范,影响了检索质量。

四、善本书目整理的工作框架

针对以上存在的问题,经过古籍部整理人员的多次讨论,人大图书馆搭建了善本书目整理工作框架(见图1 善本书目整理框架图),指导和完善善本书目的整理工作。首先,设计具有弹性的古籍元数据方案。然后,根据元数据进行善本的著录,目录的分类以及组织排序。

图1:善本书目整理框架图

(一)设计古籍元数据方案

在整个工作框架中,最关键的是古籍元数据方案的设计。古籍著录的深度与广度取决于元数据的设定。元数据既要满足善目的出版细节,又要为便于书目数据库的检索,其要点在于古籍元数据字段的选择,即著录项的选择。旧版的著录项详细,有序号、馆藏分类号、题名、责任者及责任方式、版本数据、函册、版式及其它说明等。特别是版式的著录,在1980-1990年代出版的众多善目中并不多见,更显善目质量之高。时至今日,旧版著录项仍是可圈可点。

经过对《北京大学图书馆藏古籍善本书目》、《北京图书馆古籍善本书目》和《中国古籍善本书目》等诸多的善本目录的比较,同时参考了国家图书馆古籍数据、北京大学图书馆古籍数据以及CALIS“学苑汲古”的著录标准,图书馆以CALIS古籍著录标准为底本,制定出了适合本馆的古籍善目元数据方案。

此次新版的著录项在旧版的基础上增加和丰富了以下内容:为加强古籍管理,增加了登录号字段以及图书条码号字段;丰富了版式的尺寸信息,为版本研究提供了全面的信息;丰富了古籍装帧形式,强化古籍的艺术价值;增加了古籍破损状况字段,为未来的修复工作奠定数据基础;单独设立钤印字段,为馆藏源流的总体分析及单套古籍的历史源流研究、古籍的艺术欣赏提供了信息;单独设立刻工字段,为古籍版本的考订增加了检索点。

图2: 人大图书馆善本书目(1991年)著录图示

(二)目录数据著录

目录数据著录是古籍整理人员应用版本学、目录学、文字学等多种学科知识进行的专业性极强的编目活动。著录数据以excel格式编排,著录过程中着重两项工作。其一,版本的鉴定。有的版本较容易鉴定,有的即使查看牌记、序跋、正文、避讳和钤印等内容信息都难以断定,就要通过墨色、书法、纸张、版式等特征信息加以推断。其二,钤印的识别。有的钤印在旧版善目中已经识别,但仍有部分钤印需要识别。

(三)目录分类

1991版主要参照《全国古籍善本书目总目》的分类,分为经、史、子、集、丛五部,部下分类至二级分类。因该分类已经成为古籍通用分类,本版仍沿袭该分类,补充个别的二级分类用来容纳部分难以分类的古籍。

(四)目录排序

目录排序就是在分类之后,每一类书大体按著者年代排列顺序,同种书按不同版本编排,同一版本之书按版刻或抄写年代先后编排。目录分类和目录排序最后确定了善目的宏观结构,印本善目的主体结构就此确定。

五、善本书目整理的成果

(一)全面揭示馆藏善本,摸清了馆藏状况

无论是之前的2400余种还是新增的600余种善本,图书馆都加以著录,可以全面揭示馆藏善本。通过整理,人大馆摸清了古籍善本的总体情况,明晰种、部、册卷之数量。著录的元数据字段增加登录号、条码号、图书馆破损状况的登记,摸清了善本的现状,为图书馆的古籍管理和修复提供了有效的数据。

(二)查漏补缺,纠正谬误,彰显版本学及目录学之意义

此次善目整理,对善本的题名、版刻年代、出版年代、版式、钤印等各个字段进行了严格的审核。将1991年版善本书目数据和“学苑汲古”数据作为参照,发现了1991年善本书目、学苑汲古、本次整理的善本目录均有不同程度的错误。针对错误,进行了详细的备注,查漏补缺,纠正谬误,让版本数据确实可靠,彰显版本学目录学指示治学门径的作用。

(三)优化工作流程,规范元数据操作,完善数据核查

针对过往工作流程的不足和缺陷,借本次善目整理工作之机,重新制定了工作流程,规范了元数据操作,增加了数据核查环节,保证了著录工作的效率和质量。

(四)善本书目为未來的古籍研究奠定了基石

首先,补充了许多以往未识别的钤印。钤印是考察图书收藏历史的重要凭证,善本中的钤印内容丰富,姿态百样,具有极高的艺术价值。有的是名家钤印,更具文物价值。整理人员凭借深厚的文字功底和严谨热忱的态度,识别了不少前人未识别的钤印,为今后的钤印研究和出版提供了有益的基础。其次,揭示了稿本和钞本等写本。稿本和抄本向来为研究者所重视。本次整理,非常重视稿本和抄本的信息著录,增加了抄录人的生平信息、稿本和抄本的内容信息和价值意义。这为未来的稿本和写本研究指示了门径。

(五)促成善目出版,凸显人民大学古籍资源的特色

图书馆积极促成古籍善本书目的出版,这是善目整理的初衷与可预期的成果。善目的修订与出版,将向世人展示人大古籍的面貌和特色。

(六)为建设有效的本馆古籍目录数据库奠定基础

古籍书目数据库本地化建设是善目整理的目标之一。网络化环境下,古籍数字化建设如火如荼,数字化古籍全文数据库不断涌现,但数字化目录建设仍是古籍数字化工作的基础和前提。人大图书馆古籍目录能在“学苑汲古”中共享,却没能较好地实现人大图书馆书目数据库的本地化,可谓憾事。此次整理善目,为古籍善目数据库本地化建设奠定了数据基础。图书馆可对人大图书馆的集成管理系统、购买的数据库平台系统进行详细的考察,选择合适的平台进行古籍目录数据的批量导入。平台考察的内容主要包括元数据是否可批量导入、检索点的设置、检索方式及浏览方式、检索速度、检索相关度排序、繁简通检、异体字通假字字库等等。通过这些努力,最终实现古籍书目数据库的本地化,为人民大学师生乃至全国读者提供优质的服务。

六、结语

古籍是中华文明的见证和载体,对古籍的整理、揭示是我们传承文明的重要方式。图书馆拥有的丰富的古籍馆藏,犹如一座珍宝库值得我们去挖掘和发现。古籍目录的整理是图书馆当仁不让的责任,是传统古籍在新时代焕发勃勃生机的有效方法。图书馆开展目录整理的工作,不仅可以让古籍在世人面前再现其魅力,还可借此契机建设满足读者需求的古籍书目数据库,最大限度地发挥古籍的文献价值。

注释:

中国人民大学图书馆.中国人民大学图书馆善本书目.中国人民大学出版社.1991.序言.

郭伟玲、戴艳清. 论古籍数字化的检索问题.图书馆理论与实践.2011(10).13-16.

葛红梅、徐晶晶. 基于DC的古籍元数据评述.兰台世界.2015(26).33.

猜你喜欢
元数据数据库
数据库
数据库
基于来源的组织机构元数据构建研究
元数据与社会化标签在微视频搜索中的应用
高等院校智慧校园建设规划与实现
数据库
财会信息资源元数据标准的研究
基于隐语义模型和用户信任的个性化推荐模型
数据库
数据库