关于敦煌遗书数据库

2018-05-22 08:05韩春平许端清
敦煌学辑刊 2018年4期
关键词:图版遗书敦煌

韩春平 马 德 许端清

(1.兰州大学 图书馆,甘肃 兰州 730000;2.敦煌研究院 文献研究所,甘肃 兰州 730030;3.浙江大学 计算机科学与技术学院,浙江 杭州 310027)

随着数字化技术的出现和发展,创建基于各种学术资源的数据库成为学术界保障学术研究的一项重要工作。正是在这一背景之下,敦煌遗书收藏机构和敦煌学界为了更好地推动遗书的保护、整理和研究等工作,开展了创建敦煌遗书数据库的崭新业务,旨在为相关工作搭建技术平台。自上世纪末期以来,海内外出现了多个相关的数据库,极大地推动了敦煌遗书各项工作的开展。相关数据库内容有别,名目各异,但“敦煌遗书数据库”则成为综合性技术平台的通称。

敦煌遗书数据库的内容总是随着业务工作的推进而拓展,其功能也总是随着数字化技术的进步而提升。早期的数据库不论内容还是功能,都存在很大的不足,后来的数据库则内容更加全面、准确,功能也更加强大。本文关注的是目前由敦煌研究院组织实施的国家社会科学基金重大项目“敦煌遗书数据库建设”的基本情况,特别是数据库的内容与功能、现有成果的优点与不足等问题。

一、项目概况

由于敦煌遗书保护、整理和研究等各项工作的需要,也由于国家层面的高度重视,全国哲学社会科学规划办公室于2012年将“敦煌遗书数据库建设”列为本年度国家社科基金重大项目(第三批)招标选题。[注]《2012年度国家社会科学基金重大项目(第三批)招标选题》,全国哲学社会科学规划办公室网,2012-06-18,http://www.npopss-cn.gov.cn/GB/219471/219479/220880/18220011.html.申报公告发布后,敦煌研究院作为遗书主要的收藏和研究机构,由时任文献研究所所长马德研究员牵头,联合省内外有关高校,积极组织开展申报工作。经过紧张而又充分的准备,项目终于获批立项,编号12&ZD141。[注]需要说明的是,上海师范大学方广锠教授也参与申报了本批次“敦煌遗书数据库建设”项目,并与马德研究员一同获批立项(《2012年度国家社科基金重大项目(第三批)立项名单(共91项)》,全国哲学社会科学规划办公室网,2012-10-16,http://www.npopss-cn.gov.cn/n/2012/1016/c219469-19279862.html)。本文不涉及方广锠教授所主持项目的相关情况。项目由马德研究员担任首席专家,成员来自敦煌研究院、浙江大学和兰州大学等多家单位。自2013年1月通过立项答辩后,项目各项工作全面展开,并取得了较为显著的成绩,数据库规模初具。项目原计划在4年内完成,但因遗书数量巨大,收藏分散,具体工作中细节浩繁,用工浩大,耗时长久,国家社科规划办已同意延期实施,并给予滚动资助。

二、内容与功能

目前数据库平台设计已经完成,并已录入一定数量的遗书数据,初期入库数据主要是敦煌研究院所藏遗书(含藏文遗书)的数字资源,流散于国内外各地的遗书数据正在次第整理入库。下面以数据库用户界面操作功能为线索,对数据库的搜索、显示两大功能,以及具体的数据内容进行展示。

(一)搜索功能

当前数据库的主界面在图像设计上以敦煌莫高窟藏经洞(第17窟)及其外窟(第16窟)景致为背景(图1)。在主界面右上部设置了“首页”、“简介”和“搜索遗书”等按钮。通过点击“简介”按钮,可以在打开的页面了解敦煌遗书的基本情况。通过点击“搜索遗书”按钮,则可以直接进入数据库,该按钮也是进入数据库的唯一途径,用户可由此查询并综览全部入库遗书的各类资源。

检索功能是本数据库的一项主要功能。点击“搜索遗书”按钮后,便可直接进入检索界面。检索界面包括“快捷检索”和“高级检索”两种可以自由选用的检索方式,每种方式都可以进行精确检索和模糊检索。

1.快捷检索。在这一检索方式中,检索词既可以是常用的遗书编号或题名,也可以是遗书基本信息(即详细目录)乃至录文中的任意字符串,并可用“与/或”两种布尔逻辑设置检索方案,同时还可以进行繁简字体的转换。

图1 主界面(首页)

图2 高级检索界面

2.高级检索。高级检索界面(图2)的相关功能更为强大,不仅检索字段非常丰富,包括编号、对应号、名称、首题、中题、尾题、题记、按语、收藏地、子目、语种及朝代等12个检索端口,而且有“与/或”两种布尔逻辑可供选择,同时还有“编号/名称”和“正序/倒序”两组“排序关键字”可供灵活组配选用。此外其“字体转换”的下拉菜单中包括名称、子目、首题、中题、尾题、题记、按语等选项,以供进行繁简字体转换时灵活选用。

(二)显示功能

显示功能是本数据库的另一项主要功能,可经由表格方式或缩略图方式实现:如果使用快捷检索功能,则检获数据的显示只有表格方式一种;如果使用高级检索功能,则数据显示有表格方式和缩略图方式供用户灵活选用。

1.表格显示。这一方式重在显示遗书的基本信息。当检索到相关数据后,显示界面会用表格方式显示遗书的基本信息,但同时也会在页面相应位置罗列查阅和导出两组功能按钮,以方便用户查阅和导出遗书数据的其他各种信息。

(1)查阅按钮功能。本组按钮位于每一号遗书基本信息下方,具体包括“查看录文”、“进入图版”、“相关文献”和“对照浏览”等名目,各按钮只关联本号遗书的相关数据信息。具体情况如下:

●点击“查看录文”,可弹出一个小窗口,呈现本号遗书的录文全文。在小窗口内部右上方,设有“只显示原文”、“只显示汉译文”和“全部显示”三个单选项。如遇到非汉文书写的胡语遗书,选择“只显示原文”时便只会显示胡语录文,选择“只显示汉译文”时则只显示汉文译文,当然如果选择“全部显示”,则会同时显示胡汉两种文字的相关内容,目前胡语遗书只有藏文遗书的数据,并且尚无汉文译文,但一般配套有汉文题名。

●点击“进入图版”,可打开一个新页面,显示遗书的高清彩图。图版可以通过上下左右键进行移动,同时还设有预览、缩放、全屏、翻页等多种功能键。

●点击“相关文献”,可打开一个小窗口(不可缩放),显示基于本号遗书的研究文献目录。这些目录还可以通过“超级链接”功能,关联其电子版全文内容,用户可以不必退出数据库另外查询就能直接阅读文献原文。

●点击“对照浏览”,可打开一个新页面,在同一屏幕分左右两个部分、左文右图同时显示所检获遗书的录文和图版内容(图3),可方便用户进行对照阅读。其右部图版与“进入图版”的页面功能相同,可以实现多种操作。在左部录文的顶部,配备有两个功能设置:一个是针对图像配设的“图像调节”模块,可点击调出下拉菜单,对图像的亮度、对比度、饱和度、色相、灰度和褐色等进行调节;另一个是针对录文而设的“切换录文排版”按钮,可对录文排版在横排、竖排之间进行切换,以适合不同用户的阅读习惯。

图3 对照浏览

(2)导出按钮功能。本组按钮位于显示页面右上方,具体包括“导出基本信息”、“导出录文”和“导出相关文献”等名目,能够依照所检获遗书的显示顺序,批量导出各号遗书的基本信息、录文和相关研究文献等文本内容,可极大方便用户。现举例如下:

●“导出基本信息”2例。

例1

Dy.096 金刚般若波罗蜜经注

首题:金刚般若经 金刚藏菩萨注

尾题:金刚般若波罗蜜经

题记:大唐天宝元年(七四二年)五月囗日白鹤观御注

现状:首尾俱全。厚黄麻纸。线装册叶(过去称为蝴蝶装)。册高15.5厘米,宽11.5厘米。厚1.5厘米,天头1.1厘米,地脚1.1厘米,乌丝栏,栏宽1.64厘米。共74叶,每半叶书6行,行11至15字不等,总933行。

说明:朱、墨两色书写,朱笔写经文,墨笔写夹注。《金刚般若波罗蜜经》传世本的疏释、经论,不下数十种,藏经洞出土的也有十来种,但没有一种与此雷同。从佛教史的角度看,此卷很有价值,亟需整理、研究。此件的“注”家,自称“金刚藏菩萨”,究竟何人,限于我们的学识,多年来未能获知。尾部题记“大唐天宝元年(742年)五月囗日白鹤观御注”,其字体与正文字体相去甚远,显系后加。“白鹤观御注”也令人费解。此件的装帧,甚为特别:取纸五叶或六叶对折成一叠,几叠合起来后用丝。

收藏地:莫高窟

语种:汉语

汉译首题:梵语名:大乘无量寿宗要经;藏语名:大乘无量寿宗要经。

汉译尾题:大乘无量寿宗要经终。

汉译题记:杜公略抄,薛多嫩抄,张英子校,张英子做了三次校对。

现状:麻纸,卷轴装;长134厘米,高31.6厘米,天头1.3厘米,地脚1.3厘米。3纸,单纸长44.5厘米,每纸二栏,隔栏宽1.5厘米,栏19-20行;抄写1遍,首尾完整,有题记;叶面有油污。

收藏地:莫高窟

语种:藏文

●“导出录文”1例。

Dy.009 佛说灌顶章句拔除过罪生死得度经卷第十二

录文:

1.太和十一年五月十五日 佛說灌頂章句拔除過罪生死得度纟圣

2.佛說灌頂章句拔除過罪生死得度纟圣

3.如是我聞一時佛遊毗舍離音樂樹下

4.与八千比丘眾菩薩三万六千人俱國

5.王大臣人民及諸天龍八部鬼神共會

6.法於是文殊阝市利法王之子菩薩摩訶

7.承佛威神從坐而起長跪叉手前白佛

●“导出相关文献”1例。

Dy.062 金光明经卷第一序品第一

1.薄小莹《敦煌遗书汉文纪年卷编年》,长春出版社1990年3月1版,第4页;第84页。

2.[日]池田温《中國古代寫本識語集録》,東京大學東洋文化研究所1990年3月30日発行,p93第105号題记録文。

3.施萍婷《太和十二年张安宁习字》,载《敦煌》,甘肃人民出版社、江苏美术出版社1990年7月1版、1993年7月,第288页第261条目解说;第244页图版。

4.林聪明《敦煌文书年代考探略述》,载《1990年敦煌学国际研讨会文集·石窟史地·语文编》,辽宁美术出版社1995年7月1版,第551页。

5.沃兴华《敦煌书法》,上海书店出版社1995年8月1版,第39页。

6.施萍婷《敦煌研究院·上海图书馆·天津艺术博物馆敦煌遗书巡礼》,载浙江省博物馆编《浙江与敦煌学常书鸿先生诞辰一百周年纪念文集》,杭州,浙江古籍出版社2004年12月1版,第305页《太和十二年》,原发表[日]《東洋學報》1990年12月第72卷第1·2号。

需要说明的是,在导出数据中,研究文献目录的超级链接将不复存在,如需进行链接操作,必须点击查阅组按钮中的“相关文献”才能实现。

图4 缩略图显示

2.缩略图显示。这一方式重在显示遗书的图像信息。当检索到相关遗书后,显示界面会重点呈现被检获遗书图版的低分辨率发布图,同时也像表格显示方式一样,在页面相应位置配套查阅和导出的链接功能。导出按钮的位置和名目与表格显示完全相同,而各查阅功能设置的名目与位置则多有变动(图4)。在图版右侧,仅标明该图像对应的遗书编号、名称,并配设“查看录文”和“相关文献”两个按钮,功能与表格显示中的同名按钮相同。同时在图版左下方和右下方外侧,分别设置了“图片查看”和“更多详细信息”两个超级链接:前者功能与表格显示中的“进入图版”相同,关联遗书的高清图版;后者功能较为独特,所连接的是一个由基本信息和录文内容混合编排的新页面(不含研究文献)。

三、优点与不足

(一)优点所在

通过前文叙述,并对比之前既有各同类数据库的相关情况,我们不难看出,本数据库具有多方面的优势,可以总概为以下几点:

1.数据更加全面。所谓全面,是指与之前既有各种同类数据库相比,本数据库在数据类型方面更加全面。过去的数据库其数据大都是单一型的,并且侧重于目录和图版数据,通常是要么只有目录,要么只有图版和附带的简略图版标目,其他的数据类型只是偶有出现。[注]这些数据库数据类型单一、操作功能简单,如敦煌研究院早期同名项目“敦煌遗书数据库”便专注于遗书的注记目录,中国国家图书馆“王重民向达所拍照片影像库”专注于王、向两先生早年在海外所拍的万余幅敦煌吐鲁番遗书照片,上海师范大学“敦煌文献资料库”专注于英藏敦煌遗书的录文(由域外汉文古文献研究中心创建,系《英藏敦煌社会历史文献释录》电子版),而中国国家图书馆“各国藏敦煌遗书研究目录索引”则又专注于研究文献。类似的数据库还有很多,包括兰州大学早年创建的以遗书内容中佛教人物为主题的“敦煌文献中的佛教人物数据库”,以及中国国家图书馆的“中国国内散藏敦煌文献联合目录数据库”(系EXCEL数据库),等等。之前综合两种或两种以上复合型数据的数据库虽然并非没有,但是极为罕见,并且整合效果不够理想,数据库质量不高。[注]国际敦煌项目(IDP)的专属数据库“IDP Database”虽然采用了目前品质最好的遗书高清晰彩色图版,但该数据库的目录数据却非常简单,不仅没有详尽的注记目录,而且既有的简目也大都只有英文内容,无法用汉文实现检索。兰州大学原先创建的“敦煌学数字图书馆”,其遗书库内容虽然有详尽的目录,但其图版却采用了基于早期低品质缩微胶卷所翻拍的黑白图像。爱如生数字化技术研究中心的“敦煌文献库”虽然已经实现了图版和录文的同屏对照显示,但其图版同样属于低品质黑白图像。而本数据库则不仅目录、图版兼备,而且纳入了遗书的录文和研究文献,尤其值得称道的是,数据库还新增了藏文遗书的相关数据。录文、研究文献和藏文遗书数据的整体性纳入,成了本数据库的最大亮点。各相关数据首次在同一数据库中集聚,不仅实现了敦煌遗书数据库从数据单一型或简单复合型向综括各相关类型数据的综合型的巨大转变,而且使数据资源得到了充分整合和挖潜,数据库和数据质量都得到了极大的提升,这必将为研究人员带来更多的便利。

2.信息更加精确。本数据库的数据,不论目录还是图版,抑或是录文、研究文献,数据的精确性都较过去的数据库大为提高。就目录而言,过去敦煌研究院“遗书数据库”和兰州大学“敦煌学数字图书馆”的遗书目录,其数据的准确性在既有各数据库中已经为人称道,不过这些成果都无法与本数据库相比。本数据库目录吸收了目前最新的研究成果,信息更加准确、详尽,其基本信息包括首题、尾题、题记、现状、说明、收藏地、语种等很多项细节描述,其中多项描述都有了新增内容。比如就现状而言,不但涉及遗书的完残、用纸、装帧、尺寸、天头、地脚、栏线、栏宽等各种细节,而且对纸张的数量、抄录行款等信息也备细罗列。再就图版信息而言,在“敦煌学数字图书馆”和爱如生数字化技术研究中心的“敦煌文献库”等数据库中,大都使用了早期低品质黑白照片的翻拍图像。本数据库则使用了高清晰的彩色图版,极大提高了图像信息的精确性。

3.功能更加优越。与既有同类数据库相比,本数据库相关功能也更加优越。比如在图版界面,可以对图像的多项参数进行调节,还可以使用移动、预览、缩放、全屏、翻页等多种操作。这些操作功能之前数据库中大都不曾具备,国际敦煌项目(IDP)的专属数据库“IDP Database”虽然有高清彩色图像,也具有一定的图版操作功能,但其功能设置终究较为初级。再就本数据库的录文内容而言,其排版方向可根据用户习惯进行自由切换,文字的繁简也可以灵活调整,这些功能都是之前专注于录文的上海师范大学“敦煌文献资料库”所缺乏的。此外,本数据库已经在一定程度上具备了基于撕裂文献的缀合关联功能。例如在检索“Dy.001”号遗书时,可以将与“Dy.001”相关的“Dy.369”两号“归义军衙府酒破历”遗书一并检出,用户可以从中发现两文献之间的缀合关联关系。这样的功能无疑很方便学者对遗书进行缀合,或进行关联考察和研究。

(二)不足之处

限于目前的技术水平,也限于在遗书图像共建共享等方面遇到的现实阻力,既有的成果还存在一定的不足,主要表现在以下方面:

1.内容相对有限。目前目录、图版、录文和研究文献等各种数据内容还相对有限,其中研究文献目录中能够链接的全文也属于少数,绝大部分研究文献的全文数据仍待补充。另外除藏文遗书外,对其他胡语遗书尚未涉及。

2.功能仍待开发。今后部分功能有待继续开发,比如繁简字转换功能尚未真正实现,需要让其真正发挥作用。同时没有配套在既有遗书目录数据库中已被开发、极便于进行主题检索的分类检索方式,今后也应该予以增补。

3.数据尚需优化。现有的各种数据成果还存在一定问题,其中录文等数据中的文字问题较为突出,亟待解决。比如在数据库中存在着字库已经有字、却因种种缘故而没有准确输入的情况。[注]比如前文“导出录文”例子中的“経”字,就被迻录为“纟圣”,不仅使用了简化偏旁,而且将一个字一分为二。另外同例“文殊阝市利”一词中的“阝市”,无疑是“師”字的俗写字形,本应直接迻录为“師”字,但却按遗书卷面中的笔画字形作了如上处理。录文者或许意在展现文字原貌,实则所用右部偏旁与文字原貌并不完全符合。类似的处理很容易使用户在未及核对原图的情况下陷入误解。关于录文格式,旧有录文数据库一些好的做法也很值得借鉴。[注]典型的例子是上海师大的“敦煌文献资料库”。该库录文不仅附有说明、校记和参考文献,而且用不同的颜色和字号来区别正文原文和注释等不同内容,对于考察遗书文字内容非常便利。此外录文中还存在正文用繁体、题名却用简体的情况。

四、结语

由于本数据库在许多方面进行了有益的尝试和改进,从而成为迄今为止数据内容最为详尽,功能也最为先进的敦煌遗书数据库。当然也应该看到,目前在数据库建设方面也确实存在着许多现实的困难。比如就图版资源而言,海外所藏遗书的图版仍然难以全面实现共享。同时对于数量庞大的遗书而言,全部进行录文也绝非短时期内能办,加之受限于文字编码字符集现状,要处理这种既有俗字、异体字、避讳字等多种特殊字形的汉文文献,又混杂多种古代胡语文献的敦煌遗书,其艰难情况可想而知。其他困难尚难一一缕述。

尽管如此,我们还是坚定地认为,任何困难都不能也不应该成为今后工作的障碍,敦煌遗书数据库的建设前景仍然是乐观的。相信经过项目组成员的不懈努力,后期不论是遗书数据的递增和完善,还是数据库功能的提升和界面的优化等,都将会有不俗的成绩,从而为各界奉上一份满意的成果。

猜你喜欢
图版遗书敦煌
古代敦煌人吃什么
基于高中地理教材人教版和中图版比较的教学设计研究
古代敦煌人吃什么
基于谓词逻辑的飞机线束工装图版设计
亮丽的敦煌
绝世敦煌
潦草的遗书
教授的暗示
新世纪以来唐代墓志的收藏与刊布
漫画