高校图书馆面向特藏资源的多站点统一管理平台建设研究*

2022-10-10 02:01
图书馆研究与工作 2022年10期
关键词:东京大学站点图像

鲁 丹 张 毅

(华东师范大学图书馆 上海 200062)

特藏资源与数字人文紧密结合在一起,近些年随着数字人文、智慧图书馆等新技术的快速发展,国内外众多图书馆将各自馆内具有鲜明特色及价值的资源(包括图书、古籍、报纸、期刊、地图、手稿、卷轴、档案材料、图片、书信等)选出,重新编目和组织起来,建立了大量的特藏资源平台。然而,各大特藏资源平台彼此独立,特藏资源彼此孤立,容易形成数据孤岛现象,且资源之间存在重复的现象,资源与平台难以统一管理。特藏资源多站点统一管理平台的出现,使得特藏资源及站点能够实现统一管理,图书馆员不用花费巨大的精力维护不同的平台。同时,资源间能够彼此联系,避免资源孤岛现象的存在。

1 特藏资源及其平台概述

1.1 特藏资源介绍

特藏资源发展历史悠久,自15世纪英国圣安鲁斯大学成立起,就在收集手稿、照片和大学档案资料等特藏资源,为教学和研究提供支持[1]。我国特色资源的实践与研究始于20世纪80年代,上海曲阳图书馆自1989年开始围绕影视资料特色资源开展建设与服务[2]。特藏资源的定义并不统一,公认的是OCLC(Online Computer Library Center,Inc,联机计算机图书馆中心)的定义:特藏资源是指以任何形式存在的图书和档案资料(比如珍稀书籍、手稿、照片、机构档案等),具有艺术或经济价值、独特性、稀缺性等,有长期保存和获取的必要,通常置于单独的馆藏空间中。通常,特藏资源的流通是受限制的[3]。特藏文献资源是高校图书馆核心竞争力的体现,是精准化学科服务的重要资源,是科研的重要趋动力,是教学资料的丰富源泉,是数字学术的重要数据来源,是校园文化、人文情怀、艺术修养的培养基地[4]。国内外的学术型图书馆和公共图书馆都将特色资源的建设与研究放在一个极其重要的位置。

1.2 特藏资源平台介绍

图书馆在推动数字人文发展的时候,首要基础是特色资源[5]。近年来,数字人文的兴起与发展给图书馆特藏资源的建设提供了机遇,图书馆进行了大量的特藏资源建设。特藏资源建设包涵描述、编目、数字化及传播平台的建立与维护[6]。在描述与数字化之后,需要对特藏资源进行展示及管理,特藏资源管理平台即是对特藏资源进行管理、展示的平台。目前特藏资源管理平台主要分为三大类:①图书馆自建平台;②商业管理平台;③无需新的平台。不管是自建平台还是商业平台,在特藏资源管理平台的建设过程中会出现一定的难点和问题,包括特藏资源编目时元数据著录无标准参考,元数据标准不一致,资源重复及平台独立的现象。

2 特藏资源平台建设面临的问题

2.1 元数据著录不一致

元数据是描述资源的数据,元数据的结构决定了资源被检索、利用及共享的方式。特藏资源种类繁多,包括古籍、手稿、图片、书信等各种类型,每种类型的特藏资源通常拥有独特的元数据描述。目前,高校图书馆主要采用机读编目格式标准(Machine-Readable Catalogue,MARC)、DC(Dublin Core,都柏林核心元数据标准)、自建元数据等方式对特藏资源进行描述与揭示[7]。在自行设计元数据方案时,各大高校图书馆通常会在现行元数据的基础上,结合特藏资源类型及研究者需求设计专门的元数据方案。不同标准的元数据方案,就造成了元数据著录不一致的问题,这样容易使得特藏资源平台用户和研究者混淆,同时资源也难以被共享。

2.2 资源重复

在特藏资源建设的过程中,也会遇到资源重复的问题。例如,有的资源会存在于不同的特藏资源平台上。目前,各大图书馆、机构仍是以自身为中心来进行特藏资源的收集、整理、存储和应用推广,对特藏资源共识程度较低,这导致在资源建设过程中,会出现资源重复建设的现象[8]。例如,有的特藏资源会存在于不同机构自建的特藏资源平台上,不仅会导致特藏资源独特性的价值降低,还会浪费人力物力,导致特藏资源的建设无法继续。可采用资源池的形式解决资源重复问题,在资源池的基础上根据需要选择资源建立不同的特藏资源平台。

2.3 平台独立

特藏资源管理平台对特藏资源的内容进行管理及传播。各大高校图书馆会基于本馆特色建立不同的特藏资源平台。就笔者所在学校,拥有方志数据库、年谱数据库、名师库、杜鲁门口述史全集等平台,特藏资源平台非常之多,其中有的平台是自建、有的是由厂家建设。众多的特藏资源平台彼此独立,在建设时需要花费图书馆的经费,在后期也需要不同人维护,难以管理。然而,特藏资源管理平台本质上是资源管理及揭示系统,拥有一定的共同点。因此,可以建立特藏资源多站点形式的统一管理平台,不仅可以节省经费,同时还便于馆员的后期维护。

基于目前特藏资源管理平台的问题,高校图书馆应建立一个特藏资源统一管理平台:能够兼容不同标准的元数据方案,实现元数据的标准化及特殊化;能够以资源池的形式管理资源,避免资源的重复;能够有一个统一的管理后台,方便操作,实现多站点管理。在满足基本的条件后,系统还应开放,可扩展,紧跟技术前沿。

3 东京大学图书馆特藏资源建设实践

3.1 Omeka S及国际图像互操作框架介绍

Omeka是一个开源的网络发布平台,于2008年发布,具有易于安装与使用、强大而灵活元数据功能、多样的数据管理能力以及强大的社区支持及核心功能可扩展等特点,许多图书馆、博物馆及档案馆将其作为数字资源的管理与展览系统[8]。Omeka S为机构提供了一个统一的管理平台,能管理多个站点,用户在后台创建不同类型资源,形成资源池,在资源池的基础上可以创建不同的网站、平台;Omeka S以JSON-LD作为其数据格式,每个资源(条目、资源和条目集)有一个URI,使用资源描述框架RDF词汇表,最大限度地提高了与其他数据发布者间的互操作;Omeka S预置了Dublin Core、Dublin Core Type、Bibliography Ontology及Friend of a Friend4种RDF词表,也可以选择第三方词表,实现了元数据的规范与标准;Omeka S拥有强大的社区支持,社区开发维护了众多插件,包括支持元数据收割协议的OAI-PMH插件,支持CSV文件、XML文件导入的插件,能够方便实现元数据迁移工作;支持标签云、地图展示等资源揭示插件[9]。同时为了使得所管理的图像资源能够开放共享,实现了国际图像互操作框架(International Image Interoperability Framework,IIIF)标准。在基础的元数据迁移、管理及资源揭示的基础上,Omeka S支持图像资源数字化操作的众包转录,支持OCR、文本分析等[10]。用户只需根据自己的需要安装相应插件即可。

图像是特藏资源领域非常常见的一种非文本视觉媒介,具体表现形式十分多样,包括绘画、照片、草图、手稿、印章等。图像包含了深刻的文化内涵、复杂的时空场景和较为抽象的思想语义,然而图像容易被禁锢在数据库中,无法共享和复用[11]。IIIF是一种新兴的开放数据框架,通过定义一组通用的应用程序编程接口来确保全球图像存储的互操作性和可获取性。IIIF提供了图像API(Image API)、呈现API(Presentation API)、认证API(Authentication API)、内容检索API(Content Search API)、更改发现API(Change Discovery API)以及内容状态API(Content State API)六种API[12],其中图像API与呈现API为核心API。图像API定义了图像请求API,能够实现图像选择、缩放等图像细粒度互操作;呈现API定义了图像展示API,能够实现图像开放、共享,图像能够嵌入到其他遵循IIIF标准的机构。目前,国内外许多图书馆都将其应用到特藏资源的建设中,并取得了一定的效果。国外大英图书馆、Europeana、哈佛大学图书馆、剑桥大学图书馆等都将IIIF应用到馆藏资源的建设中来。国内,厦门大学图书馆的百万幅数字特藏文献高清影像,上海图书馆的家谱、期刊、音视频等诸多领域,复旦大学图书馆的“印藏虚拟图书馆”[13],华东师范大学的近代教科书平台[14]也都将IIIF引用进来,进行图像资源的发布。

Omeka S拥有IIIF服务器、图像服务器和Universal Viewer查看器等插件,安装了IIIF相关插件后,特藏资源(包括手稿、书籍、相册等)中的图片能够放大缩小旋转,开放共享。Omeka S是一款非常适合图书馆、档案馆、博物馆等领域的特藏资源管理与揭示的平台。将Omeka S与IIIF相结合,重构图书馆特藏资源库建设,为特藏资源管理与揭示打开了一条全新的思路,能够使得特藏资源的建设参与到国际特藏资源的保存与共享当中[15]。东京大学图书馆就是将两者结合起来,进行馆内特藏资源的建设与揭示。

3.2 东京大学图书馆特藏资源平台介绍

东京大学图书馆特藏资源以站点列表的形式在首页显示,共49个站点,包括手稿、画卷、地图、文库、古籍、图像数据库等,类型多样[16]。尽管东京大学图书馆特藏资源类型多样,但是其大多以数字图像为载体。东京大学图书馆是在其馆藏的基础上,选择馆藏将其数字化,以图像的形式在网上发布。东京大学图书馆特藏资源平台是使用开源内容管理系统Omeka S建立的,每个网站展示不同的特藏资源内容,每个站点对应一种资源的具体展示,资源来源于不同部门,其架构图如图1所示:东京大学图书馆在已有的资源基础上,首先通过原始资源元数据与Omeka S预置的词汇表及自定义词汇表对应,将元数据导入Omeka S数据库中,形成资源池。不管是图像、地图、手稿还是其他类型的资源,在Omeka S中都以Item形式存在,Item可通过分类形成Item Set。在Item及Item Set的基础上可以建立不同机构管理的不同站点,东京大学图书馆在资源池的基础上,创建了包括“源氏物语”、“富士川文集”及“石本收藏”等49个站点,每个站点属于不同的机构,通过Omeka S实现不同人员拥有不同权限的管理。Omeka S通过引用IIIF相关模块,实现所有资源图像的放大、缩小、旋转及共享。东京大学图书馆所有的图像可浏览、打印、下载,可复制、修改,支持非商业目的的二次使用(出版、网站使用),使用时需注明引用机构[17]。东京大学图书馆特藏资源的数据集提供四种方式使用,分别为:Excel查看元数据,关联数据浏览器查看RDF数据,Image Annotator为图片添加注释,以及元数据的聚合。

图1 东京大学图书馆特藏资源建设架构图

Omeka S可通过多站点、多用户角色配置,实现不同部门不同资源的分别展示,不仅方便使用者查看资源,也方便管理者统一管理资源。

3.3 东京大学图书馆特藏资源平台建设特点

东京大学图书馆特藏资源管理平台有如下特点:(1)使用Omeka S作为其特藏资源建设平台,每个特藏资源网站风格一致,多站点统一管理——东京大学图书馆特藏资源平台首页拥有49个站点,分别属于不同的机构,Omeka S实现了不同机构特藏资源网站的风格统一以及资源管理。(2)使用关联数据描述资源,实现资源的深度揭示——东京大学图书馆在使用基本词汇表的基础上,结合资源特性自定义词表,其词表在meta-bridge上注册,具有一定的权威性。(3)使用IIIF发布图像,图像资源能够放大、缩小,开放、共享——东京大学图书馆特藏资源使用IIIF发布其高精度图像,拥有统一和丰富的图像访问功能,支持IIIF客户端的查看,支持IIIF数据分享,其他机构可根据其IIIF数据调用其资源。(4)提供多种形式的资源下载,促进资源的开放与共享——东京大学图书馆不仅通过IIIF允许其他机构调用其特藏资源,还提供资源下载,元数据提供json-ld、rdf/xml、n-triples等格式导出。数据集支持Excel查看,关联数据浏览器查看,同步发布在Github上。

制定元数据战略将不仅有利于馆藏利用率的提升,更关乎整体社会资源流通及国家大数据战略的推进[18]。东京大学图书馆注重特藏资源元数据标准与国际化,以RDF为基础组织内部资源,注重资源开放共享,利用IIIF实现了异构平台之间图像资源的共享与复用;将馆内所有特藏资源以资源池的形式存于数据库,在资源基础上选用Omeka S创建不同特藏资源网站,统一管理,值得国内图书馆借鉴与学习。

4 高校图书馆特藏资源多站点统一管理平台建设之建议

4.1 针对特藏资源,从国家或行业层面制定元数据标准与规范

特藏资源类型多样、载体多源、个性化强,采用通用性的元数据标准有利于同类型分散资源的整合与揭示、开发标准化的深度挖掘方法[19]。国内特藏资源领域还缺乏权威元数据标准与规范,没有通用的标准,会造成元数据著录不一致,不利于资源整合与发现。目前,上海图书馆在复用国际词表的基础上,创建了人名规范本体、古籍本体、家谱本体等。但是特藏资源类型繁多,应在国家层面或者行业层面,针对不同的特藏资源类型,建立元数据标准与规范,让各大高校图书馆或公共图书馆有标准可参考。

4.2 全面梳理本馆特藏资源平台,明确需求,制定特藏资源多站点统一管理建设规划

目前,特藏资源领域存在重建设、少互动、缺合作的现象,特藏资源的知识组织形式、特藏数据管理与治理等方面研究不足,特藏资源的建设应考虑建设的长期性与延续性,注重战略规划。因此高校图书馆在建设特藏资源平台时,应从全局出发,统筹考虑全馆特藏资源,明确需求,制定特藏资源多站点统一管理建设规划。在选择特藏资源统一管理平台时,不管是商业的还是开源的,都需要注重元数据规范。

4.3 选择合适的方案、技术逐步实施特藏资源多站点统一管理平台的建设

高校图书馆在进行特藏资源多站点统一管理平台的建设时,应依据自身实力,选择合适的技术方案。除了本文介绍的东京大学图书馆将Omeka S作为其特藏资源多站点统一管理平台,国内的厦门大学图书馆也将其作为统一管理平台。厦门大学图书馆的探索表明,应具备国际视野,坚持以特藏资源和图书馆特色为本,采用国际通行的系统和标准,推进特藏资源数字化、数据化和智慧化进程[20]。在调研的基础上,华东师范大学图书馆也引入了Omeka S作为特藏资源多站点统一管理平台,逐步迁移相关特藏资源。

从节约经费、方便操作及未来发展等方向上考虑,高校图书馆应综合考虑现有特藏资源平台,确定元数据方案,建立统一的资源管理平台。在平台建立好后,逐步实现数据的迁移。然而,元数据基础设施及特藏资源统一管理平台的建设只是特藏资源建设的基础工作,为了使特藏资源更好地支持研究工作,未来还有很多的工作要做,例如图像的标引、古籍的转录等。只有将存在于图书馆的特藏资源数字化、数据化、智慧化,才能使得特藏资源真正地支持研究者的研究。

猜你喜欢
东京大学站点图像
浅析p-V图像中的两个疑难问题
巧用图像中的点、线、面解题
曾宣称“不录用中国人”东京大学教师道歉
以“夏季百日攻坚”推进远教工作拓展提升
日本东京大学内部治理体系探析
积极开展远程教育示范站点评比活动
怕被人认出
名人语录的极简图像表达
先进站点应与落后站点开展结对帮扶
趣味数独等4则