区域协作视角下古籍文献信息共享平台建设研究

2019-06-14 08:00东北大学图书馆
图书馆理论与实践 2019年5期
关键词:古籍界面数据库

李 宇(东北大学图书馆)

古籍是记录历史文化的重要载体,是人类文明进程中宝贵的精神财富。由于古籍文献历经数百年的研习流转,大多已脆弱不堪,且受收藏单位地域等条件限制,人们获取信息存在极大障碍,史料价值难以被深入发掘。为了长久保存这一宝贵历史文化遗产,古籍文献载体的数字化转换策略被业界广泛认同,但由于资源有限、古籍研究人员稀缺、技术手段不足等原因,古籍文献数字化依旧存在很多困难。为了打破这种壁垒,图书馆应积极采取区域联盟协作方式,建设“数字化共享的古籍文献信息平台”,实现古籍文献资源的长久保存,提升古籍科考使用效率,促进古籍文献资源研究工作的深入推进。

1 古籍文献保护现状

中华文明造就了无数经典古籍,然而经过风霜雪雨、战火兵戎的洗礼,大多古籍文献损害严重,濒临消失。留存下来的古籍尤为珍贵,国家对古籍文献保护工作极为重视。2007年1月19日,国务院办公厅发布了《关于进一步加强古籍保护工作的意见》,明确要求各省、市政府及相关机构充分认识古籍保护工作的重要性和紧迫性,科学规范地开展古籍收藏、修复、整理、保存工作,推进古籍保护工作的有效开展。[1]2008年4月28日,国务院公布第一批2,392部国家珍贵古籍名录和51个全国古籍重点保护单位;2016年5月24日,公布了第五批国家珍贵古籍名录和重点保护单位,全国12,274部古籍文献被纳入珍贵古籍名录,180家单位入选“全国古籍重点保护单位”。[2,3]

各地方机构先后开展了各种古籍文献保护的相关工作,主要体现在两方面:一是原生性物理修复,尽量延长古籍文献存世时间;二是再生性载体转换,即通过数字化实现古籍文献的永久保存。数字化转换作为古籍保护的重要方法,不仅能够呈现古籍文献的全部内容,更能依靠网络通信技术实现资源共享,有效解决了古籍保护与古籍使用之间的矛盾,为古籍文献的数据发掘、知识传递、情景再现创造了实现条件。各地方开展的古籍数字化工作经过多年努力取得了系列进展,大量古籍文献得到有效保护,但依然存在很多问题,如,缺少统筹规划、没有统一标准、转化技术有限、平台建设不够规范等,制约了我国古籍文献保护工作科学持续发展。

2 创建联盟式古籍资源共建体制

古籍文献与普通图书不同,古文、排版、印刷、装帧都呈现出鲜明的历史特征,差异极大,揭示难度较高。首先,古籍文献整理、识别、归档、校验、编审涵盖了古汉语、文献目录、编辑出版、模式识别等多个专业领域,需要多学科团队密切配合才能科学整理、揭示古籍文献信息;其次,古籍文献的影印采集、数据库建设、安全保障、网络共享等对技术条件有较高要求;再次,古籍文献再生性数字化转换是一项长期性工作,需要大量人力及资金投入。因此,图书馆需要开展广泛的馆际合作,积极建立联盟协作机制,在古籍文献挖掘、保护、整理等方面广泛交流互通,实现合作共赢。

古籍保护工作的技术性和专业性驱动图书馆开展馆际合作。美国学者贝克指出:“现代信息科技的发展使得每个图书馆不能孤立的存在,图书馆之间需要广泛地协作互通,打造世界范围的知识共享体系才能不断满足用户的信息需求”。[4]20世纪30年代,美国掀起了高校图书馆联盟合作体制,在资源建设、信息获取、知识服务等领域积极合作,极大促进了图书馆事业的发展。联盟协作已经成为图书馆建设常态化机制。需求催生变革,技术驱动创新,在网络科技日新月异的今天,图书馆需要在各个领域广泛开展合作,图书馆间联盟协作已经成为必然趋势。[5]

古籍文献数字化共享平台作为古籍保护工作的一项重要内容,是一项复杂的系统工程,涉及多个业务领域。创建区域范围内数字化共享联盟体系,统一古籍文献发布平台,开展古籍资源数字化共建共享工作可以充分发挥各图书馆的资源优势,形成合力,实现合作共赢,共同推动古籍文献保护事业的快速发展。

3 古籍信息共享平台建设

3.1 古籍信息共享平台内容建设原则

(1)统筹规划,分工协作。古籍文献信息共享平台建设需要区域内各成员馆提高认知、达成共识、统筹规划、鼎力协作。以往高校图书馆、公共图书馆都各自为阵,古籍资源零散纷乱,重复建设现象频繁,易形成资源孤岛,致使古籍信息得不到有效利用。区域协作的共建共享联盟体制强调资源建设的战略性、整体性,由联盟中心统一规划古籍文献信息共享平台建设内容,制定长远战略规划,明确成员馆建设任务,各个成员馆按照阶段建设目标完成古籍数字化建设任务,最后统一整合、统一发布。联盟中心亦可在工作流程中加以侧重,在古籍载体转换、元数据揭示、数据库平台建设、异构数据整合等领域增加投入,攻克难关,实现馆际间优势互补、成果共享。

(2)达成共识,统一标准。古籍文献信息共享平台要积极接收成员馆现有建设成果,统一标准,实现各成员馆项目成果的有机融合。古籍数据化载体转换过程涉及图文采集、元数据著录、数据存储、信息发布等标准,这些实施标准是古籍文献资源建设的先决要素,也是古籍资源数据库建设的质量保证,决定着古籍数字化信息共享平台的规范性、可用性。联盟成员馆共享平台建设应优先采用已经发布的国家标准和行业标准。近十年,国内关于古籍文献数字化载体转换的标准规范已经日趋完善,能够提供系统性的规范化指导。现行图书馆资源加工标准见下表。[6-7]

表 图书馆资源加工标准

3.2 古籍信息共享平台设计目标

通过统一的设计规范和存储标准,整合各联盟成员馆的古籍特色库、方志、图谱、古籍刻本等异构资源,采用开放通用的B/S技术模式,建设与各成员馆系统兼容的平台架构。

(1)设计统一的著录标准。规范存储古籍文献资源的各项数据,字段的显示应符合用户的使用习惯,资源的各项记录须经过准确性验证。

(2)设置标准的采集录入系统和管理界面,需满足多元异构数据揭示需求。

(3)建立综合检索系统,能进行分项检索及多项综合检索,可进行统计分析等数据挖掘功能。

(4)数据库平台应能够承载海量的数据信息,对各个功能模块进行结构化设计,采用开放的数据接口,使其具备拓展及延伸服务功能。

(5)系统应具备信息推送及后台管理功能,便于设置系统操作权限、使用等级,调整及修改相关服务模块及资源内容。

3.3 古籍信息共享平台框架体系设计

古籍文献信息共享平台总体框架可以分为“古籍转换层”“数据处理层”“使用功能层”“用户界面层”四个层级(见图1)。① 古籍转换层主要完成古籍文献信息的图像扫描、图文转换,以及现有古籍数据库索引信息的整理合并、异构处理等工作;② 数据处理层主要完成元数据提取、数据标引、数据审核、数据清洗等工作,形成符合数据仓储中心规范的数据信息;③ 使用功能层主要提供古籍管理、繁简识别、综合检索、平台导航等服务功能;④ 用户界面层主要为用户提供古文界面、检索数据、统计表单、相关链接等交互性信息。

图1 古籍文献信息数字化共享平台

3.4 古籍信息共享平台功能模块设计

古籍信息共享联盟成员馆要充分认识古籍文献的资料特点、共享平台的服务内容,从系统运营管理的角度出发,结合用户实际使用需求,合理规划古籍信息共享平台功能模块。从目前国内古籍文献建设现状和使用状态来看,古籍文献信息共享平台至少应具备8个功能模块。

(1)数据采集功能。完成古籍文献信息录入,将数字化转换后的图文资料存入系统,管理人员通过采集模块可以实现古籍信息的添加、删除、修改、补充等操作,同时提供批量导入、批量转换功能,实现数据的集中审核提交处理。

(2)繁简识别功能。通过繁简识别,为不同层次的用户提供文字转换服务以便其查询浏览古籍信息。系统中创建与古籍文献一致的繁体字库,并建立与简体字库的映射关系。通过检索界面,获取用户查询条件,系统进行自适应识别,匹配到映射的繁体字段后则转入后台进行检索操作,并返回检索结果;如没有匹配信息,则繁简一致亦可转入后台直接检索,并返回查询结果。

(3)综合检索功能。共享平台的用户既有古汉语领域的专家学者,又有涉入尚浅的初级用户,因此检索功能要直观、操作性强,以满足不同用户的信息需求。古籍信息共享平台既可以提供基于“书名”“作者”“年代”“收藏机构”等的单一条件检索,也可提供多条件组合检索。根据用户实际使用需求,还可以利用古籍涉及的学科分类,如历史学、宗教学、天文学、社会科学、军事、哲学等进行多维度检索。

(4)统计分析功能。古籍文献蕴含大量史料信息,统计与分析功能与古籍史料的信息挖掘密切相关,系统平台要提供针对数据库核心字段的统计功能。通过抓取词条分布状态和重复频率,可以发现不同历史时期的社会规律和人文动态,通过多个微观维度统计分析就可以反映整个宏观层面的客观现实,继而实现信息考证。

(5)界面导航功能。现有古籍资源系统大多采用“组织结构”和“信息内容”两种导航方式。古籍平台的“组织结构”导航模式主要基于“经史子集”四部分类进行分块展现;“信息内容”导航模式则多基于古籍内容、年代、学科分类等进行导航指引。还可以开展古籍门类导航,如“方志集录”“甲骨拓片”“碑帖林斋”等。古籍信息共享平台可以设计不同形式的导航功能,多角度展示古籍文献信息资源。

(6)后台管理功能。设置后台管理功能可以有效维护古籍文献信息共享平台。通过后台管理模块,根据不断增加的古籍文献信息内容,可以增加系统导航层级、添加导航类目、调整文献检索组合策略;也可以根据数据维护的实际需要,临时关闭部分古籍栏目或开辟新的古籍揭示版块。[8-9]

(7)普及推广功能。由于广大读者受现代教育范式的影响,对现代知识范畴具有较好的认识体系,但对古籍却缺乏了解,加之古文识别能力有限,很多读者对古籍文献束手无策。图书馆担负着教育职能和信息服务职能,古籍信息共享平台有必要设置古籍推广普及模块,即通过发布各种“古文经典赏析”“名家点评品鉴”“古今译注读本”等图文信息及视频,提升读者对古籍文献的认识能力,使古籍资源受到更多关注并被充分开发利用。

(8)信息递送功能。信息递送是根据用户行为或由用户定制的个性化信息推送的智能服务,系统平台设置记录用户兴趣偏好的数据库表,通过用户个人的“在线添报”及“行为抓取”,及时获知用户信息价值取向,定期向用户递送相关古籍最新信息,以便用户获知古籍研究动态。

3.5 拟定古籍元数据字段及E-R关系模型

古籍文献信息的元数据字段设计是整个平台建设基础。以往由于各成员馆古籍收藏类别不同,元数据字段亦有较大不同。为保证数据规范,应参照《中华人民共和国文化行业标准(WH/T66-2014):古籍元数据规范》设计元数据字段,其中古籍核心元素13个,古文献类型核心元素4个,内部包含元素修饰词项、编码体系修饰词、复用标准子项合计65个,古籍元数据字段设计应包含17个核心元素项,然后依据联盟成员馆古籍构成情况进行添加修改。很多现行古籍文献数据库元数据字段通常包含题名、并列题名、其他题名、主要责任者、责任者说明、其他责任者、出版日期、印刷日期、出版者、出版地、印刷地、附注、缺字附注、子目、相关资源附录、主题、四库类名、年号纪念、语种、资源类型、标识符、权限、版本类别、版印说明、载体形态、装订方式、数量、尺寸、行款版式、收藏历史、题跋印记、馆藏信息、中图分类号、索书号、数图文件等。这些古籍数据字段既要符合行业设计规范,也要满足古籍文献实际使用需求,充分揭示古籍文献信息内容;对于特殊类型群体的古籍书目,还可以通过增加附注性说明字段揭示附注信息。姚伯岳等指出,图书馆古籍元数据的制定应遵循准确性、通用性、可扩充性原则,同时兼顾古籍特点及文献自身状况,古籍数字化保存主要任务不在于图书馆馆藏的揭录展示,而是满足人们查询、浏览、研究古籍文献的现实需求。[10]

E-R模型(Entity-relationship Model)是用来设计数据库结构的建模工具,它在需求分析的基础上,基于概念数据模型,抽象描述数据结构和数据走向,最终映射到物理模型指导程序设计。应用这一原理,技术团队可以结合古籍文献信息共享平台的实际需求,按照功能模块设计数据库表,形成完整的数据字典。数据库表主要包括古籍记录信息表(BookTable)、古籍索引信息表(Book-indexTable)、古籍四部导航类目表(Four-partsTable)、古籍学科导航类目表 (NavigationTable)、用户定制信息表(HabitTable)、推广图文信息表(PopularizationTable)、古籍用户信息表(Reader Table)、权限等级信息表(RoleTable)等,这些数据库表是古籍信息管理的基础集合,需要合理规划各数据库表关联关系,从而形成古籍信息共享平台各功能模块的程序规划方案。本文课题组结合实践设计的部分古籍信息E-R数据库关系模型见图2。

图2 数据库表E-R模型

3.6 古籍文献异构资源整合

各图书馆基于发展需要开发了一定数量的古籍数据库,作为特色资源且仅限本机构人员访问使用。区域联盟式古籍信息共享平台可以利用Web Service整合技术实现异构资源的有机融合。

为保证各联盟成员馆的知识产权,对异构资源的整合应采取整合古籍文献元数据信息、原文图像分布式存放的数据解决方案,用户可以统一检索元数据信息内容,系统按照分布式数据库逻辑映射调取异地图文,各联盟成员馆根据协商一致性原则制定原有全文数据的开放获取权限,既保证了古籍文献共享平台元数据等基础信息逻辑完整性,又保证了联盟成员馆资源独立性。

Web Service是目前广泛应用的异构数据资源整合技术,具有低耦合、高内聚、封装性能良好等特点,与SFX调用OpenURL开放链接不同,Web Service采用XML和SOAP技术,通过HTTP协议实现数据动态调配,可以传输发布各种类型的图文数据信息以及Audio、VideoStreaming数据流。Web Services规范的兼容性技术有效地规避了DCOM和CORBA的技术不足,通过使用TCP/IP应用层传输协议,保证传输数据的安全,成为实施异构数据整合、实现数据集成的通用性方案。

对异构数据整合之前,技术人员要分析联盟成员馆间异构数据资源数据库构成情况,大多数异构古籍资源都使用SQLServer、Oracle作为数据库平台,这些平台都能提供标准的数据接口,完成数据调用;个别特殊关系型数据库如Kbase,需要利用Web Services调用COM组件编程。技术人员在数据库服务器端创建OpenAPI接口,通过Services.Svc发布服务器端的URL,再按数据类型配置Iservice和Service,用以规定数据调取参数及处理过程,设定好数据调取范围,用户端可以通过调用Web Services的OpenAPI接口加载服务器端的调用过程完成图文数据的获取。[11]

3.7 古籍信息共享平台交互界面设计

古籍信息共享平台交互界面是用户和系统进行信息传递的窗口,是人与机器互动交流的桥梁,交互界面的性能直接影响古籍文献信息的使用效果。业界将交互界面的设计人员称为“Information Architecture”,这一称谓显然表明了该项工作绝非简单美术设计或代码添加,而是涵盖了软件工程、艺术设计、用户行为、认知心理等多个领域的知识组合。古籍文献信息共享平台展示了大量的古书史话,因此交互界面更要注重美观设计,体现高雅、厚重的文化氛围,古籍数据库交互界面开发要遵循四个设计原则。

(1)实用性原则。以用户为中心,界面元素简单易用,满足用户获取信息的功能需求。古籍交互界面功能按键、菜单按键、提示信息都要清晰明了、简单易懂,避免使用复杂的专业术语。在功能窗口设置必要的辅助选项,减少不必要的人工操作。在古籍综合检索界面,应设置复选控件,便于用户选择查询条件,以选择性操作替代输入性操作。此外,交互界面还要提供繁简字典等工具服务,提升用户体验。

(2)一致性原则。一方面,古籍信息共享平台交互界面的字体、组件、颜色要清晰直观,让人一目了然;另一方面,要实现交互界面功能一致,当用户在古籍信息平台学会了一项操作,那么类似界面相同的操作可以实现一样的功能,界面功能的一致性会让用户快速适应古籍平台的各种服务流程,带来良好的用户体验,提升用户的使用效率。

(3)层次性原则。古籍信息共享平台要体现清晰的界面层级,使用户易于掌握平台的组织架构。尤其是古籍信息平台的导航模块,不同层级标题及序号等要素信息的字体、颜色要有层次变化,下一层级标题的显示位置要缩进固定的单元长度,跳转页面后要在下层页面添加返回上一层级的指示按键。交互界面中层次信息要素的显著变化为用户的界面转换、去留选择指明了方向,更让用户按分类导航标志快速获取古籍信息提供了有利条件。[12]

(4)美观性原则。随着用户审美标准的提升,交互界面的美观性越来越受到设计者重视,美观的界面会使用户获得良好的使用体验,增加用户粘性。目前,大多古籍文献软件平台的主要颜色都选用黄色,凸显年代感和沧桑感,并以竹简或黑色古文为背景图片,展现古代文化特征。如,“古籍善本网”“中华经典古籍库”等古籍平台都较好地展现了古典文籍的历史气息。联盟成员馆在组织交互界面设计时,可在交互界面中增加古典书画词文等艺术元素,提升古籍信息共享平台的整体美观效果。

4 古籍信息共享平台建设的保障措施

4.1 建立有效的协调机制

有效的协调机制是开展区域协作、馆际联盟的重要保障,联盟成员馆要重视顶层设计,统筹总体规划。古籍文献资源整理加工需要组建一支组织分散、管理有序、分工明确、运行高效的工作团队,制定明确的组织章程、活动纲领、运营模式、管理措施,选派具有较高行政职务和学术威望的领导负责组织协调,或者直接委派各成员馆业务馆长牵头实施。定期在联盟成员馆间开展古籍文献整理的评比推进活动,调动各成员馆的积极性,使古籍文献数字化转换长期稳定运行。

4.2 专业技术队伍建设

人才资源是古籍信息平台建设的决定性因素。古籍文献资源建设项目既需要掌握“古籍文献目录”“编辑出版”“古文识别”专业知识的人员,又需要懂得“数据库建设”“系统开发”“网络运营”的技术人员。联盟成员馆应积极开展馆际之间学术交流、技术培训、鼓励人才创新,支持团队申报省市创新课题,开展横向合作;分批次选派优秀人才参加国家、省市的“古籍数字化保护”“专业数据库建设”等培训,加强队伍梯队建设;聘请相关领域专家学者作为团队顾问,让项目成员及时获得专家的技术指导;开展纵向人才合作培养,与高校的“考古学院”“文博学院”“计算机学院”等机构联合开发古籍资源,形成长效的人才交流培养模式,通过系列举措打造一批稳定的古籍文献建设队伍,为平台建设提供人力保障。[13-14]

4.3 广泛协作,突出优势

古籍文献共享平台充分利用图书馆联盟协作互动,将分布式数据资源汇聚集中,因此古籍信息资源开发强调区域合作,图书馆不仅要通过省级图书馆联盟的横向协作,实现资源互补,更要加强与博物馆、档案馆、大数据中心等地方机构的纵向协作沟通,扩大联盟范围。此外,在开发古籍文献资源时要结合成员馆自身优势,注重利用自身优势与学校传统“特色资源”“优势学科”紧密结合,站在发展的角度把握全局,不能一味求“全”、求“快”,重视数量却忽视质量,要坚持“稳步推进,打造精品”的发展思路。[15]

4.4 政策资金保障

古籍文献资源信息平台建设是长期性工作,国家及地方的政策支持、资金投入是古籍资源建设的重要保障。我国的“中华古籍保护计划”十年来累计划拨资金已超过两亿;[16]地方政策也相继出台,2018年1月3日,重庆市发布了《重庆市市级文物保护专项资金管理办法(试行)》,明确规定了由重庆市财政安排用于古籍保护的专项经费,专款专用,用以推动古籍保护工作;联盟成员馆要积极争取国家、地方古籍保护专项经费,持续开展古籍数字化平台建设。[17]此外,作为高校的文献资源服务中心,图书馆要充分发挥信息资源建设职能,保护挖掘濒危文化遗产。高校图书馆需要积极争取校、院两级行政领导认可,给予高度重视,将古籍文献建设作为学校资源建设的一项重要内容予以扶持,提供资金等配套措施。

5 结语

随着信息技术的快速发展,图书馆文献信息资源建设不断完善,为古籍文献保护和挖掘创造了有力条件。近年来,各省市积极开展古籍文献保护的数字化建设工作,并取得了一定的进展,建成了一批如“贵州府县志辑数据库”“广西珍贵古籍名录图录”等区域协作式的古籍信息共享资源平台。在联合发展、协同创新的时代背景下,建立协作共享的信息资源平台,能够充分发挥联盟成员馆资源优势,推进古籍文献数字化进程,实现古籍文献再生性保护,使古籍文献信息资源获得更大范围的应用推广。古籍资源的信息挖掘是一个浩大的工作,希望借助广泛的联盟合作方式,能快速推动古籍文献事业持续发展,实现古籍文献资源信息全面共享。

猜你喜欢
古籍界面数据库
中医古籍“疒”部俗字考辨举隅
微重力下两相控温型储液器内气液界面仿真分析
关于版本学的问答——《古籍善本》修订重版说明
国企党委前置研究的“四个界面”
西藏大批珍贵藏文古籍实现“云阅读”
一种可用于潮湿界面碳纤维加固配套用底胶的研究
扁平化设计在手机界面中的发展趋势
我是古籍修复师
数据库
数据库