音乐图书馆中乐谱资源库自动采编系统的设计与实现

2013-09-25 07:52纪婧怡李岳韩
图书馆学刊 2013年6期
关键词:乐谱书目管理员

纪婧怡李 岳韩 博

(1.天津音乐学院图书馆;2.南开大学软件学院,天津 300000)

纪婧怡 女,1985年生。硕士,助理馆员。研究方向:中国传统音乐。

李 岳 男,1980年生。博士,副教授。研究方向:软件图像研究。

1 前言

近 10年来,随着通信、电子技术的高速发展,信息存储和交流变得越发重要。图书馆作为承载大量资料的主流数据库,更是面临着巨大挑战。面对着呈爆发性增长的各种书籍、网络、电子化信息,如何正确地进行收集和管理就成为图书馆管理的重中之重[1-2]。以音乐高校的乐谱图书馆为例,乐谱的采编往往需要管理员花费大量的时间和精力[3-4]。在采编和编辑资源库的过程中,由于资料的特殊性,如乐谱的难以识别,乐谱收藏时需要收集大量谱音分析、演奏技巧等信息等,大量工作需要由采编管理员人工完成,导致采编工作效率普遍较低。

现阶段,传统图书馆面临着向自动化、电脑辅助管理、互联网、信息化图书馆方向转型的过程[4]。笔者根据在音乐图书馆的工作经验,分析了现阶段音乐学院图书馆中乐谱采编系统的工作流程和现阶段采编系统效率较低的原因,进而提出了乐谱资源库自动采编系统的设计方案,同时采用自行编写软件与现有软件结合使用的方法,创立了该自动采编系统。

2 采编系统需求分析

2.1 系统工作流程

在乐谱资源库采编过程中,系统需要完成一系列的工作,从流程上分析如下(图1所示)。

在采编过程中,管理员首先需要根据条形码获取该书籍信息,而后人工判断该书籍是否收录于数据库中;如果书籍已经收录数据库中,管理员需要根据个人对于音乐的专业知识,对书籍中的乐谱数据进行更新。更新数据一般来自于各个网络数据库、互联网信息等信息源头。更新后的本地数据信息将等待最后全市音乐图书馆整合时统一处理;如果该书籍数据不存在,则管理员需要人工输入书籍所有的文字信息及分类号等基本信息,并进行分类记录。其后录入乐谱的所有相关信息,主要包含作者信息、乐谱评论、谱音分析、演奏注意事项等,之后管理员需要扫描该乐谱,并录入图像数据。

图1 音乐图书馆采编系统工作流程

为完成整个业务流程,采编系统需要由数据交互、数据录入、相关信息收集以及数据库管理4个主要模块构成(图2所示)。

在上述功能模块中,数据交互模块主要完成书目/乐谱数据的上传下载功能,满足图书管理员在线查询“总图书馆”图书资源信息,并在需要汇总时完成本地图书馆上传与合并工作。

图2 音乐图书馆采编系统功能模块

数据录入模块下设3个子功能模块,分别为书目录入模块、乐谱录入模块与乐谱图像录入模块。其中书目录入模块管理员需要人工录入书目的所有信息,并完成信息的整合工作;乐谱录入模块管理员需要分别对书中的每个乐谱进行相关信息录入;而乐谱图像录入模块主要由管理员完成将纸质乐谱扫描并上传至数据库,以具备查询的功能。图2的虚线所代表的电子乐谱录入功能子模块为作者建议增加的自动化模块。

相关信息收集模块主要功能是用于管理员收集乐谱的各种信息,包括乐谱的谱音信息、演奏技巧等。该功能模块现阶段仍需要手工完成。

数据库模块用于存储所有数据的相关信息。如工作流程中所描述的,乐谱信息上传至市图书馆往往不是即时完成的,而是需要将乐谱信息暂时保存在本地数据库,等待特定时间进行综合信息汇总,再统一上传。故此数据库模块需要建立并管理一个当地数据库。

2.2 系统的自动化改进

基于上述描述,该采编系统具有以下几个缺点,对此,笔者提出相应改进意见。

①系统中除交互模块由相应的软件完成(图3所示),且数据库模块交由软件后台自动管理(图4所示)外,其余模块全部需要管理员手动完成,导致效率非常低。其中尤以数据录入模块手动输入工作量较大,不能满足高效率的自动化办公的要求。②作为新时代的多媒体图书馆系统,往往要求其保存的资料可以多方面地展示,增加视听可读性。而本系统所存储的资料往往是只有文字资料和扫描的乐谱图像。故此,作者建议增加电子乐谱录入功能,在录入文字信息和扫描乐谱后,同时将纸质乐谱转化为电子乐谱,进行输入。③相关信息采集模块现阶段需要由管理员手动完成信息采集,且大部分信息来自互联网、其他图书馆等机构的复杂资源。鉴于信息收集的困难程度及手动输入信息的复杂程度,笔者建议引入网络信息抓取功能,通过使用部分特定软件,自动化搜索目标数据库上的相关信息,并对所获得信息进行优化整理及归档。

图3 系统抓取数据的页面

笔者所在图书馆已通过合作开发软件的方法,基本实现数据录入功能的所有过程自动化并允许输入电子乐谱。另一方面,鉴于现阶段技术原因,完全自动化的网络信息抓取难以实现,故该功能模块的自动化处理仍在开发中。

图4 系统选择数据库抓取已存数据

3 自动化采编系统的设计与实现

如前所述,现阶段智能化的网络信息抓取系统仍在开发中[5-6],故本系统着眼于数据录入模块的自动化实现。笔者将按照数据录入各个子模块的顺序介绍采编系统自动化实现的过程。

3.1 书目录入模块

书目录入模块主要有两个功能:图书条形码扫描功能及图书书目信息录入功能。其中书目条形码扫描已有较成熟技术[7],该类条形码“编码—扫描—识别—比对”技术已经被广泛应用于图书馆书目管理及其他类似信息管理系统中。

对于书目输入系统,需要管理员输入书目扉页上所有相关信息。对此功能笔者提出自动化设计处理流程如图5。

图5 书目信息自动录入系统处理流程

在本模块中,书籍扉页扫描功能可以通过扫描仪或摄像头抓取图像获得,如图6(a)所示。其后,系统可以使用绝大部分收费或免费的OCR软件对书籍扉页图像中文字加以识别。图6(b)所示为使用abbxy软件扫描软件的识别效果[8]。经试验,大部分OCR软件都可以达到较为理想的效果。

图6 书目扉页扫描及识别效果(a)、扫描图像(b)识别word文档

本模块的核心在于自动完成书目信息填表的功能。然而,鉴于不同书籍扉页的信息分布往往并不一致。如图7(a)、(b)所示,两本书扉页上书名、作者、出版等位置都不一样。

图7 不同书目扉页所含信息内容及位置不同

尽管通过语言分析[9]技术可以完成所有文字的自动识别,但该类技术需要较高的技术成本,进而增加了本系统的开发、运行与维护成本。故此,笔者开发了一套半自动系统。该系统可以允许用户将扫描识别后的文字自动存入浮动窗的剪贴板。而用户只要双击剪贴板的内容,就可以完成自动填表。具体效果如图8所示。本插件处理对象是扫描以后的Word文档。鉴于文档内容的复杂性,本插件只将扫描的内容,以行为单位拷入剪贴板,同时剪贴板悬浮于左侧,允许用户快速双击可见剪贴板的内容,并将其拷入所需填写的栏目。另外,该插件的功能需要使用VC开发,需要安装微软的.netframe work和of fice 2007以上com的支持。

图8 书目信息自动录入系统

3.2 乐谱录入模块及电子乐谱生成模块

在完成本系统自动化录入系统并生成电子乐谱的模块中,由于其使用技术较为类似,故将这两个子模块合并论述。本模块设计思路如图9所示。

图9 书目信息自动录入系统

在本模块中,所有乐谱首先要使用扫描仪或摄像头进行扫描/拍照,以获得该类乐谱的图像资源。该类资源将被自动保存至数据库,从而完成乐谱图像录入功能模块的任务。之后本系统可以使用较为成熟的商业乐谱OCR软件如SmartScore[9]对乐谱图像进行识别。用户只需要使用软件载入扫描后的乐谱,该软件就可以自动完成MIDI音乐生成(图 10)。经测试,大部分专业识别软件都可以较为准确地识别出该类乐谱。

图10 乐谱扫描及电子乐谱(MIDI)生成

综上所述,在完成书目录入模块与乐谱相关信息(包含乐谱信息、乐谱图像与电子乐谱)自动化录入阶段后,本采编系统已经基本实现了办公自动化,并增加了多媒体系统的视听多样性。

4 结语

基于现阶段的研究,下一阶段的科研方向为使用数据采集技术提高相关信息收集工作的效率,实现相关功能模块的自动化,进而完成对整个采编系统的自动化改造。

[1] 邓宗极.高校图书馆信息化建设问题初探[J].教育探索,2003(6).

[2] 黄晨.图书馆信息化的技术工程[J].情报杂志,2001(3).

[3] 朱海燕.音乐文献编目中应注意的几个问题[J].图书馆论坛,2008(2).

[4] 张继红.数字时代的音乐学院图书馆[J].星海音乐学院学报,2011(2).

[5] 赵德平,等.面向高校信息的垂直搜索引擎的研究与实现[J].沈阳建筑大学学报:自然科学版,2012(3).

[6] 周立柱,林玲.聚焦爬虫技术研究综述[J].计算机应用,2005(9).

[7] 李伟.条形码阅读器在现场采购图书中的应用[J].图书馆建设,2004(6).

[8] 陈耀东,王挺,陈火旺.浅层语义分析研究[J].计算机研究与发展,2008(1).

猜你喜欢
乐谱书目管理员
山之高
推荐书目《初春之城》
我是小小午餐管理员
我是图书管理员
我是图书管理员
可疑的管理员
乐谱:放飞梦想
一毛学琴记——乐谱失踪
基因密码乐谱
本刊邮购书目