馆配电子书平台:纸电融合趋势下促进图书馆电子书发现与获取的一种新方式

2019-08-22 06:20上海师范大学图书馆
图书馆理论与实践 2019年7期
关键词:全文检索编目电子书

蔡 颖(上海师范大学图书馆)

1 引言

与纸质书相比,电子书具有易于保存、方便使用、降低工作人员劳动强度、节省藏书空间的优点,便于读者更有效地检索和整理信息资源,因而成为图书馆的一种重要馆藏资源。目前,许多图书馆在电子书上的经费投入已经超过了纸质书,[1,2]电子书的保存与获取问题也获得了业界更多关注。

国外较早开展对电子书发现与获取问题的研究,研究范围包括电子书使用目的、使用人群、电子书阅读器比较、国际间馆际互借对于电子书格式的要求等。笔者通过文献调查发现,美国读者倾向于使用关键字来搜索电子书,在信息集成页面浏览搜索结果;[3]印度读者会使用自动化软件将电子书添加到图书馆目录中,读者通过OPAC系统检索并下载电子书全文;[4]韩国大学图书馆的用户主要通过图书馆官网了解和访问电子书。[5]2012年,随着国外电子书的用户驱动采购模式常态化,[6]资源提供商在推行电子书时较为顺畅,很多最新的学术资源能实现纸电同步发展。

我国电子书的发展历经十余年,很多图书馆馆藏中有百万册甚至更多的电子书。高校图书馆采购电子书是为服务于学科建设,购买需求是刚性的。作为理工科见长的高校图书馆代表,同济大学和上海交通大学对于学术类图书资源首选电子版本;[7]而公共馆需兼顾各年龄段人群,如上海图书馆采取电子图书和纸质图书并行的馆藏发展策略。

有需求就有市场,面对图书馆的选择,馆配商积极响应并推动纸电同步政策。2015年,多家图书公司及民营馆配商开发了自己的电子书采购平台,如,中文在线、汇雅书世界、畅想之星、云田智慧、E店、芸台购、易阅通等品牌。这些馆配电子书平台,既提供图书零购,也能纸电同步购买,还提供包库服务,供图书馆用户根据自身需求灵活选择购买中文电子书。

2 图书馆揭示中文电子书的主要方式与存在问题

笔者基于文献调研和网络调查法,对国内高校已购买电子书数据库的图书馆进行梳理,发现只有少数资金和技术力量比较雄厚的高校图书馆把电子书纳入常规采购,并以批量操作的方式加快编目速度,节约编目成本(如清华大学、北京大学、上海交通大学、中国人民大学等),且大都利用数据库商提供的MARC数据对电子资源进行编目,[8]也有少数图书馆采用管理系统自带的批量处理功能对电子资源进行编目(如上海交通大学图书馆)。[9]经过编目处理以后,读者可以在检索OPAC的同时检索到馆藏电子书的详细信息,也可以在图书馆提供的各类数字资源检索平台中检索到电子书的相关信息。

大部分图书馆由于技术所限,对电子资源不做任何编目,而是依靠电子书平台自带的检索功能对资源进行揭示,导致读者检索、下载电子书时需要检索多个数据库;同时,许多单库检索平台缺乏二次检索及全文检索功能,用户检索的灵活性和准确度受到了很大限制。近年来,许多图书馆引进了资源发现系统,如EBSCO Discovery Service、Primo、Summon、读秀、e读、超星学术发现、百链、CNKI学术搜索等,实现了对馆藏资源的部分甚至全覆盖,读者可以通过资源发现系统实现统一检索服务。资源发现系统虽有其独特优势,但在实际使用中仍然存在一些问题,如国外引进的资源发现系统对中文资源的整理和检索能力有限,在使用Primo检索中文资源时,检索词加引号和不加引号对检索结果有较大影响;[10]各资源发现系统对数据库品种和数量有限制,部分专业性较强的中小数据库中的内容未被收录。

3 馆配电子书平台在中文电子书发现与获取机制上的新探索

3.1 纸电融合发展是未来电子书出版的必然趋势

近年来,图书馆的纸质图书借阅量逐渐下降,许多图书馆在采购纸本书时已降低了复本量。全国整体纸本书市场复本从2013年的2.58册降到2017年的2.38册,高校图书馆纸本书复本量从2013年的2.93册降到2017年的2.42册,[11]很多馆已经开始用电子书来替代纸本书的复本服务。教育部发展规划司已正式发文(教发司〔2017〕261号)把电子图书作为图书馆馆藏资源纳入高校办学评估指标体系。

3.2 出版社提供大量的电子书

我国的电子书新书主要由人天、三新、新华传媒等纸质书馆配商和超星、中文在线等数据库商提供,但目前还不是真正意义上的新书,与纸质书出版发行时间相比,电子书至少要滞后半年以上,通过与出版社的合作可在一定程度上解决这个问题,每年新增的电子书可达到30万册以上,[12]这些资源可以单本零购,也可以包库购买,资源可以镜像到本地,也可以远程托管,图书馆可按需采购。如畅想之星馆配电子书均为出版社提供,所有电子书都有出版社和作者的双重授权。[13]

3.3 馆配电子书平台融入图书馆门户系统的情况

笔者选取了目前在中文馆配市场上比较有代表性的畅想之星、云田智慧、书世界和书香校园电子书平台,对各电子书平台上的资源能否被图书馆用户有效发现与获取进行了调查(见下表)。其中,畅想之星是北京人天书店集团于2015年推出的电子书平台,其纸电一体化的理念在业内对推动数字出版有一定影响力;云田智慧是湖北三新文化传媒有限公司于2017年上线的纸电图书平台,提出采编自动化理念,研发了自动编目工具和编目审校工具;“汇雅书世界”是超星公司于2014年推出的电子书平台,整合了“汇雅”和“书世界”两个平台的电子书;“书香校园”是北京中文在线公司于2012年面向高校师生推出的读书服务平台,偏重于资源平台的阅读推广活动,在高校图书馆有较高的市场占有率。

表 四家电子书平台融入图书馆门户系统数据情况

(1)电子书元数据来源。书商在出售图书的同时能否为图书馆提供配套的书目数据直接关系到新书的上架速度。业界对此展开了“跨行业编目共享”的讨论。刘秀华等就书目数据的跨行业编目共享运作提出具体构想,建议由出版社提供符合CIP数据要求的各项数据、图书目录、部分章节等信息,由联合编目中心按编目规则完善MARC数据,图书馆下载、核对数据后,根据本馆情况确定图书著录方式。[14]馆配商要做编目前置,就相当于自觉承担了从联合编目中心下载数据或是从出版发行信息中提取编目数据进行加工、将书目数据转换成MARC格式导出等工作,但是馆配商提供的书目数据质量如何、是否拥有一个内容丰富且学术质量高的可供书目数据库仍需考量。

畅想之星从人天大库套录元数据,在出版社发布新书以后由该公司数字加工部门进行元数据加工、数字对象加密、深加工、审核、发布等工作,当图书馆订购电子书后,可以收到完整的MARC书目数据,还可以根据图书馆的要求加入特定字段、提供元数据包。云田智慧的书目数据来源较为多样:一方面通过与出版社EDI(Electronic Data Interchange,电子数据交换)对接,实时传送合作出版社的新书书目;另一方面还有三新公司本身积累的可供书目库和供应商书目库。汇雅书世界的书目元数据来自于超星公司的合作出版社以及自有的读秀知识库等数据平台,能够实现超星自有的电子图书、纸质图书联合查询。书香校园的资源来自云端而非镜像资源,目前不能提供元数据。从元数据的质量来看,纸质书商比数据库商更有优势。人天公司和三新公司为传统纸质书商,在业内提供书目数据代加工服务已有多年,在编目外包质量控制与绩效评价方面已形成一定规程,书目质量更能得到保障。值得一提的是,三新公司研发了一款自动编目工具应用于云田智慧电子书平台,可以基于采访数据自动生成编目数据,在极短时间内自动生成书目元数据包。超星公司在文献数字资源相关领域耕耘多年,有读秀知识库、百链、超星发现等多种产品,可以无缝链接到汇雅书世界。中文在线的书香校园为云端资源,目前不能为图书馆提供MARC格式的元数据。

(2)与图书馆门户系统的整合程度。馆配电子书平台上的电子书是否能够通过图书馆OPAC系统和资源发现系统顺利被读者检索到,关系到电子书资源是否最终能得到有效利用。在OPAC中整合电子书书目信息不仅能极大地方便读者使用,还有利于图书馆采访查重、资源统计等内部业务工作的开展。在提供OPAC接口方面,畅想之星、云田智慧、汇雅书世界都已具备这一功能,统一检索馆藏资源,一旦匹配到电子书就可以直接进入电子书全文阅读。畅想之星主要利用网页插件技术,在客户端里内置了浏览器插件,当用户访问OPAC浏览书目基本信息时,插件程序实时进入系统服务器调动数据,并在OPAC的详细信息页面嵌入畅想之星电子书链接,点击链接即可对电子书进行阅读、荐购、收藏等操作;云田智慧不但提供开放接口,还提供元数据包,让馆员编目时根据需要自行添加书目数据;汇雅书世界目前只提供接口,不提供数据包;书香校园虽然也可以对接图书馆OPAC系统,但不属于常规业务,需要另外定制服务,并且图书馆页面也需要做相应调整。

资源发现系统能满足用户通过单一界面同时检索馆藏目录、数字资源、自建资源、数据库等。目前,国内图书馆使用比较多的资源发现系统有Summon、Primo、超星发现、百链、e读、读秀等。[15]在与这些资源发现系统的对接方面,畅想之星、云田智慧、汇雅书世界都能提供接口和各大平台对接,而书香校园目前只和超星的发现系统进行对接。以上四家电子书平台提供的图书以中文书为主,且畅想之星、云田智慧、书香校园只提供中文书。为了验证各电子书平台的检索效果,笔者选取国家图书馆、对外经济贸易大学图书馆、上海师大图书馆、复旦大学图书馆分别进行抽检测试。测试发现,畅想之星和云田智慧可以显示本馆资源与未购买的在版编目数据,汇雅书世界和书香校园只能链接本馆已购买资源,而所有本馆已购买的中文电子书都能被100%检索到。

(3)平台内电子书的全文检索及显示功能。电子书相较纸质书在检索功能上的一大优势是可以全文检索,但在商业实践中电子书由于版权保护、技术能力和资金投入等原因,并不能完全实现全文检索。这里的全文检索指的是对文档集的全文进行精确查询、匹配,并对检索结果加以整合。就单本电子书的检索效率而言,各个电子书平台在支持简单检索的基础上提供了高级检索、分类检索等检索方式,但全文检索尚未完全实现。畅想之星的基础检索字段为题名、ISBN号、作者、出版社、内容简介,在此基础上还提供了高级检索和分类检索,但从测试结果来看,内容检索方面只能粗略做到目录检索,还不能实现章节检索和具体页检索;云田智慧的基础检索字段为书名、作者、出版社、ISBN号,此外还有图书分类检索,但无法实现全文检索;汇雅书世界的基础检索字段包括书名、作者、目录信息,在此基础上还有二次检索、高级检索、图书分类检索,但经测试,目录检索与全文检索还未实现;书香校园的基础检索字段为书名、作者、出版社,还可以按《中国图书馆分类法》分类号检索图书,是四家平台中唯一接近全文检索的,但检索结果还不够精确。从四家平台的检索测试结果来看,目前电子书平台多字段组合检索准确率不高、知识发现的相关度也不高,读者需要具备一定的检索技巧才能找到满足自身需求的检索结果。在显示全文方面,读者可以直接阅读和下载图书馆已经采购的电子书。畅想之星、云田智慧和书香校园为未购买电子书的用户或未注册的读者提供试读功能,支持图书馆PDA购买;汇雅书世界则在用户购买后显示具体内容。

4 思考与建议

目前,中文电子书平台已经能够对接图书馆自动化系统,支持图书馆PDA采购计划,能让读者一站式检索和使用,在一定程度上对资源发现系统的检索效率起到正向提升作用,但检准率还有待提高。正规电子书平台上的图书都是获得了出版社合法授权的,经过书商加工的元数据可以直接与资源发现系统对接,从而提升数据的检全率和检准率。平台对电子书实行编目前置的做法不但提高了新书上架环节的效率,而且节省了图书馆编目员的工作时间,简化了从采购到编目到流通的工作流程。

虽然馆配电子书平台可以提高电子书被用户发现和获取的机率,但以下几点仍需图书馆员加以注意。① 图书馆需要向馆配商提供详细的OPAC信息页面文件,或者由对方提供代码,图书馆负责添加。图书馆一旦为馆配商开放某种程度的权限,就有可能造成读者身份信息的泄露。② 根据出版社的规则,电子书不能退货,图书馆下单后馆配商直接在电子书平台上实时结算,做好的书目数据直接对接自动化系统。一旦因误操作或其他差错想退货,主动权就不在图书馆手里了。③ 在获得了馆配商提供的书目元数据后,图书馆工作人员仍需结合本地情况评估书商提供的书目数据质量,检查编目数据是否规范完整、URL链接地址是否正确,如果出现错误则需要对记录进行修改。

猜你喜欢
全文检索编目电子书
试析图书馆编目的边缘化与编目馆员的转型
国家图书馆藏四种古籍编目志疑
谈谈电子书
Oracle数据库全文检索性能研究
电子书可以帮助提高儿童的词汇量
我与电子书结了缘
网络环境下图书馆编目工作问题探讨
新形势下高校图书馆编目工作面临的挑战和发展契机探讨
电子书 等
全文检索引擎Lucene系统模型与应用研究