高校图书馆小语种特色数据库建库实践与思考
——以黑河学院俄文自建数据库为例

2022-02-14 08:50王雪涛
黑河学院学报 2022年11期
关键词:俄文黑河原则

王雪涛

(黑河学院 图书馆,黑龙江 黑河 164300)

20世纪80年代初,为了开发馆藏信息资源充分挖掘馆藏价值,各图书馆将文献的二次开发作为馆藏文献发展的重要工作之一,并依托自身馆藏特点开始建立自己的馆藏数据库。但该阶段的自建数据库均为书目文摘型,检索功能单一,数据规模较小[1]。自1998年CALIS(中国高等教育文献保障系统)系统启动后,在新技术的保障下,成员馆规模不断扩大,并逐渐掀起了特色数据库建设热潮。

2001年后,国家加强了对高等学校教学水平的评估工作,同时也增加了对高校经费的投入,由此高校图书馆逐渐成为我国特色数据库建设的主力军。在高校图书馆特色数据库发展建设期间,其资源主要以中文文献为主,并伴有少部分外文文献,如暨南大学《华侨华人数据库》、杭电图书馆《超声理论与工程应用数据库》等。而外文文献则一般为直接购买欧美成品数据库,少有自建库,小语种自建库则基本没有。

在俄文纸本资源建设上,黑龙江具有独特地缘优势。目前,除黑河学院图书馆以外,省内部分高校馆、公共馆及科研机构馆均收藏有一定数量的俄文文献,如哈尔滨工业大学图书馆、哈尔滨工程大学图书馆、黑龙江大学图书馆、黑龙江省图书馆等。在俄文数据库建设上,一般是通过参与集团采购或是以自采的形式实现的,但目前俄文数据库产品中只有“俄罗斯数据大全”资源相对较全。少有图书馆自建俄文数据库,有的也基本是将俄文纸本资源电子化。因此,通过对“黑河学院俄文特色自建数据库”建库过程及使用情况进行深入分析,对小语种自建数据库建设研究有着较高的学术价值。

一、黑河学院图书馆俄文特色数据库建设现状

(一)建设背景

黑河学院地处中俄边境城市黑河市,对岸是俄罗斯远东第三大城市布拉戈维申斯克市,得天独厚的地缘优势造就了其俄语、美术、音乐等国家级特色专业,与其相关的学术研究也呈现逐年增长的趋势。黑河学院图书馆秉持特色办馆理念,自2004年开始采购俄文原版图书,购买了数据库产品“俄罗斯数据大全”,积极通过多种途径收集俄文原版电子资源,并成立俄罗斯文献信息中心,为学校教学与科研提供了文献信息保障。

(二)建设目的

为进一步提高图书馆俄文特色资源建设步伐,满足学校特色学科建设及学术研究需要,2021年5月26日,黑河学院图书馆与清华大学欧亚战略研究中心联合成立“清华大学欧亚战略研究中心·黑河学院文献中心”。同年6月29日,与俄罗斯布拉戈维申斯克国立师范大学图书馆共建“远东图书资源中心”。2所中心的成立使图书馆俄文特色资源建设工作,由碎片化向专业化、学科化转变。在此背景下,原有纸本书与数据库产品已无法满足研究需要,因此,图书馆通过自建模式打造了“黑河学院图书馆俄文特色数据库”,以弥补俄文专业文献的不足,真正使俄文文献资源向专业化与学术化转变。

(三)建设原则

俄语自建数据库的建设原则应包含七个方面,分别是独特性原则、实用性原则、系统性原则、标准化原则、并发性原则、分级原则、资源共享原则。只有把握好数据库建设原则,才能在数据库建设中不脱离实际,实现建设初衷达到建设目的。

1.独特性原则

自建数据库的目的就是为了补充学校基础库无法满足的特色学科、重点专业、重点研究等对特定专业文献的需求。因此,数据库建设应突出本校地方特色、专业特色与研究特色,打造学校特色名片。俄语作为黑河学院国家级特色专业,对其语言学及相关学术分之的研究不仅对学校俄语教学与科研工作有所帮助,对地方经济与重点领域也有一定的助益。

2.实用性原则

自建数据库应遵循用户至上的原则,将实用、好用、能用放到首要位置。要有其特定的用户群体,要能满足该群体人员的需求,还要考虑自建库为学校、地方提供智库功能与辅助研究的可能性。俄语是除汉语外在黑河市使用范围最广的第二外语,相比英语更加注重实际应用。在黑河学院除俄语教学外,对于其分支学科的研究也一直没有间断过,特别是在旅俄华侨等学术研究方面,一直有相关团队持续研究。因此,俄语特色数据库有其特定的用户群体,满足实用性原则。

3.系统性原则

自建数据库在数据的获取、整理、加工、上传等阶段应遵循系统性原则,这是由于在数据资源建设过程中,涉及学科、文献类型、载体形式、出版时间等多种因素。对数据来源进行统一,协调好各种数据资源,保证数据的一致性和有效性是确保数据质量的关键。

4.标准化原则

为了保证数据资源的标准化、规范化与兼容性,俄文自建数据库应严格按照USMARC(西文图书)标准著录格式进行标引。文字类数据统一采用PDF格式;图片类数据采用JPEG、BMP等常用格式;视频类数据采用MPEG、AVI等格式。

5.并发性原则

并发性原则是衡量一个数据库使用效能的关键指标,当多个用户并发存取同一个数据块时应对并行操作需要进行控制,从而保持数据库数据的稳定与一致性。

6.分级原则

明确基础数据与专题、专业数据的划分。对基础数据应参照《中图法》进行类目划分,而专题、专业数据则应根据研究方向实行独立划分,这样可以更直观的展现资源特色,便于用户更快速的找到所需资源。黑河学院俄语特色数据库则是参照《中图法》+研究方向的形式进行划分的,除按照自然科学、社会科学等学科划分外,还根据重点研究方向划分了旅俄华侨研究、俄罗斯远东问题研究、中俄关系研究及马克思列宁主义研究等几大分支,以明确数据库资源划分。

7.资源共享原则

俄文等小语种文献资源的共享有利于资源的开发与合理利用。其共享方法和手段主要为:馆际互借、合作采买、合作编目、编制联合目录与建立资源共享网络等。馆际互借是基于CALIS系统的成员馆之间的有偿借阅模式,其可以最大化地提高馆藏资源利用率。但在特色馆藏方面,一般是不对外开放使用的,这其中涉及到版权等问题。

(四)收录范围

为了提高数据库的专业性,最大限度的满足各方需求,通过前期调研、座谈及采访等多种形式,确立了以俄罗斯远东地区为基本区域范围,以人文历史、语言文化、艺术、旅俄华侨、中俄关系为主要搜集范围的文献收录标准。并进行延展,使数据库内容更加完善,从而使其价值最大化。

1.俄罗斯远东问题研究

该类目主要收集俄远东地区人文历史、政治、宗教、社会发展等多方面的史料文献,时间跨度从1854—2018年前后不等。对于俄罗斯远东地区相关研究有着较高的学术价值。

2.旅俄华侨研究

旅俄华侨研究是黑河学院对俄重点研究方向,多次获批国家、省、市社科基金项目。该类目主要收集有旅俄华侨移民政策、现状、分布情况、赴俄志愿军情况等多方面史料文献,包含学术论文与原版电子书。时间跨度从1900—2020年不等。

3.社会科学

该类目收录文献主要以俄罗斯语言学、文学、政治、经济、军事等为主,时间跨度从1800—2020年前后。对于全面研究俄罗斯及苏联时期社会进程发展有着较高的学术价值。

4.艺术

该类目主要收集的是俄罗斯美术及音乐相关的文献、乐谱、画集等内容,时间跨度从1854—2020年前后。美术与音乐分别是黑河学院国家级、省级级重点专业,相关文献对于教学及学术研究均由较高价值。

5.期刊

数据库主要收录俄远东问题研究、中俄问题研究、大学学报等电子刊物。相比电子书,期刊在延续性、时效性等方面具有优势,可以更好地服务教师教学与科研工作。

6.其他

数据库还收录有数理化、医学、生物、工具辞典等类目,为全面研究俄罗斯科技、医疗等领域发展提供了大量文献史料支撑。

(五)数据库平台功能与访问方式

1.平台功能

为了便于读者访问、使用资源,平台添加了“分类导航”功能,用户可以根据专题分类进行数据访问;提供“下载”与“在线阅读”两种资源使用方式,其中在线阅读提供打印、放大、导航、双视图等多种个性化功能;期刊内每篇文章均具有DOI数字对象唯一标识,可实现文章独立检索。具备“图形摘要”“原文传递”等特色功能。

2.平台访问方式

平台分用户端和数据端两部分,用户端以WEB的形式进行数据访问,数据端以云服务的形式进行存储与调用,这种WEB+云存储的方式可以有效降低硬件投入成本、提高用户访问速度、降低运维成本。用户访问方式分为校内与校外两种,校内基于IP段访问,校外访问则基于学校VPN进行远程访问,以满足用户不同需求。

(六)数据库使用效果分析

对数据库使用效果进行科学、合理的分析,有助于数据库资源的优化与整合,同时对图书馆数据库整体建设与发展具有重要意义。目前,黑河学院俄语特色资源数据库共收录旅俄华侨、俄远东问题研究等相关领域及扩展学科俄文原版电子书共计3 227册;《РОССИЙСКО-КИТАЙСКИЕ ИССЛЕДОВАНИЯ》(中俄问题研究)等俄文原版期刊15种。数据库自2021年5月正式投入使用至今,访问读者6.3万余人次、下载量3.6万余册/篇,月平均访问4 200余人、下载2 400余篇。其中旅俄华侨、远东问题研究、艺术、社会科学类电子书下载量分别占比17%、19%、11%、13%,期刊占比31%,其余9%。

根据以上数据分析得出,电子书下载量占全部资源下载量的2/3,期刊占比为1/3。其中电子书分类中特色学科旅俄华侨、远东问题研究占下载总量的36%。另外,在期刊31%的下载量中,《РОССИЙСКО-КИТАЙСКИЕ ИССЛЕДОВАНИЯ》(中俄问题研究)、《Проблемы Дальнего Востока》(远东问题)等相关学科期刊文献下载量,占期刊下载总量的24%。结合以上,特色学科下载量占总下载量的60%以上,基本达到了建库目的。

二、数据库建库中存在的问题

(一)数据库内容问题

自建数据库的主要目的就是为了提升学校特定学术领域的专业性,其收集的文献学术水平决定了数据库的质量。首先,近几年俄罗斯电子文献出版业增长较快,但其主要出版发行的电子书、有声读物,是以文学等休闲消费类书籍为主。具有较高学术价值的文献如政治、经济、宗教等类别的电子资源出版发行较少。其次,俄语作为小语种其数据库产品较少,市面上仅有俄罗斯大全一款成型的俄罗斯数据库产品,要想自建只能从代理商或进出口商提供的文献目录中进行购买。最后,数据库建库时正值全球疫情爆发,无法实地考察俄罗斯出版社,这极大地制约了文献获取的途径[3]。

(二)数据库知识产权问题

版权是外文自建数据库建库中遇到的最大问题。首先,与传统纸本文献库相比,基于“互联网+”环境搭建的数据库其最大的特点就是获取容易、使用方便,但其在使用过程中容易出现非法下载、传播与滥用的可能,造成侵权行为;其次,具有一定学术水平的文献资源,较大部分被俄罗斯国家图书馆收录,并受到严格的版权保护,只有成为会员并到馆才能访问;最后,俄罗斯学者所发表的学术成果,版权属于其受聘期间所在的单位,作者没有权利出售,且在出版发行时印刷量较少,因此,通过互联网无法轻易获得这些具有较高学术价值的成果。

(三)数据库的可持续发展问题

数据库的可持续发展是衡量一个数据库质量的重要指标。特别是自建数据库,因为文献具有时效性与连续性等特性,如果不对自建数据库内容进行补充、完善,就会造成数据库内容学术价值的下降。

三、应对策略

(一)多维度加强数据库内容建设

为了完善俄文数据库内容,提升数据库科研价值,应从多维度开展数据库内容建设。一是从载体形式上除了文本资源以外,应大力发展图片、视频、音频等多种格式的数字资源,进一步充实俄文数据库内容。二是依托地理优势,通过集团采购、实地采购、馆际互借等多种方式,购置或借阅俄文学术文献,并通过纸转电的方式,将纸本文献转换成符合数据库要求的数字文献。

(二)完善数据库使用制度建设

要想避免因版权造成的法律纠纷与经济损失,就应该建立健全数据库的使用制度,从而最大限度减少因版权带来的风险。首先,在数据库的使用上应限制为本校师生使用,对于校外人员使用的需求,则严格限制在CALIS(中国高等教育文献保障系统)成员馆中。其次,为保障数据库良好运行,应严格禁止用户使用软件工具或代理服务器批量检索、下载电子资源。再次,对于有版权风险的文献,如通过扫描复印、馆际互借、纸转电等方式获取的资源,应严格控制在校内使用,避免资源在传输与使用的过程中带来不可控的版权风险。

(三)建立科学合理的数据库资源评价体系

为了及时了解数据库使用与建设情况,实现数据库的可持续发展。应建立健全数据库评价体系,对数据库进行科学、合理的评价。从数据库收录内容、数据库检索效率、数据库使用情况及数据库各项指标的标准化、规范化程度等几个方面进行分析,并根据反馈的信息有针对性的进行优化,以期达到数据库的可持续发展。

四、结语

俄语作为小语种的代表语言之一,在当前中俄两国全面战略协作伙伴关系进一步深化时期,其实用性与学术性的重要不言而喻。俄文数据库的建设不仅可以弥补因疫情大背景下造成的俄文纸本文献的不足,更是为学校俄语教学、科研提供了切实的文献信息保障。

猜你喜欢
俄文黑河原则
到张掖看黑河
黑河来到了张掖
三亚将替换错译俄文路牌
俄文网站新闻的篇章及句法特征
无罪推定原则的理解与完善
黑河的孩子(中篇小说)
养生之道应遵守九不原则
惹人喜爱的原则(二)
惹人喜爱的原则
黑龙江·黑河·瑷珲历史陈列馆