垂直搜索在图书馆电子资源系统中的应用研究

2016-07-23 10:18谢振宝刘迎春司福明安徽机电职业技术学院安徽芜湖400安徽建筑大学安徽合肥300
赤峰学院学报·自然科学版 2016年11期
关键词:电子资源图书馆

谢振宝,刘迎春,司福明(.安徽机电职业技术学院,安徽 芜湖 400;.安徽建筑大学,安徽 合肥 300)



垂直搜索在图书馆电子资源系统中的应用研究

谢振宝1,刘迎春2,司福明1
(1.安徽机电职业技术学院,安徽芜湖241002;2.安徽建筑大学,安徽合肥230022)

摘要:电子资源作为现代图书馆的重要馆藏资源,不仅是高校以及其它科研机构从事教学、科研的重要参考资料,其建设水平也成为了图书馆馆藏的主要衡量标准之一.随着图书馆信息化程度的不断提高,如何科学、有效地使用电子资源,已经成为现代图书馆关注的重要课题.而垂直搜索是针对某一特定领域,服务于某一特定人群的搜索,垂直搜索在技术上与传统的搜索并无根本差异,但搜索的策略却发生了变化,即由传统的“大而全”变为“专而精”.垂直搜索能有效整合图书馆现有电子资源,提高电子资源的利用率,节省用户时间.在图书馆电子资源系统中发展垂直搜索已经成为水到渠成的事情.

关键词:图书馆;电子资源;垂直搜索

1 背景

目前,各个公共图书馆和高校图书馆都投入了巨大的人力和财力引进了大量的电子资源.2012年11月至2013年1月间的一项针对国内本科高等学校的调查表明目前我国高校图书馆平均拥有中外文电子数据库以及自建电子数据库的数量为33.78个,某些高校的电子资源数量甚至超过200个[1].面对如此众多的电子资源,如何进行科学、有效地使用,这已成为现代图书馆关注的重要课题.与发达国家相比,国内利用资源整合软件进行资源整合的图书馆相对较少,且大多数都处于试运营阶段[2].综合而言,国内目前在图书馆电子资源利用方面还存在以下一些主要问题[3]:

(1)电子资源整合度偏低.电子资源大多被简单地罗列在图书馆的门户网站上,用户要定位到某个电子资源上需要花费一定的时间.

(2)缺乏统一的搜索方式.用户需要时间去熟悉不同电子资源的搜索方式.而图书馆相关部门对电子资源搜索技能的培训往往又受到用户的轻视.

(3)部分电子资源利用率低下.那些在简单排列中相对靠后的资源,用户往往很难发现,其利用率比较低.

(4)内容重复现象严重.不同电子资源之间的内容大量冗余,导致用户搜索效率低下.

为解决以上问题,国内外近年来陆续研发了诸如统一检索系统、垂直搜索等解决方案.即通过对资源的分类,以满足不同用户对不同分类电子资源的搜索需求.

2 现状

图书馆电子资源的使用方式目前有以下几种:直接罗列在图书馆网站中;使用简单的分类如分为”中文”、“外文”、“试用”等类别;进行简单的资源整合如使用首字母排序、学科导航等方式.当图书馆电子资源越来越多,对资源整合的要求也就越来越高.作为最有效的电子资源整合的一种方式,统一检索平台[4]应运而生.而垂直搜索是将垂直搜索技术与统一检索平台相融合的一种新型的搜索系统.

目前,国内外具有代表性的电子资源搜索系统有[5]:清华同方基于数字图书馆管理系统(TPI)基础上提供的统一检索平台USP(UnionSearchPlatform)、CALIS(中国高等教育文献保障系统)统一检索平台、CrossSearch检索系统、MetaLib系统、Web FeatPrism系统等.这些国内外系统在一定程度上满足了图书馆对电子资源整合搜索的要求,但也存在着一些不足,譬如系统价格昂贵、没有对电子资源进行分类、缺乏灵活性、没有充分利用图书馆本身的电子资源馆藏优势、不能本地化,使用受网络条件影响等等.

因此,这些系统并不能满足图书馆在电子资源整合搜索方面所有的需求.而针对图书馆局域网的基于本馆自身电子资源的垂直搜索[6]系统能较好地解决上述问题.所谓垂直搜索既是针对某一特定领域,服务于某一特定人群的搜索,垂直搜索在技术上与传统的搜索并无根本差异,但搜索的策略却发生了变化[7],由传统的“大而全”变为“专而精”.

发展垂直搜索并建立一个对图书馆现有电子资源的垂直搜索平台,能有效整合资源,提高资源利用率,实现管理员后台管理用户需要搜索的电子资源,对资源进行分类.用户依据这些分类对分类下的所有电子资源进行统一搜索,搜索结果按照与搜索串相关程度返回给用户并实现结果的“去重”.

3 搜索平台的实现

3.1功能需求

垂直搜索平台应以图书馆所处的网络环境为基础,使用B/S(浏览器/服务器)架构为其基础框架.将服务程序放置在服务器中,客户端通过浏览器对服务器进行访问,服务器接收到客户端请求后进行应答.平台主要需求用例如图1所示:

图1 平台功能需求用例图

上图中主要的角色和业务如表1所示:

表1 平台的角色

3.2架构设计

根据需求分析,同时考虑到平台的健壮性、扩展性和开发过程的方便性,应采用分层架构.分层架构可以使开发过程分散关注、松散耦合,还可以使开发过程中的业务逻辑可以复用,对标准化的建立也是大有好处的.根据平台的功能需要,架构可分为表示层、应用层和数据层.

3.2.1表示层

表示层是直接与用户打交道的层.首先,表示层要负责获取用户的输入以及用户对分类和搜索项的选择,并将这些信息发送给应用层相应功能模块.其次,显示层要将应用层传递过来的搜索结果以统一的格式显示给用户.

3.2.2应用层

应用层是系统的核心部分.主要负责将表示层传送过来的用户的输入、选择的分类及搜索信息统一生成为CURL搜索命令,将CURL工具获取的网页信息经过相似性算法比对去除重复的信息,将获取的信息标题和用户输入的字符串语句进行匹配确定所有信息的排序,依据合理的顺序将所有信息发送到表示层.

3.2.3数据层

数据层是系统要检索的电子资源的集合.主要指图书馆已有的将要加入到电子资源垂直搜索平台的数据库资源,包括各种中文数据库、外文数据库、试用数据库以及本馆的特色数据库等.

3.3平台的详细设计

平台总体上分为前台的搜索模块和后台的管理模块,其详细功能层次分布如图2所示:

图2 功能层次图

以下就部分核心模块进行简要阐述.

3.3.1搜索请求收集与结果反馈模块

搜索请求收集模块与搜索反馈模块相互配合,完成用户的搜索过程.其主要操作和处理流程如下:

(1)用户首先选择所要搜索的电子资源类别,点击相应类别后在搜索框下方会出现用户所选类别的搜索项,用户可以选择其中某项也可以选择所有字段进行搜索.

(2)选择完成后用户在搜索框中输入搜索内容,点击搜索按钮进行搜索.

(3)系统根据用户的操作生成搜索式并提交给CURL,CURL将该搜索式发送到用户所选类别下的各个电子资源并抓取返回信息.

(4)反馈信息经过信息提取、去重并按照题名信息与用户搜索语句的相关程度返回给用户.返回的信息根据搜索项的不同返回诸如题名、作者、来源、全文路径等信息.

搜索过程如图3所示:

图3 搜索过程序列图

3.3.2分类管理模块

该模块主要负责对电子资源分类进行管理.用户通过点击后台的导航对应菜单进入该模块,该模块通过信息表格的方式向用户展示所要搜索的电子资源分类信息.用户点击新增、编辑和删除按钮,系统会弹出相对应的对话框信息,用户通过填写该对话框来完成上述操作. 3.3.3搜索项管理模块

电子资源搜索项根据电子资源分类不同而变化.如“电子图书”类的搜索项包括“书名”、“作者”、“主题词”,“电子期刊”类的搜索项包括“标题”、“作者”、“刊名”、“关键词”.该模块主要操作和处理流程如下:

(1)页面加载.页面加载时,系统以信息表的形式列出所有的电子资源搜索项详细信息,包括“搜索项名称”、“搜索项简介”、“所属分类”信息.

(2)新增搜索项信息.用户点击“新增”按钮时,系统弹出“新增搜索项”对话框,用户输入新增的搜索项详细信息,并通过下拉列表选择该搜索项所属的分类,点击保存按钮进行保存.保存成功后在当前的信息表中会动态添加新增搜索项信息.

(3)编辑搜索项信息.用户点击“编辑”按钮时,弹出“编辑”对话框,在该对话框中显示了当前待编辑项的所有信息,用户可以对其进行修改并可以重新选择当前搜索项的分类,修改完成后,点击保存按钮.修改成功在信息表中会即时更新用户修改的内容,如果修改失败,系统会弹出修改失败信息提示框,提醒用户修改失败及失败的原因.

(5)删除检索项信息.点击“删除”按钮时,会弹出提醒用户是否删除当前记录的对话框,确认后即可删除当前选中的搜索项信息.

3.3.4电子资源管理模块

电子资源管理是管理模块中最为复杂的模块,其展现形式和基本操作和前述各模块基本相似,不同的地方在于:

(1)弹出对话框搜索项输入区域的动态变化.点击“新增”、“编辑”的时候,在弹出对话框中,根据选择的不同电子资源分类信息,搜索项参数信息输入区域会出现当前分类所对应的搜索项的参数表达式、参数匹配模式和参数匹配正则式的输入框.

(2)保存电子资源信息时,要保存与其相关的其他表的数据.当用户点击保存后不仅要保存电子资源的基本信息,还要将参数表达式以及参数匹配模式和参数匹配正则式保存到搜索项参数信息表中.

(3)删除电子资源信息时,也要删除对应参数表中的信息.

4 总结

目前国内很多图书馆都订购了大量的电子资源,建有自己的机房,配备了服务器和存储设备,用于存储海量数据,投入了大量的资金.但是,这些电子资源信息往往只是通过链接的方式,简单罗列于图书馆主页上,用户如果想查找电子资源的话需要按顺序查找,浪费了大量时间,而且致使很多不容易被发现的电子资源利用效率比较低.本文针对这种情况,在充分调研了图书馆各个电子资源的架构和获取方式的基础上,研究并设计了图书馆电子资源垂直搜索平台主要框架.该搜索平台的实现能有效整合图书馆现有电子资源,提高资源利用率,节省用户用于查找电子资源的时间.

参考文献:

〔1〕刘建国,苏万鹏.全国本科院校图书馆电子资源调查研究[J].图书馆学刊,2013(5).

〔2〕丁申桃,庞跃霞,曹丽娟.我国高校图书馆数字化资源建设现状分析[J].图书馆论坛,2005,25(6).

〔3〕勾丹,郑洋洋.我国高校图书馆电子资源利用现状与对策[J].图书馆学研究,2008(11).

〔4〕林林.数字资源整合与统一检索平台[J].情报资料工作,2004(5).

〔5〕王效岳,王志玲.国内外异构数据库统一搜索系统的比较研究[J].情报杂志,2005(12).

〔6〕王文钧,李巍.垂直搜索引擎的现状与发展探究[J].情报科学,2010,28(3):477-480.

〔7〕Notess,GregR..Custom Search Engines[J]. ComputersinLibraries,2008,5(28):16-17.

〔8〕刘欣,李慧.PHP开发宝典[M].北京:机械工业出版社,2012.430-470.

〔9〕张卫,罗长寿,张峻峰,于峰,栾汝朋.基于CURL异构数字资源统一搜索的研究[J].中国农学通报,2010,26(22).

中图分类号:G250.76;TP302.1

文献标识码:A

文章编号:1673-260X(2016)06-0167-03

收稿日期:2016-02-28

基金项目:安徽省高校自然科学研究项目(kj2016A134)阶段性成果

猜你喜欢
电子资源图书馆
图书馆
时间重叠的图书馆
图书馆
关于少数民族师生数据库利用情况调查研究
图书馆数字资源评价指标权重赋值方法概述
图书馆纸质资源与电子资源最优配置研究
高校图书馆电子资源的宣传与推广
河南省本科院校电子资源建设与利用状况研究
高校图书馆电子资源评估研究
去图书馆