省级档案网站资源检索现状及其问题研究

2016-02-03 08:53南京政治学院上海校区
浙江档案 2016年9期
关键词:检索系统检索数据库

王 晨/南京政治学院上海校区

档案网站是档案事业在互联网中的门户,承担着开展档案宣传工作与提供档案利用服务的重要职责。随着网络成为信息获取的重要渠道,档案网站在档案利用服务中的作用越发明显,其检索质量的高低将直接影响开放档案资源的价值实现。因而,以我国目前各省级档案网站的资源检索现状为研究对象,深挖网站资源检索问题的根源并给出科学合理的应对策略分析,是新形势下档案信息化建设的重要举措。

1 我国省级档案网站建设概况

中国人民大学研究品牌计划项目“我国档案网站建设测评与评价”项目组成员自2004年以来对我国同一级别的33个省级档案网站的建设现状进行追踪测评。该项目研究成果得到的数据显示,截至2015年,我国各省级档案网站的检索建设都有了相当大的进步与突破:网站收集的档案信息资源不断丰富,且开始逐步满足多样化的档案用户需求;档案网站相关信息的更新速率有所提高;人机交互的界面友好度上更加趋于人性化;与此同时,各网站逐步开始建立其颇具特色的数据库,网站的规范程度也得到逐年加强[1]。

天津档案网、上海档案信息网、北京市档案信息网和浙江档案网等网站的建设较为突出,在该项目的综合指标测评中排名靠前。尽管其他地区省级档案网站建设的步伐也在加速,但相对来说,地区间网站的建设和发展水平依旧存在差异,华北、华东地区整体上仍处于领先地位[2][3]。省级档案网站是我国综合档案馆建设水平的最高代表,能够直接反映出档案信息化建设的进程,然而不可避免的是,由于我国档案工作的整体建设水平尚未能完全满足用户日益个性化的利用需求,档案网站的相关建设还存在很多问题和不足,许多功能有待进一步提升。

2 省级档案网站资源检索模块的功能分析

档案网站的各大功能中与利用者关联最紧密的无疑是资源检索模块,该功能是连接用户和档案的直接窗口,其建设质量的高低将会在很大程度上对档案利用服务的用户体验以及用户黏性产生影响。本文以我国各省级档案网站中总体建设水平较高的网站为研究样本,对其检索模块的各类功能进行相关剖析。

2.1 主体检索功能

我国档案网站目前的主要功能更多定位在做好档案的宣传工作,检索模块虽然必不可少,但就整体而言其地位并不是特别高。在对综合测评较好的省级档案网站的实际检索体验中,可以看到网站现有功能模块都会在页面主菜单显示有查档服务或者在左右两侧的宣传栏中设计有检索系统的简易搜索框。例如,北京市档案信息网查档服务模块下的网上查档,天津档案网的档案查阅以及上海档案信息网在页面左侧的“开放档案一站式查询”。

从可检索内容上看,各档案网站的数据库主要提供开放的相关历史档案、政府信息公开查阅、企业档案、民生档案和部分编研成果,形式上包含了数字化的纸质档案、电子文件以及声像等多媒体档案类型;从检索方式上来看,关键词搜索是目前档案网站中最主要的检索方式,它是针对题名、档号等档案著录项所进行的重点检索。以北京市档案信息网的原文阅览查询为例,可以在搜索框内输入任一档案著录项所包含的字眼作为关键词在库内进行检索。值得一提的是,上海档案信息公共服务平台的主体检索功能中还有其他诸如浏览查询、专题查询和条件查询,可根据档案的标题、档号、档案存址、目录类型和起始终止时间对档案目录进行相对专业的布尔逻辑检索。

2.2 分类检索功能

除了输入关键词进行搜索的主体检索方式,大多数档案网站针对数据库内的馆藏档案信息都进行了资源组织归类,以实现基本的分类检索功能。时间顺序、行政区域或者档案类型是常见的划分依据,将档案信息资源进行细分,然后在每一个类别下设置检索框输入关键词实现检索。

比较典型的如北京市档案信息网,在其网上查档的原文阅览服务中将收集的档案信息资源按照来源分为了北平市政府(J001)、北平市社会局(J002)、北平市民政局(J003)、北平市教育局(J004)、北平市卫生局(J005)和冀北电力有限公司北平分公司(J006)等6个档案数据子库[4][5]。同项目组在过去几年的调研报告数据比较中发现,近年来各档案网站的分类检索功能除了在馆藏数据上有所丰富外,在具体的分类调整上并无变化,面对日益多元化的档案用户需求,目前省级档案网站的分类检索功能还有待进一步完善。

2.3 检索辅助设计

相比国外档案网站将资源集中化管理、一体化检索的集成模式,我国省级档案网站在检索功能的设计与建设方面较为分散。除了主要的检索通道和分类检索,多数网站在页面与功能设计上把政府信息公开、档案展览以及档案编研成果等其他形式的辅助检索单列在网站两侧[6]。检索辅助设计既包括专门档案、特色档案数据库及编研成果的专门查询,同时也有馆际间的资源共享服务和相关链接,如上海档案信息网“开放档案一站式查询”中设有档案馆电子地图,将上海市内实现联通的档案馆标注在地图上,并可以通过点击访问已联通的区档案馆网站进行更细致深入的档案查阅[7]。

另外,综合测评较好的各大档案网站中一般设置热点排行等rank浏览形式的档案检索,突出颇具特色的档案数据库或单列出用户可能会利用的档案及文件类型以便于查询,如北京市档案信息网将民生档案共享平台、天津档案网将企业档案和“天津抗日群英谱”单列在网站两侧[8]。值得一提的是,大部分网站会将“查档指南”作为辅助检索部分嵌入到网站设计中。

3 省级档案网站资源检索功能的不足

尽管从整体建设上看,我国省级档案网站的档案资源检索功能建设上已达到基本要求,然而即便是走在前列的档案网站,其检索功能在页面总体作用中的地位也并不高,相对国外比较成熟的档案网站而言,还存在不小的差距,主要体现在数据基础、标准建设以及系统整合等多个方面。

3.1 档案资源检索的数据基础薄弱

就目前情况来看,我国省级档案网站检索系统的数据库建设还不够成熟,表现为数字化程度低、数据基础相对薄弱。这一问题从本质上讲,是档案馆前期的收集整理工作不到位以及数字化进度慢、程度低造成的。据统计,北京市档案信息网目录检索目前能提供的档案目录约为81万余条,而数据量最大的天津档案网也才158万余条,相比国外如美国、加拿大等相同级别的档案网站,在数据规模方面至少相差十倍以上[9]。

而从开放档案的门类上看,我国档案多集中在文书档案上,科技档案和专门类档案的数量不多,数据库的整体建设质量也不高。为数不多的网站为其收集的科技与专门档案成立单独的数据库展示在检索界面,例如北京市档案信息网的目录检索全部的8个数据库中就有1个诉讼档案目录数据库。另外,从网站主体检索所能查阅到的内容上来看,除了像北京市档案信息网和天津档案网等为数不多的网站能够提供原文查阅,大多数档案网站中的档案资源检索服务仅提供数据库内的目录检索和档案全宗简介等二次信息,无法实现档案原文全文检索和查阅。

3.2 档案资源检索的纵向层级不通

用户在利用档案网站检索系统查阅档案信息时所能检索到的纵向深度是对档案网站建设质量的重点评估项之一。就国内省级档案网站目前的建设现状而言,对文件的著录还无法实现“全宗—案卷—文件”的三级检索。数据库内档案信息著录项不完善、不规范,数据库之间著录项标准不统一是造成上述现象的主因。以在档案网站检索系统上摘录的档案信息为例,北京、上海等大多数省级档案网站对档案文件的信息著录只包含档号、责任者、标题、起始时间、终止时间和存址几项[10][11]。由于目前的著录没有实现纵向层级上的多级联通,因而从文件向上无法检索至案卷以及全宗,知道全宗也难以向下定位至相关案卷及文件。对用户而言,这样的检索服务体验无疑会使用户在搜索档案信息时受到相当大程度的阻碍,从而影响档案利用服务自身的发展。

3.3 网站检索系统的整合程度较低

相比国外档案馆较为成熟的档案网站,我国各省级档案网站检索系统最大的问题在于整合程度过低。一方面是由于档案馆前期收集整理和数字化工作的滞后导致数据库内档案信息本身的数量和质量不高,因而在资源整合阶段对档案信息的分类集成便有所阻碍,信息著录项缺损不全、关联性不强,整合程度较低;另一方面是由于档案网站自身的定位及相关设计理念使得本应作为档案利用服务主要工具的检索系统在网站页面内的地位堪忧,技术上没有实现同界面的跨库检索,各数据库之间也存在关联性不强且过于分散等问题,这一点在各档案网站中表现得尤为明显[12]。从根本上讲,无论是上游的数据资源还是下游的检索系统本身,国内各省级档案网站都还处于相对独立的阶段,同目标要达成的系统化集成与整合还有相当一段距离。

4 对档案网站资源检索不足的思考

新形势下,我国档案事业的发展需要“充分利用已有的信息传输网络和平台,积极推进档案信息资源共享,支持档案馆(室)将可公开的各类档案上传网络、提供利用。”[13]立足于我国档案事业发展的实际和检索功能的不足,笔者认为省级档案网站的资源检索在未来发展中需要完成“三个转变”,实现功能上的逐步完善。

4.1 检索用户从专业人员转向普通用户

以目前各大省级档案网站的设计理念及应用体验来讲,档案网站更多的是作为一个宣传档案工作并便利专业人员检索的媒介平台,针对的目标群体更倾向于具有一定专业素质的档案工作者。然而随着社会档案意识的提升,越来越多的人开始对档案价值有所认知,检索和查阅档案的需求必然会随之提升。因而,作为档案工作与服务网络门户的档案网站,其在线查档的检索用户不可避免地将由面向专业人员逐步转向面向普通用户。针对这种转变,档案网站的检索功能开发,一方面要完善其查档指南等辅助设计,帮助普通用户了解档案网站并让检索步骤简易化、便捷化;另一方面对于检索途径的选择要更加“平民化”,更多地选择基于关键词、题名等易于理解的模糊或精确检索、联想词检索甚至自定义检索途径以弥补普通用户认知同档案专业术语之间的检索鸿沟[14][15]。

4.2 检索系统从独立分散转向集成统一

档案网站的功能定位很大程度上会决定其中各模块的地位作用以及所占比例。由于我国各省级网站的聚焦点还停留在档案宣传上,因而资源检索系统在目前来说还不是档案网站的主要功能,数据库零散地分布在网站页面的侧边。然而随着未来档案工作的重心由“存”转向“用”,档案资源检索系统必然会经历由独立分散向集成统一的转变。这种转变从本质上讲是对档案资源数据库的有机整合,将各门类档案资源以及特色数据库以统一的标准融合在一个树状的检索系统中[16]。以美国国家档案与文件署网站为例,其下包含有档案研究目录系统(ARC)、档案数据库通道(AAD)、在线公共通道检索(OPA)以及电子文件档案馆(ERA)等,所有开放的档案信息和现行文件几乎都能够在其中某个库内检索到[17]。

4.3 检索内容从档案目录转向全文原文

未来档案用户需求的增长必将给档案网站的检索内容带来变化。一是用户对档案信息的检索需求已不仅仅满足于得到档案目录信息,而更倾向于在档案网站上直接查阅档案信息全文;二是用户对所查内容的检索方式将不再仅限于档案目录的著录项,而将变为输入原文中的关键词直接对原文进行检索[18][19]。这项转变对我国省级档案网站的发展而言将是质的飞跃,既需要网站后台数据库内档案信息的质和量都达到一定要求,还需要突破对档案原文的数据化等实现原文检索技术的前期必备工程。毫无疑问,用户对档案网站检索内容从档案目录逐步过渡到原文全文的趋向已势不可挡,关键要夯实用户需求牵引过程中前期的数据支撑与技术基础。

5 结语

省级档案网站既是反映我国档案事业发展的一个重要场所,同时也是网络时代用户了解和利用档案的重要平台。资源检索作为连接用户与档案资源的直接通道,其功能的完善与否将会直接影响用户对档案利用服务的印象。我国档案网站资源检索功能的建设还处于发展与探索期,问题与机会并存,随着新形势下国家和社会层面对档案信息资源需求的不断增加,各省级档案网站需要在未来对其检索系统的功能做出进一步的完善和升级。

注释与参考文献:

[1][2]张宁,夏天,王皓等.2015年我国省级档案网站建设测评项目综述[J].中国档案,2016,(01):36-39.

[3]陈晓晖,赵屹.我国档案网站建设情况综述[J].档案学研究,2013,(04):55-63.

[4][6][10][14][18]赵屹.我国档案网站检索系统的不足与发展策略—以美国国家档案馆的ARC系统为参照[J].档案学研究,2014,(02):57-64.

[5][8][19]锅艳玲,段爱峰.完善我国档案网站检索功能的策略研究——基于国内外档案网站检索功能的比较 [J].档案管理,2012,(02):17-20.

[7]上海档案信息网[EB/OL].[2016-03-15].http://218.242.141.101/org.html.

[9]周莉.我国档案网站建设的问题与对策研究[D].合肥:安徽大学,2010.

[11]赵山山.浅谈我国档案网站网上检索功能现状与未来建设 [J].档案管理,2009,(03):33-35.

[12]赵雪.从检索服务角度分析我国档案网站的现状及发展 [J].北京档案,2002,(09):18-20.

[13]杨冬权.做好新形势下档案工作、建设档案强国的纲领性指导文献——学习《关于加强和改进新形势下档案工作的意见》体会[J].中国档案,2014,(05):17-22.

[15][17]王敏.中美档案网站检索功能之比较与启示[J].档案,2014,(03):59-62.

[16]吴建华,刘明,王斌等.中国档案网站建设概况与重点分析 [J].档案学通讯,2008,(04):50-54.

猜你喜欢
检索系统检索数据库
浅析图书馆检索系统的应用
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
基于行车调度指挥的高危作业智能检索系统研究
世界地质公园地图检索系统开发与应用
浅议专利检索质量的提升
数据库
浅析图书馆检索系统的应用
数据库
数据库