历史文献四维时空联动图形化检索方法

2021-03-07 07:57姚远黄玉兰
电子技术与软件工程 2021年24期
关键词:历史文献图形化研究者

姚远 黄玉兰

(武昌工学院 信息工程学院 湖北省武汉市 430065)

如今计算机与网络已经深入到人类社会各个领域,大数据和云计算等信息聚合概念层出不穷,为人们的生产生活提供便利、为科学技术经济的发展加速。但在历史文献检索和使用方面,数字化信息化的进程却相对比较落后。仅仅停留在低级的数字化原始文本、分类存储的阶段,充其量只是一个数字化的图书馆,现今四类历史文献资源,分别为全图像版、标题检索版、全文本版和图文检索版[1]。历史文献研究者、相关领域应用者及爱好者们是历史文献检索系统的主要使用群体,目前的仅供数字化查阅的历史文献检索系统使得大量的文献收集整理工作仍然需要研究者们手工进行。而如何从海量的历史文献中找到有逻辑联系、有时空线索的有用信息,来满足自己的课题研究及相关需要是至关重要的。

目前的文献检索方法包括直接法(顺查法、倒查法、抽查法)、追溯法、循环法,但无一不是利用人名、事件名等文字信息进行常规人工检索或者计算机检索。现在有些研究者提出基于TopicMaps技术的可视化检索方法等[2],但这类方法也仅仅是做到以各种关键字的可视化,无法做到按时空坐标的系统化检索。经统计,研究者们为了获取与主题相关的历史文献,通常是从历史事件发生的时间和地理信息上进行事件扩展的关键字搜索的,这些工作因为传统的文字检索方法使得搜索效率不高,往往会占用研究者们约40%以上的研究时间。如果利用历史事件的天然属性:三维空间位置和范围,限定历史事件发生的区域和时间顺序,给终端研究者们呈现一个四维立体化的操作界面,相互穿插的历史事件序列分布在这个基于时空和地理位置的四维立体空间中,通过研究者 “所见即所得”的图形化搜索:移动时间轴、地图漫游、缩放等操作,得到准确快速高效的相关事件兴趣点群及目标历史文献集合。那么这将是一个通过历史事件之间四维属性的关联性而得到目标文献集的新方法,也即是本文提出的历史文献四维检索方法。

1 历史文献四维检索方法的理论基础

历史文献四维检索方法利用历史事件的天然属性:三维空间位置和范围,限定历史事件发生的区域;利用最重要的时间维度,限定历史事件发生的时间顺序。本文关于历史事件四维属性观点的提出,为历史文献图形化立体检索方法提供了理论基础。

2 历史文献四维检索方法

通过研究者所划定的时空坐标范围可以迅速找到与研究主题紧密联系的历史事件、并将它们以时间为主轴、空间位置和其他重要信息为坐标形成一个时空立体化事件序列供检索者高效查询,同时得到记载这些关联事件的对应文献。传统文献的检索方法如图1所示,四维时空检索方法如图2所示。

图1:传统检索法查找文献

图2:四维时空检索法查找文献

四维时空检索方法替代简单原始的文字信息检索,采用四维空间的图形化方法进行“所见即所得”的联合检索,使发现和利用历史事件间的关联通过高速有效途径来准确和快速获得,当多个时间、空间连续的事件在文献检索系统的显示区域显示时,这些事件序列将从四个维度纵横交错,立体化延伸,迅速将相关文献呈现给检索者。所以拖动四维空间中的时间轴或者改变地理坐标点时,就会得到一系列四维事件序列,可以将历史事件的时空连续性直观而完整的描述起来,于此同时,丰富的对应历史文献作为事件的记载者也会呈现给操作者。这样对于研究者来说可以对历史趋势、人类社会变迁始末、事件发生发展变化进行立体的、结构化的研究,从而真正发现和掌握各个历史事件的内在联系,对深入研究历史、全面理解古代社会文化生活起到重要作用。这种给予检索者的丰富文献呈现,将大大加快目标文献的获取进程。

该种文献检索方法将大大提高研究者们的搜索效率,同时研究者的最新研究成果(新产生的文献)也无缝融合到这个四维历史文献模型的云存储之中,成为它的组成部分,使得这个四维历史文献云的目标文献搜索能力不断增长。这样一个能够不断生长并不断吸收研究者成果的智能云,将会是历史文献研究的重要发展方向和智能成果的体现。能够使历史研究成为真正的信息扩展源,为社会发展、生产生活做出卓越贡献。

四维历史文献检索方法的实际应用需要确定以下3 个方面:

(1)历史事件作为基本检索单元,需确定历史事件四维属性的存储,确保历史事件得以检索。包括地理空间坐标体系、历史时间尺度与公元纪年对照等数据存储标准的确定。

(2)确定历史文献和其记载的历史事件的映射存储。

(3)确定四维图形化检索在内的多种检索服务。

2.1 历史事件四维属性存储

四维历史文献检索方法,通过历史事件得到历史文献,历史事件之间四维属性的时空连续性,使历史文献时空联动的立体化检索成为可能,所以历史事件的存储、历史事件/历史文献的映射尤为重要。

四维立体图形化检索界面中事件所代表的兴趣点,对于计算机技术来说是数据的表现。数据表现来源于数据的存储,历史事件作为基本数据存储实体,具备四维属性,是文献云的基本检索单元。

时间是历史文献所记录事件的天然属性之一,包括成书时间、陈述时间,以及文献叙述内容的时间。任一起历史事件将会与一个时间段联系,但是时间段有大有小,有的事件可能发生于一天之内。事件对应的时间尺度将区分事件的影响时间范围。存储时间尺度的分类是重要研究内容之一。

历史文献中记录的事件除了时间维度之外,还有另外一个天然属性:空间位置和范围。任何历史事件,都发生在某个地表上特定的地理位置、一个特定的空间。根据历史事件的规模和影响范围,这个地理空间单元可以以三维空间坐标表示,并且根据其影响范围选定相应的空间尺度。根据地球上地点的表示方法,统一选用WGS84 经纬度坐标对地理地点进行标注。

时间、空间位置及范围是历史事件的四维属性,四维属性的划分使得历史事件作为四维文献云的基本检索单元成为可能。

2.2 历史事件/历史文献的映射存储

利用数据库技术存储事件、事件序列、文献映射数据。利用全文搜索技术和空间查询扩展完成四维属性的获取和存储。

基于时空GIS 的数据存储技术已经较为成熟[3-7],有些甚至已经利用到按时间变化的三维动态实时建模技术[8]。由于历史文献四维检索方法关心的是历史文献数据,为了简化表达和便于检索,历史文献四维检索方法使用四维点模型作为基本存储。所有的历史事件统一作为四维时空坐标中的四维点存储。

同一个事件会被记载于不同的历史文献中,所以当所搜索的事件在四维联动空间中出现时,相应的历史文献应得以呈现。这就需要存储这种映射关系。

同一个历史文献会记载多个事件序列,同样需要云存储来实现这种映射关系。把历史文献和其中所记载的事件序列,理解为一个四维存储区。每一份文献及其中记载的历史事件,均可看作具有一定时间区间和一定空间范围的单元实体,依附于这个实体之上的主要因素,如人物、地点、社会面貌、军事力量等等,都体现在事件的发生变化之中。

在大数据大行其道的今天,每一个终端操作者都无时不刻充当着各类平台的使用者,同时也是数据的贡献者。将历史文献和其中所记载的事件序列、时间、空间信息等进行抽取,按照四维形式进行存储;每一个研究者也都可以将最新研究成果(新产生的文献)无缝融合到四维历史文献云之中,成为它的组成部分,使得这个四维历史文献云的目标文献搜索能力不断增长。

2.3 历史文献四维立体图形化检索服务

四维时空联动检索方法提供四维立体图形化检索服务来高效获取检索文献结果。使用者通过图形化操作界面搜索文献,以完全区别于以往的高效搜索方式而定位到目标文献信息。与以前的单纯文字信息检索方式相比,对历史文献中记载的各个事件的时间维度和空间三个维度的信息整合和关联,会给使用者前所未有的便利和高价值的信息量。

四维立体图形化检索数据服务允许使用者输入的单一包含事件/人物的关键字,不再是得到常规的历史文献文字结果信息,而是根据关键字的四维属性值得到一系列相关联的历史事件,这些事件在四维空间检索立体空间中以兴趣点的形式标注出来。同时,所有记录该相关事件的历史文献将以弹窗或者其它悬浮形式呈现给操作者。最重要的是,当在四维操作空间中通过时间轴进行尺度缩放、前后移动,或者将地域范围进行比例尺缩放、及通常的漫游、移动等操作时,该单一事件所关联的时空连续性事件将全部呈立体化以兴趣点的形式在界面中高亮出来,这些兴趣点都对应着相应的历文献结果列表,重要文献将被同步高亮。这样由点及面、由平面到空间、一个快速、高效的立体化历史文献搜索序列结果就此快速可以在四维图形化立体空间中产生。且当时间轴上标注的时间发生变化时,地图框内的地理名称也将随其变化,改变为当时历史上的对应名称。形成一种简单明了、操作方便的四维时空联动的检索空间。

四维时空联动检索方法同时提供丰富的四维历史文献检索服务,包括文献全文检索服务、事件检索服务、时间轴检索服务、地理位置检索服务、关键字检索服务等。

3 应用历史文献四维图形化立体检索方法搭建文献云

使用大数据分析、时空四维数据存储及自然语言智能搜索等软件技术,搭建一个能够以时空为线索,针对任意历史人物、地点、事件、物体等事件/主题进行搜索的文献云,实现历史文献四维时空联动检索。

四维时空联动文献云采用流行的JavaEE 技术提供WEB 服务,WEB 客户端操作界面则利用支持MVC 模式的Javascript 框架AngularJS 来实现。全面使用最为先进的AJAX 及JS template 技术,系统集成地图服务提供商提供的中国全域地图提供空间维度搜索服务;同时系统提供统一时间标准检索替代原始公元纪年对照表,文献云的大数据分析技术将会对时间刻度与文献关联度进行智能存储、提供时间轴检索。

文献云部署所有的后台软件服务与电子历史文献数据,通过云服务向广大历史文献使用者提供基于四维立体图形化检索的数据服务。使用者使用编著者、人物、地理名称、事件名称等进行主题检索,这些主题都将转换成四维属性的形式位于云存储中;同时操作者通过图形化方式快速在四维联动空间界面中得到拥有四维属性的兴趣点或兴趣点群,进而通过内部云存储映射机制得到兴趣点对应的历史文献信息。在呈现的时候,四维联动空间界面中以时间为纵轴附加到一个可缩放移动的地图窗口内,以给文献检索者一个动态的反映实际变化的信息,而不再是常规方式孤立无序的文献片段。四维时空联动文献云将历史文献时间维度和空间三个维度的信息整合和关联,给使用者前所未有的便利和高价值的信息量。

4 结语

四维历史文献检索方法,首先对文献检索的操作方式进行了变革。以前的目录树方式按文字检索虽得以保留,但在以时间为主轴的时空联动检索中,采用了新颖的时间轴显示方式。用户可以以公历时间、中文纪年输入年代日期信息,或者通过时间轴的拖拉定位到特定时代的相关文献。通过搜索得到的事件、事件序列等将会在四维地理时空中以兴趣点的方式进行立体化呈现,从而将记载事件的历史文献通过映射技术提供给使用者,使其方便快速的得到有用的信息。

其次,对历史文献的存储方式进行了改进,把单纯的电子化文本内容,变为动态的,按照一定主题不断演化和增长的文献生长系统,使文献存储本身可以自组织和优化,对历史文献的使用带来丰富化和网络化。历史文献四维图形化立体检索方法,能够让研究者从时间范围和空间范围内大大缩小需要阅读的文献量,可以将需要阅读的文献缩减到常规方式下日常工作的十分之一甚至更少。与原始简单文字的搜索方法相较,在搜索准确度和效率上呈指数倍增长。

再次,提出新形态的四维历史事件单元概念,利用这个概念把重要的历史事件、地点人物组织起来,让历史文献能够以时间维度把描述相近或相同的内容并列,以方便文献使用者筛选编辑。文献研究者可以以历史事件为单位,组织考察相关的文章资料来源,按照这种方式可以快速有效的检索到自己需要的文献资料。使用者可以充分利用文献数据的按时间空间的四维组织形式,对自己的研究主题进行数据收集整理。能从根本上解决卷帙浩繁的历史文献难以组织时间线索,获取资料不易取舍的问题,大大加快文献使用者得到有效信息的进程,促进历史文献研究者们的研究。

猜你喜欢
历史文献图形化研究者
高等教育中的学生成为研究者及其启示
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
LKJ自动化测试系统图形化技术研究
历史文献纪录片中蒙太奇的运用
运用图形化听写式复习,构建高效地理课堂
我国历史文献中所见黑水靺鞨概述
医生注定是研究者
图形化地区电网无功优化软件开发与应用
珠镶玉嵌 蔚为大观——读《都江堰文献集成·历史文献卷(近代卷)》
图形化仪表控制系统上位机软件的设计与开发