多源空间矢量数据一致性处理技术探讨

2017-01-20 09:26胡蝶赵璞陈明爽岑欣童杨晓彤
软件 2016年4期

胡蝶 赵璞 陈明爽 岑欣童 杨晓彤

摘要:地理信息系统的迅速发展和广泛应用积累了大量数据资源,空间数据质量已然成为国际地理信息系统领域的研究热点。作为空间数据产生和更新中的重要数据来源,空间矢量数据的一致性处理问题也更加为人们所关注。本文立足现有的多源空间数据,阐述了多源空间数据不一致性的产生,并对多源空间矢量数据的一致性处理方法进行了探讨,介绍多源空间矢量数据在几何位置、属性特征和要素关系方面的一致性处理方法,提高空间矢量数据的质量和现势性。

关键词:多源空间矢量数据;不一致性;几何位置;属性特征;要素关系

中图分类号:TP39 文献标识码:A DOI:10.3969/j.issn.1003-6970.2016.04.004

0 引言

随着各种各样的地理信息系统的应用,人们对空间数据的需求也越来越大。当前在空间数据生产与更新过程中,国家各个部门从行业应用需求出发生产了大量的空间数据(遥感影像、矢量数据、统计数据、多媒体数据、测量数据等)。然而,对已经获得了的海量空间数据中所蕴含着的、丰富的地理信息没有得到充分地利用和挖掘。为了充分地利用好这些丰富的数据资源,就需要有效的技术和方法来对多源空间数据进行相应处理,实现多源空间数据在几何特征、属性特征和空间关系等特征上的一致性。

1 多源空间数据概述

1.1 空间数据的定义及其特征

空间数据,也可以称为地理数据,是地理实体的空间特征和属性特征的数字描述。地理实体的空间特征表现为地理实体的几何特征(定位:地理实体的位置、形状、大小及其分布特征)和实体间的空间关系;地理实体的属性特征(定性)表现为实体的数量特征、质量特征和时间特征。定位是指一个已知的坐标系里空间目标都具有唯一的空间位置,定性是指空间目标的自然属性,时间是指空间目标是随时间的变化而变化。

空间数据具有三个基本特征:

①空间特征描述现象的空间位置或现在所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示。

②属性特征描述事物或现象的特征,例如变量、分类、数量特征和名称等等。

③时间特征指事物或现象随时间的变化,例如人口数的逐年变化。

1.2 多源空间数据不一致性的成因

造成多源空间数据不一致的因素有很多,可以概括为以下几个方面:

(1)获取手段多源

数据的获取途径较多如目测及实地勘察、数字地图、遥感影像、地图表格、前期数据档案等。数据的多数据来源就造成了多数据格式、多语义性、多比例尺、多存储格式等多个层次。同时,地理信息在分类编码、图层分层上没有的统一标准,造成基础数据共享和跨部门协作的难度。在空间数据的使用过程中,不同操作人员的认知理解及其它一些主观因素也会导致不确定性出现。

(2)多语义性差异

对于同一个地理信息单元,在现实世界中其几何特征是一致的,但是却可能对应着多种语义,如森林的类型、林木的特征等等,按森林的作用可以将其分为分类:防护林、用材林、经济林、薪炭林、特种用途林。应用于不同问题的侧重点也有所不同,因而会存在语义上的分歧。

(3)多时空性和多尺度性

数据具有很强的时空特性。同一个数据源中既有同一时间不同空间的数据,也有同一空间不同时间的数据。不仅如此,根据系统需要而采用不同的尺度对地理空间内的信息进行表达,会用到不同的比例尺和不同的精度。

(4)地图投影差异

地图投影是通过数学方法,建立地球面上点的坐标(B,L)与地图平面上点的坐标(X,Y)之间一一对应的关系。是实现信息定位和信息可视化的基础。地图投影的实质是一一对应的函数关系,保证了空间信息在区域上的联系与完整性。在投影的过程会产生投影变形,变形的大小及性质会因为投影方式的不同而产生一定差异。在调查过程需要对数据进行相应处理,如格式转换、投影变换、误差校正等也存在不确定性。

(5)坐标系的差异

不同地区和国家都根据自身情况,选择适合本国的坐标系统。不同的国家和地区,根据自身情况获得大地原点的大地起算数据和基准面,建立了适合本国的国家坐标系。我国境内常用的坐标系有:新1954北京坐标系(新BJ54)和WGS-84坐标系。

另外,空间基准是随时间变化而变化的。例如WGS-84坐标系,这种坐标系的主要参数,每隔一定的时间就会重新测定一次,这就意味着采集到的空间数据即使使用了同样的大地坐标系,由于使用了不同的时间参数,也会造成空间数据不一致的问题。

1.3 多源空间数据不一致的主要表现形式

根据以上提到的空间数据的三个基本特征:空间特征、属性特征、时间特征,多源空间矢量数据处理中的不一致主要体现在几何位置、属性特征和要素关系三个方面。

(1)几何位置不一致

遥感技术是现代高科技之一,借助遥感手段获取信息具有周期短、信息量丰富等优势。遥感数据正以指数级增长。由于遥感影像因其获取手段先进、现势性较好且能提供更为准确的几何位置信息,一直以来空间数据更新中都是基于影像更新矢量数据中同名要素的几何位置,但是在许多方面遥感影像、矢量数据和栅格数据都存在差异。如表1所示:

在投影方式层次来看,遥感影像多采用中心投影方式,因为遥感技术采用全景投影和斜距投影会产生较大的变形误差。数据处理后的矢量数据或栅格数据采用的是高斯一克吕格投影。在表示方法层面,遥感影像仅是只纪录各种地物电磁波大小的胶片(或相片),是以影像形式表现出来。而矢量数据一般通过地图符号、坐标、颜色、文字和其它地图语言等多种形式将实体对象的空间位置表现出来。而栅格数据是按网格单元的行与列排列、具有不同灰度或颜色的阵列数据。在时间层面来看,遥感影像是拍摄的那一固定时间的结果,矢量数据则是一个累计的过程即一段的信息编辑处理后的加工成果,而栅格数据是特定时间的结果。从以上三个层面可以看出,不同格式之间的转换必然会造成同名要素几何位置的差异。

(2)属性特征的不一致性

在实际应用过程中,通过各种方法采集的数据要经过相应的分析与处理。由于不同部门对空间数据的实际需求不同,其分类分级的方式有很大差异,导致属性特征的表达更是千差万别。概括起来,多源空间数据属性特征的不一致主要有以下几方面内容。

①要素分类分级的不一致

分类是将共同属性特征的事物划分到一起,分级是在一类对象的基础上,按特定差异标准进行分级。常见的分类分级方法有线分类分级法(国家基础信息数据分类方法)、面分类分级法和混合分类分级法(即线面分类结合)。多源数据的分级不一致主要体现在所采用的分级原则及指标上。如森林资源可以按森林的作用的分类(防护林、用材林、经济林、薪炭林、特种用途林)、按人为影响的程度分类(原始林、次生林和人工林)、按林木特征的分类、按森林的自然属性的分类。

②属性特征表达的不一致性

属性字段描述的内容主要是由该地理要素在不同数据中的用途决定的,因此不同数据在描述同名实体上,可能存在:属性字段的数量、属性字段的类型、属性字段的含义等方面的不一致。

(3)要素关系不一致

多比例尺地图中同名对象之间关联关系的建立和动态维护是多尺度空间数据级联更新的关键技术环节,是更新得以传递的桥梁和纽带。在多源空间矢量数据的加工处理过程中,同名实体要素关系之间可能会产生许多冲突。如小比例尺数据的更新操作往往以大比例尺的数据作为基础,在进行缩编过程的中,大比例尺地图上的各种元素之间的距离会按不断地相对缩近,达到某种程度时,相离的元素可能变成相接或重叠的,这就造成了不同元素间拓扑关系的变化。

2 多源空间数据的一致性处理方法

2.1 几何位置的一致性处理方法

几何特征更新主要有两个研究方向:一是多尺度矢量数据之间通过几何匹配来实现同名实体的几何特征更新;二是基于影像实现矢量数据中同名实体的几何特征更新。

(1)几何位置一致性处理的基本方法

多源空间数据的几何位置一致性处理的基本方法主要有空间基准转换、数学基础变换和几何位置的配准与纠正。国内外许多专家对不同空间直角坐标系之间的坐标转换作了大量研究,成熟的转换模型有三参数坐标转换模型、七参数坐标转换模型等。数学基础变换主要是指地图投影变换,主要解决多源空间数据的地图投影不一致问题,研究并实现多种地图投影的正反解变换。几何位置配准与纠正的实质是根据原始数据的几何畸变特点,采用一种几何变换将原始数据归化到目标数据的坐标系中。其中空间基准转换和数学基础变换是消除几何特征差异的前提,主要包括大地坐标系统变换、地图投影解析变换、地图投影数值变换、常用讳度函数正反解变换、等高线制式转换等方法。

(2)基于影像的矢量数据几何位置一致性处理

矢量数据更新中通常是基于影像更新矢量数据,这种更新模式在应用过程中的关键,就是基于影像实现矢量数据中同名实体的几何位置一致性处理,消除它们之间的几何位置不一致。由于对影像和矢量数据进行几何位置一致性处理比较困难,从而提出了一种通过构建影像与矢量之间的控制点集,利用三角剖分实现两种数据的几何位置一致性处理的方法。

(3)几何位置一致性基本流程

对于处理几何位置一致性基本流程为:先进行空间基准转换与数学基础变换,然后进行影像与矢量数据的控制点识别匹配,最后通过基于同名点三角剖分的几何位置变换来实现几何位置一致,并通过实例分析去验证针对几何位置一致性处理技术方法的可行性。

2.2 属性特征的一致性处理方法

针对导致数据属性特征不一致的两个方面,提出如下两类处理方法:

(1)分类分级“化繁为简”

虽然不同区域、不同部门的要素分类分级存在多样性与多变性,但是数据的分类分级主要表现为两种关系:从属关系和并列关系。通过要素关系分类分级的映射,将不同来源数据的诸多繁杂分类分级,最终简化抽象为从属关系和并列关系两种。映射的实现首先要全面细致的分析不同来源数据各自的分类分级方法,然后理清要素分类分级之间的联系,依据相应的原则实现映射。对于分类分级映射的具体操作要注意:对于分类分级的标准的合理性、在整个映射内部的系统性、整个体系的完备性。

(2)属性特征项抽取与转换

在属性特征项的抽取和转换的过程中,主要应用三大类规则文件:转换控制文件、对应控制文件、结构定义文件。

①转换控制文件:该文件定义源数据中每个层级要素是否需要转换,以及转换时所调用的层要素对应控制文件。

②层要素对应控制文件:每层要素对应一类控制文件,该类文件有着重要的作用,文件中抽取了源数据及目标数据的相应属性特征项,同时描述了源数据的属性与转换数据属性,以及属性项的概念映射关系。为了提高准确性应采用多对一或多对多的对应关系,最大限度的保留源数据的属性信息,采用多个字段对应转换数据的一个属性以及若干属性项。层要素对应控制文件结构如图1所示。

③结构定义文件:定义了转换数据中每一类要素的:属性字段及其长度、类型、默认值等信息,此文件的结构往往是多变的,它会根据目标数据的情况(要素分类、属性特征)加以组织定义。

多源空间数据中属性信息一致性处理方法的研究属性特征的一致性处理流程

2.3 要素关系一致性处理

(1)要素关系的描述

空间要素主要分为点、线、面三种要素。空间关系信息主要涉及几何关系的“相接”、“相邻”、“包含”等信息,它通常用拓扑关系或拓扑结构的方法来分析。(拓扑关系是明确定义空间关系的一种数学方法,与图、要素关系是相通的。)从拓扑的角度出发,侧重的是空间的点、线、面之间的位置关系,而不管实际图形的几何形状。因此,即使图形的几何形状相差很大,它们的拓扑结构却可能相同。按照拓扑学的原理,拓扑元素主要有三种基本类型:结点、弧段和面域。

要素关系一致性处理算法的复杂度和拓扑关系划分的详细程度成正比。所以需要对拓扑关系进行了适当合理的简化,主要处理要素关系处理中常用到的点一线、线一线和线一面拓扑关系。

(2)要素关系处理的基本方法

根据实际情况对于不同类型的要素关系,其一系列处理方法也各不相同,对于要素关系的基本处理方法有位移、合并与分割、删除、化简等。

①位移 涉及到地图比例尺的缩小时,用符号表示的各个物体之间位置关系变得模糊甚至覆盖到一起。通过图解位移来保证各要素总体结构的完整性、适应性,相似性,此操作应用最为广泛。

②合并与分割 涉及到比例尺缩小时,为了反映其主要特征,当某些物体的图形面积或间隔小于分界尺度时,可采用合并同类物体的碎部。分割与合并恰恰相反,它是分割次要实体来达到消除冲突的目的。

③删除 删除的目的是减少要素种类;同类要素中删除对是减少同类要素的数量。对整体空间的分布不会产生影响的无关实体常常作为删除的对象。

④化简 为了减少弯曲,主要应用于线状地物,如单线河、等高线等,对于面状地物主要是化简其边缘轮廓。通过化简一些次要的实体特征,避免与重要实体之间的冲突。

3 结束语

多源空间数据一致性处理技术是提高生产与更新数据质量和效率的重要途径,可以促进空间数据的共享和集成,快速持续的更新地理空间数据库,提高地理空间数据的现势性,充分挖掘并利用海量空间数据中所蕴含着的、丰富的地理信息。鉴于多源空间数据一致性处理的复杂性,多源空间数据间不一致性智能化检测和处理方法是今后研究发展的趋势。