地质图空间数据库两种建库模式比较

2013-05-30 03:19刘福魁左群超曹世欣倪振平
中国矿业 2013年5期
关键词:属性数据数据模型图层

刘福魁,左群超,曹世欣,倪振平

(1.山东省地质调查院,山东 济南250013;2.中国地质调查局发展研究中心,北京100037;3.山东省地质环境监测总站,山东 济南250014)

建国以来,经过山东省广大区域地质调查工作者的努力,形成了一大批采用野外人工定点、手工记录等“传统填图”方法取得的填图成果,这些以纸介质为载体的成果涵盖了全部1∶20万和大部分1∶5万、1∶25万标准图幅。数字国土工程开展以来,山东按照中国地质调查局的统一部署,逐步对以往纸介质成果地质图开展了地质图空间数据库建库工作。上述3种比例尺的地质图建库时,都基于矢量表达地质和地理内容。较早完成建库的地质图幅中包括了全部1∶20万和少量1∶5万地质图,后期为了保持数据格式的一致性,剩余1∶5万地质图幅在建库时,仍采用了和前期1∶5万和1∶20万地质图建库相同的地理关系数据模型;而稍后才开始建库的1∶25万地质图幅,则采用了较先进的面向对象数据模型(又称地理数据库模型)。

建库工作中应用的地理信息系统(GIS),是采集、贮存、管理、分析和描述整个或部分地球表面(包括大气层在内)与空间和地理分布有关的数据的空间信息系统[1]。它主要涉及与空间几何特征有关的空间数据、记录空间数据特征和说明信息的属性数据及相关拓扑关系的组织和管理,具有数据量大、应用面广、数据模型复杂的特点。空间数据库作为GIS的核心,是GIS技术发展的基础,而空间数据模型是空间数据库的基础和核心。空间数据模型是寻求一种描述地理实体的有效的数据表示方法,根据应用要求建立实体的数据结构和实体之间的关系以便于应用[2]。

1 空间数据模型的发展历程

空间数据模型的发展至今已历三代:计算机辅助设计模型的代表,CAD数据模型;地理关系数据模型的代表,Coverage数据模型;面向对象数据模型的代表,Geodatabase数据模型。

1.1 CAD数据模型

出现于20世纪60~70年代,它用点、线、面描述空间实体,存储采取二进制文件格式。几何要素与相关的颜色、形状等属性要素存放在一起。其缺点是只能存储少量的属性数据,不利于空间信息的描述和 GIS分析[3-6]。

1.2 Coverage数据模型

源于ESRI公司1981年推出的ArcInfo软件,采用分层结构对空间数据进行组织管理,用建立了索引的二进制文件存储点、线、面描述的空间实体数据。ESRI公司1996年将以二维表为基础的关系数据库管理系统(DBMS)引入数据模型中,属性数据就被存储在DBMS表中;空间数据和属性数据通过公共的标识编码关联,实现了空间数据与属性数据的有机结合。不仅如此,它还存储了矢量数据间的拓扑关系。因此Coverage数据模型提高了对地理空间信息的表达能力和数据的分析能力。

但Coverage数据模型将空间数据和属性数据存储的方式,已很难适应于以海量数据和并发处理为特征的企业级和社会级的GIS应用;另外拓扑结构不够灵活,局部的变动必须对全局的拓扑关系重新建立[3-6]。

1.3 Geodatabase数据模型

是ESRI公司在ArcInfo 8之后引入的一个全新的数据模型,融入了面向对象技术,是建立在DBMS之上的统一的、智能化的空间数据库。面向对象的数据模型与人们认识事物的观点和分类方法很接近,因此直观且简单实用。

在Geodatabase数据模型中,为描述由现实地理世界抽象出的数据,引入了要素、对象和关系的概念,其中非空间实体被抽象为对象,空间实体被抽象为要素,数据对象间的关联被抽象为关系。相同类型的对象构成对象类,对象类没有空间特征,但每个对象类都有其属性、行为和规则;相同类型的要素构成要素类,一组具有相同空间参考的要素类组成要素数据集。数据对象之间的关系规则构成的关联集合构成关系类[3-6]。

2 以Coverage数据模型为基础的1∶5万地质图的建库模式

2.1 1∶5万地质图空间数据库中的数据组织

以Coverage数据模型为基础进行的1∶5万地质图空间数据库建设,实行水平分幅、垂直分层的数据组织管理方式。

在1∶5万地质图空间数据库中:图元是图面上表示空间信息特征的基本单位,分为点、弧段(线)、多边形(面)三种类型。图层作为空间数据集合,由相同类型的图元和描述这些图元特征的属性数据共同构成。描述图层中所有图元特征的属性数据的集合构成属性表。由于每个图层对应的空间实体对象特征不同,与其对应的属性表的数据结构也不同;数据项是属性表中最小单元,规定了明确的数据类型,用于存放描述图元某一方面特征信息的属性数据。

由于水平分幅,为保证多幅图拼接后每个图形信息及相应属性信息的独立性,防止图层名重复出现,“1∶5万区域地质图空间数据库(分省)建设实施细则”对图层的划分和命名都作了详细的规定,每个图层属性表的名称与图层名相同。如图1所示。

2.2 MapGIS中1∶5万地质图空间数据库数据组织的实例

1∶5万地质图空间数据库的建库应用了MapGIS软件6.7前的版本。图2为山东省1∶5万黄墩幅地质图空间数据库,由图层文件列表栏可知黄墩幅由30个图层文件构成。主窗口显示的局部图面内容以3个面图层为主,分别是表达 “面状水体”的地理图层 “LEHDF02S”、表达地质图层“沉积地层单位和火山沉积地层单位”的“DEHDF01D”和 “变质岩系地层单位”的“DEHDF01B”。 在 图 2 所 示 范 围 内,“LEHDF02S”有1个图元,“DEHDF01D”有3个图元,“DEHDF01B”有4个图元。

主窗口内因被选中而呈红色显示的图元属于“DEHDF01B”图层,“区属性编辑”对话窗口展示了该图层属性表的部分数据项及其中所填写的被选中图元的属性。黄墩幅中“DEHDF01B”图层有24个图元,在以“DEHDF01B”命名的DBF格式的属性表中相应的有24条属性数据记录。属性数据在1∶5万地质图空间数据库中起着重要作用,是查询、更新、检索和分析等操作的基础[7]。

图1 构成1∶5万地质图空间数据库的图层

图2 MapGIS中1∶5万地质图空间数据库数据组织示意图

表1展示的是“DEHDF01B”和“DEHDF01D”2个地质图层属性表的结构。从中可以看出,不同图层属性表的数据项个数、名称、数据类型都不相同;既使名称和数据类型都相同的数据项,其数据长度也不一定相同。

3 以Geodatabase数据模型为基础的1∶25万地质图的建库模式

3.1 1∶25万地质图空间数据库中的数据组织

以Geodatabase数据模型为基础进行的1∶25万地质图空间数据库建设,把数据组织成关系型的数据对象。在“数字地质图空间数据库标准”中建立了15个基本要素类,8个综合要素类,12个对象类,5个独立要素类。空间对象以要素类来存储,非空间对象以表来存储;关系以关系类来存储,关系可以存在于空间对象(要素类中的要素)之间、非空间对象(表中的行)之间、空间对象和非空间对象之间。

地质图中具有空间几何特征的地质和地理实体,以点、线、面的形式由要素类数据集和综合要素类数据集表达;其中要素类具拓扑关系,综合要素类与要素类的关系不具拓扑关系,是覆盖关系。对象类表达基本要素类和综合要素类的属性,用ACCESS表来存储。独立要素类表达地质图附属的图例、柱状图和责任表等图外内容。

表1 两个图层属性表结构对比

由表2可以看出1∶5万地质图空间数据库中参与拓扑的“DX△△△01D”和“DX△△△05M”等8个独立的图层,因为应用面向对象技术的理念,按“1∶25万区域地质图空间数据库建设技术流程及实施细则”中的规定,被合并成“_GeoPolygon”一个图层。

表2 1∶25万和1∶5万地质图空间数据库图层关系对比

3.2 RGMapGIS中1∶25万地质图空间数据库数据组织的实例

21世纪初,中国地质调查局主导开发的“数字地质调查系统(RGMap)”首先在25万区调项目中开展试点,该系统贯穿了从野外地质调查到最终建成1∶25万地质图空间数据库的整个过程,为保持数据格式的一致,对前期人工完成的纸介质1∶25万地质图建库时,也采用了RGMap的室内综合整理与数据处理子系统(RGMapGIS)[8,9]。

应用RGMapGIS建立了山东省1∶25万淄博市幅地质图空间数据库。在基本要素类“_GeoPolygon”图层中的地质和地理空间面实体有5个需人工录入的共同属性数据项:①地质体面实体标识号(ID号)、②地质体面实体类型代码(地质体符号)、③地质体面实体名称(地质体中文名称)、④地质体面实体时代、⑤子类型标识。子类型标识用1位整型数值表示,可据此使用RGMapGIS的“自动从地质体面实体提取相应对象类”功能,从“_GeoPolygon”图层中提取相应对象类。如存储“沉积地层单位和火山沉积地层单位”属性的对象类数据集(_Strata),其子类型标识是“0”;运行自动提取功能后,上述5个共同属性数据项中与“_Strata”有关图元的属性数据会被自动继承下来。但数据项名称会依据对象类数据集的不同而改变,如“地质体面实体类型代码(地质体符号)”更名为“要素分类(地质代码)”。

对象类数据集(_Strata)在继承下“_GeoPolygon”图层5个共同属性数据项基础上,又扩展出“岩石组合名称、岩石组合主体颜色、岩层主要沉积构造、生物化石带或生物组合、地层厚度、含矿性”等数据项。其它对象类数据集也做了类似的数据项扩展。

4 1∶5万和1∶25万地质图空间数据库2种建库模式比较

因为地质图空间数据库建设依据的数据模型不同,所以1∶5万和1∶25万地质图空间数据库的数据组织管理方式也不同。

4.1 空间数据组织管理的不同

1∶5万地质图空间数据库,在建库过程中实行水平分幅、垂直分层的数据组织管理方式。水平分幅与当今成果地质图分幅出版、存贮的现状相适应。但由图2、表2可以看出,垂直分层将一幅地质图中参与统一拓扑的地质和地理空间面实体分成了“DX△△△01D”和“LX△△△02S”等8个独立的图层。

这样的方式人为地割裂了所要表达的地质和地理空间,不能直观反映人们的感知,也不能表达不同类型和实体之间的空间拓扑关系和语义关系。地质图空间数据库中参与拓扑的任意一条弧段,一般都有左右2个相邻的多边形。这时变动某个图层中的一条弧段就会带来问题,如果该弧段左右相邻的多边形不在同一个图层中,考虑到还可能涉及不参与拓扑的图层,则最少需要在2个图层做2次修改,才能保持各空间实体之间拓扑关系的一致性。

1∶25万地质图空间数据库在建库时,仍采用水平分幅,但将“DX△△△01D”等8个独立的图层用一个基本要素类图层“_GeoPolygon”表达,避免了上述问题的存在。

4.2 属性数据组织管理的不同

图3所显示的属性数据的存储,上部是1∶5万地质图空间数据库采用的DBF表,下部是1∶25万地质图空间数据库采用的ACCESS表。二者除了数据存储格式的不同,1∶25万地质图空间数据库的属性数据之间在“关联、依赖”关系之外,还多了“组合、继承”关系。

图3 1∶5万和1∶25万地质图空间数据库中属性数据存储对比

图3 上部是山东1∶5万黄墩幅地质图空间数据库“DEHDF01D”图层中各图元的属性。从图3中可以看出“DEHDF01D”图层中各图元都有如表1所示、由9个数据项所组成的属性数据结构,每个图元都需要录入这9个数据项中的数据。黄墩幅“DEHDF01D”图层中有很多特征相同的图元,它们的属性数据也是相同的。仅在图3有限可视范围内,“DEHDF01D”属性表中就有3个“沂河组”图元、2个“莱阳群城山后组”图元的重复属性记录,形成了很大的数据冗余。导致修改某个图元的属性数据时,属性表中所有同类图元的相关记录都要修改,才能保证图元属性的一致。

图3下部是山东1∶25万淄博市幅地质图空间数据库中“_Strata”对象类的属性。由前述可知,在基本要素类“_GeoPolygon”图层中各图元有5个共同的属性数据项,每个图元都需要录入这5个数据项中的数据,但这些属性数据都可以被地质图空间数据库中各个对象类自动继承下来,不需要重新录入。另外可以看出,“_Strata”对象类属性表中没有重复的属性记录。也就是说,在“_GeoPolygon”图层中所有特征相同的图元,在与其对应的对象类属性表中只用一条记录进行表达。

所以1∶25万地质图空间数据库采用的这种属性数据组织管理方式,直接降低了数据冗余、减少了重复录入工作量,也给修改属性数据带来很大便利。

5 结论

与以地理关系数据模型为基础建成的1∶5万地质图空间数据库相比,以面向对象数据模型为基础建成的1∶25万地质图空间数据库,不仅可以将空间数据和属性数据有效地融合在一起,并且能直观反映各空间实体之间的拓扑关系,有效降低数据冗余、减轻建库工作量。这种建库模式适应了以处理海量数据和并发操作为特点的GIS应用发展趋势,对于处理复杂的地质和地理空间对象具有很大的优越性。

如果面向对象数据模型在根本意义上实现面向对象,必然会为GIS提供更加灵活高效的存储管理机制,也将给予GIS更好的发展前景。

[1] 龚健雅.地理信息系统基础[M].北京:科学出版社,2001.

[2] 魏少春,梁焕炎.浅谈地理信息系统中的空间数据模型[J].地矿测绘,2006,22(3):21-23.

[3] 叶亚琴,左泽均,陈波.面向实体的空间数据库模型[J].地球科学:中国地质大学学报,2006,31(5):595-599.

[4] 李国标,庄雅平,王钰华.面向对象的GIS数据模型—地理数据库[J].测绘通报,2001,6(6):37-39.

[5] 郭新慧,张和生.第三代地理数据模型—Geodatabase及其实现[J].太原科技大学学报,2008,29(1):5-8.

[6] 陈静,张树文.第三代地理数据模型及其实现[J].三晋测绘,2003,10(2):7-9.

[7] 刘福魁,马莉,蔡青.矿产资源潜力评价成果图空间数据库中属性数据质量检查探讨[J].山东国土资源,2013,29(1):31-34.

[8] 李超岭,杨东来,李丰丹,等.中国数字地质调查系统的基本构架及其核心技术的实现[J].地质通报,2008,27(7):923-944.

[9] 李超岭,杨东来,于庆文,等.数字地质调查系统操作指南(中册)[M].北京:地质出版社,2011.

猜你喜欢
属性数据数据模型图层
为《飞舞的空竹龙》加动感
城镇地籍数据库建设过程中存在的问题和注意事项
基于GIS的房产测绘管理信息系统架构研究
无源多传感器综合数据关联算法研究
属性数据分析教学改革初探
面板数据模型截面相关检验方法综述
解密照片合成利器图层混合模式
经济全球化对我国劳动收入份额影响机制研究——基于面板数据模型
基于数据模型的编程应用
用Photoshop图层技术制作精美邮票