地理空间数据库质检平台设计

2022-10-31 12:04李鹏辉周自翔刘文涛
地理空间信息 2022年10期
关键词:质量检查字段边界

贾 斌,李鹏辉,李 蕾*,周自翔,李 昱,刘文涛

(1.西安市勘察测绘院,陕西 西安 710054;2.西安坐标原点地理空间研究院有限公司,陕西 西安 710054;3.西安科技大学测绘科学与技术学院,陕西 西安 710600;4.中国建筑西南勘察设计研究院有限公司,四川 成都 610052)

随着社会的不断发展与变革,人们对地理数据的要求也在不断提高,如国土资源“一张图”工程便是将多种应用的功能叠加,以构建统一的综合管理平台[1-2],因此,对于地理空间数据库的质检平台设计显得十分必要。而只有建立高质量的数据库,才能更好地为后续规划与建设服务[3-4]。

数据质检系统保证了数据的质量检查,很好地提高了地理信息数据入库的效率[5-7]。质量检查是地理数据质量控制中不可缺少的环节,现有数据库质检软件通常为某一特定项目设计,缺乏灵活性[8-14]。不仅如此,数据库设计也是一个不断优化的过程[15],需要多方面的支持和配合才能完成[16-17]。

论文针对数据库的一般操作人员设计地理空间数据库质检平台,以关联属性字段、提示属性字段及空间关系为考量依据,对程序集结构合理性再构思,期望设计出方便解析、易于移植、易于表达、主次分明的对象序列化平台。

1 数据库质检平台分析

地理空间数据库质检平台的设计主要包括空间属性质量检查、空间图形质量检查以及关联检查。对于空间属性质量检查主要是对数据表的检查,首先是对接mdb、gdb以及shp数据,在获取数据实例后应区分路径、区别特征以及子内容特征;其次是自定义关系规则(长度规则、唯一性规则、空规则、身份证规则、包含性规则、单字段值规则、多字段值规则、多表多字段关系等);最后是对数据表再进行进一步检查。空间图形质量检查主要是针对图形的拓扑检查,是基于九交模型对图形与图形相互之间的内部、边界与外部关系模拟分析(包含、覆盖、交叉、分离、封套相交、相等、内部、相交、重叠、接触及包含于等关系),逐一筛检,检查图形拓扑关系的合理性与正确性。而关联检查是检查图形与属性之间的一致性与完整性,主要有逻辑一致性检查和完整性检查等。其质检平台总体设计流程图,如图1所示。

图1 质检平台设计流程图

2 质检平台设计

2.1 空间属性质量检查

基于Data Table进行数据检查,是对非空性质(无值或非空)、唯一性(单子段或多字段)、长度、范围多字段关系、包含性、连接字符串等内容进行全字段的字典检查。其中,多字段关系检查主要包括文本字段关系检查与数字字段关系检查;包含性检查主要是检查字段的起始包含、结束包含及任意包含;连接字符串检查即根据条件提取信息,如不动产单元号的检查与提取,就需先获取区域内所有户号为00001的不动产单元号信息,再逐一获取剩余户号信息,而论文将空间属性质量检查主要分为单属性表检查与多属性表检查进行设计。

2.1.1 单属性表检查

单属性表检查包括单表单字段检查和单表多字段检查,以唯一值即唯一指定值与组合字段唯一值为检查规则,分别对数字类型与文本类型进行检查。数字类型检查包括介于与未介于,等于与不等于,大于、小于、不大于且不小于等内容检查;文本类型检查包括包含与不包含,始于与止于,等于,长度,效率等内容检查。而主要检查关系有字段唯一性检查、字段内容长度检查、字段信息包含检查、字段内容字典检查、多字段关系检查、字段内容等于检查及字段内容范围检查。其中,字段唯一性检查又包括单字段检查和多字段检查;字段信息包含检查又包括字段内容起始检查、字段内容结束检查及字段内容包含检查;字段内容字典检查又包括字段全内容字典检查和字段部分(指定位置)字典检查;多字段关系检查又包括文本字段组合检查和数字字段计算关系检查。

2.1.2 多属性表检查

多属性表检查主要是指多表关联检查,包括多表单向关联检查和多表双向关联检查,分别是对数字类型与文本类型进行检查。数字类型检查是指对数字求和判断检查、数字差检查、数字均值检查、数字方差检查、数字有效个数检查等;文本类型检查是指对文本组合检查,文本拼接检查等。

2.2 空间图形质量检查

图形检查与属性检查不同,常规的拓扑检查首先需要加载默认的检查规则;其次需要在创建的地理数据库中添加要素数据集,并根据相应的规则循环创建所需拓扑规则,添加规则要素集并添加拓扑规则信息;最后需要获取并设置拓扑检查范围(默认全库、全范围检查),或可根据其数据空间参考关系灵活设置所对应的范围。

论文对其平台设计的图形检查主要分为一般拓扑规则检查和定制拓扑规则检查。一般拓扑规则检查包括图斑检查,自相交检查及点线面关系检查;定制拓扑规则检查主要包括节点距离检查与角度检查,将统一分为点关系检查,线关系检查,面关系检查以及点、线、面关系检查进行分述。

2.2.1 点关系检查

方法二:将a,b看成一元二次方程x2=3x-1的两根,用根与系数的关系分别求出a+b,ab的值代入式子得到18.

点关系检查主要包括点悬挂检查、邻近距或区域检查及点线距检查,其过程包括三步:第一步,获取总图点集几何数据;第二步,分点单项检查指定范围内的点集;第三步,并行分治检查输出结果。

2.2.2 线关系检查

线关系检查主要包括夹角检查、闭合检查、相交检查、自相交检查、重叠检查、线悬挂检查、伪节点检查及缝隙检查等,主要以构线去重、距离控制为原则。其具体过程包括三步:第一步,获取邻近点线距及总图边线集等几何数据;第二步,分析以一点圆心构成的圆与多段线形成的切割关系,描述最小位置,命令线段中节点个数逐点返回,构造结果集;第三步,对开始(临界值)位置进行描述,求交点并进行多线细化操作。

2.2.3 面关系检查

面面关系错综复杂,不仅需要分析同一图层面面关系,而且需要分析不同图层之间的面面关系。因此,基于九交模型,分析面关系检查类型,面A的内部、边界、外部和面B的内部、边界、外部分别对应不同的关系类型,可得出以下几种关系:面重叠关系、面相等关系、面相交关系、面交叉关系、面包含关系、面包含于关系、内部关系、封套相交关系、接触关系以及分离关系等。面重叠关系与面相等关系即是两个面的边界和内部相交或具有相同的边界和内部;面相交与面交叉关系即是两个面没有分离,一个面的内部和另一个面的边界和内部相交,但是它们的边界不相交;面包含关系即是一个面的内部完全包含了另一个面的内部和边界;面包含于关系是指一个面的内部和边界完全在另一个面的内部;内部关系是指一个面在另一个面的内部,但是与其边界不接触;封套相交关系是指两个面的外边界图形相交;接触关系是指两个面的边界相交,但是内部不相交;分离关系是指两个面的边界和内部不相交,其具体检查类型如表1所示。

表1 面关系检查类型

2.2.4 点、线、面关系检查

2.3 关联检查

2.3.1 逻辑一致性检查

地理空间数据的逻辑一致性检查是指地理数据关系上的可靠性,包括数据结构、数据内容和拓扑性质上的内在一致性。而对地理空间数据库的逻辑一致性检查主要是检查数据属性与相应的几何属性是否一一对应,是否存在数据结构、数据格式和属性编码混乱,以及是否有遗漏等问题。

2.3.2 完整性检查

数据库中的数据是由外界输入,而数据的输入往往由于种种原因,会造成输入无效或错误,使数据丧失完整性。而对于地理空间数据库的完整性检查主要是检查数据属性与相应的几何属性是否有缺失或多余,以及是否缺少图层信息或其他信息。

3 多线程加载数据优化展示

基于文章设计,加载了5个地理数据表,共7 215条属性数据,对此进行多线程优化速率测试。比较可知,开启4线程比非多线程耗时缩短了16.5 s,CPU使用率降低了1%,运行率提升了13%;开启8线程比非多线程耗时缩短了17.5 s,CPU使用率降低了1%,运行率提升了19%;总体速率提升了58.6%,如表2所示。

表2 多线程优化速率测试表

4 结语

地理空间数据库应用广泛,使其质量检查的要求更全面、具体。论文针对不同质检内容与属性,提出地理空间数据质量检查的设计思路,将地理空间数据库质检平台的设计分为空间属性质量检查、空间图形质量检查以及关联检查三部分。空间属性质量检查主要是字段检查,主要有文本检查和数字检查两部分;空间图形质量检查有点关系检查、线关系检查、面关系检查以及点线面相互关系检查;关联检查包括逻辑一致性检查和完整性检查,三部分检查设计相辅相成、互为补充,且具有较高的应用价值。

猜你喜欢
质量检查字段边界
守住你的边界
带钩或不带钩选择方框批量自动换
突破非织造应用边界
审计署赴江西省审计厅质量检查座谈会
意大利边界穿越之家
浅谈台湾原版中文图书的编目经验
人蚁边界防护网
混凝土防渗墙的几种特殊处理方法与质量检查
水利水电工程的施工质量控制探讨
无正题名文献著录方法评述