1∶10 000面实体要素网格化描述较优级的选取

2022-01-17 06:38王小军王焕萍
地理空间信息 2021年12期
关键词:真值网格化实体

王 程,王小军,赵 龙,张 号,王焕萍

(1.自然资源部陕西测绘产品质量监督检验站,陕西 西安 710054;2.自然资源部测绘标准化研究所,陕西 西安 710054)

现有的地理空间数据存在形式多样,种类繁多、关系复杂等特点,用于描述各类实体要素(地理空间数据中对现实世界现象(实体)的抽象描述)的数据也十分复杂,按表达形态进行分类,实体要素可分为点、线和面实体要素。研究不同实体要素与地球空间网格对应关系,实现实体要素的网格化离散,利用适宜级的地球空间网格单元表达,能够推进地球空间网格地理信息的组织、表达方式,更好地发挥其作为信息整合、管理的作用。本文主要研究1∶10 000 常用比例尺下,面实体要素的表达精度,确定面实体要素网格化描述的地球空间网格的较优级[1-5]。

1 面实体要素网格化描述较优级选取的方法

面实体要素网格化是在确保据数据精度的基础上,利用地球空间网格对面实体要素进行网格化离散,通过选定适合级的地球空间网格单元,将面实体要素离散为一系列紧密关联的空间单元集合。网格化离散能够为多维、多源、多尺度空间数据的一致性关联、新型空间索引建立提供解决方案,促进多源空间数据统一组织、融合和管理,消除数据间的不一致、矛盾和冲突情况,提高空间数据融合、管理及应用的效率,满足统一化、精细化管理的需要。地球空间网格共分为33 级,各级地球空间网格所表示的空间范围固定,而不同实体要素大小、范围和几何特征不相同,不同比例尺其精度也不同,若选取的网格过大(级过低),则不能够准确的表达面实体要素,损失其精度。选取的网格过小(级过高),会增加数据量,造成数据冗余,降低索引速率。因此,合适的地球空间网格级的选取是面实体要素网格化离散表达的关键。

面实体要素网格化描述的较优级需要按照其表达精度和尺寸确定,在保证数据精度基础上利用合适大小的网格单元,描述面实体要素的形状、分布、大小和地理空间位置。首先需要确定面实体要素网格化描述级范围,在选择合适的网格级范围内,才能进一步找到较优级。在确定网格化描述级范围后,通过选定判别因子,统计分析结果,最终找到面实体要素网格化描述较优级。

1.1 面实体要素网格化描述级范围的确定

根据《基础地理信息数字成果1∶5 000 1∶10 000 1∶25 000 1∶50 000 1∶100 000 数字线划图》和《1∶5 000 1∶10 000 地形图航空摄影测量内业规范》中的规定:“地物点相对邻近野外控制点的平面位置中误差平地、丘陵地不大于5 m;山地、高山地应不大于7.5 m”[6];“地物点对附近野外控制点中误差分别在平地、丘陵地不大于0.50 m;在山地、高山地不大于0.75 mm 的规定”[7]。将这2 个指标解算到地面约为5 m 和7.5 m,限差约为10 m 和15 m,可以确定1∶10 000 面实体要素的平面位置精度应在5 m 和15 m 之间。而22~24 级地球空间网格赤道附近边长在15.5~3.9 m 之间[5],由此可得,1∶10 000 面实体要素网格化描述的级对应范围为22~24 级网格。

1.2 面实体要素网格化描述级选取判别因子的确定

面实体要素网格化较优表达可以通过面积差比指标来进行判断,即面实体要素的网格面积与实体要素本身的面积(面实体要素的矢量面积作为真值,以下简称面积真值)之差的比值越小,越接近零,说明网格化表达越优,网格化图形更接近面实体要素。正确的统计网格面积,对正确计算面积差比有重要的影响。面实体要素网格化,对于实体要素内部,面积统计可以直接计算网格总面积(即网格面积×网格总个数)。对于边缘网格(面要素边界落入的网格),如何统计其面积,确保面实体要素的网格面积计算能够最准确,是解决问题的关键。本研究通过计算面实体要素在边缘网格的面积占比,并利用不同的面积占比阈值,作为边缘网格是否统计面积的依据,找到边缘网格的最优面积占比阈值,准确统计网格面积。并统计在最优面积占比阈值下,各面实体要素在不同的网格级,计算得到的网格面积与面积真值的差比,找出1∶10 000比例尺下,面实体要素网格化的较优级,即面实体要素网格化的较优表达。

2 实验与分析

2.1 实验数据

本实验共选取9 幅1∶10 000 标准图幅DLG 面实体要素数据展开,选取了陕西省范围内不同地貌特征的典型区域进行。由于各矢量图幅中的面实体要素是按照类型进行分层表示的,如:HYDA 层为水系面层,LRDA 层为道路面层,所以,对面实体要素的相关面积统计是按照各图幅下的分层进行分类统计。

2.2 实验方法

通过统计各图幅面实体要素(以图层为统计单元)22 级到24 级网格面积,同时利用面实体要素矢量数据计算得到的面积真值,比较网格面积与面积真值之间的数据差异,统计分析确定1∶10 000 面实体要素较优表达尺度所对应网格大小(较优级)。

表1 试验数据情况简介

实验主要分为2 个部分:

1)最优面积占比阈值的确定。主要选取了网格面积与实体要素的面积真值之差比作为级选取的判别因子。网格面积计算的正确性将直接影响级的选取,而边缘网格面积的统计直接影响着网格面积计算的正确性。因此首先要确定边缘网格统计的正确性,即边缘网格最优面积占比阈值。实验阈值选定了10%,20%,30%,40%,50%,60%,70%,80%,90%,即对于边缘网格,面实体要素落入网格内部,其面积占比达到设定的阈值后,将网格面积统计在内,否则,不统计此网格面积。实验主要统计图幅内面实体要素在22~24 级的地球空间网格面积,对边缘网格分别计算不同面积占比阈值得到的网格面积与面积真值的差比,找到最接近面积真值的最优面积占比阈值。

2)较优级的选取。面实体要素网格化较优级的确定需要在保证数据精度的前提下,利用合适大小的网格单元对其进行描述,既要保证数据本身的精度,又要避免数据冗余。1∶10 000 面实体要素的平面位置精度在5 m 和15 m 之间,由此确定其网格化描述对应的等级范围为22~24 级。在找到边缘网格最优面积占比阈值的情况下,统计实验图幅中各面实体要素在22~24 级下,各图层面实体要素的网格面积与面积真值的差比,并对结果进行分析,找到1∶10 000 比例尺面实体要素网格化描述较优级。

2.3 结果分析

1)通过对9 幅实验图计算各面实体要素在22 ~24 级网格下,对边缘网格的不同面积占比阈值统计,得到的网格面积与面积真值的差比结果可知,边缘网格面积占比阈值过小或者过大,都不能够正确的表达面实体要素的网格面积。随着阈值的变化可以发现,阈值选定离50%越远,统计得到的面实体要素的面积真值与网格面积差比越大,越难正确的表达面实体要素的面积。

实验结果表明,所有实验图幅在22、23、24 级,均以50%面积占比阈值统计得到的网格面积与面积真值的差比最小,最接近实体要素面积真值。对于边缘网格而言,面实体要素与网格相交,面积占比大于网格面积的50%,才将其面积统计在内。由此可知,50%面积占比阈值为边缘网格的最优面积占比阈值,如图1所示。

图1 不同面积占比阈值下面积真值与网格面积差比统计图(部分图幅,23 级)

2)通过统计实验图幅在最优面积占比阈值(50%)下22~24 级网格面积与面积真值之差比(见图2)发现,在所有实验图幅中,22 级网格面积与面积真值的差比最大为-82.42%;23 级网格面积与面积真值的差比最大仅为-4.64%;24 级网格面积与面积真值的差比最大为10.84%。从22 级到23 级间网格面积与面积真值的差比变化速率最大,而从23 级到24 级间网格面积与面积真值的差比变化速率相对较小。由此可见,面实体要素利用23 级网格计算得到的网格面积与面积真值较为接近,表达效果较好。

图2 各级面实体要素网格面积与面积真值差比统计图(50%面积占比阈值)

综上所述,在考虑数据的表达精度和尺寸的前提下,23 级网格能够较好的对1∶10 000 面实体要素网格化进行描述。

3 结 语

本文以地球空间网格理论为基础,对1∶10 000 比例尺面实体要素网格化表达较优级进行研究,根据1∶10 000 面实体要素的平面位置精度,确定其网格化描述对应的级范围为22 ~24 级。利用网格面积与面积真值的差比为判别指标,找到了边缘网格统计面积的最优面积占比阈值为50%。在此基础上,通过实验统计得到从22 级到23 级间网格面积与要素面积差比变化速率最大,23 级的网格面积与要素面积差比值较小,多集中在0~1%之间。在考虑数据的表达精度和尺寸的前提下,选取23 级网格作为1∶10 000 面实体要素网格化描述的较优级。本实验结果进一步验证了利用比例尺精度确定实体要素网格化描述适合级的可行性。然而本实验目前仅完成了某一特定比例尺下的某一类实体要素的网格化级选取工作,需要进一步研究完善。下一阶段将加大样本选取量并选择不同比例尺下实体要素开展实验,进一步确定不同比例尺实体要素描述所需的较优地球空间网格级,找到其规律。

猜你喜欢
真值网格化实体
以党建网格化探索“户长制”治理新路子
前海自贸区:金融服务实体
城市大气污染防治网格化管理信息系统设计
实体的可感部分与实体——兼论亚里士多德分析实体的两种模式
10kV组合互感器误差偏真值原因分析
两会进行时:紧扣实体经济“钉钉子”
振兴实体经济地方如何“钉钉子”
化解难题,力促环境监管网格化见实效
网格化城市管理信息系统VPN方案选择与实现
真值限定的语言真值直觉模糊推理