多尺度面实体的匹配方法研究

2017-08-31 13:33蓝振家郭庆胜刘纪平
测绘工程 2017年11期
关键词:同名格网算子

蓝振家,郭庆胜,刘纪平,王 勇

(1.武汉大学 资源与环境科学学院,湖北 武汉 430079;2.中国测绘科学研究院,北京 100830)

多尺度面实体的匹配方法研究

蓝振家1,郭庆胜1,刘纪平2,王 勇2

(1.武汉大学 资源与环境科学学院,湖北 武汉 430079;2.中国测绘科学研究院,北京 100830)

从多尺度面实体匹配的需要出发,分析地图综合所引起的一对多、多对多匹配关系,以及不同地图综合算子给同名实体所造成的差异,将一对一匹配关系的几何相似性度量模型和非一对一匹配关系的基于重叠度的面实体匹配方法相结合,采用指标阈值自动确定方法,建立一种新的适用多尺度变化的面实体匹配方法。最后以多个比例尺的居民地为实验对象,验证本方法的可行性和有效性。

面实体;多尺度;匹配;几何相似性;地图综合

同名实体匹配已经成为空间数据集成、空间数据自动更新、位置服务等空间数据处理的关键技术,是目前国内外学者研究的一个热点问题,例如,居民地、湖泊等面状地物的匹配[1-3]。已有的面实体匹配方法主要适用于相近比例尺的一对一关系匹配,大致有3类方法:①从单个面实体的几何特征出发,通过计算位置、形状、大小、方向等多特征的几何相似性来确定匹配实体[2,4-6];②利用降维技术,通过提取二维面实体骨架线,将二维面匹配问题转化为一维线匹配问题[7-8];③通过提取面实体空白区域骨架线,将面实体的匹配转换为空白区域骨架线网眼匹配[9]。在多尺度空间目标匹配方面,郭黎研究了基于面状拓扑要素关系的数据匹配技术[10],翟仁建研究了基于全局一致性评价的多尺度矢量空间数据匹配方法[1]。然而,当数据源的比例尺差异较大时,地图面状目标匹配受地图综合的影响比较大,同名实体以一对多、多对多匹配关系为主,并且有少量其它的匹配关系。因此,本文从多尺度面实体匹配的需要出发,分析了不同地图综合算子给同名实体所造成的差异,将几何相似性度量模型和基于重叠度的面实体匹配方法相结合,建立了一种顾及地图综合因素的能适应多尺度面实体匹配的新方法。

1 多尺度地图同名实体的差异性

不同地图空间的同名实体之间有差异原因:地图综合、实际变化以及数据误差[11],其中,地图综合是不同比例尺地图空间的同名实体有差异的主要原因[1]。地图综合算子在地理空间数据的综合包括目标选取、目标简化、多目标的合并、移位、夸大以及典型化[12-14,15]。不同地图综合算子造成的同名实体差异也会不同,简化、夸大算子会造成同名实体在形状、大小等方面的差异;选取算子会造成实体的删除;移位算子会产生空间位置的差异;合并算子和典型化算子会造成同名实体多方面的差异。多尺度地图空间中面实体之间的匹配可细分为一对零(即1∶0或0∶1)、一对一(即1∶1)、一对多(即1∶N或M∶1,N>1,M>1)和多对多四种不同的匹配关系[1,11]。不同地图综合算子造成的同名实体的差异以及对应的匹配关系如表1所示。

表1 不同地图综合算子造成同名实体的差异以及对应的匹配关系

2 面实体的一对一匹配方法

2.1 几何相似度模型原理

面实体几何相似度模型是以单个面实体的形状、大小和位置三个几何特征量作为匹配的依据,将形状、大小和位置的相似度进行加权求和,综合性相似度最大的两个实体可以匹配。假设:待匹配实体为A和B,其综合性相似度指标由向量[a1,a2,a3]T和[b1,b2,b3]T组成,其中的分量代表大小、位置、形状;g(A,B)表示A与B之间的差异度;sim(A,B)表示A与B之间的相似度,见式(1)。若采用加权的欧氏距离度量g(A,B),式(1)可以转化为式(2)。

(1)

(2)

(3)

式中:AreaA,AreaB分别为面实体A,B的面积;Max(AreaA,AreaB)为面实体A和B面积的最大值。

(4)

式中:(XA,YA)和(XB,YB)分别为面实体A和B的中心点;dmax(A,B)为面实体A边界上任意一个点与面实体B任意边界上任意一个点之间的最大距离。

2.2 匹配的过程

设有2个面实体集合,大比例尺面实体集合A={a0,a1,…,am},小比例尺面实体集合B={b0,b1,…,bn},这两个集合的面实体匹配步骤:

1)采用文献[4]的方法确定匹配参数阈值。从两个集合中人工选取认为可以匹配的若干实体目标对,作为样本,计算样本中每一个实体对的距离差异度、形状差异度和大小差异度三个分量,并对每一个分量的标准差进行倒数归一化,得到各个分量的权重w1,w2和w3。根据分量权重和每个实体对的各个分量,求取实体对的综合性相似度。然后,根据综合性相似度均值S以及标准差δ,计算出综合性相似度阈值:S-3δ。

2)对A和B建立固定格网空间索引,计算A和B中每个面实体所经过的格网和每个格网所包含的面实体。

3)读取A中实体ai(i=1,2,…,m)在空间索引中的格网位置,以一个格网为距离单位,找到这些格网的BUFFER区域,随后以这个区域内的格网为范围,检索出B中的面实体子集合,作为ai候选匹配集。

4)在实体ai和与候选匹配集中每个实体之间计算位置差异度、大小差异度和形状差异度3个分量。计算实体ai与候选匹配集中每个实体之间的综合性相似度,若综合性相似度最大并且大于阈值,那么实体ai在候选匹配集中有匹配实体。

5)若A中实体都已经被匹配,则结束;否则回到第(3)步。

3 非一对一面实体匹配方法的改进

设大比例尺面实体集合A={a0,a1,…,am},小比例尺面实体集合B={b0,b1,…,bn},具体的匹配过程如下:

1)依据前文所提到的阈值计算方法,人工选取一定数量的正例样本,确定重叠度阈值(Mlimit),而现有的方法需要人工设置重叠度阈值。设dmin为最小可分辨距离,并按照地图比例尺转换为数据库的长度单位。

2)遍历集合A中的m个面实体元素ai,针对每个元素(面实体),检索出与其最短距离小于dmin的所有实体,设这些面实体组成一个集合ACi,对于集合A而言,形成了一个由m个集合组成的集合群AC。

3)遍历集合B中的n个面实体元素bj,针对每个元素(面实体),在集合A中检索出与其相交的所有面实体,设这些面实体组成一个集合BCi,对于集合B而言,就形成了一个由n个集合组成的集合群BC。

4)集合ACi和集合BCj中的元素都是来源于集合A,也可能为空,因为可能在集合A中没有检索到符合条件的面实体。若BCj的元素个数大于1,则计算BCj中每一个面实体ai与BCj对应的面实体bj的重叠度M。把M>Mlimit的面实体组成一个集合Qj,就从BCj得到一个与bj有匹配关系的面实体集合,其元素都是来源于集合A。

(5)

其中,sc为ai与bj的重叠面积;sai代表ai的面积;sbj为bj的面积。

5)从集合Qj中遍历所有的元素(面实体ai),若ai对应的集合ACi中的元素(面实体ak)也是集合BCj中的元素,则面实体ak也加入集合Qj中,形成一个新的集合群Q。

6)从集合Qj中分析面实体的匹配关系:若Qj的元素个数大于1,并且Qj中的某个面实体(ai)在整个集合群Q中具有唯一性,则匹配关系为一对多(bj与Qj中的面实体之间的匹配关系),否则相关的面实体(包含元素ai的集合Qj中的所有面实体和bj)之间的匹配关系为多对多。

4 实验与分析

4.1 数据匹配总体流程

设有2个数据集,大比例尺面实体集合A,小比例尺面实体集合B,依据前文所设计的算法,面实体匹配的主要流程如下:

1)坐标变换。两种数据源之间坐标变换有两个目的[10]:一是统一两幅图的投影系统和坐标系统;二是消除两幅图之间可能存在的系统偏差。

2)建立面实体空间格网索引。索引的建立有2个好处:一是在匹配过程中,减少了不必要的搜索时间,提高了算法的效率;二是在确定匹配候选集时,缩小了匹配候选对象的范围。

3)匹配过程。若比例尺相近(倍数小于2.5),则采用几何相似度模型进行匹配;否则采用改进的非一对一匹配方法。

4)输出匹配关系。若比例尺相近,则输出的匹配关系有一对零和一对一;否则输出的匹配关系包括一对零,一对一,一对多和多对多。

4.2 匹配实验

实验1采用武汉周边某区域1∶1万和1∶2.5万的居民地数据,如图1所示,浅灰色为1∶1万居民地,有270个面,黑色为1∶2.5万的居民地,有84个面。

图1 1∶1万与1∶2.5万居民地重叠图

匹配开始之前,人工随机选择6对已经确定匹配的正例样本(尽量选择位置误差较大的实体对),计算样本对中面实体几何特征的各个分量的差异度,见表2。

对距离差异度、形状差异度和大小差异度等分别计算标准差,然后对标准差进行倒数归一化,则距离权重是0.101 1,形状权重是0.690 7,大小权重是0.208 2;根据权重值求得各对样本的综合性相似度,相似度的均值是0.972 4,标准差是0.01,则综合性相似度阈值为0.942 3,同理可得重叠度均值0.847 4和标准差0.096 6,则重叠度阈值为0.557 4。设居民地面实体间的图上最小可分辨距离为0.5 mm[18],匹配结果的统计如表3所示。

实验2采用同一区域的1∶1万和1∶5万比例尺的居民地数据,如图2所示,浅灰色为1∶1万居民地,有270个面,黑色为1∶2.5万的居民地,有11个面。匹配结果的统计如表4所示。

表2 样本特征分量、总相似度以及重叠度

表3 1∶1万与1∶2.5万居民地匹配实验统计结果

图2 1∶1万与1∶5万居民地重叠图

表4 1∶1万与1∶5万居民地匹配实验统计结果

5 结 语

本文将面实体的形状、位置和大小三个几何特征量作为构建几何相似度模型的因素,匹配方法中指标阈值能自动确定,由表3和表4可知,多个比例尺的匹配实验都得到了正确的匹配结果,证明了该方法适应于多尺度面实体的匹配,相对于文献[10]的方法,本方法更加科学。

[1] 翟仁健. 基于全局一致性评价的多尺度矢量空间数据匹配方法研究[D]. 郑州:信息工程大学, 2011.

[2] 郝燕玲, 唐文静, 赵玉新,等. 基于空间相似性的面实体匹配算法研究[J]. 测绘学报, 2008, 37(4):501-506.

[3] 张桥平, 李德仁, 龚健雅. 城市地图数据库面实体匹配技术[J]. 遥感学报, 2004, 8(2):107-112.

[4] 安晓亚, 孙群, 肖强,等. 一种形状多级描述方法及在多尺度空间数据几何相似性度量中的应用[J]. 测绘学报, 2011(4):495-501.

[5] 付仲良,逯跃锋.利用弯曲度半径复函数构建综合面实体相似度模型[J].测绘学报,2013,42(1):145-151.

[6] 郭黎, 崔铁军, 郑海鹰,等. 基于空间方向相似性的面状矢量空间数据匹配算法[J]. 测绘科学技术学报, 2008, 25(5):380-382.

[7] 黄智深, 钱海忠, 郭敏,等. 面状居民地匹配骨架线傅里叶变化方法[J]. 测绘学报, 2013, 42(6):913-921.

[8] 黄智深, 钱海忠, 王骁,等. 基于降维技术的面状居民地匹配方法[J]. 测绘科学技术学报, 2012, 29(1):75-78.

[9] 王骁, 钱海忠, 何海威,等. 利用空白区域骨架线网眼匹配多源面状居民地[J]. 测绘学报, 2015, 44(8):927-935.

[10] 郭黎, 崔铁军, 王豪,等. 基于面状要素拓扑关系的数据匹配技术研究[J]. 测绘科学, 2010, 35(1):130-132.

[11] 赵彬彬.多尺度矢量地图空间目标匹配方法及其应用研究[D].长沙:中南大学,2011.

[12] 郭庆胜.地图自动综合理论与方法[M].北京:测绘出版社,2002.

[13] 杨杰, 杨敏华. 基于信息熵的面状要素在地图综合中的量测方法分析[J]. 测绘工程, 2012, 21(2):54-56.

[14] 武芳, 王家耀. 地图自动综合概念框架分析与研究[J]. 测绘工程, 2002, 11(2):18-20.

[15] 张清林,林泉,周伟.基于多尺度公开版地图数据库的制图综合指标与模型的建立研究[J].测绘与空间地理信息,2016,39(4):102-104,109.

[16] 王斌, 舒华忠, 施朝健,等. 一种基于轮廓线的形状描述与匹配方法[J]. 电子与信息学报, 2008, 30(4):949-952.

[17] 蓝秋萍.地图数据多尺度级联更新方法研究[D].武汉: 武汉大学,2010.

[18] LI Z L, YAN H, AI T, et al. Automated Building Generalization Based on Urban Morphology and Gestalt Theory[J]. International Journal of Geographical Information Science, 2004, 18(5):513-534.

[责任编辑:李铭娜]

Research on the method of multi-scale areal feature matching

LAN Zhenjia1, GUO Qingsheng1, LIU Jiping2, WANG Yong2

(1.School of Resource and Environment Science,Wuhan University,Wuhan 430079,China; 2. Chinese Academy of Surveying and Mapping, Beijing 100830,China)

The existing methods of areal feature matching mainly focus on the similar scale. According to the need of multi-scale areal feature matching, the reasons of causing 1∶M and M∶N matching relationships in map generalization and the differences between same entities caused by different map generalization operators are analyzed in this paper. Combining geometrical similarity model for 1∶1 matching relationship of areal features with the matching method based on overlap which is suitable for not 1∶1 matching relationship, the thresholds of indices can be determined automatically. A new adaptive method is proposed for multi-scale areal features matching. At last, the multi-scale residential data are taken as the experimental object to verify the feasibility and effectiveness of this method.

areal feature;multi-scale;matching;geometrical similarity;map generalization

著录:蓝振家,郭庆胜,刘纪平,等.多尺度面实体的匹配方法研究[J].测绘工程,2017,26(11):28-31.

10.19349/j.cnki.issn1006-7949.2017.11.006

2016-08-17

国家自然科学基金资助项目(41471384);公益性科研专项基金资助项目(201512032)

蓝振家(1991-),男,硕士研究生.

TP75

A

1006-7949(2017)11-0028-04

猜你喜欢
同名格网算子
与由分数阶Laplace算子生成的热半群相关的微分变换算子的有界性
同名
拟微分算子在Hp(ω)上的有界性
Heisenberg群上与Schrödinger算子相关的Riesz变换在Hardy空间上的有界性
遥感数据即得即用(Ready To Use,RTU)地理格网产品规范
实时电离层格网数据精度评估
各向异性次Laplace算子和拟p-次Laplace算子的Picone恒等式及其应用
矢量点状数据抽稀方法的研究与实现
正六边形规则格网表达的DEM谷地线提取
79首同名民歌《放风筝》的宗族关系