基于群体智能的多源遥感数据分页查询方法

2022-11-15 01:53曾泳谕
经纬天地 2022年5期
关键词:本体检索语义

曾泳谕 丘 泉

(广东省国土资源测绘院,广东 广州 510000)

0.引言

随着航空航天遥感技术和光学成像技术的不断进步和发展,遥感数据的来源广泛、种类繁多,数据体量越来越多,这些数据涵盖了空间TDICCD相机成像时产生的影像数据、卫星监测数据、物探数据、地质环境监测等遥感数据。随着多源遥感数据的种类和规模越来越大,急切需要构建优化的多源遥感数据分页查询方法,对这些数据进行特征分析和像移参数分析,从而实现对多源遥感数据的特征检测和识别,降低多源遥感数据查询和检索开销,提高数据的实时分析能力[1]。

对多源遥感数据分页查询是通过用户和数据的属性参数检测和识别实现的,结合对全局和局部的参数融合,采用分组和分块检测的方法,最终构建多源遥感数据分页检索和特征分类集。当前,查询多源遥感数据的方法主要有扩展类别检测法、语义搜索法、图像处理法等[2,3]。文献[4]通过构建基于HBase的遥感数据分布式存储与查询方法,利用HBase的过滤机制设计过滤列族,进行词语关联规则挖掘;基于目标遥感影像数据的分类属性,通过扩展算法,达到在查询时筛选数据的目的,但该方法的聚类性较弱。文献[5]中提出一种遥感栅格数据库检索高效的拓扑查询方法,采用最小外接矩形(MBR)和最大内接矩形(IR)的空间拓扑关系实现遥感数据查询,但该方法易出现共现频率结合形成新规则现象,导致查询的稳定性较低。

对此,本文提出基于群体智能的多源遥感数据分页查询方法。首先采用本体图模型和关联规则扩展的方法构建数据查询的分布模型和数据结构模型,并采用语义本体特征分析,实现对多源遥感数据分页特征分析;然后采用群体智能进行多源遥感数据分页查询过程聚类和分类识别;最后进行仿真测试,验证了本文方法在提高多源遥感数据分页查询能力方面的优越性。

1.多源遥感数据的分布结构和特征分析

1.1 分布结构

首先,为实现多源遥感数据分页查询,需要结合群体智能学习的方法,构建多源遥感数据分页特征检测模型;其次,需要结合样本参数的训练和语义结构分析方法,进行Word-Net本体的加权图查询和模型结构参数分析;再次,通过语义相似度扩展的方法,建立多源遥感数据的模型库和语义特征本体库,结合Web检索的方法,构建多源遥感数据的多维动态特征分布集;最后,通过关键词检索和特征降维,降低多源遥感数据的存储空间维数,同时提高多源遥感数据的查询精准度。在进行多源遥感数据分页查询中,使用WordNet和其语义关联度构建知识本体库,通过元素标签识别和扩展词应用的方法,使查询结果接近用户意图,满足多源遥感数据的属性分类性和特征聚类性,最终构建多源遥感数据的存储节点分布模型。根据存储节点分布,采用多重检索的自适应搜索方法,进行数据集成,构建概率树模型,并通过元素标签识别,分析遥感数据的特征量,得到多源遥感数据的特征分布结构,如图1所示。

图1 多源遥感数据的特征分布结构

在Map/Reduce模式下构建多源遥感数据的时态分析模型,在时态对象模型中,采用动态查询结合非结构化的数据处理机制,建立多源遥感数据的延迟预写日志,同时基于映射(key/value)和关系模型分析建立多源遥感数据的动态分布集合,并通过遥感物探分布,采用全周期记录和动态存储的方法,实现对多源遥感数据的动态挖掘和编码。基于语义概念分析的方法,进行多源遥感数据查询扩展性分析。对多源遥感数据的查询扩展主要包括同义词扩展、语义扩展、遥感卫星数据扩展、图像边缘性扩展等。基于语义外延特征分析,采用规则性挖掘和调度的方法,得到多源遥感数据扩展的相关规则词。同时设置多源遥感数据的权重分量,在原查询词中,采用语义消歧和图像滤波检测的方法,构建多源遥感图像滤波和降噪模型;在遥感动态数据的相关规则集中,通过相关规则持续性爬取,实现遥感数据的分页查询检索。多源遥感数据查询总体技术路线如图2所示:

图2 多源遥感数据查询总体技术路线

1.2 数据特征

结合数据特征分析,建立多源遥感数据的动态查询分析模型,采用本体图模型和关联规则扩展的方法,建立多源遥感数据的语义索引通道,并设定数据初始步长与初始稀疏度,定义数据查询的链路分布映射为:X→Y,其中X,Y⊆I且是空间向量R中的一组正交基,D=}是原始多源遥感数据的动态事务特征分布集合,称为数据库。其中多源遥感数据的特征分布集t在I中是非空子集。X和Y分别为多个相同长度数据的稀疏参量和重构参数。其中supp(X∪Y)是联合稀疏函数,包含X和Y的百分比,supp(X)、supp(Y)分别为最小效用阈值在X和Y的百分比,以相似度多源遥感数据查询的特征关系如表1所示。

表1 多源遥感数据查询的特征关系表

2.数据查询算法优化

2.1 群体智能学习算法

采用概念结构图模型分析的方法,进行语义扩展和数据的关联性度量,结合群体智能学习算法,分析多源遥感数据的层次性结构分量,同时使用基本粒子群算法作为智能群体。在遥感数据挖掘中,粒子初始化是随机产生方式,挖掘得到的遥感数据解称为个体极值pbest,迭代前期,粒子的自我认知过程采用适应度函数来控制。基于收敛控制,构建多源遥感数据挖掘的位置之间的关系分布式,如式(1)所示:

式(1)中,xt=xt-1+vt为多次调整总效用;vt为适应度;xt为离散粒子群更新规则;c1和c2分别为遥感数据分页训练过程中的操作算子常数,一般取c1=c2=2;rand1()和rand2()是[0,1]之间的随机数,为最小相对效用阈值;pbest、gbest分别为测试集和训练集粒子的最佳训练函数,通过随机数进行自适应训练,对于每个Xi对应的一个函数,在存在高效用项集的状况下,得到双重二元粒子群训练的迭代式,如式(2)所示:

式(2)中,ρ为Xi的最小支持度阈值;f(xi(k))为k时刻第i个粒子向其邻居集合中第i个粒子移动的概率;γ为粒子群的离群系数;li为挖掘频繁项集;k为查询扩展的过程类别参数。

采用群体智能学习,得到粒子群个体之间的距离,并得到多源遥感数据分页查询的变异适应度值,搜索全局最优点,实现遥感数据挖掘过程中的粒子自适应寻优[6]。

2.2 数据分页查询输出

以地理空间位置分布特性,结合遥感特征提取方法,通过群体智能学习算法建立多源遥感数据的分页检索和分类模型,并采用全域本体类型模型,在粒子群里智能寻优下,数据查询输出公式如式(3)所示:

式(3)中,pad为所有的个体最优位置的平均值;ω为在相同特征子集下的加权权重;c1和c2为正则项参数;r1和r2为回归参数;pgd为最大相关系数;xtid为查询最终特征子集;m为数据库的分布维数;pid为稳态特征量,根据排序索引集合,得到遥感数据分页查询后输出的新粒子集{x~ik}Ni=1。

通过本文改进算法设计,采用全局性领域本体特征分类,在群体智能性分类集中实现对多源遥感数据的分页查询。

3.试验测试

3.1 试验环境描述

对于多源遥感数据查询的群体智能学习工具,采用PyTorch1.3.1。试验中取智能粒子群的种群个数为2000,状态分布的关联规则项为600,遥感数据的多源类别属性为4,汇聚节点汇聚40个节点,训练周期设置为100 epoch,遥感数据的像素为1200×1200像素,包含10类场景。多源遥感数据的数据库特征参数,如表2所示。

表2 数据库特征参数

3.2 结果分析

在表2所建立的多源数据参数分布基础上,进行数据分页查询,得到10类场景的查询结果,如图3所示。

图3 遥感数据分页查询结果

由图3可知:采用本文方法进行多源遥感数据查询的分类性能较好,查询输出结果准确可靠。测试采用不同方法进行遥感数据查询的查准率,与采用本文方法进行对比,结果如表3所示,可知采用本文方法的查准率优于传统方法。

表3 查准率对比测试 单位:%

4.结束语

本文提出基于群体智能的多源遥感数据分页查询方法。该方法的核心理念是构建多源遥感数据的存储节点分布模型,采用多重检索的自适应搜索的方法进行数据集成,并结合群体智能学习算法分析多源遥感数据的层次性结构分量,最终实现对多源遥感数据的分页挖掘;同时通过10组遥感数据与传统方法进行对比测试,试验结果准确可靠,查准率明显高于传统方法,具备一定的应用价值。

猜你喜欢
本体检索语义
语言与语义
基于本体的机械产品工艺知识表示
“上”与“下”语义的不对称性及其认知阐释
专利检索中“语义”的表现
《我应该感到自豪才对》的本体性教学内容及启示
认知范畴模糊与语义模糊
专题
Care about the virtue moral education
语义分析与汉俄副名组合
国际标准检索