时空数据研究初探

2020-06-19 08:50倪婷
科学与信息化 2020年11期
关键词:立方体空间数据聚类

倪婷

摘 要 进入信息时代以来,很多先进的地理信息科学技术在城镇建设、土地规划、科研等领域发挥了巨大的促进作用。当前,时空数据的研究已从通用数据模型转向面向应用领域的研究;从离散时空数据模型转向连续时空数据模型的研究;从单一尺度、单一维度时空数据的研究转向多尺度多维度时空数据的研究;时空数据查询、管理、表达、分析和挖掘将是日后研究的热点问题。

关键词 地理信息科学;时空数据;数据挖掘

1时空数据研究概述

近30年来,随着地理信息科学的发展、GIS技术的普及应用,GIS空间数据量正以空前的速度增长,并且GIS空间数据呈现出动态变化的特征,为了应对管理不断增加的动态空间数据的需求,许多GIS学者致力于时空数据的研究,包括如何表达、分析和预测空间信息随着时间变化的过程。Langran出版了第一本正式介绍时态GIS的书籍,该书较为系统地论述了时空数据的概念模型和实现,这标志了时空数据逐渐成为GIS研究的热点问题[1]。

2大数据GIS驱动下的时空数据挖掘研究

网络和通信技术的发展,传感器设备的普及,使得GIS走向大数据时代。如何将GIS大数据空间特性和时间特性有机结合,分析并发现更多有意义的信息将是大数据时代地理信息科学研究的前沿问题,是时空数据挖掘所需要解决的主要科学问题。

虽然GIS时空数据体量在飞速增长,但大量时空数据提供给我们的信息量却很少,因此需要我们从大量的GIS时空数据中挖掘发现所需要或有意义的信息。刘大有(2013)等对时空数据挖掘的定义“从具有海量、高维、高噪声和非线性等特性的时空数据中提取出隐含的、人们事先不知道的、但又潜在有用的信息及知识的过程”。时空数据挖掘研究的主要内容包括:时空自相关、时空预测、时空聚类和时空可视化等。

2.1 时空自相关与时空预测

地理对象具有很强的时空依赖性,为了发现这些时空依赖性特征,GIS研究者们对GIS时空数据的自相关性做了广泛深入的研究。Cheng(2012)通过对公路网数据的时空自相关结构的分析,建立一个合适的时空预测模型。該研究使用了伦敦的路网数据,对其时空自相关性进行了探索性的分析。通过全球和区域尺度的分析,发现路网结构的时空自相关性是动态、不均匀的。全球尺度的时空自相关性无法解释路网的结构,而区域动态的则可以进行时空数据建模和预测[2]。

2.2 时空聚类

时空数据挖掘另一个十分重要的任务是从大量的不明确的时空数据中,抽取有意义的模式和关系。因此我们希望在没有任何先验的假设下从海量的时空数据中搜索到一定的结构,然后再据此结果形成、归纳提炼我们的假设。这就是所谓的非监督分类,在时空数据挖掘中最重要的非监督分类的方式就是聚类。这涉及对时空数据进行分组,相似的数据在同一个簇中,不同的簇之间有较高的差异性。时空聚类是一种检测海量时空数据中异常值的常见方法。

2.3 时空可视化

大多数的地理现象和地理对象都在随着时间变化而变化着,如:森林火灾、台风移动、海洋污染、河流水位变化、交通拥堵情况等。随着物联网技术的发展,人们可轻易捕获这些动态变化的过程,如何通过地图对这些动态变化的地理过程进行可视化表达,成为当今GIS研究的前沿问题。

俞肇元(2012)等基于几何代数对多维时空场数据组织方法进行了构建,基于时空立方体设计了数据的存储结构,提出了基于张量算子的地学时空场数据分析方法。Bachthaler(2012)等基于时空立方体的方法提出了一种新的时间变换序列的排序方法,该方法将时空立方体转换成一种新的可视化方式—轨迹墙,该法可快速有效地对轨迹属性进行可视化表达,将这一方法应用在大城市出租车轨迹的表达上,并在表达方式中加入了时域透镜,使其能够进行更高层次的时空分析。时域透镜为交互式定义的空间查询显示出了时间聚合信息,如图1:

图中表示了时空立方体对出租车轨迹时空数据的表达,时空立方体中,较高速的绿色区域通常表现为聚集在一起的簇,而红色和黄色的点为异常数据,这些点通常聚集在一起,指示着某一区域存在交通阻塞。

3时空数据研究展望

传统的GIS重视空间数据而往往忽视了数据的时态性,在未来快速更新GIS数据的环境下,数据的时态性将越来越重要,时空数据的研究虽然已获得了诸多客观的成果,但还远不能满足GIS应用的需求,目前对于高维度、连续性的时空数据的研究仍存在很多不足,几何代数为时空数据的统一表达和分析开辟了一个全新的领域,但其实用性仍需进一步探讨。GIS海量时空数据的积累带来了数量的成倍增长,但我们从中获取的信息方式仍较为单一,对于复杂多样的时空数据的组织、分析、表达、查询等,还需要不断提高GIS方法和手段的应用研究,这将是未来GIS研究的前沿问题[3]。

总体上看,时空数据经历了一个理论研究到应用研究的过程,当前正是时空数据大爆炸的时代,各种基于轨迹的时空数据广泛存在于我们的日常生活中,大数据概念的提出将时空数据研究的进一步推向GIS研究的热点。

参考文献

[1] 刘大有,陈慧灵,齐红,等.时空数据挖掘研究进展[J].计算机研究与发展,2013,50(2):225.

[2] Tao C,James H,Wang J.Spatio-temporal autocorrelation of road network data [J].Journal of Geographical Systems,2012,14(4):389-413.

[3] 俞肇元,袁林旺,罗文,等.基于张量的地学时空场数据组织与分析方法[J].遥感技术与应用,2012,27(5):699-705.

猜你喜欢
立方体空间数据聚类
基于模糊聚类和支持向量回归的成绩预测
内克尔立方体里的瓢虫
融入空间数据的地图制图路径探究
基于流形学习的自适应反馈聚类中心确定方法
图形前线
基于密度的自适应搜索增量聚类法
折纸
k元n立方并行容错路由