遥感大数据驱动的定量遥感

2020-03-04 07:31薛勇
环境与生活 2020年12期
关键词:复杂性海量范式

薛勇

大数据是一个无形的东西,在2020年,全世界约有59ZB(zetta bytes)的数据产生、复制、被访问,据权威机构估计,这个数字到2024年将达到149 ZB。

大数据是什么?是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的定义可以是四维或五维,目前,国际上还没有准确的定义,但大量、多样、高速、价值、真实性等五方面基本是被认可的。数据量的大小与价值没有直接的关系,大数据是海量资料,这些巨量资料来自世界各地随时产生的数据,在大数据时代,任何微小的数据都可能产生不可思议的价值。

科学大数据与普通用的大数据是有差距的,科学大数据代表了自然科学与社会科学之间复杂的关系。一般来说,这些自然现象或科学过程的外部表现,具有高度相关性和多重数据属性。大数据的维度概念已超出我们认知中的维度,超出了四维的范围。大数据有几个特性,一是高复杂性,定义大数据的边缘范围是很困难的;二是高不确定性,科学大数据来自对自然过程的获取,有非常高的不确定性;三是高价值。

大数据的技术包括大数据接入、大数据存储、大数据分析挖掘、大数据共享交换、大数据展示等五方面。这些技术都是在使用中,也在发展过程中。

“数字地球”是一个可以嵌入海量地理数据的、多分辨率的、真实地球的三维表示。

地球大数据是第四范式(数据密集范式,即科学大数据)的典型示例,数据密集范式是继实验科学、归纳总结、计算机仿真后的第四代范式。

地球大数据作为大数据的一种特殊类型,在Volume(大量)、Variety(多样性)、Velocity(高速)、Veracity(真实性)方面具有自己的特点。

大量:PB级(PB指petabyte,它是较高级的存储单位,1PB=1024TB)的遥感影像数据档案,不断增加的实时传感器观测数据和基于地理位置的社交媒体数据,海量的VGI(志愿者地理信息)数据等,以及这些数据的不断增加,不仅带来了数据存储问题,也带来了海量的分析问题。

多样性:地图数据、图像数据、带地理标签的文本数据、结构化和非结构化数据、栅格数据和矢量数据,所有这些不同类型的数据都需要更高效的模型、结构、索引和数据管理策略和技术。

高速:频繁更新的高分辨率图像数据、传感器连续观测数据、物联网、实时的全球导航卫星系统轨迹和社交媒体数据都需要与之相匹配的数据生成速度和数据处理速度来满足需求。

真实性:许多地理空间大数据的来源未经验证,准确性不高或不清楚,其准确性因数据源的不同而不同,这就对源数据的质量评估以及如何“统计化”地提高分析结果的质量提出了问题。

地球大数据处理包括:数据收集、数据质量评估、数据建模和结构化、数据可视化和可视化分析、数据挖掘和知识发现。

下面介绍遥感大数据,遥感大数据是地球大数据的一个方向。遥感大数据是指以海量遥感数据集为主、综合其他多种来源的辅助数据,运用大数据思维与手段,从海量遥感数据集中获取行业价值信息的理论、方法、技术与活动的统称。随着遥感卫星、导航卫星、地球物理卫星和各种平台以及各种观测仪器和传感器的使用增加,來自太空的地球大数据正成为大数据研究的主流。它呈现出了大数据的科学特征,例如海量数据、多种来源、异构性、多时间性、多种规模和非平稳性。来自太空的地球大数据涉及地球观测技术、通信技术和计算机技术,为地球科学研究带来了新的机遇。 它可以促进地球科学的深入发展,并有助于获得重要的科学发现。

遥感大数据发展包括数据获取、数据管理、数据分析、数据应用等方面的发展。遥感大数据的来源包括卫星、无人机等多元载体;有光学、影像等多种类型;全谱段、全天域覆盖等多种数据覆盖。遥感大数据具有大容量、多样性、高效性、难以识别、高价值等外部特点和高维度、多尺度、不稳定性等内部特点。遥感大数据具有复杂性,包括数据复杂性、计算复杂性、系统复杂性等。

遥感大数据对我们的挑战:我们要进行定位、识别和分析不同空间尺度的地理目标的多层次分析,比如对生态中山体滑坡的分析,比如数据分类和不同的分析方法可以得出不同的角度和结论,不同的分析方法、多时相方法、高频率观测、背景知识、专业知识缺乏、扩展、数据和知识质量等都形成挑战。当然,针对各方面的挑战,我们均在探索不同的解决方案。

遥感大数据未来的发展方向包括遥感大数据多类不确定性建模、大数据环境下的多源遥感信息融合、遥感大数据的机器学习方法、用于遥感大数据分析和可视化的统一架构、基于知识驱动的定量遥感的大数据挖掘等方面。

总结一句话,最大挑战就是“遥感大数据对定量遥感如何挖掘出全新的知识,以便更好地为用户服务”。

(本文录音由实习生崔鸿青整理,并经发言专家本人审核)

猜你喜欢
复杂性海量范式
基于SCP范式的贵州省食用菌产业分析
复杂性背后
通往深刻的简单
谨言慎行
从教师视角谈“读思达”课堂范式——以“百分数的认识”为例
工商银行与第四范式正式签约共建银行AI核心系统
管理会计中的复杂性成本研究
一个图形所蕴含的“海量”巧题
从教材中突围,走课内海量阅读之路
Hadoop构建的银行海量数据存储系统研究