湿地遥感分类方法评估
——以玛多湖湿地自然保护区为例*

2022-06-01 08:02史良树田燕芹李一琼
关键词:玛多数据源波段

吕 烨,史良树,田燕芹,张 丽,闫 敏,李一琼

(1.中国国土勘测规划院,北京 100035;2.中国科学院 空天信息创新研究院,北京 100094;3.苏州科技大学 地理科学与测绘工程学院,江苏 苏州 215009)

湿地与森林、海洋并称为地球3大生态系统[1],是目前自然界中功能最全、结构最复杂、物种最丰富的一种自然生态结构,能够产生经济、社会、生态和环境方面的作用和功能[2]。湿地不仅拥有极强的降解污染的功能,而且在气候调节、水源涵养、生物多样性和生态链完整性维护等方面都发挥着重要作用[3],具有“地球之肾”“生命的摇篮”和“物种基因库”等美称。中国是亚洲拥有湿地面积最大的国家。但第二次全国湿地资源调查统计,与第一次调查相比,我国湿地面积减少了将近340万hm2,减少率达到8.82%,自然湿地面积减少了337多万hm2,减少率达9.33%(来源于国家林业和草原局政府网)。为了防止湿地资源进一步损失并对其进行有效保护,研究湿地空间分布和定量化分析显得尤为重要。

在国际上,应用遥感技术进行湿地制图并以此开展湿地资源调查与监测的相关研究最早起源于19世纪70年代[4]。随着遥感技术应用的快速发展,基于卫星遥感进行湿地信息提取已成为湿地资源调查、监测与保护最为有效的手段之一[5]。如Finley等[6]利用 Landsant MSS 遥感数据进行人工目视判读,根据遥感影像自身提供的颜色、纹理等特征获取了更高精度的湿地空间分布状况信息,为湿地资源调查提供了可靠的基础数据。郭焱州[7]基于国产GF-1卫星对长沙市城区湿地信息提取获得了Kappa系数0.88和总体精度90.53%的精确结果。王霄鹏等[8]通过融合Radarsat-2和Landsat-5两种影像数据,利用两类数据源的综合特征对滨海湿地进行分类,验证了应用该分类方法的可行性与实用性。目前研究以Landsat系列数据为主,高分辨率数据的应用较少,尤其是有关玛多湖区域的针对性分析更少。而玛多湖湿地是国家重要湿地之一,淡水资源丰富,拥有巨大的生态功能。在全球气候变暖的大背景下,玛多湖湿地是对气候变化较为敏感的地区之一,但也极易受到气候改变带来的影响。因此,及时监测并实时掌握玛多湖湿地的空间分布及变化情况,对该地区的经济发展、社会稳定以及政策决策有着深远影响,也为人类社会的发展提供充足的资源保障。本研究以玛多湖国家湿地保护区为研究区,基于Sentinel-2高分辨率遥感影像,采用3种分类方法进行自动识别,量化3种分类方法应用于高分辨率多光谱卫星数据进行湿地信息提取间的差异,并比较不同分类方法之间的性能与适用性,得到适合该区域湿地类型识别的最佳分类方法,以期为当地政府开展湿地资源保护和生态修复等工作规划提供理论依据。

1 材料与方法

1.1 研究区概况

玛多湖湿地位于青海省南部果洛藏族自治州西北部的玛多县,地理位置介于34°38′N~35°00′N,97°55′E~98°20′E之间,由4个面积分别为3 100,3 000,2 000和2 000 hm2的淡水湖泊及几个更小的湖泊及沼泽地组成(见图1)。该地区属于典型的高原大陆性半湿润气候,一年中无四季之分,只有冷暖之别,且干湿分明,年平均气温为-4 ℃,全年无绝对无霜期,6—9月是植被生长季,地势自西北向东南倾斜。该湖区水源来自当地径流,出水流入黄河上游,冬天湖泊及其沼泽地完全冰冻,湿地总面积约11 000 hm2。

图1 研究区空间位置

1.2 数据源

Sentinel-2是欧洲航天局倡议的全球环境与安全监测系统(即哥白尼计划)的重要组成部分,主要服务于植被监测、土地覆盖变化、湖水和近海水域污染监测,以及自然灾害应对与管理等。它是由Sentinel-2A和Sentinel-2B两颗互补卫星组成的卫星星座,轨道高度为786 km。两颗卫星均携带一个多光谱成像仪,可覆盖13个光谱波段,空间分辨率分别为10 m,20 m和60 m,单颗卫星重访周期为10天,星座重访周期为5天。本文选择2020年9月2日无云Sentinel-2B影像作为原数据,并通过美国地质调查局网站(http://glovis.usgs.gov/)下载获得,利用欧洲太空局提供的Sentinel-2 Toolbox软件对影像进行辐射校正和大气校正。根据多光谱图像中的波段计算4种光谱指数。计算公式如式(1)~(4)所示。

NDVI=(NIR-RED)/(NIR+RED),

(1)

NDWI=(GREEN-NIR)/(GREEN+NIR),

(2)

BI=BLUE+RED,

(3)

RVI=NIR/RED。

(4)

DEM数据是由ALOS(advanced land observing satellite)卫星相控阵型L波段合成孔径雷达(PALSAR)采集。该传感器具有高分辨率、扫描式合成孔径雷达、极化3种观测模式,数据水平及垂直精度可达12.5 m。

1.3 分类系统与解译标志

分类系统与研究目的、分类层次及研究尺度相关,同时分类系统的制定直接影响制图精度[9],是湿地信息提取的首要步骤。参考《湿地公约》、我国湿地分类系统以及已有研究的分类体系,并基于玛多湖湿地利用现状,将研究区划分为2个一级类、5个二级类,其划分标准与解译标志如表1所示。

表1 玛多湖湿地分类体系与影像解译标志

1.4 分类方法

机器学习作为人工智能的核心,可从数据集中自主学习并发现知识,可用于预测高性能模型。如随机森林(random forests,RF)、神经网络(neural net,NN)和支持向量机(support vector machine,SVM)等在作物识别中都有较好的表现。随机森林算法由Breiman等于2001年提出,是一个包含多棵独立决策树的分类器,可对随机抽取的样本信息进行类别预测的无参数分类器[10],并且其输出的类别是由个别树输出的类别的众数而定。神经网络技术使用标准反向传播进行监督学习[11],可通过调整节点中的权重以最小化输出节点激活和输出之间的差异来进行学习。SVM分类器是一种基于内核的机器学习技术,可通过决策面将类分离,从而最大化类之间的余量[12]。

本研究选择随机森林、神经网络和支持向量机3种机器学习分类器,应用于原始数据和波段合成数据两种数据源,共产生6种分类方法。研究区内土地类型可分为6类,结合目视解译与Goole Earth影像,在ENVI中划定感兴趣区,每类选择15到30个训练样本,样本总集群数大约为土地覆盖类别的30倍。根据训练样本的像素数量,按照7∶3的比例确定检验样本的像素数量。每种分类方法使用相同的训练样本集和检验样本集。

1.5 精度评价

利用检验样本集,对6种分类方法进行精度评价,生成每种分类图的误差矩阵。基于误差矩阵计算分类精度度量,包括总体准确度(OA)、总体Kappa系数(OKp)、生产者准确度和用户准确度[13]。在此基础上,计算单一类别的Kappa系数,作为每个类别的精度评价指数,公式为

(5)

式中:ki是类别i的Kappa系数;N是像元总数;xii是类别i被正确分类的像元个数;xi+是类别i地表真实像元总数;x+i是类别i被分类像元总数。

2 结果与分析

2.1 总体精度评价

图2显示了6种分类方法的分类结果图。从视觉上看,所有分类图似乎都能提取出研究区内不同的土地覆盖类型,体现实际地类的分布情况,在“椒盐”效应上也表现出了较好的视觉效果。但分类效果上存在一定的差异,基于原始数据的神经网络分类图与其他分类图有着明显的视觉差异,主要是将裸土错分为人工表面。

图2 分类结果图(R=原始数据,L=波段合成数据)

6种分类方法的总体分类精度与Kappa系数如图3所示。总体精度从基于波段合成数据进行支持向量机分类的95.8%到基于原始数据进行神经网络分类的62.1%,相应地,Kappa系数从0.95降到0.53。该结论与视觉效果一致,并且可进一步得知6种分类方法下的分类精度差异较大。有趣的是,相对于两种数据源所表现出的效果差异,分类方法间的差异更加明显,尤其是NN分类方法与RF和SVM两种分类方法间的差异。在两种数据源下,RF和SVM两种分类方法表现出了较好的一致性和稳定性,总体精度均大于90%,Kappa系数也在0.90以上。而NN分类方法的总体精度还不到70%,Kappa系数更是低至0.53。总地来说,3种机器学习分类器的制图精度趋势可概括为SVM>RF>NN;波段合成数据较原始数据而言,分类精度虽有提高但幅度较小。

图3 总体尺度精度评价(R=原始数据,L=波段合成数据)

2.2 类别尺度精度评价

图4给出了6种分类方法下各类别的Kappa系数。从图中可以看出,各个地类在6种分类方法下都有不同程度的精度差异。其中,裸土类的Kappa系数从R_NN的0.04到R_RF和L_SVM的1.00,相差了0.96,是所有地类中差异幅度最大的地类,湖泊则是差异幅度最小的地类。各地类在6种分类方法中的精度差异幅度的趋势为草本沼泽>湖泊>草地>裸土>人工表面>河流。同时,也可以看出,RF和SVM两分类器相对于NN来说,有着明显的可分性。

按数据源的不同对图4中的Kappa系数进行重新排列,并计算两种数据源下各地类在3种不同分类方法中的平均Kappa系数(AKp1),如表2所示。可以看出,波段合成数据较原始数据有明显的分类精度提高,尤其是在草地和人工表面两个非湿地类中。裸土和所有湿地类的分类精度在两种数据源下差异较小,具有较高的稳定性和可分性。按分类方法的不同对图4中的Kappa系数进行重新排列,并计算3种分类方法下各地类在两种不同数据源中的平均Kappa系数(AKp2),如表3所示。可明显看出,对所有地类而言,NN分类方法的分类效果均较差。在RF和SVM两种分类方法中,裸土和所有湿地类的AKp2均在0.90以上,与表3中的结论一致。而草地和人工表面两种地类在RF和SVM两种分类方法中的AKp2值有0.1的差值,具有一定程度的低一致性。

表2 类别尺度上不同数据源的分类评价

表3 类别尺度上不同分类方法的分类评价

图4 类别尺度精度评价结果(R=原始数据,L=波段合成数据)

在实际应用中,对于新手或图形处理能力较差的用户来说,基于原始Sentinel-2影像进行RF或SVM分类是个很好的选择。对于一般用户来说,加入地形信息和其他光谱信息的波段合成数据进行SVM分类是一个合适的组合。对于有经验或精度要求较高的用户,可以尝试多种数据源和多种分类方法的不同组合进行对比分析。

3 结论

基于Sentinel-2影像数据,以玛多湖湿地自然保护区为例,采用随机森林、神经网络和支持向量机3种监督分类方法进行湿地信息的自动提取研究,并与加入DEM地形数据以及NDVI,NDWI,BI,RVI 4种光谱指数信息后的波段合成数据作对比分析。该研究结果表明,支持向量机分类方法和波段合成数据的组合在玛多湖湿地制图中表现出了最好的精度效果,总体精度为95.8%,Kappa系数为0.95。两种数据源对分类结果的影响明显低于分类器的影响。虽然支持向量机与随机森林分类方法间的效果差异较小,但相较于神经网络分类方法,分类精度有着明显提高。在实践应用中,如果用户具有图像处理能力或是较高的精度要求,可以使用多种方法进行比较分析;否则,则可以基于原始Sentinel-2影像,简单实现支持向量机或者随机森林分类方法,无需复杂的图像处理软件且对硬件要求较低。

猜你喜欢
玛多数据源波段
最佳波段组合的典型地物信息提取
用高品质冷链物流服务客户
——专访雅玛多(中国)运输有限公司总经理王杰
基于PLL的Ku波段频率源设计与测试
Web 大数据系统数据源选择*
小型化Ka波段65W脉冲功放模块
基于不同网络数据源的期刊评价研究
2015年玛多5.2级地震特征研究
日常维护对L 波段雷达的重要性
基于真值发现的冲突数据源质量评价算法
分布式异构数据源标准化查询设计与实现