黄河流域多源遥感土地覆被数据精度评价与一致性分析*

2023-06-28 15:58吴宗洋蔡卓雅王彦芳

中国生态农业学报(中英文) 2023年6期

吴宗洋,蔡卓雅,郭英,王彦芳**

(1.河北省农业干旱遥感监测国际联合研究中心/河北地质大学土地科学与空间规划学院石家庄 050031;2.河北省高校生态环境地质应用技术研发中心石家庄 050031;3.中国科学院遗传与发育生物学研究所农业资源研究中心/中国科学院农业水资源重点实验室/河北省节水农业重点实验室石家庄 050022)

土地覆被是地球表层自然状态的客观反映,其空间分布格局及动态变化对于解决全球和区域环境演变、可持续发展等问题具有重大意义[1-3]。近年来,随着卫星遥感技术和GIS 技术的高速发展,极大程度促进了土地覆被产品的时空分辨率和精度的提高,涌现出大量优质的土地覆被数据集。然而,这些数据集在区域尺度的具体应用中往往存在以下几个方面的不确定性[4-5],使得数据集的应用受到限制: 1)所使用的遥感数据获取时间、土地覆被分类技术、分类体系等的差异;2)目前发布的土地覆被数据集大多数是全球和国家尺度的,在区域尺度的精度和适用性存在不确定性;3)测量或表达尺度即数据源和产品的空间分辨率也存在差异,使得多套的数据集在区域尺度存在不确定性,使用受到限制,难以选择合适的数据集[6]。因此,在使用数据之前对现有土地覆被数据的精度分析与评价至关重要。

目前,国内外学者基于各类土地覆被遥感产品在不同尺度上进行了相关研究,主要以洲际和国家尺度居多,包括中国、西班牙、南美洲、欧洲、北极地区等相关区域的研究[7-13]。例如宋宏利等[8]以中国科学院的CHINA2000 数据为参考,从国家尺度上对全球4 种土地覆被遥感产品的分类精度进行了评价;戴昭鑫等[12]评价了5 种全球卫星土地覆被产品在南美洲地区的一致性。区域尺度上,我国学者对长江流域、新疆、京津冀等地的多套数据产品进行了基本精度验证及一致性分析[14-16],评价方法上多采用相对评价方法、类型面积对比、误差矩阵分析和类型空间混淆等方法[17];研究形式上部分学者以某套数据产品为对象,评价在研究区域内的总体精度[18-21],或者评价多套全球土地覆被数据精度和一致性。虽然众多学者对各土地覆被产品的研究取得了一些成果,但是存在对同一地区不同年份的对比、参考数据的选择具有随意性等问题,也鲜见对黄河流域多空间分辨率土地覆被产品的定性和定量对比评价,数套不同分辨率的遥感产品该如何选择的问题,仍有待进一步研究。

本文以黄河流域为研究区,基于2020 年的30 m 分辨率土地覆被产品CLCD_v01_2020、GLOBELAND30和GLC_FCS30_2020 和低分辨率土地覆被产品LANDCOVER (300 m)、MCD12Q1 (500 m)和CNLUCC-1000 (1000 m),采用直接和间接评价相结合的方法,进行区域尺度精度评价。本研究旨在通过对比同期不同来源不同空间分辨率的土地覆被产品在黄河流域的精度表现,为用户在区域尺度合理利用土地覆被遥感产品提供科学参考。

1 研究区概况与数据来源

1.1 研究区概况

黄河流域地势东低西高,西部河源地区平均海拔在4000 m 以上(图1),分布着众多高山,有冰川地貌发育;中部地区的平均海拔1000～2000 m,为黄土地貌;东部地区主要由黄河冲积平原组成。该流域横跨东、中、西三大地形阶梯,是我国重要的生态安全屏障,也是人口活动和经济发展的重要区域。因此,黄河流域的生态环境问题是关乎流域生态安全及社会经济高质量发展的关键问题之一。而根据《2019 年中国水资源公报》和《2020 年中国统计年鉴》[22],黄河流域水资源总量为797.5×108m3,仅占全国水资源总量的2.75%;黄河流域降水量为496.9 mm,相当于长江流域的46.87%;黄河流域人均国内生产总值(GDP)为55 470.29 元,低于全国水平的27.80%。同时,根据《2019 黄河泥沙公报》,近10 年来,随着干流河底的不断淤积,小浪底库区最大支流畛水的断面淤积抬高62.90 m,主要支流大峪河的断面淤积抬高53.83 m。当前黄河流域存在的水资源匮乏、水沙关系失衡等生态环境问题严重制约了黄河流域的发展质量,是关乎流域生态安全及社会经济高质量发展的关键问题之一。目前,黄河流域生态保护和高质量发展已上升为重大国家战略,系统科学地认识黄河流域的环境格局变化是实现黄河流域高质量发展的重要前提[23-24]。

图1 研究区概况图Fig.1 Overview of the study area

1.2 数据来源

1.2.1 土地覆被数据

本研究采用不同来源30～1000 m 不同分辨率的6 种土地覆被产品进行精度评价和一致性分析,各种数据详细参数如表1 所示。中国逐年土地覆盖数据集(Annual China Land Cover Dataset,CLCD),是基于GEE 上所有可获得的Landsat 数据,结合从中国土地利用/覆盖数据集(CLUD)中提取的稳定样本,以及从Google Earth 等通过目视解译收集的训练样本,结合随机森林分类器得到1985-2021 年中国土地利用分类结果[25],本文采用的为Version 1.0.0 中2020年的数据,即命名为CLCD_v01_2020。GLOBELAND30数据集是国家基础地理信息中心等多单位开发的全球首个30 m 地表覆盖数据产品,包含2000 年、2010 年和2020 年3 期,采用“像素分类-对象提取-知识检核”方案制作而成[26]。GLC_FCS30_2020 是中国科学院空天信息创新研究院2020 年最新研发的全球30 m 地表覆盖精细分类产品,并以该数据为基准,采用耦合变化检测和动态更新相结合的长时序地表覆盖动态监测方案,生产了1985-2020 年全球30 m 精细地表覆盖动态监测产品,该产品包含29 个地表覆盖类型,更新周期为5 年[27]。LANDCOVER 数据集是利用2003-2012 年的中分辨率成像光谱仪(MERIS)数据生成10 年基线土地覆被图,然后再结合AVHRR、SPOT、PROBA-V、Sentinel-3 等不同数据进行回溯和更新而生成,时间序列为1992-2020 年。MCD12Q1 数据产品是使用MODIS Terra 和Aqua 反射率数据经过监督分类后,再结合先验知识和辅助信息等做分类后处理进一步细化到特定类别[28]。中国多时期土地利用/土地覆被遥感监测数据集(CNLUCC1000)是中国科学院地理科学与资源研究所牵头生产的系列数据集,2020 年的数据是在2015年土地利用遥感监测数据的基础上,基于Landsat 8遥感影像,通过人工目视解译生成[29],该原始数据空间分辨率为30 m,本文所采用的是公开发布的空间分辨率为1000 m 的重采样产品。

表1 研究所用多源遥感土地覆被产品的参数表Table 1 Parameters of multi-source remote-sensing land cover products used in the study

所采用的6 种土地覆被产品年份均为2020 年,其中 CLCD_v01_2020、GLOBELAND30 和 GLC_FCS30_2020 产品分辨率均为30 m;LANDCOVER、MCD12Q1 和CNLUCC1000 为更低分辨率,分别为300 m、500 m 和1000 m。

1.2.2 验证样本

本研究所采用的验证样本点均是在Google Earth 上通过对2020 年黄河流域的历史影像进行目视解译筛选出来的,共采取了1540 个样本点(图2),其中耕地540 个、林地293 个、草地204 个、水域182 个、冰川58 个、裸地105 个和建设用地158 个样本点。为减少样本由于定位误差和解译误差所带来的影响,在进行样本选择及解译时需遵循以下原则: 1)样本点选择区域至少为2 km×2 km 均质区域的中心点。2)使用与待评价数据时相一致的2020年的遥感影像,并参考2019-2021 年间的多时相数据。3)对于少数解译较为困难的样本,结合参考其他辅助信息解译。4)采用多人独立解译方式,并在解译结果经商议无法统一时,舍弃该样本。在遵循以上原则的基础上,按类别面积大小、随机采样确定样本位置。

图2 基于Google Earth 的黄河流域样本点分布Fig.2 Sample points distribution of the Yellow River Basin based on Google Earth

1.3 数据预处理

首先,将LANDCOVER 和MCD12Q1 的格式进行统一化处理,而后,为保证土地覆被数据投影一致和无面积变形,选择Albers 等积投影作为基准投影,最后将数据进行裁剪得到黄河流域的土地覆被数据。

统一的分类体系是土地覆被数据精度评价的前提。由于6 种数据采用了不同的分类体系,为了统一标准,在精度评价前需将6 种数据聚类为表2 所示的7 种地物类型,分别是耕地、林地、草地、水域、冰川、裸地和建设用地。

表2 研究所用土地覆被产品类别聚合表Table 2 Aggregation table of land cover types of multi-source remote-sensing products used by the study

2 研究方法

2.1 样本精度评价

由于Google Earth 影像具有定位准确、时相丰富、分辨率高、获取方便、覆被广泛等优势,是精度评价的主要数据源之一[30-33],所以本研究采用Google Earth 影像作为样本,生成了6 种土地覆被分类数据的混淆矩阵。计算总体精度(overall accuracy,OA)、Kappa 系数(K)、使用者精度(user accuracy,UA),以评价6 种土地覆被产品在黄河流域的分类精度情况,将精度最高的产品作为参考数据进行后续的分析与评价。具体计算方法如下:

式中:N是参与评价的样本总数,n是混淆矩阵中的行列数,xii是混淆矩阵中第i行第i列的样本数,xi+和x+i分别为第i行和第i列的样本总数。

2.2 面积一致性评价

为满足土地覆被产品的不同应用需求,在对多套土地覆被分类产品进行比较时,通常将多套验证数据与参考数据进行构成相似性分析得到面积一致性评价。相关系数(R2)表示的是两向量之间的线性关系,本研究通过计算聚合重分类后的5 种土地覆被验证数据与参考数据土地利用数据类型面积的相关性来评价5 种数据类型面积相对参考数据的偏离程度。

2.3 类别混淆图谱分析

面积一致性评价能够表明不同土地覆被产品间土地类型面积构成上的相似性,但无法刻画不同产品之间同一土地覆被类型在空间上的混淆程度[34-35]。因此,采用空间叠置方法,获取不同产品之间逐像元的空间对应关系;而后汇总计算全部类型像元的个数(面积),并与总像元数(总面积)比较,即可得到关于不同产品之间、同一土地覆被类别在空间上的纯净程度(两种产品指示为同一种类型)或混淆程度(两种产品指示为不同的类型)的判断。

3 结果与分析

3.1 样本精度评价

通过Google Earth 在2020 年黄河流域的历史影像上选取验证样本点,然后运用公式(1)-(4)计算得到多源产品精度评价结果(表3)。从总体精度(OA)看,CLCD_v01_2020 最高(OA=88.12%),CNLUCC-1000 最低(OA=71.82%)。其他数据总体精度从高到低依次是GLOBELAND30 (OA=85.32%)、GLC_FCS30_2020 (OA=84.09%)、LANDCOVER300 (OA=77.79%)、MCD12Q1 (OA=73.38%)。30 m 土地覆被产品的KAPPA 系数均在0.8 以上,分类精度较高,随着产品分辨率的下降,分类精度总体也呈现下降趋势。

表3 不同遥感产品的土地覆被精度Table 3 Accuracy results of land cover types of different remote-sensing products %

各数据集在不同覆被类型上存在较大的精度差异。GLC_FCS30_2020 在耕地上具有最高的使用者精度(UA,93.28%),CNLUCC1000 的UA (79.40%)最低。对于林地,MCD12Q1 具有最高的UA (99.48%),CNLUCC1000 最低(93.45%)。草地方面,CLCD_v01_2020 具有最高的UA,但也仅有64.97%,MCD12Q1的UA 仅为40.09%。对于水域CLCD_v01_2020 和LANDCOVER300 具有最高的UA (100%),CNLUCC-1000 具有最低的UA (70.45%)。6 种产品在冰川类型上都具有最高的UA(100%)。对于裸地和建设用地,GLC_FCS30_2020 均具有最高的UA,CNLUCC1000具有最低的UA。

综上可知,CLCD_v01_2020 具有最高的精度结果,主要是由于该数据是以国家为尺度制作的,相比于其他数据在中国拥有更多的样本,并且分类体系属于一级分类,从而增加了聚类的准确性。CNLUCC-1000 具有最低的精度结果是由于分辨率是所有数据中最粗的,较粗的栅格增加了混合像元的概率,同时在定位上可能会存在偏差。6 种产品对于冰川都具有最高UA,草地的分类精度最低,存在耕-草和林-草混淆。

3.2 面积一致性分析

统计6 种遥感产品中各地表覆被类型的面积占比发现,不同数据源各类别面积构成比例总体一致,但具体数值上仍存在一定差异。6 种数据均表明,流域内草地是最主要的土地覆被类型(～50%),其次是耕地和林地,裸地和建设用地等其他土地覆被类型占比较小,均在10%以下(图3a)。将具有最高样本精度的CLCD_v01_2020 产品作为参考数据,分析其他数据的面积偏差,结果表明(图3b),不同数据产品对不同土地覆被的面积判定存在差异。耕地上,GLC_FCS30_2020 与参考数据最为接近(-1.28%),GLOBELAND30 产品差异最大(7.35%)。草地的面积偏差最大,最大和最小值相差20%以上,其中,GOLELAND30 草地面积较CLCD_v01_2020 偏小12.04%,MCD12Q1 草地的面积占比均高于其他数据,比参考数据高11.19%。林地方面,除MCD12Q1(-6.8%)外,其他各验证数据与参考数据一致性较高。CNLUCC1000 的裸地与参考数据面积差异最大(3.42%)。建设用地、冰川和水域等类型与参考数据均表现出较好的一致性,这是由于这3 种土地覆被类型在黄河流域的面积占比本身较小。综上可得,GLOBELAND30 高估了耕地面积,低估了草地面积,存在耕地与草地混淆,将部分草地分进了耕地,LANDCOVER 也存在同样的情形。MCD12Q1 对草地面积的高估则是由于林草的混淆,导致部分林地被错分为草地。CNLUCC1000 数据低估了草地面积是由于草地与裸地混淆较为严重,部分草地被分进了裸地。

图3 不同遥感产品的黄河流域土地覆被类别面积组成(a)与面积偏差(b)Fig.3 Area composition (a) and area deviation (b) of different land cover types in the Yellow River basin of different remote-sensing products

由3.1 可知,CLCD_v01_2020 数据具有最高的样本验证精度,因此,确定以CLCD_v01_2020 为参考数据,分别计算其余5 种验证数据集与该数据的面积相关性。结果表明,5 种验证产品与参考数据的相关性均较高,其中最高的为GLC_FCS30_2020 产品,相关性为0.9976,这是由于两种数据采用同样的LCCS分类体系且都为一级分类,从而增加了聚类的准确性。相关性最低的为GLOBELAND30 产品,相关性为0.9687,这是由于GLOBELAND30 产品的草地和耕地的面积与参考数据相差较大,从而降低了总体的相关性。其余数据相关性从高到低依次为CNLUCC1000 (0.9917)、MCD12Q1 (0.9896)、LANDCOVER (0.9780)。

3.3 类别混淆分析

图4 展示了6 种土地覆被产品不同地物类型间的混淆情况,纵坐标表示不同土地覆被类型的样本点被划分为横坐标所对应地物的数量占比,当样本类型与横坐标对应地物类型相同时,则代表一致,否则代表混淆。

图4 多源遥感数据的土地覆被类型混淆程度Fig.4 Degrees of confusion between land cover types of different remote-sensing products

不同土地覆被产品中耕地、林地、水域、冰川和建设用地的分类精度较高,被混淆的比例较低,这是因为这些地类的光谱特征普遍明显,地物成片分布、边界较为清晰,因此和其他类别混淆相对较少。裸地和冰川光谱特征相似,因此易被识别为冰川。草地是不确定性最大的类型,且普遍存在于各分辨率产品中,CLCD_v01_2020 和GLOBELAND30 将林地、裸地与草地混淆,而GLC_FCS30_2020 存在明显的耕地和草地混淆。百米以上的粗分辨率产品对草地的分类不确定性更大,普遍存在裸地、耕地、林地与草地的混淆,这可能是由于草地存在不同覆盖特征易与其他地类混淆。粗分辨率的水域存在与林地、草地等的错分,主要是由于栅格尺寸大,但水域一般较为狭长,因此,存在混合像元导致混淆。另外,CNLUCC1000 由于较粗的分辨率,在城镇边缘存在城镇用地与耕地的混合像元,导致样本点类型有偏差。由此可见,分辨率越高,分类精度越高,所以提高遥感土地覆被产品的分辨率可以增加对不同地物的分类精度,也是目前的发展方向。

3.4 类别混淆图谱分析

为分析多源土地覆被产品在空间上的一致性,将参考数据CLCD_v01_2020 产品作为基准,对其他数据进行叠加分析(图5)。结果表明,5 种土地覆被产品与CLCD_v0_2020 总体空间一致性较高,但仍存在部分混淆情况。一致性表现在黄河上游青海东部的草地,黄河中下游部分耕地和建设用地等土地利用较为单一和明显的区域,而在黄河中游陕西北部、山西西部和宁夏区域一致性较低,主要表现为草地和林地的混淆。其中GLC_FCS30_2020 与参考数据一致性较好,但仍在黄河上中游内蒙古西南部的草地和山西西部的耕地一致性较低。GLOBELAND-30 与参考数据在黄河上中游宁夏区域和山西西部的草地一致性较差。LANDCOVER 与CLCD_v01_2020在黄河上游一致性较好,但在黄河中游山西西部和陕西北部的一致性较差,混淆在草地、耕地和裸地之间。MCD12Q1 与CLCD_v01_2020 在黄河上游草地一致性较好,而在黄河中游陕西北部、山西西部和河南北部的林地一致性较差。CNLUCC1000 与参考数据的混淆表现出破碎特征,在黄河上中游主要表现为草地的混淆,在黄河下游主要表现为林地和耕地的混淆。对于5 种数据与CLCD_v0_2020 差异较大的区域,如山西西部与陕西北部,通过与Google earth 历史影像对比,发现在山西西部差异较大的地物实际为耕地,在陕西北部差异较大的地物实际为草地,结果均与参考数据一致,这表明对于植物的精确分类算法仍需要改善。

图5 多源遥感产品与参考数据的类别混淆空间图谱Fig.5 Confuse spatial atlases of multi-source remote-sensing land cover products with the categories of reference data

4 讨论和结论

本研究评估了黄河流域6 套土地覆被数据的分类精度,结果表明,6 种数据精度从高到低依次为CLCD_v01_2020、GLOBELAND30、GLC_FCS30_2020、LANDCOVER300、MCD12Q1、CNLUCC-1000。该结果与刘琼欢等[34]在羌塘高原利用直接法得到的不同数据集精度从高到低的顺序一致(GLOBELAND30＞GLC2000＞MCD12Q1),但与陈逸聪等[14]在长三角地区的评价结果(GLC_FCS30＞GlobeLand-30＞CCI_LC＞FROM-GLC)和仝冉等[32]在蒙古高原的研究结果(GLC_FCS30＞GLOBELAND30＞FROM-GLC)存在一定差异。较已有的研究,本研究增加了CLCD数据集,发现在黄河流域该数据集较GLOBELAND30、GLC_FCS30 精度更高。在不同的研究区,可以看出多源数据精度总体较高,但由于样本的选择、目标分类系统、评价方法等的差异会对结果造成一定影响,导致各数据的评价结果也存在差异。

对于黄河流域不同土地覆被精度产生差异的原因与黄亚博等[19]在河南区域产生差异的原因类似,主要有以下几方面: 1)制图范围的不同会造成数据的精度差异。全球范围的数据在中国区域的训练样本较少,从而导致在相同分辨率下,分类精度较低。2)不同的空间分辨率也是造成差异的原因之一。高分辨率数据的像元纯净度较粗分辨率的数据高,因此,分类精度也较高。3)分类体系的转换也可能造成精度的差异。统一的分类体系是土地覆被数据精度评价的基础,但不同的分类体系在向目标分类体系转换时可能存在误差,从而会影响后续精度评价的准确性。

从混淆类型来看,黄河流域主要表现为耕地、林地和草地的混淆,这与已有的研究结果类似[13,19,21]。例如全国尺度耕地和草地面积变化趋势以及空间分布与我国实际情况存在较大差距[13],河南省山地与平原、山地与盆地过渡带的耕地、林地和草地混淆严重[19,21]。可见,目前对于植被类型的精确分类仍是土地覆被数据生产的主要难题之一,在未来针对耕地、林地和草地的混淆现象,建议在结合地形特征的基础上,引入区域植被物候信息以降低“异物同谱”所带来的影响。

综上,本研究通过在Google Earth 上选择验证点对黄河流域6 种土地覆被数据进行精度评价,并选择精度较高的数据作为参考数据与其他数据进行面积一致性分析和类别图谱分析。主要结论如下: 利用验证点对6 种土地覆被数据进行精度评价可得,6种数据的精度为71.82%～88.12%,其中30 m 的土地覆被数据中,CLCD_v01_2020 产品精度最高,低分辨率的数据中,LANDCOVER300 产品精度最高,为77.79%。6 种数据对黄河流域土地覆被构成的描述基本一致,即黄河流域主要以草地、耕地和林地为主体,继而为水域、冰川雪地、裸地和建设用地等其他土地类型。不同土地覆被产品与CLCD_v01_2020的面积相关性很强,相关系数为96.87%～99.76%。不同产品与CLCD_v01_2020 在黄河上游青海东部的草地,黄河中下游部分耕地和建设用地等类型较为单一的区域一致性较高,而在陕西北部、山西西部的一致性较差,主要表现为草地和林地的混淆。针对黄河流域土地覆被数据,30 m 分辨率的数据中可以综合选择总体精度最高的CLCD_v01_2020 数据,百米级分辨率数据中选择LANDCOVER300,或者生成粗分辨率像元内各地类的面积百分比,以提高计算和模拟精度。