MODIS 和VIIRS 植被指数产品在估算甘南草地生物量的适用性

2023-10-10 09:37张忠雪冯琦胜王瑞泾金哲人梁天刚
草业科学 2023年9期
关键词:甘南植被指数反演

张忠雪,冯琦胜,王瑞泾,金哲人,梁天刚

(兰州大学草地农业科技学院, 甘肃 兰州 730020)

草地是全球生态系统的重要组成部分[1],在生态环境中具有至关重要的作用[2]。草地地上生物量(above-ground biomass, AGB)是评价草地生态系统功能和生产力的重要指标[3],它影响着生物多样性和环境过程(水循环、土壤侵蚀和退化)。此外,它不仅能够反映草地的生长状况,还可以反映草地对全球气候变化和人类活动的敏感性,对评价和认识草地生态系统退化的严重程度至关重要[4]。近年来,随着高时空分辨率的多光谱遥感和无人机技术的不断发展,草地监测遥感数据的类型也发生了变化。MODIS NDVI [中分辨率成像光谱仪(moderateresolution imaging spectroradiometer, MODIS) 归 一 化植被指数(normalized differential vegetation index)]自2000 年起逐步替代AVHRR NDVI [改进型甚高分辨率辐射计(advanced very high resolution radiometer)NDVI],其继承了AVHRR NDVI 的优点,同时弥补了AVHRR NDVI 的部分不足,能更好地反映植被状况[5]。2011 年10 月28 日美国发射了Suomi NPP(The Suomi National Polar-orbiting Partnership)卫 星,该卫星用来接替处于超期服役状态下的Terra 和Aqua 卫星[6]。NPP 携带包括可见光红外成像辐射仪(visible infrared imaging radiometer, VIIRS)在 内 的5 个对地观测仪器,其中VIIRS 具有中、高分辨率的两种工作模式,是MODIS 系列的拓展。如果MODIS失效,VIIRS 将在延续MODIS 的任务上发挥重要作用[7]。

自NPP 卫星发射以来,VIIRS 应用于诸多研究领域。比如研究者利用VIIRS 昼夜通道反演华北地区夜间气溶胶光学厚度[8];使用VIIRS 夜灯复合材料绘制了巴西、印度、中国和美国多个定居点的夜灯地图[9];利用NPP-VIIRS 夜间灯光影像和气象数据等构建长株潭城市群PM 2.5 浓度估算模型[10];利用NPP-VIIRS 日/夜波段数据,并结合夜间光照变化和辐射归一化方法,评估郑州的经济恢复力[11];对比分析了MODIS 和VIIRS 的热发射波段数据,结果表明当亮度温度大于230 K 时,MODIS 和VIIRS可比波段的亮度温度差一般在0.2 K 以内[12]。MODIS传感器已经持续提供了20 多年的遥感数据,VIIRS传感器可为遥感数据监测研究提供更长的时间序列资料,因此对比分析MODIS 与VIIRS 在估算草地地上生物量方面的精度,探究VIIRS 能否代替MODIS 为草地地上生物量的变化监测提供数据支撑,具有重要意义。

本研究以甘南地区为例,选用MODIS 的4 种植被数据产品和VIIRS 的两种植被数据产品,结合增强型植被指数(enhanced vegetation index, EVI)和NDVI两种植被指数,分别基于传统方法与随机森林方法构建反演模型,分析MODIS 与VIIRS 在高寒草地地上生物量估测方面的精度差异,探究在高寒草地地上生物量估测方面表现更好的产品,对甘南高寒草地地上生物量监测具有指导作用,对高寒草地资源保护与利用、草畜平衡管理的可持续发展具有重要意义。

1 材料与方法

1.1 研究区概况

甘南位于我国甘肃省西南部,地处青藏高原东北边缘,南与四川阿坝州相连,西南与青海黄南州、果洛州接壤,东面和北部与陇南、定西、临夏毗邻。地理坐标为100°46′~104°44′ E,33°06′~36°10′ N,南北宽270 km,东西长360 km,海拔介于1 100~4 900 m,海拔由东向西逐渐增加,平均海拔超过3 000 m。甘南各地年平均气温在1~13 ℃,地域差异很大。总的分布趋势是自东南向西北逐渐递减。四季气温的分布趋势大致与年平均气温相似,由东南向西北递减。气温的年较差一般在20~22 ℃。年平均降水量400~800 mm,但是降水并不是平均分布,其随海拔的升高而增加。甘南地处青藏高原东缘,是黄河重要的水源补给区,同时也是甘肃省极为重要的农牧业产品供给区[13]。草地作为农牧业和水源补给的载体,对生态调节和经济发展具有极其重要的作用。甘南天然草地类型有山地草甸、高寒草甸、沼泽等,地势东低西高,可利用草地面积较大,主要分布在玛曲、碌曲、夏河三县。虽然其地处高原,年平均气温较低,但草地资源丰富,畜牧业较发达[14]。

1.2 野外调查数据

本研究采用2016-2021 年的7 月-8 月甘南的实测数据,在甘南选择具有代表性的位置设置样地。本研究采用的样方大小为0.5 m × 0.5 m,共采集了105 个样点数据,每个样点设置3 个样方,取平均值(图1)。同时应用每个样点对应的经度(X)、纬度(Y)和地上生物量等实测数据。采样记录的内容包括样点经纬度、地上生物量、干重、草层高度、植被类型等指标。其中,在采样过程中,齐地剪取植被的地上部分,将样品烘干,测量干重,即为地上生物量。图2 为105 个实测样点采样的具体时间分布。

图1 甘南草地类型和定位观测点分布Figure 1 Distribution of grassland types and locating observation points in Gannan

图2 2016-2021 年甘南野外实测地上生物量Figure 2 Above-ground biomass of field measurements in Gannan from 2016 to 2021

1.3 MODIS 和VIIRS 数据

本研究使用了来自美国航空航天局发布的MOD13A1、MOD13A3、MOD13Q1 和MCD43A4 产品以及VNP13A1、VNP13A3 产品(表1)。其中,MCD43A4 产品提供了经过双向反射分布函数(bidirectional reflectance distribution function, BRDF)校准的逐日地表反射率数据,它包括MODIS1-7 通道,本研究仅使用第1 波段、第2 波段和第3 波段来计算NDVI[15]和EVI[16]。此外,对于MOD13A1、MOD13A3、MOD13Q1 这3 种产品,本研究使用MODIS数据重投影工具(MODIS reprojection tool,MRT)进行了提取与格式转换,VNP13A1 和VNP13A3 产品基于ArcGIS 软件进行了提取与格式转换,此5 种产品均基于最邻近法重采样,并利用ArcGIS 软件进行转投影,采用AEA-Krassovsky 投影,处理后的数据为Geo-Tiff 格式。遥感影像日期与实际采样日期的对比如表2 所示。

表1 基于MODIS 和VIIRS 传感器的各植被指数产品的参数Table 1 Parameters of various vegetation index products based on MODIS and VIIRS sensors

表2 影像日期与采样日期对比表Table 2 Comparison table of the image and sampling dates

1.4 植被指数计算

本研究采用NDVI 和EVI 两种植被指数进行草地地上生物量反演模型的构建,其公式分别为:

式中:NIR、R、B分别表示近红外波段、红光波段和蓝光波段,在EVI中,L= 1,为土壤调节参数,参数C1和C2的值分别为6.0 和7.5。

1.5 随机森林回归模型

随机森林(random forest,RF)回归模型是Breiman提出的基于多棵决策树对样本进行训练,并根据训练得到的模型对待测样本类别进行预测的一种监督学习算法[17-19]。RF 利用bootstrap 重抽样方法从原始样本中抽取同原始数据样本集个数相同的多个样本构成样本子集,利用每个样本子集构建决策树,然后融合多棵决策树的预测结果[20],模型的最终输出结果由森林中的每一棵决策树共同决定。本研究中,设置的决策树数量为100,为了减少训练样本划分偶然性带来的结果误差,本研究采用10 折交叉验证确保模型的稳定性[21]。在10 折交叉验证中,试验数据样本被划分为10 份,其中9 份作为训练集,1 份作为测试集,将系统选出的测试集中最好的模型作为最终构建反演模型的结果。

1.6 精度评价

本研究采用决定系数(coefficient of determination,R2)和均方根误差(root mean square error, RMSE)评价AGB 估测模型的精度[22-23],计算公式如下:

式 中:yi、yˆi和y¯分别 为AGB 的实 测值、估测 值和实测值均值,n为 样本数量。R2的范围在0~1,数值越大,则说明模型与实测数据的拟合度越高;RMS E反映了AGB 实测值和估计值之间的离散程度,数值越小,说明预测结果越好[24]。

1.7 趋势分析

Slope 趋势分析是描述时间序列变化趋势的分析方法。其利用线性回归对时间序列进行拟合,探究不同空间尺度下变量的时空变化趋势[25]。本研究基于此方法探究甘南2016-2021 年高寒草地地上生物量的变化趋势。计算公式如下:

式中:i为年变量,从1 到n,n为 年份数,yi为 第i年的生物量。Slope为斜率,表征各参数的变化趋势。Slope> 0 (Slope< 0),即斜率为正(负),表示生物量增加(减少)。

2 结果与分析

2.1 基于MODIS 草地生物量的回归模型

基 于MOD13A1、MOD13Q1、MOD13A3、MCD43A4和试验区实测草地地上生物量建立的回归模型(表3、表4、表5、表6)可知,在4 种遥感植被指数产品中,MOD13A1 EVI 的线性(R2= 0.482)、对数(R2=0.462)、逆(R2= 0.432)、幂(R2= 0.489)、S (R2= 0.472)、增长(R2= 0.495)和指数(R2= 0.495)模型的决定系数均高于其他遥感产品,而RMSE 与其他遥感资料相比较低;MOD13Q1 NDVI 的线性(R2= 0.295)、对数(R2= 0.288)、逆(R2= 0.277)、幂(R2= 0.330)、S (R2=0.325)、增长(R2= 0.331)和指数(R2= 0.331)模型的决定系数均低于MOD13A1 和MOD13A3 产品的相应模型,RMSE 介于MOD13A1 EVI 和MOD13A3 NDVI之间,整体RMSE 值偏高,说明本研究中MOD13Q1产品反演甘南地区AGB 的精度最差。其中MCD43A4产品的R2低于MOD13A1,RMSE 值大于MOD13A1 EVI 模型。由此可见,基于MOD13A1 EVI 的增长模型是反演试验区草地生物量的最优模型。

表3 基于MOD13A1 甘南试验区草地生物量的回归模型Table 3 Biomass regression models based on MOD13A1 in the experimental area of Gannan region

表4 基于MOD13Q1 甘南试验区草地生物量的回归模型Table 4 Biomass regression models based on MOD13Q1 in the experimental area of Gannan region

表5 基于MOD13A3 甘南试验区草地生物量的回归模型Table 5 Biomass regression models based on MOD13A3 in the experimental area of Gannan region

表6 基于MCD43A4 甘南试验区草地生物量的回归模型Table 6 Biomass regression models based on MCD43A4 in the experimental area of Gannan region

2.2 基于VIIRS 草地生物量的回归模型

基于VNP13A1、VNP13A3 和试验区实测草地地上生物量建立的回归模型(表7、表8)可知,在两种遥感植被指数产品中,VNP13A3 EVI 的线性(R2=0.213)、对 数(R2= 0.215)、逆(R2= 0.2092)、幂(R2=0.230)、S (R2= 0.226)、增长(R2= 0.226)和指数(R2=0.226)模型的决定系数均高于VNP13A3 产品,而RMSE 与其相比较低。由此可知,在以上两种产品中,基于VNP13A3 EVI 的模型精度最高,但与MOD13A1 EVI 相 比,VNP13A3 EVI 的R2较 低 且RMSE 值 偏大,因此在传统方法中,基于MODIS 数据建立的甘南草地地上生物量的模型精度更高。

表7 基于VNP13A3 甘南试验区草地生物量的回归模型Table 7 Biomass regression models based on VNP13A3 in the experimental area of Gannan region

表8 基于VNP13A1 甘南试验区草地生物量的回归模型Table 8 Biomass regression models based on VNP13A1 in the experimental area of Gannan region

2.3 基于随机森林的草地生物量反演

基于随机森林和试验区实测的草地地上生物量建立的回归模型(表9)可知,在6 种遥感植被数据产品中,MOD13A1 的测试集R2(0.653)最高,RMSE值(718.89)最低;VNP13A3 的测试集R2(0.246)最低,RMSE (851.34)最高,二者精度相差较大,因此基于MOD13A1 植被指数产品的随机森林模型的精度较高,VNP13A3 植被指数产品的精度较低。与传统方法得出的最优模型的精度相比,应用随机森林方法计算的精度更高。

表9 基于VNP13A3 甘南试验区草地生物量的回归模型Table 9 Biomass regression models based on VNP13A3 in the experimental area of Gannan region

2.4 甘南地上生物量的空间分布

基于随机森林反演得到的生物量和试验区实测草地地上生物量数据(图3)对比分析表明,真实值和预测值的拟合度较好,数据的分布比较集中,异常值较少,中位数位于四分位距的中间。预测值偏态非对称,中位数位于四分位距的中间偏下,预测值的分布与真实值相比较集中。

图3 基于随机森林得出的预测值与真实值Figure 3 Prediction and actual based on a random forest

基于MOD13A1 产品模拟甘南地区2016-2021年草地地上生物量的分布结果(图4)表明,甘南地区草地地上生物量较大的区域(> 3 000 kg·hm-2)主要是玛曲县、碌曲县和合作市,草地地上生物量较小 的 区 域(< 1 500 kg·hm-2)主 要 是 夏 河 县 和 迭 部县。西部地区的草地地上生物量较高,东部地区的非草地区域比较多,且生物量较低。

图4 2016-2021 年甘南地区草地地上生物量均值空间分布Figure 4 The spatial distribution of mean grassland above-ground biomass on the Gannan Plateau from 2016 to 2021

2016-2021 年甘南地区地上生物量变化趋势情况如图5 所示。生物量增加幅度较大的区域主要分布于夏河县北部、玛曲县西北部以及碌曲县中部,生物量减少幅度较大的区域主要分布于玛曲县东南部和碌曲县南部。

图5 2016-2021 年甘南地区草地地上生物量变化趋势Figure 5 The trends of grassland above-ground biomass on the Gannan Plateau from 2016 to 2021

3 讨论

本研究选用的6 种植被数据产品间EVI 的相关系数如图6 所示。结果表明,MOD13A1 与其他5 种产品的相关性最好,其中,MOD13A1 与MOD13Q1、MOD13A3、MCD43A4 的相关系数均在0.8 以上,相比较而言,MOD13A1 产品与VNP13A3、VNP13A1的相关性较低。MCD43A4 产品与其他5 种产品的相关性也较高,与MOD13A1、MOD13Q1 的相关系数在0.8 以上,与MOD13Q1、VNP13A3、VNP13A1的相关系数均在0.7 以上。VNP13A1 产品与其他5 种产品的相关性最差。本研究选用的6 种植被数据产品间NDVI 的相关系数如图7 所示。结果表明,MOD13A1 与其他5 种产品的相关性最好。其中,MOD13A1 与MOD13Q1、MOD13A3、MCD43A4的相关系数均在0.8 以上,相比较而言,MOD13A1产品与VNP13A3、 VNP13A1 的相关性较低。MOD13A3 产品与其他5 种产品的相关性也较高,与MOD13A3、MCD43A4 的相关系数均在0.8 以上,与MOD13Q1、VNP13A3 的相关系数在0.7 以上,与VNP13A1 的相关性较低。VNP13A3 产品与其他5 种产品的相关性最差。经对比分析发现,4 种MODIS植被指数产品间具有较高的相关性,这可能是由于传感器相同,而相关性大小有所不同的原因可能是时间分辨率、空间分辨率及交点时间不同。本研究发现MODIS 与VIIRS 间的相关性较低,原因可能是卫星和传感器不同。

图7 各植被指数产品间NDVI 的相关系数Figure 7 The correlatio coefficient of NDVI among different vegetation index products

陆荫等[26]基于MOD13Q1 产品采用传统方法构建了甘南草地地上生物量的反演模型,建模精度R2=0.525,与其相比,本研究建模精度为0.653,建模精度的差异可能是因为植被指数产品不同以及建模方法不同。但本研究基于传统方法下的MOD13Q1 产品估算甘南地上生物量的最优模型精度仅为R2= 0.387,这可能是由于采样点不同,导致了结果的差异。于惠等[27]基于MCD43A4 产品采用传统方法构建了古浪县草地地上生物量的反演模型,建模精度R2=0.540,而本研究基于传统方法下的MCD43A4 产品估算甘南地上生物量的最优模型精度R2= 0.391,出现差异的原因可能是研究区域以及应用的植被指数不同。Meng 等[28]研究表明,卫星图像的时间和空间分辨率、传感器类型、图像处理方法和采样点等都会对草地生物量反演模型的精度造成影响。

本研究基于传统方法的6 种植被数据产品估算的模型精度在0.154~0.495,而基于随机森林估算的模型精度在0.246~0.653。以MOD13A1 为输入数据的随机森林AGB 模型具有较高的建模精度(R2= 0.653,RMSE= 718.89 kg·hm-2),而传统方法的精度较低(R2= 0.495,RMSE= 580.77 kg·hm-2)。说明在本研究中机器学习相较于传统回归模型,更具优势,精度更高。Zhang 等[29]以青藏高原AGB 观测数据为基础,结合气候、土壤和地形数据,利用随机森林算法构建草地地上生物量估算模型,建模精度为0.760。与其相比,本研究建模精度较低。因此,在后续研究中,还应探讨其他辅助数据对于建模精度的影响。

本研究探讨了MODIS 与VIIRS 的NDVI、EVI指数和草地地上生物量的关系,然而MODIS 和VIIRS还包括如MCD19A2 等在内的多源数据,我们将在后续研究中探讨其他产品与高寒草地地上生物量的关系。此外,根据本研究结果,在地上生物量方面,虽然VIIRS 也有较高的精度,但是仍无法代替MODIS,因此,在今后的研究中会继续探讨其他产品,例如FY-3D 等能否在研究高寒草地地上生物量方面比MODIS 表现出更好的性能。

4 结论

本研究以甘南地区为例,选用MODIS 的4 种植被指数产品和VIIRS 的两种植被指数产品,结合EVI 和NDVI 两种植被指数,基于传统方法和随机森林分析对比MODIS 和VIIRS 两种传感器在甘南地区草地地上生物量估算中的精度。现主要结论如下:1)与VIIRS 相比较,基于MODIS 的甘南地区草地地上生物量反演模型的精度更高,MODIS MOD13A1产品更适用于甘南高寒草地地上生物量的估算。2)甘南地区草地地上生物量较大的区域(> 3 000 kg·hm-2)主要分布于玛曲县、碌曲县和合作市,草地地上生物量较小的区域(< 1 500 kg·hm-2)主要分布于夏河县和迭部县。西部地区的草地地上生物量较高,东部地区的非草地区域比较多,且生物量较低。3)生物量增加幅度较大的区域主要分布于夏河县北部、玛曲县西北部以及碌曲县中部,生物量减少幅度较大的区域主要分布于玛曲县东南部和碌曲县南部。

猜你喜欢
甘南植被指数反演
反演对称变换在解决平面几何问题中的应用
甘南走读
甘南九章
甘南记
《去甘南》
基于植被指数选择算法和决策树的生态系统识别
AMSR_2微波植被指数在黄河流域的适用性对比与分析
河南省冬小麦产量遥感监测精度比较研究
基于低频软约束的叠前AVA稀疏层反演
基于自适应遗传算法的CSAMT一维反演