基于无人机与机器学习的黄河源高寒草地植被覆盖度反演技术

2021-09-13 02:26赵健赟丁圆圆刘文惠朱海丽李国荣
科学技术与工程 2021年24期
关键词:样方覆盖度实验区

赵健赟,丁圆圆,杜 梅,刘文惠,朱海丽,2,李国荣,2,杨 静

(1.青海大学地质工程系,西宁 810016;2.青藏高原北缘新生代资源环境重点实验室,西宁 810016;3.青海省刚察县气象站,刚察 812300)

青藏高原是“世界第三极”,具有高寒、高海拔气候环境,其陆地生态系统具有独特性、脆弱性等特征,它是欧亚大陆草地的重要组成部分,也是中国五大草地畜牧业基地之一[1]。20世纪70年代起,在过度放牧、鼠兔干扰、气候变化等自然和人为因素的共同作用下,高寒草地呈现出明显的退化趋势,覆盖度降低是草地植被退化的重要标志之一[2-3]。同时,植被覆盖度是国家实施地理国情监测战略的重要监测内容,也是水土流失的主要影响因子和水土保持监测的重要区域环境因子[4]。

草地植被覆盖度(fractional vegetation cover,FVC)是指草地样方中全部植物个体的叶、茎等地上部分垂直投影比例,是反映草地植被生长状况和环境质量的重要参数,也是气候、生态、水文模型中的核心输入参数[5],可以通过目测法、照相法、遥感解译等多种方法进行测量[6]。赵增秀等[7]利用数码相机提取了FVC,发现基于近红外相机的草地覆盖度估测系统具有更高的精度;胡健波等[8]研究发现半自动阈值法提取数码相片草地覆盖度的准确度堪比最大似然法,且不存在低覆盖率高估问题,人工干预少,计算结果准确客观,有较强的适用性强,但对绿色特征不明显的植物效果不佳;蔡栋等[9]基于多源遥感数据开展FVC的估算,发现乘幂模型对以像元二分法计算的FVC校正效果最佳,对数模型对以二分法计算的FVC校正效果最佳。尽管Landsat等地球观测卫星系统、以及甚高分辨率扫描辐射计(advanced very high resolution radiometer,AVHRR)、中分辨率成像光谱仪(moderate resolution imaging spectroradiometer,MODIS)等遥感数据能够较好地解决大面积区域FVC反演问题,但在高原高寒地区也客观存在数据质量不佳、数量源受限与反演结果不确定等问题。因此,如何基于遥感数据进行极端环境下植被覆盖度的反演,已经成为区域环境监测等领域的热点问题之一。

为此,利用低空无人机(unmanned aerial vehicle,UAV)可见光遥感开展高寒FVC反演,一方面能够为区域地表覆盖度反演提供真实性检验与验证的基础资料,另一方面也具有较高的作业效率和较低的野外工作成本。拟利用UAV、统计建模和机器学习方法开展高寒FVC的测量与估算,为高原复杂环境下生态环境质量调查与评估提供参考。

1 实验区概况

实验区处于黄河源地区,位于青海省东南部河南蒙古族自治县境内,九曲黄河第一右旋弯曲部南端,地理位置如图1所示。该地区地势东北高、西南低,海拔3 600 m以上,属典型的浅切割高山区,高原大陆性气候特点明显,5—10月份温暖、多雨,11月至次年4月份寒冷、干燥、多大风天气,年均气温约为10.4 ℃,年降水量约600 mm,年均蒸发量约1 340 mm,境内有天然草场约9 800万亩(1亩=666.67 m2),是青藏高原东部著名的天然优质草场之一[10]。

图1 实验区地理位置

2 数据来源与研究方法

2.1 数据来源

利用大疆精灵Phantom 4 Pro V2.0型无人机,于2018年7月在实验区采集地表覆盖数据,设置航飞高度为120 m,航向/旁向重叠率为75/65%,飞行速度为9.5 m/s,地面采样距离(ground sample distance,GSD)为3.28 cm/pixel,经由大疆智图平台完成图像拼接,获得实验区约3 km2的数字正射模型(digital orthographic model,DOM)影像数据,如图2所示。

图2 实验区低空无人机影像

2.2 研究方法

研究采用的技术流程如图3所示。首先,在获取的实验区低空无人机影像上随机选择141个25 m×25 m的样方,利用人工目视解译的方法获得每个样方的FVC值,由于空间分辨率高达3.28 cm,由此解译的结果可以视为真值。同时,将样方空间分辨率重采样至25 m,计算各个样方的归一化差异指数(normalized difference index,NDI)、过绿指数(excess green,EXG)、可见光波段差异植被指数(visible-band difference vegetation index,VDVI)和红绿蓝比值植被指数(red-green-blue rate index,RGBRI)[11],计算公式分别为

图3 研究采用的技术路线图

NDI=(G-R)/(G+R)

(1)

EXG=2G-R-B

(2)

VDVI=(2G-R-B)/(2G+R+B)

(3)

RGBRI=(R+B)/2G

(4)

式中:R、G、B分别为无人机影像红、绿、蓝波段的像元值。

然后,将141个样方随机分为训练组和检验组,其中训练组含100样方,检验组含41个样方,并利用线性模型、指数模型、对数模型、幂指数模型、Logistic模型和Gamma模型分别对样方覆盖度数据和可见光指标指数进行相关性分析与统计建模。同时,对样方R、G、B均值和对应的FVC建立反向传播(back propagation, BP)神经网络模型,并利用Levenberg-Marquardt(L-M)算法进行学习。L-M算法是梯度法与高斯-牛顿法的结合,同时具备局部收敛性和全局收敛性。原理如下:假设xk为第k次迭代的神经网络权值向量,新的权值向量xk+1为

xk+1=xk+Δx

(5)

式(5)中:Δx为相邻权值向量的迭代值,计算规则为

Δx=-[JT(x)J(x)+μI]-1J(x)e(x)

(6)

式(6)中:I为单位矩阵;μ为常量系数;e(x)为误差;J(x)为Jacobian矩阵,可表示为

(7)

式(7)中:e1,e2,…,en为迭代向量的残差。

在学习过程中,设定训练最大次数为5 000,误差为0.000 1,使用S型传输函数。

基于以上建立的统计分析模型和机器学习模型,采用均方根误差(RMSE)、估算精度(AC)和相对偏差(RD)来评价各方法的精度,计算公式为

(8)

(9)

(10)

最后,利用建立的最优FVC反演模型对实验区低空无人机遥感影像的草地植被覆盖度FVC进行反演和分析。

3 结果与分析

利用式(1)~式(4)计算所有样方的EXG、NDI、RGBRI和VDVI指数,并与FVC真值进行相关性分析,结果如表1所示。

表1 可见光植被指数与FVC的相关性

由相关性分析结果可知,各个指数与FVC的相关性均大于0.6,除了RGBRI与FVC为负相关外,其余指数均与FVC存在显著的正相关关系,其中EXG指数与FVC具有最高的相关性。因此,对100个训练样方利用FVC真值FVC与EXG指数建立指数、对数、logistic、gamma等统计模型,结果如图4、表2所示。

图4 EXG与FVC的统计模型

表2 FVC统计模型信息

基于FVC训练组数据建立机器学习模型,该模型是含有2个隐含层、10个节点的BP神经网络模型,对训练样方R、G、B均值和对应的FVC利用L-M算法对网络进行学习;同时,基于41个检验组FVC真实数据对建立的统计模型和机器学习模型进行精度检验,利用式(8)~式(10)分别计算各个模型的均方根误差RMSE、估算精度AC和相对偏差RD值,结果如表3所示。

由表3可以看出,统计分析模型中对数模型的均方根误差RMSE、估算精度AC和相对偏差RD指标均优于线性模型、指数模型、幂指数等其它统计模型,而机器学习模型的RMSE、AC和RD指标精度又显著优于对数模型。因此,可以利用上述L-M算法建立的机器学习模型,对实验区获取的无人机可见光影像进行反演,获得实验区FVC数据,结果如图5所示。

图5 实验区FVC反演结果

表3 统计模型与机器学习模型精度检验

根据上述反演结果可以发现,实验区FVC低值主要分布在未利用荒地、建筑用地和河岸沙滩地,而

FVC高值主要分布在小灌丛覆盖和未退化草甸覆盖区,结果与实验区实地调查情况吻合。

4 讨论

刘艳慧等[12]分析了无人机大样方估算FVC的可行性,结果发现通过绿植被指数EXG估算无人机大样方FVC的精度较高,与本研究获得的结果一致;高永平等[13]研究表明,可见光波段差异植被指数VDVI反演FVC精度最好,这与本研究获得的FVC与过绿指数EXG具有最高的相关性结果不一致,本研究的实验区地处黄河源腹地,主要针对高寒草地的FVC,与其针对的腾格里荒漠地带存在显著的地理差异。因此,利用无人机可见光开展FVC反演,需要充分考虑地域间的分异特征。

目前,对于FVC估算与反演问题,样方尺度上主要采用照相法直接估算,尺度难以拓展且效率较低;大面积区域尺度上一般通过遥感影像进行FVC反演,但地面验证和真实性检验一直是其瓶颈问题。本文提出的基于低空无人机可见光遥感技术在样方、样地和小区域尺度上的FVC反演中具有较强的可靠性、适用性和较高的生产效率。而针对可见光影像FVC方面的研究,大多是构建VDVI、EXG等可见光植被指数后,再利用统计建模的方法进行覆盖度反演,各个模型精度差异较大,而对数、gamma和多项式模型一般具有较好的精度[14-15]。在开展统计建模的基础上,将无人机遥感与机器学习应用于可见光高寒草地FVC反演中,各项精度指标均显著优于统计模型(图6),具有一定的创新,且表现出明显的技术优势。但是,研究涉及的实验区在黄河源区较为集中,下一步将在黄河源其他高寒草地覆盖区开展进一步验证,并基于覆盖度反演结果进行高寒草地退化与生态环境质量评价方面的工作。同时,将结合Landsat、高分系列等卫星影像数据,开展对应植被覆盖产品在高寒地区的真实性检验与验证。

图6 机器学习与统计模型的精度比较

5 结论

针对高寒草地生态环境质量调查与实验过程中大面积FVC测量问题,在黄河源地区利用UAV遥感技术、统计建模与机器学习方法,开展了基于可见光影像数据的高寒FVC反演、精度验证等方面的研究,得出以下主要结论。

(1)基于可见光红、绿、蓝波段值构建的NDI、EXG、VDVI、RGBRI指数中,过绿指数EXG与FVC具有最高的相关性,其相关系数比RGBRI略高,比NDI高出近5.2%,表明利用EXG开展FVC反演具有较高的可靠性。

(2)利用EXG指数建立与高寒草地FVC间的线性、指数、对数、幂指数、Logistic和Gamma等统计模型中,对数模型的验证精度最高,其次为Gamma模型,幂指数和指数模型精度欠佳,且发现建立统计模型时存在显著的地域分异特性。

(3)直接利用可见光红、绿、蓝波段值所建立的机器学习模型,检验获得的均方根误差、估算精度、相对偏差和决定系数比对数模型分别提高2.68%、3.75%、7.35%和13.91%,显著优于各个统计模型。机器学习技术优势明显,且不需要预先构建可见光植被指数模型,通过对样方的学习后即可实现对大面积FVC的反演,成本、效率和精度均优于地面测量和卫星遥感数据反演获得的结果。

猜你喜欢
样方覆盖度实验区
国家可持续发展实验区全要素生产率的空间分异及影响因素
呼和浩特市和林格尔县植被覆盖度变化遥感监测
基于NDVI的晋州市植被覆盖信息提取
植被盖度对飞播造林当年出苗效果的影响
典型野生刺梨(Rosa roxburghii Tratt.)灌草丛植物多样性研究
塞罕坝机械林场植被覆盖度及景观格局变化分析
2016年国家文创实验区规上文化产业收入近2000亿元
基于多元线性回归分析的冬季鸟类生境选择研究
教育部办公厅下发关于公布国家特殊教育改革实验区名单的通知
我国高校设立100个人才培养模式创新实验区