基于深度学习的多源遥感反演麦田土壤墒情研究

2023-03-04 06:28张成才恒卫东

节水灌溉 2023年2期

李艳，张成才，恒卫东

（1.河口生态安全与环境健康福建省高校重点实验室，福建漳州 363000；2.厦门大学嘉庚学院环境科学与工程学院，福建漳州 363000；3.郑州大学水利科学与工程学院，郑州 450001）

准确获取土壤墒情，特别是粮食主产区的土壤墒情信息，对于保障农作物健康生长发育，估算农作物需水情况，制定农作物生长灌溉用水计划，指导农业建设、防旱抗旱以及农田生态环境修复都具有重要的科学意义和现实意义[1,2]。

遥感技术能够快速、准确、可持续地获取大面积地表信息，是目前监测和反演土壤墒情的主要手段之一。根据传感器的不同，遥感可大致分为光学遥感和微波遥感。光学遥感是目前发展较为成熟的遥感手段，基于光学遥感发展了一大批土壤墒情反演方法[3-5]。但是，光学遥感受云层、太阳照射以及天气条件的影响较大[6]。微波遥感不仅能够全天时、全天候的对地物进行探测，还能够穿透云雾和一定厚度的植被而直接获取地表信息，有效弥补了光学遥感的不足[7,8]。以合成孔径雷达（Synthetic Aperture Radar， SAR）为代表的主动微波，其后向散射系数对地物的几何特征如地表粗糙度、介电特性等非常敏感，为反演土壤墒情提供了可靠的数据支持[9]。受地表粗糙度、植被的衰减等因素影响，微波信号与土壤水分之间的关系很难用数学解析式精确表达[10]。

与传统统计回归方法相比，机器学习方法具有很强的自学习、自组织和自适应等能力，非常适合解决这种非线性的复杂问题。因此，机器学习方法在土壤墒情反演研究中得到了广泛的应用。Paloscia 等[11]利用模拟的Sentinel-1 SAR 数据，采用人工神经网络（Artificial Neural Network， ANN）配置不同的训练数据，在意大利、澳大利亚和西班牙等6个试验区对土壤墒情进行反演。结果表明，在6 个实验区域中采用ANN得到的土壤墒情与实测值的均方根误差（RMSE）介于1.67%和6.68%之间，且大部分区域小于4%。 Greifeneder 等[12]将Sentinel-1 SAR数据与Landsat-8的光学数据相结合，采用渐进梯度决策树（Gradient Boosting Decision Tree ， GBDT）的机器学习方法，对全球的地表土壤墒情进行了反演。结果显示：不同的土壤类型反演结果略有差异，总体的RMSE和R2分别为0.04 m3/m3和0.81。蒋金豹等[13]首先利用MIMICS （Michigan Microwave Canopy Scattering）模型和高级积分方程模型（Advanced Integral Equation Model， AIEM）模型建立后向散射系数数据库，然后分别采用BP 神经网络、支持向量机（Support Vector Machine， SVM）、思维进化算法（Mind Evolutionary Algorithm， MEA）与BP 神经网络结合（MEABP）、最小二乘支持向量机（Least Squares Support Vector Machine，LS-SVM）等方法建立模型，实现研究区麦田土壤墒情的反演。结果发现，采用LS-SVM 模型反演结果精度最高，BP 神经网络的拟合结果精度最低。基于人工神经网络，2006年由多伦多大学的Hinton 研究组提出“深度学习”的概念[14]。深度神经网络通过模拟生物神经元对刺激的非线性响应来对数据进行学习，能够表征更加抽象的数据特征和模式[15]。由多个层次或多个非线性信息处理模块组成的深度学习不仅具备从大数据中学习的能力，并且能够更好的表达变量与结果之间复杂的非线性关系，在计算机视觉、语音及图像识别、信息检索、图像特征编码等众多领域都有出色的表现[16]。近几年，利用深度学习的方法反演土壤墒情的研究也在不断增加。Babaeian 等[17]基于高空间分辨率光学反射率无人机系统（UAS）和自动机器学习（AutoML），反演地表、近地表和根区土壤墒情。Fang 等[18]利用SMAP 卫星结合LSTM 架构的深层递归神经网络，对美国大陆的土壤含水量进行了反演研究。

本研究选取河南省鹤壁市的麦田为研究对象，综合光学和微波遥感的各自优势，提取雷达后向散射系数，计算植被含水量以及植被覆盖度等信息，全连接深度学习的方法对研究区麦田土壤墒情进行反演研究，以期为监测麦田旱情提供决策信息。

1 研究区域与数据源

1.1 研究区域

鹤壁市位于河南省北部（113°59'E～114°45'E，35°26'N～36°02'N），南北长67 km，东西宽69 km，总面积约2 182 km2，属暖温带半湿润型季风气候，四季分明，冬春两季降雨少，夏秋两季降雨多，年平均气温14.2～15.5 ℃，年降水349.2～970.1 mm。鹤壁市在2012年被农业部确定为全国5 个整建制推进高产创建试点市之一，农业机械化、信息化和标准化水平位于全国前列，是河南省唯一基本实现农业现代化的地区。截至2019年7月，优质专用小麦种植面积183.33 km2，较2018年增长64.7%（https://www.hebi.gov.cn）。图1 是研究区及试验点位置示意图。

图1 研究区地理位置及采样点分布图

1.2 遥感数据及预处理

1.2.1 Sentinel-1及预处理

Sentinel-1 卫星是C 波段合成孔径雷达（SAR），由Sentinel-1A 和 Sentinel-1B 两颗卫星组成。单个卫星每12 天映射全球一次，双星座重访周期缩短至6 天。Sentinel-1 卫星具有4 种成像模式（干涉宽幅模式（Interferometric Wide Swath，IW）、条带模式（Strip Map，SM）、超幅宽模式（Extra Wide Swath，EW）和波模式（Wave Mode，WV））实现对地观测，具有全天时、全天候、大范围、多模式、短重返周期等特点。Sentinel-1 数据产品分为Level-0，Level-1 和Level-2 三个级别，其中，Level-1 级数据产品包括：单视复数影像（Single Look Complex，SLC）和地距影像（Ground Range Detected，GRD）。

本研究从哥白尼开放获取中心（https://scihub.copernicus.eu）获取了2018年10月至2019年5月Sentinel-1A SAR IW 模式下Level-1 级别的SLC 产品共17 景，极化方式为VV 和VH。Sentinel-1A SAR 遥感数据采用欧空局提供的SNAP软件对其进行辐射定标、去噪处理、图像拼接以及地理编码等处理，得出雷达影像图。图2 为经过预处理得到VV 和VH 极化后向散射系数，并采用Arcgis 软件对后向散射系数进行了色彩上的调整。

图2 研究区 VH/VV 极化的后向散射系数（2019年5月3日）

1.2.2 Sentinel-2及预处理

Sentinel-2 是一组高分辨率多光谱成像卫星，由Sentinel-2A 和Sentinel-2B 两颗卫星组成。卫星携带高分辨率多光谱成像装置（Multi Spectral Imager，MSI），拥有从可见光到短波红外的13 个光谱波段，其中，有4 个波段（Band2，Band3，Band4，Band8）的空间分辨率达到10 m。在多光谱遥感卫星中，Sentinel-2 是唯一在红边范围携带有3 个波段（Band5，Band6，Band7）的多光谱卫星，其独特的“红边”波段为区域植被生态环境特征信息的提取分析提供了全新的解决方案[19,20]。

与Sentinel-1 数据下载地址相同，本研究从哥白尼开放访问中心下载了2018年10月-2019年5月的Sentinel-2 影像，取与雷达Sentinel-1 基本同步，且无云或少云干扰的Sentinel-2数据产品。Sentinel-2 MSI 产品级别分为Level-0、Level-1A/B/C 和Level-2。本研究使用的Sentinel-2 数据产品有两种级别，分别为Level-1C级和Level-2级数据。Level-1级数据需要进行辐射定标和大气校正；Level-2 级数据无需此过程，直接对数据进行重采样并转换格式即可。本研究采用SNAP 软件对Level-1C 级产品先进行辐射定标和大气校正，然后将处理过的Level-1C级产品与Level-2级产品数据重采样至10 m的分辨率，并裁剪出研究区域。图3 为经预处理后的Sentinel-2 影像图。

图3 Sentinel-2影像合成结果（8，4，3波段合成）

2 研究方法

本研究基于全连接深度神经网络(Fully Connected Neural Network，FCNN)对研究区麦田土壤墒情进行反演研究。深度学习网络的输入特征变量为提取的Sentinel-1 SAR 数据的VV和VH 极化雷达后向散射系数和根据Sentinel-2 数据计算植被参量（植被含水量和植被覆盖度）。在试验过程中，首先把输入样本进行分组，即训练样本和检验样本；然后对输入参数进行归一化预处理，并预设和格网搜索深度学习神经网络隐含层的层数（H），隐含层节点数（N）和隐含层迭代次数（E），以期获得高精度和高性能结果。在隐含层中，通过数据标准化、防数据过拟合处理以及优化神经网络权重和偏置，最后采用决定系数（Coefficient of Determination，R2）和均方误差（Mean Squared Error，MSE）评估，使得代价函数收敛到最小。

2.1 植被含水量

Li[21]利用Sentinel-2 数据，分别计算归一化植被指数[22]（NDVI）、两种归一化水分指数[23]（Normalized Difference Water Index，NDWI），即NDWI1610、NDWI2190和归一化红边指数[24]（Normalized Difference Red Index，NDRI），并采用归一化方法对多植被指数进行耦合，得到植被含水量公式，即：

式中：mveg为植被含水量，x1，x2，x3和x4分别为NDVI，NDWI1610，NDWI2190和NDRI。

2.2 植被覆盖度

植被覆盖度（Vegetation Fraction，VF）是一阶离散植被模型的重要参数之一。混合像元分解模型[25]是计算植被覆盖度常用的方法，该方法假设遥感影像的每个像元包含植被和土壤两部分，即每个像元都包含植被覆盖区域和裸土区域。通常采用归一化植被指数NDVI表示像元内这两个区域的信息[26]，即：

式中：NDVI为像元的归一化植被指数值；NDVIveg为完全植被像元的植被指数值；NDVIsoil为完全土壤像元的植被指数值。

则植被覆盖度的计算公式为：

式中：NDVI是从Sentinel-2 影像中提取并预处理得到的值；NDVIsoil理论上接近于0；NDVIveg理论上接近于1。本文以0.95和0.05 置信度截取NDVI的上下阈值来分别表示NDVIveg和NDVIsoil。

2.3 全连接深度神经网络(FCNN)

全连接深度神经网络（FCNN）是一种典型的前馈深度学习网络，含有一个输入层，若干个非线性隐含层以及一个输出层。在全连接神经网络中，每相邻两层之间的节点都有边相连，因此会将每一层的全连接层中的节点组织成一列，这样方便显示连接结构。输入层由d个神经元组成，用于输入样本的各个特征值；每层隐含层包含不同的隐藏神经元，且每个隐含层的神经元个数n也是不确定的；输出层由l个神经元组成，即需要分类的类别数。

对于多层的深度神经网络，神经网络从输入层开始，上一层的输出作为下一层的输入，直到输出最终的结果。即下一层的每个节点在进行计算的时候，激活函数的输入是上一层所有节点的加权，不同的层激活函数可以不一样，采用g[i]（Z[i]）表示第i层的激活函数。

在前向传播中，前一层的输出作为后一层的输入，一层一层的计算直至输出A[L]，如图4所示。

图4 全连接深度神经网络前向传播示意图

在本研究中，深度学习隐含层训练过程采用效率更高的ReLU 函数，而输出层选择sigmoid 激活函数将输出值控制在（0，1）范围内，并使用均方误差MSE表示损失函数，即损失函数可表示为：

式中：L(i)为第i个训练样本的损失值；y(i)为第i个训练样本计算预测的输出变量值；为样本的观测值。

FCNN 的反向传播与BP 神经网络类似，在每次迭代优化过程中，根据每层的残差动态计算每层参数的梯度，直至模型收敛。

3 数据处理与分析

3.1 数据预处理

将VV 和VH 极化后向散射系数，植被覆盖度和植被含水量作为输入自变量，实测土壤墒情作为输入因变量构建深度学习神经网络，即深度学习神经网络的输入变量设置为：

输出变量为：

由于各参数之间量纲不同，因此在建立深度学习回归模型之前，需要对输入数据进行归一化预处理，使得所有变量的数值范围都比较均匀的分布在(0，1)区间内。

3.2 隐含层的设计

研究表明[27]，深度学习的隐含层越多，其预测结果的精度也会越高，但是隐含层越多网络越复杂，网络的训练时间增加，导致模型训练效率降低，而且还会出现过拟合的情况。此外，隐含层中的神经元个数和练训样本的迭代次数的选择也影响到神经网络的预测精度。为构建模型的最优参数，本研究设置隐含层层数（H）为3 到8，神经元个数（N）为20到100；隐含层层数增长为1，神经元个数增长步长为20，迭代次数（E）增长步长为1，采用格网搜索算法使隐含层结构（H，N，E）的决定系数（R2）稳定趋向最大，均方误差（MSE）稳定趋向最小，见图5。

图5 经过多次迭代的收敛误差

3.3 数据标准化

由于深度神经网络每一层输入数据的分布一直在发生变化，当输入特征值的范围差异较大时，与权重进行矩阵相乘后，会产生一些偏离较大的差异值，这些差异值产生的微小变化都会影响到下一层，而且偏离越大表现越明显，还会因此导致梯度发散[28]。为了降低特征值的范围差异变化带来的不确定性，采用Batch-Normalization(BN)，通过计算每个minibatch的均值和方差，并将其拉回到均值为0方差为1的标准正态分布，可以有效改善模型的稳定性和收敛速度。

BN 过程为：在隐含层的输入先做标准化预处理，然后向整体数据的均值方差方向转换，即：

（1）标准化：

式中：k为通道数。

（2）转换式：

式中：ϵ是为了防止方差为0 导致数值计算的不稳定而添加的一个小数。

3.4 防止模型过拟合

在深度学习网络的训练过程中，通过Dropout 忽略一部分的特征检测器，使一部分的隐含层节点值为0，可以明显减少过拟合现象[29]。使用Dropout 之后，深度学习网络的训练过程如下：

（1）随机删掉网络中部分的隐藏神经元，输入输出神经元保持不变。

（2）把输入x通过修改后的网络前向传播，然后把得到的损失结果通过修改的网络反向传播。一小批训练样本执行完这个过程后，没有被删除的神经元按照优化算法更新对应的参数（W，b）。

（3）继续重复这一过程。

本研究隐含层的Dropout 常数设置为0.3，即隐含层有30%的节点随机失活。

通过实验发现，将隐含层最后两层的BN 层改为dropout层，可以进一步提高模型的泛化性能。因此，在本研究中，隐含层的n-2层之前采用BN层，最后两层采用dropout层。

3.5 模型优化

本章采用Adam（Adaptive Moment Estimation）算法调整权重w和偏置b，使代价函数收敛到最小。Adam 算法[30]利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率，还有自己的动量，这样在训练的过程中，对于每个参数都更加具有独立性，能够提升了模型训练速度和训练的稳定性。

4 结果与讨论

为了验证研究区土壤墒情反演方法并评价其精度，本研究在研究区布设了28个试验点[见图1（c）]，在小麦全生育期（2018年10月-2019年5月）期间，Sentinel-1卫星过境同期对研究区的地表及植被参数进行观测和取样。土壤含水量采用环刀法对每个实测点0～10 cm 的土样进行取土，取得的土样及部分作物样本带回实验室，用烘干称重法获得土壤重量含水量和植被含水量数据。土壤重量含水量通过计算换算成体积含水量。共计576 组样本数据，去除异常数据，选取561 个有效数据用于构建和检验深度学习神经网络模型。通过随机样本抽取法，选择其中505组样本数据作为训练样本，余下的56组样本数据作为深度学习神经网络模型检验。经过全连接深度神经网络的训练，部分结果如表1所示。

表1 训练参数与反演结果

从表1 可以看出，当模型隐含层为6，隐含层节点数为80，迭代次数为450时，模型训练效果最佳。当继续增加隐含层节点数，R2和MSE基本不变，当继续增加隐含层数，R2降低，MSE增加。即当隐含层大于6时，训练结果与实测土壤墒情相关性反而降低，即构建的6层隐含层已经达到本研究深度神经网络上限。

采用余下的56 组样本数据进行模型检验，根据深度神经网络模型的训练结果，本文仅取其中（5，100，500），（6，60，450），（6，80，450）和（7，100，500）4 组模型的测试结果与实测数据验证和分析。如图6所示。

当隐含层为5，节点数为100，迭代次数为500 次时[图6(a)]，深度学习模型反演的土壤墒情与实测土壤墒情的相关关系较好，R2达到0.847 4，MSE为0.001 9。当隐含层为6，迭代次数为450，节点数分别为60 和80 时[图6(b)和6(c)]，两组模型都表现出良好的相关性和精度，即R2分别为0.908 1 和0.925 2，MSE分别为0.001 1 与0.000 8。反演的土壤墒情整体与实测值在1∶1 线附近。当隐含层为7，节点数为100，迭代次数达到500 次时[图6(d)]，深度学习模型反演结果与实测值的相关性减弱（R2=0.785 2），反演精度也大幅度降低（MSE=0.002 5），即网络的泛化能力降低。说明隐含层为6 时，构建的深度神经网络效果最佳。

图6 深度学习模型估算土壤墒情与实测土壤墒情对比散点图

值得注意的是，当土壤墒情实测值大于0.35 cm3/cm3时，即土壤相对湿润时，反演的土壤墒情多低于实测值。张钟军等[31]通过研究发现，随着土壤水分的增加，植被的散射和吸收特性也增强，雷达后向散射系数变化不能完全表达土壤的水分信息。因此，消除植被对雷达后向散射的影响是非常必要的[32]。

5 结论

本研究将深度学习的方法应用于研究区麦田土壤墒情的反演研究。利用Sentinel-1 和Sentinel-2 数据，结合地表实测数据构建基于全连接深度神经网络的监督学习模型。在模型训练过程中，通过控制隐含层个数，神经元数和迭代次数等基本参数对模型不断调整，采用Adam 算法调整权重和偏置，实现模型的最优设置。使用未参与模型训练的实测土壤墒情值对模型精度进行评定，实验结果表明深度学习的方法不仅能够高效地反演土壤墒情，而且对地表参数的依赖性较低，适合大规模的土壤墒情反演。

由于本研究训练数据的数量并不是很大，采用深度学习反演得到的土壤墒情结果与实测值的相关性较好，但是误差结果还有待提高，后续的研究中将通过补充足够的地面同步高精度训练数据，进一步提高模型的反演精度。