基于GF-6 PMS影像的积雪信息识别

2021-07-05 11:40王光远邓正栋王大庆许颢砾赵晓宁
红外技术 2021年6期
关键词:积雪决策树波段

王光远,邓正栋,路 钊,王大庆,时 玥,许颢砾,赵晓宁

〈图像处理与仿真〉

基于GF-6 PMS影像的积雪信息识别

王光远,邓正栋,路 钊,王大庆,时 玥,许颢砾,赵晓宁

(中国人民解放军陆军工程大学 国防工程学院,江苏 南京 210007)

以黑龙江省哈尔滨市道外区为研究区,系统探讨分析了基于遥感的不同方法在积雪信息识别中的应用。首先,对研究区两个时相的高分六号(GF-6)多光谱相机(PMS)影像进行目视解译,掌握了研究区内地物类型和积雪分布特点。其次,基于目视解译结果,选取了8种典型地物类型,得到了“积雪”和“非雪”两类像元的光谱特征规律。再次,探讨分析了6种方法在积雪识别中的应用,利用精确率、召回率和F指数3个指标进行了精度评价。最后,提出了基于投票结果的最终识别结果判定方法,得到了研究区积雪信息最终识别结果。研究表明:①受下垫面和阴影的影响,研究区“同谱异物”和“同物异谱”现象普遍;②深度学习算法的识别效果最好,决策树法的识别效果相对较差;农田区的识别精度高于池塘区,误识别和漏识别的现象都相对较少;③基于投票结果的最终识别结果判定,可以有效改善单一识别方法存在的误识别和漏识别现象。

积雪识别;GF-6 PMS;目视解译;积雪指数;深度学习算法

0 引言

作为地表最活跃的自然要素之一,积雪对自然环境和人类社会活动的影响非常显著[1]。积雪覆盖面积(snow cover area,SCA)是最重要的积雪参数之一,对于流域尺度的水资源管理和融雪径流模型的建立具有重要意义[2-3]。此外,SCA对于陆-气耦合系统研究必不可少[4]。与传统人工观测手段相比,遥感技术具有宏观、快速、多时相、多分辨率和多波段等优点,在气象资料不足、气候条件较差的地区,已成为获取大范围积雪信息、研究积雪变化的唯一技术手段[5-6]。

20世纪60年代,光学遥感卫星数据最早被用于积雪观测[7]。针对中低分辨率的光学遥感数据,学者们提出了多种积雪识别方法,包括基于密度分割法的识别[8-9]、基于积雪指数的识别和基于图像分类技术的识别[10-12]。其中,应用最为广泛的是基于积雪指数的识别方法。Dozier[13]针对Landsat TM影像首次提出了归一化插值积雪指数(normalized difference snow index,NDSI)。该方法主要用到TM影像的绿波段和短波红外波段,通过设置合适的阈值将积雪和其他地物区分开。该指数后来被国内外学者广泛应用于积雪识别的相关研究工作[14-18]。

主动微波遥感具有可穿透云层、对山区阴影不敏感和全天时全天候的特性。受液态水含量的影响,干雪和湿雪的介电常数差异非常大,湿雪的主动微波后向散射系数远小于干雪。文献[19-20]提出了利用下雪前和下雪后两个时相的SAR影像变化识别积雪的方法,若两个时相的后向散射系数比值小于某阈值,则为湿雪。此算法成功应用于北芬兰森林区[21-22]、北苏格兰与瑞典北部[23]和挪威山区[24]的积雪制图。被动微波遥感也是积雪识别的手段,大多数被动微波积雪识别算法都是基于决策树的分类方法,通过设置各种过滤器,将积雪与其他地物类型区分开[25-28]。

相比于微波遥感,在无云或少云地区,光学遥感可用数据源更多、对干雪识别效果更好,因此光学遥感仍是当前积雪信息识别的主要数据源。但是,高空间分辨率光学遥感影像的波段设置通常为蓝、绿、红和近红外波段,此类影像的积雪识别方法以归一化差分雪/冰指数(normalized difference snow/ice index,NDSII)[29-30]为主,该方法通过设置合适的阈值实现积雪识别,然而阈值的选取对识别结果影响非常大;对于地物类型多样的地区,仅依靠NDSII指数无法取得满意的识别效果;除了NDSII指数法,其他识别方法的应用研究较少。因此,基于高空间分辨率光学遥感影像的积雪识别研究存在严重不足。

本文选用GF-6 PMS光学遥感数据,以黑龙江省哈尔滨市道外区为研究区,探究了6种方法——决策树、随机森林、最大似然法、支持向量机法、Softmax分类器和深度学习算法在积雪信息识别中的应用。通过系统探讨分析不同方法的识别效果,弥补基于高空间分辨率光学遥感影像积雪识别研究的不足,对将来基于GF-6 PMS的积雪识别应用也有重要指导意义。

1 研究区与遥感数据

1.1 研究区概况

东北地区是我国三大典型季节性积雪区之一,为积雪相关研究提供了有利条件。研究区位于黑龙江省哈尔滨市道外区,如图1所示,地理坐标范围为126°44¢50²~126°53¢7²E,45°49¢21²~45°55¢5²N,面积约为114.77 km2,海拔在132~175 m之间,该地区由于长期受到流水侵蚀,地形有一定起伏但并不显著,松花江干流由西向东贯穿研究区北部。年平均降雪量在60 mm以下,降雪时间主要为当年10月到次年的3月。

图1 研究区位置示意图

1.2 遥感数据

本文选用高分六号(GF-6)光学遥感数据对研究区积雪信息识别展开研究。该卫星于2019年3月21日正式投入使用。GF-6卫星具有高分辨率、宽覆盖、高质量成像、高产能成像和国产化率高的特点。GF-6卫星共配置2个相机,其中多光谱高分辨率相机(PMS)的分辨率为2m全色/8m多光谱,相机观测幅宽为90km。GF-6 PMS相机的参数如表1所示。

表1 GF-6 PMS相机参数

2 研究方法

2.1 GF-6 PMS遥感数据预处理

本文选取了2019年9月29日和2020年1月30日两个时相的GF-6 PMS数据;前者为积雪识别过程提供必要的地物类型等参考信息,后者实现研究区的积雪识别。GF-6 PMS数据包含多光谱波段和全色波段,前者的预处理过程包括辐射定标、大气校正和几何校正,后者只需辐射定标和正射校正,最后一步为图像融合。如图2所示为预处理后研究区2020年1月30日GF-6 PMS真彩色影像。

2.2 积雪信息的图像表征

2.2.1 研究区目视解译

通过目视解译,掌握研究区的地物类型特点和积雪分布情况。通过对研究区GF-6 PMS影像目视解译可知,研究区地物类型简单,有城镇、河流、池塘、农田、滩涂以及道路(铁路、国道、县道和乡道)等。从积雪覆盖情况来看,由于河面冰冻和冬季“农闲”,大部分河流和农田都被积雪覆盖,没有人为破坏的痕迹,雪面较为完整、连续且区域范围很大;仍进行“冬捕”活动作业的池塘未被积雪覆盖;滩涂和沙洲部分被积雪覆盖;由于车辆通行和人力维护的原因,铁路、国道、县道、乡道等道路几乎都无雪覆盖,像元呈现明显的暗黑色。该时相的研究区遥感影像云量为0%,也没有大量的烟气排放,所以不对烟云及其阴影对积雪判读的影响作进一步分析。

图2 研究区GF-6 PMS影像

2.2.2 积雪光谱特征分析

为进一步分析不同地物的光谱响应,在预处理后的GF-6 PMS影像上选取8类典型地物——农田/河流、树木阴影区、阳面屋顶、建筑阴影区、植被/裸土、道路、池塘、滩涂,分析其在各波段的图像反射率。

如图3所示为典型地物在各波段的图像反射率频率直方图。从图中可以看出,农田/河流和阳面屋顶反射率分布在0.65~1.0之间,两者在0.65~0.85范围内有重叠,与其他几类地物有明显的区分和界限,并且几乎无重叠。对于农田/河流,在蓝、绿、红和近红外波段,当反射率分别为0.78、0.80、0.77和0.74时,反射率直方图达到峰值,说明达到此反射率的像元数最多。树木阴影区反射率分布集中在0.21~0.70之间,且当反射率分别为0.41、0.36、0.33和0.30时,反射率直方图达到峰值;与滩涂的反射率分布大部分重叠,仅在不同反射率上像元占比不同;与植被/裸土、道路、池塘和建筑阴影区都有少部分重叠。

通过以上分析可知,虽然同为“积雪”像元,但是农田/河流、树木阴影区和阳面屋顶的光谱反射率有较大差异,即存在明显的“同物异谱”现象;而树木阴影区的“积雪”像元和其他“非雪”像元反射率又有不同程度的重叠,即存在“同谱异物”现象。

2.3 积雪信息识别方法

2.3.1 基于积雪指数的识别方法

高空间分辨率卫星传感器一般只设置全色波段、可见光和近红外波段,缺乏短波红外波段。文献[31-33]针对此类卫星影像提出了雪盖指数NDSII:

式中:VIS和NIR分别为可见光和近红外波段反射率。NDSII取值范围通常为-1~1,理论上积雪的NDSII值应大于0。

为了考查该指数能否应用于GF-6 PMS卫星影像的积雪识别,针对上文提到的8类典型地物,分析其在3种NDSII组合(蓝波段-近红外波段、绿波段-近红外波段、红波段-近红外波段)下的可分离性。如图4所示为不同NDSII组合下各地物NDSII箱型图。

在蓝波段-近红外波段NDSII组合下,农田/河流几乎全部像元的NDSII指数都大于0,且有超过70%的像元指数集中在0.025~0.030范围内。树木阴影区有超过98%的像元NDSII指数大于0,且指数范围比农田/河流像元稍大,有超过50%的像元指数集中在0.12~0.20范围内。阳面屋顶、建筑阴影区、道路和池塘NDSII指数大于0的像元占比分别为44%、84%、67%和88%。

在绿波段-近红外波段NDSII组合下,农田/河流所有像元的NDSII指数都大于0,且有超过75%的像元指数集中在0.040~0.047范围内。树木阴影区有超过99%的像元NDSII指数大于0,且指数范围比农田/河流像元大,有超过75%的像元指数集中在0.072~0.145范围内。阳面屋顶、建筑阴影区、道路和池塘NDSII指数大于0的像元占比分别为92%、81%、70%和92%。

在红波段-近红外波段NDSII组合下,农田/河流所有像元的NDSII指数都大于0,且有超过75%的像元指数集中在0.019~0.025范围内。树木阴影区有超过96%的像元NDSII指数大于0,且指数范围比非阴影区积雪像元稍大,有超过75%的像元指数集中在0.026~0.063范围内。阳面屋顶、建筑阴影区、道路和池塘NDSII指数大于0的像元占比分别为73%、70%、56%和92%。

通过分析可知,农田/河流和树木阴影区有超过96%的像元NDSII指数大于0,且分布范围相对集中,尤其是前者。其他地物类型NDSII值与这两类积雪都有不同程度的重叠,可分离性较差。因此,单纯依靠NDSII指数识别研究区全部的积雪像元是不可能的。

2.3.2 基于像素的分类方法

基于像素的分类有非监督分类和监督分类。非监督分类的前提是“同物同谱”,通过统计方法计算遥感影像中各种地物的光谱特征分布规律,根据光谱相似性利用聚类分析对像素进行分类。由2.2.2节分析可知,研究区存在较为严重的“同谱异物”和“同物异谱”现象,因此,非监督分类方法并不能有效识别研究区的积雪信息。

监督分类是用已知类别样本识别待分类像元的方法。基于不同的分类规则,监督分类方法分为平行六面体法、最大似然法、二进制编码分类法、波谱角分类法、支持向量机(SVM)和模糊分类法等。其中,最大似然分类法是应用较为成功的监督分类方法;SVM也是近些年逐渐发展并成熟的分类方法。本文以最大似然法和SVM为代表,考查监督分类算法在GF-6 PMS遥感影像积雪识别中的应用。

2.3.3 决策树和随机森林

如图5所示,决策树是一种层次结构模型,通过多因素共同决定一个对象的分类结果。如果条件1不满足,则将其归类为类1。第3类需要同时满足条件1和2。如果只满足条件1而不满足条件2,则将其归类为第2类。

图5 决策树算法

为了使生成的决策树分类器具有更强的鲁棒性,积雪和非雪样本应尽可能涵盖所有的地物类型。经过细致的目视解译,共选取27290个样本,包括7731个积雪像元(集中在农田/河流、树木阴影区和阳面屋顶3类地物)和19559个非雪像元(集中在建筑阴影区、植被/裸土、道路、池塘和滩涂5类地物)。按照7:3的比例将其划分为训练样本和验证样本。

如图6所示,为基于C5.0决策树算法得到的决策树结构。结构中内部节点和叶节点的判断条件只有2个:蓝波段反射率和近红外波段反射率,说明相对于其他2个波段,蓝波段和近红外波段信息更能体现“积雪”和“非雪”类别的差异。

图6 决策树结构

决策树是一种单分类器,其缺点是如果对样本的划分过于仔细,则会导致训练集的过拟合,反之,则不能较好地拟合样本。为了解决这个问题,Leo Breiman和Adele Cutler发展推论出随机森林的算法。数据和待选特征的随机选取使得每棵树的训练样本不同,节点上的特征也不尽相同,导致决策树彼此不同,系统多样性和分类效果得到了丰富和提升。

2.3.4 Softmax分类器

回归代价函数计算公式:

式中:1{}是示性函数,括号里的值为真时则函数为1,反之函数为0。

在Softmax损失函数中对类标记的个可能值进行了累加,将分类为类别的概率为:

加入权重衰减后,代价函数变为:

加入权重衰减项以后(>0),代价函数转换成严格凸函数,即可得到唯一解,其导数如下:

最小化()从而实现一个可用的Softmax分类器。

2.3.5 深度学习算法

积雪信息识别需要判断每一个像元是否为积雪像元,属于像素层面的图像语义分割问题。针对此类问题,Jonathan Long等人[34]提出了全卷积神经网络(fully convolutional networks,FCN)。U-net结构是FCN的一种改进,更适应小样本的简单分割问题。如图7所示为本研究采用的用于积雪识别的U-net网络结构。

图7 改进的U-net网络结构

GF-6 PMS影像包含可见光和近红外4个波段,因此输入图像的通道数为4。切片大小为464,输入图像的大小为464×464×4。为了保证最后输出的分类结果与原图像一致,将卷积策略调整为“same”,步长stride=1,卷积核尺寸仍为3×3。首次卷积运算的卷积核数量为32,经过4次池化后成倍增加为512。在上采样过程中,卷积策略同样为“same”,步长stride=1。卷积过程与低层相同通道数的特征图像进行拼接融合。最后获得输出464×464×2的特征图。

3 积雪识别结果与精度评价

3.1 精度评价方法

混淆矩阵也称为误差矩阵,是一种特定的表格布局,用来判断分类好坏程度,允许可视化算法的性能。基于混淆矩阵,选用精确率(positive predictive value,PPV)、召回率(Recall)和F指数(F-score)进行积雪识别结果的精度评价。

精确率反映了误识别的情况,该值越低说明非积雪像元被误识别成积雪像元的数目越多,值越高说明误识别的现象越少。召回率反映了漏识别的情况,该值越低说明积雪像元未被识别出来的数目越多,值越高说明漏识别的现象越少。F指数对积雪识别的整体精度进行评价,其值越高说明积雪识别效果越好,误识别和漏识别的情况越少。

3.2 积雪识别结果

基于GF-6 PMS卫星蓝、绿、红和近红外4个波段,利用决策树、随机森林法、最大似然法、SVM法、Softmax分类器和深度学习共6种方法进行了积雪识别,结果如图8所示。由图可知,虽然识别结果有不同程度的差异,但是影像中被积雪覆盖的农田区、松花江江面、树木阴影区和阳面屋顶,无雪或少雪的建筑区、滩涂区、道路等地物特征都被明显地区分开来,与2.2.1节研究区GF-6影像的目视解译结果相吻合。

如表2所示为积雪识别结果统计,从表中可以看出决策树法和随机森林法识别出的积雪像元数相对最少,积雪像元占比分别只有75.1%和76.7%;Softmax分类器和深度学习算法识别出的积雪像元数相对最多,积雪像元占比分别为88.0%和86.3%。

3.3 精度评价与误差值析

3.3.1 精度评价

本研究使用的是图像融合后分辨率高达2m的GF-6 PMS影像,目前还没有同等或者更高分辨率的积雪分类识别产品,因此,通过目视解译对积雪识别结果进行精度验证。

研究区内农田和冰冻的松花江江面覆盖有完整成片的积雪,而道路以及仍进行“冬捕”活动作业的池塘则无雪覆盖,这些地区的积雪覆盖情况肉眼可辨,因此较易通过目视解译的方法获取用于精度评价的“真值”样本。相比之下,城镇、村屯的建筑区受到房屋阴影和人类活动等影响,积雪覆盖情况较难准确判别。因此,如图9所示,选择了农田和池塘两种地物作子研究区,利用该子研究区的目视解译结果对积雪识别结果进行精度评价,评价结果如图10所示。

图8 积雪识别结果

表2 积雪识别结果统计

图9 农田和池塘子研究区及目视解译结果

由图10可知,对于农田区,这6种积雪识别方法的精确率都很高,均达到了0.9以上。但是,决策树、随机森林和SVM法的召回率都不高,均在0.8以下,说明漏识别的情况比较多;特别地,决策树的召回率只有0.56,说明有接近一半的积雪像元未被识别出来。综合来看,深度学习的识别结果精度最高,F指数为0.98;其次是Softmax分类器,F指数为0.96;决策树的识别结果精度最低,F指数为0.69。

对于池塘区,随机森林法、最大似然法、SVM法和深度学习法的精确率分别为0.90、0.84、0.89和0.91,而Softmax分类器和决策树的精确率相对较低,特别是前者,只有0.57,说明Softmax分类器在池塘区的误识别现象严重,接近一半的非雪像元被误识别为积雪。另外,除了决策树和最大似然法召回率相对较低(都在0.61左右)外,其他方法召回率都很高,Softmax分类器和深度学习召回率一度接近1.0,说明其漏识别现象极少。综合来看,深度学习的识别结果精度最高,F指数为0.95;其次是随机森林法,F指数为0.91;决策树的识别结果精度仍然最低,F指数为0.67。

图10 农田和池塘子研究区积雪识别结果精度评价

综上,深度学习算法的识别效果最好,在农田区和池塘区,其各项精度评价指标都名列前茅;而决策树法的识别效果相对较差,几乎各项精度评价指标都低于其他方法。地物类型方面,农田区的识别精度高于池塘区,积雪误识别和漏识别的现象都相对较少。

3.3.2 方法比较

为了进一步比较不同识别方法的异同,对6幅积雪识别结果图(图8)做相加运算,即将每一个像元处的6种积雪识别结果做叠加,结果如图11所示,图11中各像元的DN值统计结果如图12所示。图8中,积雪像元的DN值为1,非雪像元的DN值为2。因此,图11中像元DN值的范围应为6~12。

1)DN值为6或12的像元

由图11和图12可以看出,DN值为6的像元占比最大且为71.4%,说明有71.4%的像元被“无争议”地认为是积雪像元。这类像元绝大部分为农田区和松花江江面上较纯的积雪像元,小部分为树木阴影区和阳面屋顶积雪。其次,DN值为12的像元占比为9.7%,说明有9.7%的像元被“无争议”地认为是非雪像元。这类像元主要集中在建筑阴影区、浓密的植被区、国道和铁路,部分分布在滩涂区和小道。

2)DN值为8~10的像元

此类像元为有“争议”像元,总占比为10.9%,其中“争议”最大的像元(DN值为9)占比2.7%。这类像元大部分通过目视解译都较难判断是否为积雪像元,主要为滩涂区、裸土等与积雪混合的地物,道路和池塘等形状规则的地物边缘,以及建筑区也有分布。值得注意的是,农田区也会有这类像元,亮度较暗但通过目视能明显判别其为积雪像元。

图11 积雪识别结果叠加图

图12 积雪识别结果叠加图像元值统计

如图13所示,结合2019年9月29日时相的GF-6 PMS影像,从研究区中选取了A、B、C、D四块包含“争议”像元的典型农田区域,区域中“争议”像元如图13(c)所示,6种识别方法在该像元处的积雪识别结果统计如表3所示。

由图13(a)可知,“争议”像元所在的地物类型为开阔且连片的农田区。在2020年1月30日的遥感影像中,虽然该像元相对于附近农田的像元亮度偏暗,但是考虑到此时正值“农闲”时期,且从影像上看并无明显的人为破坏现象,所以可判定此处“争议”像元为积雪像元。

图13 包含“争议”像元的典型农田区域

从表3可以看出,Softmax分类器和深度学习法的识别效果最好,几乎无漏识别现象出现,而其他方法都不同程度地将积雪像元错误地识别为了非雪。决策树的识别结果相对较差,选区A和选区B的所有积雪像元都未被识别出来。

3)DN值为7或11的像元

此类像元为分类结果“争议”较小的像元,意味着除了某一种积雪识别方法外,其他5种方法的识别结果一致,因此,在一定程度上,这类像元最能反映某一种方法在识别积雪上存在的问题。

DN值为7的像元占比4.2%,多出现在道路、建筑区和池塘区,在农田区和树木阴影区也有分布;此类像元被5种方法一致认为是积雪,而被某一种方法认为是非雪,因此可以作为是否发生漏识别的参考,该类像元比例越大说明漏识别现象越多。

DN值为11的像元占比3.9%,大部分分布在池塘和滩涂区,道路和建筑区也有出现;此类像元被5种方法一致认为是非雪,而被某一种方法认为是积雪,因此可以作为是否发生误识别的参考,该类像元比例越大说明漏识别现象越多。

表3 “争议”像元积雪识别结果统计

如图14所示,选取E、F、G和H四个子区,其中子区E和F是包含有DN值为7像元的有雪覆盖农田区,子区G和H是包含有DN值为11像元的无雪覆盖池塘区,不同方法在子区的识别结果如表4所示。

图14 包含小“争议”像元的典型农田区域

由表4可知,子区E和F中,决策树法将所有积雪像元误识别为非雪,即出现了严重的漏识别现象。在子区G中,Softmax分类器则将所有非雪像元误识别为积雪。而在子区H中,除了绝大部分误识别是由Softmax分类器引起的之外,决策树和随机森林也将极少数非雪像元误识别为积雪。最大似然法、SVM和深度学习在4个子区都有很好的识别精度。

3.3.3 误差值分析

积雪识别的误差来源主要有:积雪识别方法本身的误差、训练样本的误差,以及目视解译样本的误差。

1)积雪识别方法本身的误差。本研究采用的积雪识别方法各自具有不同的原理内核。通过分析可知,无论是农田区还是池塘区,决策树的识别精度都最低。通过选取节点处的最优特征,将数据分成不同的子集,然后递归,直到所有训练数据子集基本分类正确或者没有合适的特征为止。决策树的分类方法决定了它对训练样本具有较高的分类精度,但对未知数据的分类能力有限,可能会出现过拟合现象。

2)训练样本的误差。本研究采用的6种方法本质上都是基于样本的积雪识别方法,本研究的识别目标是积雪,研究区地物类型较多,在农田、冰冻的江面、裸地、树阴等地都有积雪分布,而在部分建筑区、道路、池塘、滩涂等地并无积雪,因此“积雪”和“非雪”的种类都并不单一,“同物异谱”现象严重,从研究区地物的光谱特征统计分析结果来看,也有大量“异物同谱”现象。所以在选择训练样本的时候,只能尽量兼顾样本的代表性,不可能考虑到所有情况,这对识别模型的构建和识别结果的精度有一定影响。

表4 小“争议”像元积雪识别结果统计

3)目视解译样本的误差。图9中用于评价积雪识别精度的“真值”样本是基于目视解译的识别结果,是地物遥感图像特征、地理空间位置、地面同步观测和专业经验的综合产物,虽然精度很高,但是不可能做到每一个像元都精确分类,所以“真值”样本也存在一定的偏差,可能对评价结果有影响。

3.4 研究区积雪识别结果的最终判定

在以往的图像分类识别研究中,往往只用一种识别方法即完成对研究区目标地物的识别,如果待识别地物图像特征明显、范围有限,且精度验证数据和手段充足,那么采用单一的识别手段识别地物是可行的。但是一旦以上条件达不到,仅凭单一的识别方法将无法获得满意的结果。

此次研究中,数据源特点、研究区积雪分布特征及现有图像分类技术决定了单凭任何一种分类识别方法都无法完美识别研究区的积雪信息,只能根据具体的需求,最大程度优化和改进识别结果。

本文提出了基于投票结果的最终识别结果判定,即所有积雪识别方法对像元识别结果进行投票,票数最高的识别结果作为该像元的最终分类结果。这种判定方法可以有效改善单一识别方法存在的误识别和漏识别现象。如图11所示,图中像元DN值为6表明6种积雪识别方法都投票给“积雪”类别;像元DN值为7则表明5种积雪识别方法投票给“积雪”类别,一种识别方法投票给“非雪”类别,以此类推;像元DN值为12表明6种积雪识别方法都投票给“非雪”类别。DN值为8~10的像元类别最高票数仅为4。为了保守起见,防止最终分类结果包含过多的错误信息,本研究认定,当某像元积雪或非雪类别的票数大于等于5时,得到此票数的类别即为该像元的最终分类结果。如图15所示为研究区2020年1月30日GF-6 PMS影像积雪识别最终结果。

图15 研究区积雪识别的最终结果

4 结语

本文以黑龙江省哈尔滨市道外区为研究区,探讨分析了基于高空间分辨率光学遥感的积雪信息识别问题。通过目视解译,对研究区两个时相的GF-6 PMS影像进行了对比和判读。其次,选取了8种典型地物类型,得到了研究区“积雪”和“非雪”两类像元的光谱特征规律。再次,探讨分析了6种方法在GF-6 PMS光学遥感影像积雪识别中的应用,并基于目视解译结果进行了精度评价。最后,提出了基于投票结果的最终识别结果判定方法,得到了研究区积雪信息最终识别结果。

研究表明:①受下垫面和阴影的影响,研究区“同谱异物”和“同物异谱”现象普遍,严重干扰了积雪识别过程;②深度学习算法的识别效果最好,决策树法的识别效果相对较差;农田区的识别精度高于池塘区,误识别和漏识别的现象都相对较少;③相比于单一识别方法,基于投票结果的最终识别结果判定方法可以有效改善误识别和漏识别现象。本文弥补了高空间分辨率光学遥感影像积雪识别研究存在的不足,对将来基于可见光和近红外波段的积雪识别应用有重要指导意义。

[1] HE C, Liou K N, Takano Y, et al. Impact of grain shape and multiple black carbon internal mixing on snow albedo: Parameterization and radiative effect analysis[J]., 2018, 123(2): 1253-1268.

[2] Butt M J, Bilal M. Application of snowmelt runoff model for water resource management[J]., 2011, 25(24): 3735-3747.

[3] LIU M, XIONG C, PAN J, et al. High-resolution reconstruction of the maximum snow water equivalent based on remote sensing data in a mountainous area[J]., 2020, 12(3): 460-479.

[4] XU L, Dirmeyer P. Snow–atmosphere coupling strength. Part II: Albedo effect versus hydrological effect[J]., 2013, 14(2): 404-418.

[5] 汪左. 新疆玛纳斯河流域典型区雪水当量的SAR反演研究[D]. 南京: 南京大学, 2014.

WANG Zuo. Retrieval of Snow Water Equivalence Using SAR Data for Typical Area of Manas River Basin in Xinjiang, China[D]. Nanjing: Nanjing University, 2014.

[6] 贺广均. 联合SAR与光学遥感数据的山区积雪识别研究[D]. 南京: 南京大学, 2015.

HE Guangjun. Snow Recognition in Mountainous Areas Based on SAR and Optical Remote Sensing Data[D]. Nanjing: Nanjing University, 2015.

[7] Barnes J C, Bowley C J. Snow cover distribution as mapped from satellite photography[J]., 1968, 4(2): 257-272.

[8] 冯学智. 卫星雪盖制图及其应用研究概况[J]. 遥感技术动态, 1989(1): 25-29.

FENG Xuezhi. Satellite snow cover mapping and its application[J]., 1989(1): 25-29.

[9] 冯学智. 卫星雪盖制图中的一些技术问题[J]. 遥感技术与应用, 1991(4): 10-15.

FENG Xuezhi. Some technical problems in satellite snowcover mapping[J]., 1991(4): 10-15.

[10] 白磊, 郭玲鹏, 马杰, 等. 基于数字相机拍摄影像的山区积雪消融动态观测研究——以天山积雪站为例[J]. 资源科学, 2012, 34(4): 620-628.

BAI Lei, GUO Lingpeng, MA Jie, et al. Observation and analysis of the process of snow melting at Tianshan station using the images by digital camera[J]., 2012, 34(4): 620-628.

[11] Kim S-H, Hong C-H. Antarctic land-cover classification using IKONOS and Hyperion data at Terra Nova Bay[J]., 2012, 33(22): 7151-7164.

[12] ZHU L, XIAO P, FENG X, et al. Support vector machine-based decision tree for snow cover extraction in mountain areas using high spatial resolution remote sensing image[J]., 2014, 8(1): 084698.

[13] Dozier J. Spectral signature of alpine snow cover from the Landsat Thematic Mapper[J]., 1989, 28(1): 9-22.

[14] Cea C, Cristóbal J, Pons X. An improved methodology to map snow cover by means of Landsat and MODIS imagery[C]//2007, 2007: 4217-4220.

[15] Khosla D, Sharma J, Mishra V. Snow cover monitoring using different algorithm on AWiFS sensor data[J]., 2011, 7(1): 42-47.

[16] 延昊. 利用MODIS和AMSR-E进行积雪制图的比较分析[J]. 冰川冻土, 2005(4): 515-519.

YAN Hao. A comparison of MODIS and passive microwave snow mapping[J]., 2005(4): 515-519.

[17] 郝晓华, 王建, 李弘毅. MODIS雪盖制图中NDSI阈值的检验——以祁连山中部山区为例[J].冰川冻土, 2008(1): 132-138.

HAO Xiaohua, WANG Jian, LI Hongyi. Evaluation of the NDSI threshold value in mapping snow cover of MODIS[J]., 2008(1): 132-138.

[18] 汪凌霄. 玛纳斯河流域山区积雪遥感识别研究[D]. 南京: 南京大学, 2012.

WANG Lingxiao. Retrieval of Snow Water Equivalence Using SAR Data for Typical Area of Manas River Basin in Xinjiang, China[D]. Nanjing: Nanjing University, 2012.

[19] Baghdadi N, Gauthier Y, Bernier M. Capability of multitemporal ERS-1 SAR data for wet-snow mapping[J]., 1997, 60(2): 174-186.

[20] Rott H, Nagler T. Capabilities of ERS-1 SAR for snow and glacier monitoring in alpine areas[J]., 1994, 361: 965-965.

[21] Koskinen J T, Pulliainen J T, Hallikainen M T. The use of ERS-1 SAR data in snow melt monitoring[J]. IEEE, 1997, 35(3): 601-610.

[22] Luojus K P, Pulliainen J T, Cutrona A B, et al. Comparison of SAR-based snow-covered area estimation methods for the boreal forest zone[J]., 2009, 6(3): 403-407.

[23] Caves R, Hodson A, Turpin O, et al. Field verification of SAR wet snow mapping in a non-Alpine environment[J].SP, 1998, 441: 519-526.

[24] Malnes E, Guneriussen T. Mapping of snow covered area with Radarsat in Norway[C]//, 2002: 683-685.

[25] Kelly R. The AMSR-E snow depth algorithm: description and initial results[J]., 2009, 29(1): 307-317.

[26] PAN J, JIANG L, ZHANG L. Wet snow detection in the south of China by passive microwave remote sensing[C]//, 2012: 4863-4866.

[27] Singh P R, Gan T Y. Retrieval of snow water equivalent using passive microwave brightness temperature data[J]., 2000, 74(2): 275-286.

[28] LIU X, JIANG L, WU S, et al. Assessment of methods for passive microwave snow cover mapping using FY-3C/MWRI data in China[J]., 2018, 10(4): 524-545.

[29] Hinkler J, Pedersen S B, Rasch M, et al. Automatic snow cover monitoring at high temporal and spatial resolution, using images taken by a standard digital camera[J]., 2002, 23(21): 4669-4682.

[30] Keshri A, Shukla A, Gupta R. ASTER ratio indices for supraglacial terrain mapping[J]., 2009, 30(2): 519-524.

[31] Hinkler J, Ørbæk J B, Hansen B. Detection of spatial, temporal, and spectral surface changes in the Ny-Ålesund area 79 N, Svalbard, using a low cost multispectral camera in combination with spectroradiometer measurements[J].,, 2003, 28(28-32): 1229-1239.

[32] XIAO X M, SHEN Z X, QIN X G. Assessing the potential of VEGETATION sensor data for mapping snow and ice cover: a normalized difference snow and ice index[J]., 2001, 22(13): 2479-2487.

[33] XIAO X, Moore B, QIN X, et al. Large-scale observations of alpine snow and ice cover in Asia: using multi-temporal vgetation sensor data[J]., 2002, 23(11): 2213-2228.

[34] Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation[C]//, 2015: 3431-3440.

Snow Information Recognition based on GF-6 PMS Images

WANG Guangyuan,DENG Zhengdong,LU Zhao,WANG Daqing,SHI Yue,XU Haoli,ZHAO Xiaoning

(,,210007,)

From the perspective of limited research on snow recognition in high spatial resolution optical remote sensing images, considering Daowai District of Harbin City as the research area, this paper systematically discusses and analyzes the application of different methods in snow information recognition. First, ground feature types and snow distribution characteristics were mastered through visual interpretation of GF-6 PMS images of two phases in the study area. Second, based on the results of visual interpretation, eight typical surface feature types were selected, and the spectral characteristics of "snow" and "non-snow" pixels were obtained. Third, the application of the six methods in snow recognition was discussed and analyzed. Accuracy was evaluated using three indexes: positive predictive value, recall rate, and F-score. Finally, a final recognition result judgment method based on voting results was developed, and the final recognition result of snow information in the study area was obtained. The results showed that, owing to the influence of the underlying surface and shadow, the phenomenon of "same spectrum foreign matter" and "same object different spectrum" was common in the study area, which interfered with the snow recognition process to a large extent. The recognition effect of the deep learning algorithm was the best, while that of the decision tree method was relatively poor; the recognition accuracy was higher for the farmland area than that for the pond area, and the phenomenon of false and missing recognitions was relatively less. The final recognition result judgment method based on voting results can effectively improve the phenomenon of false and missing recognitions in a single recognition method. This paper has important guiding significance for snow recognition based on high-spatial-resolution optical remote sensing images.

snow recognition, GF-6 PMS, visual interpretation, snow index, deep learning algorithm

TP391

A

1001-8891(2021)06-0543-14

2020-11-05;

2020-12-20.

王光远(1991-),男,河北邢台人,博士研究生,主要研究方向为基于遥感的积雪信息识别和应用。E-mail:15295518590@163.com。

邓正栋(1960-),男,教授,博士,主要研究方向为野战给水保障理论。

猜你喜欢
积雪决策树波段
阿尔卑斯山积雪
最佳波段组合的典型地物信息提取
基于梯度提升决策树的量子科学实验卫星光学实验预测
我们
决策树和随机森林方法在管理决策中的应用
基于PLL的Ku波段频率源设计与测试
大粮积雪 谁解老将廉颇心
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术
积雪