利用分层特征组合策略的全极化SAR山区积雪识别

2022-12-30 04:13璇,李晖,黄
无线电工程 2022年12期
关键词:散射系数积雪极化

康 璇,李 晖,黄 林

(厦门理工学院 计算机与信息工程学院,福建 厦门 361024)

0 引言

积雪是冰冻圈中覆盖范围最广、最活跃的要素之一[1],对全球气候变化、生态环境和社会经济具有重要的影响作用[2-3]。季节性的积雪融水是河川径流的主要补给来源,也是西部干旱地区主要的淡水资源[4]。近年来,随着全球气候变暖,全球积雪的持续时间和覆盖范围明显减少[3],准确的积雪识别和监测对气候变化、灾害评估、融雪动态监测和生态环境安全具有重要意义。积雪多分布于高海拔、高纬度山区[4],传统的积雪研究方法数据获取难度大。遥感技术的出现为大范围、高精度积雪识别监测提供了新的可能。与光学遥感相比,SAR具有穿透云雾、全天时全天候积雪监测和部分穿透性等能力,在积雪遥感领域得到广泛应用[5-7]。

目前,仅利用SAR图像单一特征对积雪进行识别,由于SAR图像中相干斑噪声的影响,积雪散射系数的测量产生很大偏差,滤波过程中也会损失积雪部分信息,导致积雪识别结果较为破碎。因此,结合后向散射系数和多种极化特征的积雪识别有待进一步探索。鉴于此,本文选取玛纳斯河流域典型区域作为研究区,结合雷达后向散射特征和多种极化分解特征,利用机器学习方法开展多特征分层组合的积雪识别研究,分析不同特征在积雪识别中的作用,以期为极化SAR数据山区积雪识别提供研究思路。

1 研究区与实验数据

1.1 研究区概况

玛纳斯河流域位于新疆天山中段北麓,准噶尔盆地南部,北纬43°20′~45°55′,东经85°00′~87°00′,是准噶尔内陆区冰川规模最大的内陆河。流域内地势由东南向西北倾斜,最高海拔为5 243 m,最低为256 m,海拔高程3 600 m以上大部分区域为冰川和永久性积雪覆盖,平均雪线为3 970 m。玛纳斯河为干旱区典型的山盆结构,水汽来源少、降水稀少、气候干旱,属于典型的温带大陆性干旱半干旱气候。流域内积雪在大陆性气候条件作用下,具有密度低、含水量少、厚度薄等特点[15],平均积雪覆盖率1月—2月达到最高,3月开始消融,4月中旬消融结束,8月积雪面积达到最低。冰雪融水是玛纳斯河主要的径流补给,占玛纳斯河年径流量的47%,是天山北坡重要的水源[16],研究区位置如图1所示。

图1 研究区位置Fig.1 Location of the study area

1.2 数据与预处理

本文采用全极化Radarsat-2影像作为数据源,成像波段为C波段,成像模式为精细全极化(括HH,HV,VH和VV四种极化方式),产品模式为单视复数据(Single Look Comple,SLC),获取时间为2013年12月13日,入射角为43.45°,距离向像元4.733 m,方位向像元4.799 m。对数据进行多视、滤波、地理编码和辐射定标等预处理,采用Refind Lee滤波进行降噪处理,窗口大小设置为5*5,获得Radarsat数据的后向散射系数如图2所示。根据2013年12月积雪期野外同步观测数据,显示研究区该日期有降雪。

(a) HH后向散射系数

(b) HV后向散射系数

(c) VH后向散射系数

(d) VV后向散射系数图2 Radarsat后向散射系数(2013年12月13日)Fig.2 Radarsat backscattering coefficient (December 13,2013)

高分一号卫星(简称GF-1卫星)是我国高分辨率对地观测系统的首发星。GF-1卫星搭载的WFV相机包含蓝、绿、红和近红外4个波段,空间分辨率16 m,重访周期4 d。研究选用2013年12月14日GF-1数据作为参考影像,如图1所示,对数据进行辐射定标、大气校正及图像裁剪,获得研究区地表反射率。

2 研究方法

2.1 Radarsat-2散射极化特征提取

(1) 后向散射特征提取

(1)

(2)

(2) 极化分解及极化特征提取

Pauli分解[19]将散射矩阵S分解为各Pauli基矩阵的复数形式的加权和,每个Pauli基矩阵对应一种基本的散射机制,公式如下:

(3)

Freeman分解[20]在Van Zyl的基础上,以极化协方差矩阵为分解对象,将其分解为表面散射、体散射和二面角散射3种散射机理。该方法以物理实际为基础,分别对3种基本散射机理进行建模,可以较好地描述自然散射体。该极化协方差矩阵可表示为:

(4)

式中,fs,fd,fv分别代表面散射、二面角散射和体散射分量贡献值。

(5)

Yamaguchi分解[22]为了更广泛地适用于散射体具有复杂几何散射结构的情况,在Freeman分解基础上,引入了第4种散射分量——螺旋体散射,弥补了Freeman分解无法用于不对称问题的缺陷。

2.2 特征组合及积雪分类策略

全极化SAR数据不仅能够反映不同地物的后向散射系数信息差异,还包含丰富的极化信息,对积雪识别具有重要作用。为探索目标极化分解特征、后向散射特征及交叉极化和同极化比值和差值对积雪识别的贡献,本研究将处理全极化Radarsat-2后得到的20个特征图像(如表1所示)进行不同组合,得到3种特征集(如表2所示)。

表1 基于Radarsat-2影像特征参数Tab.1 Image feature parameters based on Radarsat-2

表2 分类特征集Tab.2 Classification feature set

① 基于极化分解特征的积雪识别

② 基于极化和散射特征的积雪识别

2.3 分类方法及精度评价

2.3.1 分类方法

随机森林(Random Forest,RF)算法是以决策树为基本分类器的集成学习方法[23],该方法采用Bagging方法为每棵决策树抽取一组独立同分布的样本集,对样本集进行训练产生决策树,最终结果通过决策树投票表决确定。与其他机器学习算法相比,RF算法在处理高维数据时可训练少量样本建立分类规则,抑制过拟合现象的产生,且对异常值和噪声数据具有很好的鲁棒性和稳定性[23-24]。同时,RF算法具有特征优选的能力,将未参与训练的袋外数据(Out-Of-Bag,OOB)作为测试样本,计算单棵决策树的OOB误分率,估计每个特征的重要性。本研究将决策树数目设为100,每棵决策树的特征数m计算如下:

m=sqr(M),

(6)

式中,M为用于分类的特征总数。由于RF在处理高维度特征分类时性能表现优异,具有训练速度快、准确率高等优点,在SAR图像分类领域得到广泛应用,本文选择随机森林算法进行积雪识别。

图3 本文算法流程Fig.3 Flow chart of the proposed algorithm

2.3.2 精度评价

研究参考GF-1光学影像,选择和确定积雪和非积雪样本,样本点尽可能均匀分布在研究区内。在GF-1影像上选取训练样本,其中积雪样本55个区域,非积雪样本66个区域。在GF-1卫星影像上,随机生成200个验证样本,其中积雪样本94个,非积雪样本106个。利用混淆矩阵计算精度指标和调和平均值F1(F-Measure),对3.2节的分类结果进行精度评价。精度指标包含精度总体精度(Overall Accuracy,OA)、Kappa系数(Kappa Coefficient)、生产者精度(Producer’s Accuracy,PA)和用户精度(User’s Accuracy,UA);F1表示PA和UA的调和平均值,计算如下[25]:

(7)

3 结果与分析

3.1 积雪的极化散射特征分析

(1) 极化特征分析

全极化SAR能够获得目标的散射矩阵、极化协方差矩阵和极化相干矩阵,这些极化散射矩阵综合了地物目标的极化、相位和能量特性,能够对散射过程中目标的极化变化信息进行完整的记录和描述[26-27]。极化目标分解是基于目标的散射矩阵、协方差矩阵或相干矩阵,将复杂的目标散射过程分解为多个简单散射机制之和,从而提取极化特征参数,用于地物分类识别。

图4 极化分解假彩色合成图(R(P_dblF_dblHY_dbl),G(P_volF_volAY_vol),B(P_oddF_oddFig.4 Polarization decomposition false color composite(R(P_dblF_dblHY_dbl),G(P_volF_volAY_vol),B(P_oddF_odd

(2) 后向散射特征分析

分别提取积雪和非积雪的后向散射特征值,如图5所示。

图5 积雪和非积雪的后向散射特征值Fig.5 Backscattering features of snow and non-snow

为了进一步探究积雪与非积雪可分离性,对4种后向散射强度进行频率分布统计分析(如图6所示)。

(a) HH极化

(b) VV极化

(c) HV极化

(d) VH极化图6 积雪、非积雪不同后向散射系数频率分布Fig.6 Frequency distribution of different backscattering coefficients of snow and non-snow

根据频率分布可以看出,积雪和非积雪均呈现单峰,积雪在4种后向散射强度中保持最高。对于同极化,积雪后向散射强度主要集中在-25~-5 dB,低于-14 dB,积雪后向散射强度高于非积雪,在-14 dB以上,积雪后向散射强度低于非积雪。在交叉极化条件下,积雪后向散射强度集中在-30~-15 dB之间,在-25 dB以下,积雪后向散射强度高于非积雪,高于-25 dB,积雪后向散射强度低于非积雪。由此,可将后向散射强度作为积雪识别分类特征。

3.2 基于不同分类方法结果比较

为了检验本文方法的有效性,对3个特征集分别使用RF、SVM、神经网络(Neural Networks,NNS)和最小距离分类(Minimum Distance Classification)4种分类器进行分类对比,分类结果如图7~图10所示。

图7 随机森林在3个特征集的积雪识别结果Fig.7 Snow cover recognition results of random forest in three feature sets

图8 支持向量机在3个特征集的积雪识别结果Fig.8 Snow recognition results of SVM in three feature sets

图9 最小距离分类在3个特征集的积雪识别结果Fig.9 Snow recognition results of minimum distance classification in three feature sets

图10 神经网络在3个特征集的积雪识别结果Fig.10 Snow recognition results of NNS in three feature sets

图7~图10分别为RF、SVM、最小距离分类和NNS利用特征集T1,T2和T3的积雪识别结果。对比发现,RF和NNS的整体识别效果优于SVM和最小距离分类。与RF结果相比,在研究区北部,NNS的识别结果较为破碎,少数积雪像元被误判,没有很好地将农田轮廓分出。在SVM识别结果中,西南部山区识别结果出现一些细碎斑点,非积雪像元被识别为积雪像元。最小距离分类整体识别效果最差,大量积雪范围被高估。

表3 不同分类方法识别结果Tab.3 Recognition results of different classification methods

3.3 基于不同特征组合的随机森林积雪识别结果比较

使用RF分类器,分别利用特征集T1,T2和T3进行积雪识别,结果如图7(a)~(c)所示。从分类结果可以看出,通过T1,T2,T3特征集基本可以将积雪与非积雪部分区分开,但在局部区域识别结果存在差异。仅利用目标极化特征T1进行分类(图7(a)),积雪识别范围较完整,但积雪内部区域出现细小斑块;加入4种后向散射特征T2(图7(b))及Diff和Ratio(图7(c))后,各分类结果图中斑块均有所减少,获得的积雪区域较为完整。从整体识别结果看,基于极化特征T1的识别结果积雪区域存在大量破碎斑块;与T1特征集对比,加入全极化后向散射特(T2后的识别结果积雪区域较为完整,但仍存在少量细小碎块);在以上特征的基础上添加Diff和Ratio(T3),对积雪的识别效果最好,分类结果破碎度有所降低。

对分类结果进行精度评价,混淆矩阵如表4所示,精度对比如图11所示。对比发现,在3种特征组合的分类精度中,仅利用极化特征T1进行分类,积雪和非积雪的分类精度均偏低,二者之间存在一定程度的混淆,积雪和非积雪的生产者精度分别为77.66%和77.36%,F1分别为0.76和0.78,总体分类精度为77.50%,Kappa系数仅0.55。加入4种全极化后向散射特征T2后,整体分类精度有所提高,积雪和非积雪的生产者精度分别提高3.19%和2.83%,F1均提高了0.03,总体分类精度提高至80.50%,Kappa系数提高至0.61。结合极化特征、后向散射特征以及Diff、Ratio特征(T3)分类,总体分类精度和Kappa系数最高,分别为83.00%和0.66,积雪和非积雪的生产者精度和用户精度均达到最高,F1值均高于0.80,与仅利用极化特征T1相比均提高了0.06。综上,通过对比3种特征集的分类结果,利用特征集T3总体分类精度最高,分类效果最佳,其次为特征集T2,特征集T1的分类精度最低。

表4 分类结果的混淆矩阵Tab.4 Confusion matrix of classification results

(a) 用户精度

(b) 生产者精度

(c) 调和平均值

(d) 总体精度+Kappa系数图11 分类精度对比Fig.11 Comparison of classification accuracy

为了进一步对积雪识别结果进行分析和讨论,在研究区内分别选取3个典型区域(A,B,C),同时引入2013年12月14日GF-1光学影像,使用近红外波段(R)、红波段(G)和绿波段(B)进行波段组合,如图12所示。将前述随机森林分类结果与GF-1影像进行对比发现:① A区位于研究区西北部,土地类型主要为农田和少量村庄,地势平坦。由于12月14日的GF-1影像在A区有大面积云遮掩,选择Pauli分解彩色合成图像进行对比。在对比3种特征集识别结果发现,基于特征集T2和T3积雪识别精度较特征集T1高,农田轮廓较为清晰,但部分积雪范围被低估,特征集T1识别精度最低,非积雪区域被低估,出现较多误分结果。② B区位于研究区西部,地势较为平坦,土地覆盖主要为草地和林地。对比3种特征集识别结果,特征集T3积雪识别效果最好,积雪和非积雪边界较为清晰,特征集T1和特征集T2积雪范围大致被识别,但积雪内部出现很多细小非积雪斑块,较多积雪被误分,可能是由于地表覆盖较为复杂,对雷达散射信号产生影响。③ C区位于研究区东南部,下垫面为高覆盖度草地,地势起伏较大。受地形起伏影响,该区域有阴影和叠掩现象,对SAR基于3种特征集识别结果有很多破碎斑块,非积雪范围被误分,特征集T3识别结果相对较好,草地回波散射对积雪识别产生一定影响,导致整体识别精度效果较低。

图12 积雪识别结果局部分析Fig.12 Local analysis of snow cover recognition

4 结束语

本文以新疆玛纳斯河流域为研究区,C波段全极化Radarsat-2影像作为数据源,结合后向散射特征和不同极化目标分解得到的极化特征组成特征集,利用RF方法分别对极3种不同特征组合进行积雪和非积雪识别分类研究,实现该研究区内积雪范围制图。

本研究基于多种极化分解特征和后向散射特征结合,用于山区积雪识别,虽然识别精度有所提高,但本文仅使用了几种极化特征,如何获得SAR图像中更丰富极化信息,提取对积雪识别更优的特征值,还需要做更深层次的研究。

猜你喜欢
散射系数积雪极化
等离子体层嘶声波对辐射带电子投掷角散射系数的多维建模*
阿尔卑斯山积雪
认知能力、技术进步与就业极化
极化雷达导引头干扰技术研究
基于干扰重构和盲源分离的混合极化抗SMSP干扰
沥青混凝土路面电磁散射的FDTD研究
基于半确定性面元模型的海面散射系数仿真
我们
非理想极化敏感阵列测向性能分析
大粮积雪 谁解老将廉颇心