全极化SAR影像多特征分类的海岸线提取方法

2022-10-13 09:13张龙王志勇叶凯乐常栋
遥感信息 2022年4期
关键词:海岸线极化纹理

张龙,王志勇,叶凯乐,常栋

(1.山东科技大学 测绘与空间信息学院,山东 青岛 266590;2.中国测绘科学研究院,北京 100036)

0 引言

海岸线是确定海岸带管理范围的重要依据,然而,海岸线的侵蚀与增长已成为全世界广为关注的问题之一[1]。黄河三角洲是中国乃至世界各大河三角洲中海陆变迁最活跃的地区[2],自1855年以来,由于受自然变化和人工干预影响,黄河经历了多次改道,黄河三角洲不断向渤海延伸。在淤进造陆[3]的同时,三角洲也受到海洋动力的侵蚀,在二者的双重作用下,海岸线淤进蚀退交替演变迅速。因此快速准确了解和掌握海岸线的动态变化特征,提取海岸线分布,对于海岸带资源使用、管理、保护规划及灾害的预防具有重要意义。

相比于光学传感器,合成孔径雷达(synthetic aperture radar,SAR)传感器可以在不受时间和天气的限制下连续工作,因此SAR数据更适合作为海岸线监测的原始数据。基于SAR影像进行海岸线的提取已经成为现今重要的研究方向[4]。

目前,利用SAR影像提取海岸线的方法主要可分为三类:基于边缘、基于区域和基于阈值的方法[5-6]。基于边缘方法其原理是利用海陆边缘在影像上所反映出的灰度空间突变来寻找边缘像素点[7],但其受SAR影像斑点噪声影响较大且很容易出现内陆地区虚检测情况,这增加了海岸线提取工作的复杂性。基于区域的方法是以图像的全局或者局部同质区域为对象,相比基于边缘的方法,具有抗噪性强、检测边缘连续的优点[8],又可细分为面向对象法和主动轮廓模型法。邓滢等[9]基于面向对象的思想,提出一种高精度、低虚警率的SAR影像水体提取方法,其分割技术能够保持完整的水陆边界,但无法充分利用SAR影像中隐含的信息,使得提取精度降低。Liu 等[10]利用基于区域的几何轮廓演化方法,其海岸线检测结果更加准确快速,但该方法需要给出初始轮廓,对于不同影像要进行多次实验以取得最优化的初始轮廓,需进一步研究得以广泛应用。基于阈值方法是常用的海陆分割方法,因其实现简单、计算量小而成为海岸线提取的一种常用方法[11],但其分割效果对确定阈值的依赖性强,如很多学者应用经典OTSU阈值分割方法进行海陆分割[12-13],但该算法并非针对分割水陆而设计,因此所获得的阈值并非最佳阈值。Nunziata等[14]对多极化SAR图像提取海岸线进行了一系列的研究,建立极化SAR物理模型以获得海陆分割阈值对影像二值化以提取海岸线,但其仍受不同统计分布限制,无法适用于任意场景。

影像分类的方法进行海岸线提取原理与基于阈值方法相同,区别在于以不同步骤获得海陆二值图像,以此来获得海岸线的位置。全极化SAR包含了HH、HV、VH、VV 4种极化方式,可以展示不同模式下的图像信息,描述的地面信息更加丰富,更大限度地揭示了地物的散射差别,更有利于将各类地物进行区分[15]。本文针对目前利用SAR数据提取海岸线方法的各自局限性及阈值分割方法中最优分割阈值较难确定的缺点,考虑全极化SAR影像分类的巨大潜力及可行性,提出了一种结合SAR影像的极化及纹理特征,利用随机森林分类获得海陆分割阈值并进行海岸线自动提取的方法。利用多极化SAR数据的多特征性来增强海陆对比从而进行分割,是基于多极化SAR数据影像方法提取海岸线的优越性。

由于海岸线无时无刻不在发生着变化,且受海岸线类型等诸多原因影响,真正海岸线的位置难以确定,因此,本文将卫星过境时的瞬时水边线认定为海岸线进行实验,该定义方法也是一种国内外较为认可的海岸线确定方法[16]。

1 研究方法

针对黄河三角洲复杂的背景条件,基于高分三号全极化SAR数据,提出了一种结合多特征选择和随机森林分类算法的海岸线提取方法,通过极化分解提取极化特征、灰度共生矩阵提取纹理特征,并进行特征的优化选择,得到最优特征参数组合,对最优特征组合进行分类、水陆分割及海岸线的提取。将海岸线提取结果与阈值分割算法海岸线提取结果做精度对比。

1.1 多特征提取及选择

目标极化分解提取的特征是与物理散射相关的极化特征,直接与物理意义相联系,如奇次散射、偶次散射、体散射等。利用SAR影像上水体的散射特征相对其他地物差异较大的特点,将极化分解的分量组合构建特征向量,发挥各自的特征优势,能提高分类效果[17],更有效地区分水体与其他地物类型。本文选择了3种极化分解方法:Pauli分解[18]、Krogager分解[19]和H/α/A分解[20]。

水体与其他地物在SAR图像上表现为不同的纹理特征,且纹理作为区域统计量,减弱了噪声对区域特征的影响,稳定性更强。因此,有必要将纹理特征作为分类参数的一种,提高分类的精度。由Haralick[21]于1973年提出的基于灰度级共现矩阵(gray level co-occurrence matrix,GLCM)的特征被广泛应用于纹理分割中,是目前最常见、应用最广泛、效果最好的一种纹理统计分析方法。GLCM的构造依赖于两个参数,即相对距离(d)和方向(φ),在像素对之间,d以像素数来度量,φ通常从4个方向(水平-0°、对角线-45°、垂直-90°和反对角线-135°)度量。GLCM的计算公式参见文献[21]。

在极化SAR影像分类中,利用多特征更准确地反映出地物差异,有效地改善分类结果精度。特征的组合不是固定的,较多的特征参数会造成数据的冗余,增加计算量的同时影响了分类效率[22];较少的特征参数不能准确地表达地物特点,从而降低分类精度,因此需要对所提取的特征进行降维选择[23]。本文所遵循的原则是特征之间低相关性及特征本身信息丰富性,并以此选择出最优特征组合。

1.2 随机森林分类

随机森林(random forest)算法是Breiman[24]于2001年提出的一种基于决策树的集成算法,它的基本单元是决策树。每棵决策树都是一个分类器,那么N棵树会有N个分类结果。这些决策树组成的集合构成随机森林,最后取所有决策树的预测平均值作为最终预测结果。随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终输出,它可以很方便地并行训练。

1.3 基于种子填充的孔洞填充算法

图像二值化后,总会存在一些异质斑块,因此利用孔洞填充算法去除这些异质区域,孔洞填充算法[25]的基本思想是:从图像的多边形区域的一个内点开始,该点即被称为种子点,由内向外用给定的颜色填充直到边界为止。种子填充算法常用的方法有四向联通填充方法和八向联通填充方法。

算法流程如图1所示,填充由内部像素点所组成的多边形区域,取种子像素是(4,3)。具体的填充流程从种子像素出发,沿线段路径填充,当周围像素均为所给出像素值,则该填充流程完毕。

图1 种子填充算法流程图

1.4 海岸线提取算法

本文联合极化特征和纹理特征的随机森林分类算法对黄河三角洲地区海岸线提取的具体步骤如下,提取流程如图2所示。

1)高分三号数据进行预处理。预处理过程包括辐射定标、极化矩阵转换得到极化矩阵T3、ReLee滤波及地理编码等处理。

2)极化特征提取。对极化矩阵T3进行极化目标分解,基于Pauli分解、H/α/A分解和Krogager分解,提取9个极化特征。

3)纹理特征提取。本文没有直接计算高分三号极化影像的纹理,而是基于其HV极化和HH极化,利用雷达水体指数模型最大化水陆差异,计算模型结果的灰度共生矩阵来提取图像的纹理特征。

4)特征优选。利用特征选择模型,在所获得的极化纹理特征中进行筛选,选择9个特征构建特征向量并进行分类。

5)确定分类的类别数,选择训练样本,训练随机森林分类器。特征向量作为输入数据,应用训练好的随机森林分类器,获得分类结果图像。

6)分类结果进行类别合并获得海陆二值图像,利用孔洞填充算法去除二值图像中的舰船、近岸养殖池等有干扰性质的斑块区域,对优化后的二值图像利用边缘检测算法提取获得最终的海岸线。

7)参照编码后的SAR影像和天地图影像通过人工勾绘方式获得实验区域的参考海岸线,对本文方法提取的海岸线进行精度分析。

图2 实验流程图

2 实验区及实验数据

实验区为山东省东营市东北部的黄河三角洲部分地区,北邻渤海,东接莱州湾。黄河三角洲地处中纬度,位于暖温带,背陆面海,受欧亚大陆和太平洋的共同影响,属于暖温带半湿润大陆性季风气候区,冬寒夏热,四季分明[26]。黄河所携带的大量泥沙,导致黄河三角洲正不断向海洋延伸,成为世界上最年轻的陆地之一[27]。选择两景位于黄河三角洲的GF-3全极化条带1(QPS1)模式的Level 1A级(即单视复影像,SLC)图像进行海岸线提取实验。两景GF-3影像的成像时间分别为2018年11月5日和2019年3月13日,空间分辨率均为8 m。实验数据极化假彩色合成图如图3所示。

图3 实验区域Pauli假彩色合成图

3 实验结果及分析

3.1 特征向量构建

对极化矩阵T3进行极化分解,基于Pauli分解、H/α/A分解和Krogager分解获得以下极化特征:Pauli分解体散射分量PVOL、Pauli分解奇次散射分量PODD、Pauli分解偶次散射分量PDBL、Krogager分解球散射体分量Ks、Krogager分解螺旋体分量Kh、Krogager分解二面角散射体分量Kd、H/α/A分解极化散射熵H、H/α/A分解反熵A、H/α/A分解平均散射角α。极化分解合成结果如图4所示。

图4 极化分解合成图

基于灰度共生矩阵提取以下纹理特征:均值、方差、同质性、反差、差异性、熵、角二阶矩相关性。所获得的初始特征集包括9个极化特征和8个纹理特征。将所提取的17个特征进行特征优选,所选择的最优特征参数组合中各个特征的详细信息如表1所示,利用优择的特征参数构建特征向量并分类。

表1 筛选后的特征参数

3.2 海岸线提取

由于黄河三角洲地区地物类型错综复杂,仅选择水陆两类样本其分类误差大且耗时长,为获得较好分类结果及保证分类效率,本文确定类别数量为4类(水体、植被、潮间带、其他)。利用两幅影像数据以相同的训练样本进行分类实验,其初始分类结果如图5所示。

图5 初始分类结果

根据初始分类结果,首先进行类别的合并获得初始海陆二值图像,二值图像如图6(a)所示。可看出,在白色的陆地区域存在黑色的池塘、水田、河道等白色水体区域,在黑色的海面区域内存在的大量的白色杂散点,为提高提取精度及减少人工工作量,利用孔洞填充算法来填充这些斑块区域,进行海陆二值图像的优化,优化结果如图6(b)所示。

最后利用Canny二值图像边缘检测算子提取海陆边界线,获得矢量的瞬时海岸线。本文方法和OTSU法的两幅影像海岸线提取结果如图7和图8所示,在图8(c)中可看出阈值方法提取的结果存在着一些误分区域。

图6 海陆二值图

图8 OTSU阈值法海岸线提取结果

3.3 精度验证

真实的参考海岸线难以获取,以人工勾绘的海岸线作为参考海岸线,对本文方法的海岸线提取结果精度进行分析,并与OTSU阈值分割方法得到的海岸线提取结果作对比。为定量分析提取方法的精度,本文基于ROC[28]曲线匹配原则,选择缓冲区分析方法[29]为评价方法,其主要思想是计算验证海岸线落在参考海岸线缓冲区的像素点个数,实现对提取结果的定量分析,其示意图如图9所示。

图9 缓冲区分析示意图

评价步骤为:首先以人工提取的参考海岸线为匹配标准,建立缓冲区,缓冲区宽度r为20 m和40 m,并以各个岸线提取结果的长度为权Pi,在提取的海岸线上取NPi个点,判断点相对于缓存区的位置,判定点位于缓冲区内的点个数记为TP1(true positive),缓冲区外地点个数记为FP(false positive);然后建立提取海岸线的缓冲区,并在参考海岸线上取点,如果点落入该缓冲区,认为其同提取的海岸线相匹配,点的个数记为TP2,否则定义为不匹配,个数即为FN(false negative)。定义correct、complete、quality 3个参数指标[30],分别表示海岸线提取结果的正确程度、完整程度和提取质量。海岸线提取结果的精度对比如表2所示。

表2 海岸线提取结果精度对比

由表可以看出无论哪种缓冲区半径,本文方法精度都要优于OTSU阈值分割方法;且当缓冲区半径增加,两幅影像的海岸线提取结果各项精度指标有明显提升,当缓冲区半径为40 m时,其提取结果的完整性、正确度及提取质量都在90%以上,提取结果的可靠性高。

3.4 讨论与分析

纹理提取过程中,不同计算参数对结果纹理的丰富度存在较大影响。本文纹理提取参数选择如下:比较自己所选择的实验数据,影像纹理信息在对角方向上比较多,因此确定窗口滑动方向为右下45°。滑动步长选择为1,即滑动窗口每个中心像素均与邻近像素进行比较,不易丢失纹理信息。纹理分析中,过小的窗口不能很好表示纹理信息,过大的窗口会掩盖纹理间的差异。变异系数可以用来衡量纹理滤波窗口的大小合适与否,变异系数大,说明变异幅度大,整齐性较差,稳定性小;反之,变异系数小,说明变异幅度小,整齐性较好,稳定性大,变异系数计算方法见文献[31]。

选择同质性、反差、差异性、角二阶矩和相关性来计算各个特征变异系数,分析其变化情况结果,如图10所示,并根据图中变异系数曲线变化来确定纹理提取窗口的大小。

图10 变异系数随窗口增大变化曲线

从图10可以看出,随着窗口大小的逐渐增加,从7×7窗口大小开始,不同纹理统计量的变异系数也趋于稳定,因此,在窗口大小的选择上,7×7的滑动窗口最为合适。综上,本实验进行纹理特征提取的参数如下:矩形窗口大小为7×7,方向为45°,步长为1,灰度量化级为32。

本文在分类方法的选择上做了一些工作,利用相同的训练样本及输入特征,采用最大似然比分类、随机森林分类、神经网络分类、支持向量机分类4种方法,对两幅研究区影像数据(影像数据1、影像数据2)的特征选择结果进行分类,比较分类结果的精度,选择较好的分类方法。针对两幅影像数据,4种分类方法的分类精度如表3所示。

表3 分类方法精度对比

由表3可以看出,最大似然分类方法和神经网络分类方法在面对两种不同影像数据时其分类结果表现得不够稳定,而随机森林分类方法和支持向量机分类方法则都有较好的稳定性,且随机森林方法的精度最优,因此选择随机森林分类方法为本文的分类方法。

4 结束语

本文利用极化分解及灰度共生矩阵分别提取了共计9种极化特征及8种纹理特征,并进行特征优选,选择9个特征组成最优特征组合进行随机森林分类获得水陆二值图像,孔洞填充算法对二值图像优化后,利用边缘检测算子追踪二值图像边缘得到研究区域的海岸线。

为避免单幅影像出现提取结果精度偶然性的影响,选择了两景全极化SAR影像数据进行实验。相比于利用阈值分割法或是边缘检测法直接提取SAR影像中的海岸线,全极化SAR影像进行大范围的海岸线提取能有效利用多极化信息的丰富性提高海陆辨识度,具有提取精度高、海岸线连续的优点,在40 m分析精度情况下,两幅影像提取质量均达到了90%以上,方法结果稳定可靠。

本文方法从精度上来看,可以代替人工目视解译的方法从极化SAR数据中提取海岸线,但仍存在着一些不足,如提取的海岸线为获取数据时刻的瞬时海岸线等问题,后续的工作还要针对这些方面进行研究,并针对海岸线提取的自动化和提取精度作进一步提高。

猜你喜欢
海岸线极化纹理
活跃在高考中的一个恒等式
极化雷达导引头干扰技术研究
基于干扰重构和盲源分离的混合极化抗SMSP干扰
穿越日照阳光海岸线
海岸线
肺纹理增多是病吗?
童梦
TEXTURE ON TEXTURE质地上的纹理
消除凹凸纹理有妙招!