基于混合模糊的SAR图像水陆分割算法

2018-12-20 11:04郭拯危王乐宋国磊
自然资源遥感 2018年4期
关键词:丹江口水库灰度聚类

郭拯危, 王乐, 宋国磊

(河南大学计算机与信息工程学院,开封 475000)

0 引言

合成孔径雷达(synthetic aperture Radar, SAR)是一种通过发射波束,并接收回波来探测目标的主动式雷达。相比于光学图像来说,SAR图像受时间与天气干扰极小,能够在夜间或者云、雨、雾霾等天气下采集到目标影像。SAR技术的发展,使得人们能够更加方便、可靠地了解目标区域的信息,这对于国民经济的发展和国防建设来说十分重要[1]。

水域作为SAR图像中一类非常重要的目标,在进行水域面积计算及水域相关目标识别时,水陆分割是极为关键的第一步。由于丹江口水库流域面积广阔、支流繁多且地物种类复杂[2],针对丹江口水库区域的SAR图像水陆分割的研究极少。目前利用阈值分割理论,通过对最大类间方差(maximum between-class variance,OTSU)算法的改进或采用小波变换、边界追踪技术和滤波等技术相结合来完成水陆分割,在海洋边界和河道等方面取得了较好的分割效果[3-11],但SAR图像分割至今并没有被普遍认可的通用分割算法。随着数学理论的发展,数学形态学和模糊理论被相继提出[12-14]。由于数学形态学和模糊理论本身在图像分割方面无法完成有效的分割,而经典的分割算法对于噪声抑制和运行时间上又存在较大的屏障,因此常将二者相结合来解决图像分割中噪声抑制和运行时间等问题。如倪维平等[15]提出的将马尔可夫随机场模型和数学形态学相结合的分割算法在运算速度、迭代次数和分割精度方面都有了较好的改进;叶海军[16]将边缘检测与腐蚀、膨胀算子相结合,在对图像的预处理和控制虚假边缘信息方面得到了较好的效果;安健等[17]将一维OTSU与核聚类相结合,首先把SAR图像划分成若干个互不重叠的子区域,再利用核聚类对子区域间像素进行聚类,得到较好的分割效果。另外,在模糊理论中引入水平集、分水岭和蚁群等算法,在降低运算时间及噪声处理上均有较多的成果[18-19]。目前已有算法在噪声处理及分割精度上有较大的改进和突破,但一般都仅限于某些特定环境背景,如河道和海洋边界等。对于具有地物种类丰富和支流繁多特征的SAR图像,无法完成较为精细的分割。针对上述问题,本文提出了多阈值OTSU与模糊理论相结合的水陆分割算法。

1 基本理论和方法

1.1 自适应多阈值OTSU分割算法

单阈值OTSU 算法的基本思想是类间方差取最大值时,对应的灰度值T便是所选定的阈值。将单阈值的 OTSU 算法加以推广,对于n类分割,各类别的概率、均值、方差和类间差分别标记为wk,μk,σk2(k= 1,2,…,n)和σw2,各分割阈值的组合标记为T= {tll= 1,2,…,n-1} ,则有

(1)

(2)

(3)

式中:pi为L级灰度图像中灰度值为i的像素占总像素的比重,L为灰度级;tl(1

(4)

无论是单阈值还是多阈值分割,算法所计算得到的类内差都是针对图像本身灰度特性离散程度的一种度量方式。根据这种明确的描述方式可以得到,如果类内差越小,则说明图像本身各像素点之间的灰度差异就越小。故对于一幅灰度级为L的SAR图像,利用n(n

1.2 模糊C均值算法

传统的模糊C均值(fuzzy C-means,FCM)算法中,模糊划分矩阵U的计算会随着样本数与聚类数目的增加而增加,从而导致需要大量的运算时间和存储空间,降低了分割的效率。对于给定的SAR图像来说,其灰度级是一定的,而聚类中的聚类样本数量就取决于灰度级的数目。因此,如果将多阈值分割计算得到的各均匀区域的灰度均值代替像素点进行聚类将会大大减少聚类的样本数,从而减少运算耗时,提高分割效率。

设灰度级为L的图像,多阈值OTSU粗分割后的各区域灰度均值为N(即初始化聚类中心集合)。现把图像灰度级作为样本集,将其分为C个不同的类别,那么C个类别分别对应的聚类中心为c,每个像素点i属于某一类j的隶属度为μij,并且所有的μij取值在[0,1]区间之内。由此定义模糊聚类的特征函数和约束条件,即

(5)

(6)

则更新μij和ci等式分别为

(7)

(8)

式中:N为样本数目;C为图像分割类别数;J为FCM的价值函数;xj为图像中某一点的灰度值;μij为样本元素i属于第j类子集合的隶属度;ci为第i类聚类中心;d为数据点与聚类中心的欧几里德距离;m为控制模糊度的权重指数,且m∈(1,∞)。

2 混合模糊的SAR图像分割算法

丹江口水库属于内陆人工湖,水面流动较缓,水面平滑。因此降低了后向散射,对比陆地,水域在SAR图像所表现为暗区;其周边区域地物种类较多,SAR图像中灰度级较高。因此本文通过3步来处理SAR图像:①通过自适应多阈值OTSU对SAR图像进行灰度梯度降级并计算各区域的灰度均值;②将各区域的灰度均值作为模糊聚类的聚类中心进行聚类迭代,以更有效地降低噪声对于分割结果的影响;③采用连通区域法,将邻域内小于预先设定好的面积阈值的像素点对象进行滤除,从而实现水陆的精分割。

2.1 SAR数据及预处理

采用数据源为Sentinel-1A卫星的Level-1地距多视影像(ground range detectd,GRDH),影像成像方式为干涉宽幅(interferometric wide swath,IW)模式,极化方式为VV。数据预处理主要包括辐射校正和斑点噪声抑制。

由于Level-1影像没有进行辐射定标,辐射偏差较大,所以需要对数据进行定标。辐射定标之后得到影像地物雷达后向散射系数。定标公式[20]为

(9)

式中:value(i)为后向散射系数值;|DNi|为原数据灰度值;Ai为根据查找表中定标算法选择其中的betaNought(i),sigmaNought(i)或gamma(i)值。

在SAR成像过程中,由于相干成像系统的缺陷,不可避免地会产生类似于噪声的相干斑。相干斑的存在大大降低了对SAR图像感兴趣区域的分析和解译能力。因此,相干斑抑制是SAR图像分割的首要且重要环节。本文采用ENVI5.3中的Refined Lee滤波器进行斑点噪声消除,因为Refined Lee在有效抑制斑点噪声的同时可以较大限度地保留图像边缘信息[21]。

2.2 算法步骤及流程

算法流程如下:①输入经过预处理的SAR图像I;②提取图像I的灰度统计直方图信息,得出所有出现的谷值与峰值,并记为V;③利用多阈值OTSU,将V作为参数,对图像进行灰度梯度降级,并计算各区域的灰度均值G,得到粗分割之后的图像I′;④将图像I′作为新的输入数据集,并设置目标函数精度α(α=0.000 1)、模糊指数m(m=2)和最大迭代次数Tm(Tm=15),当前迭代次数t为0;⑤根据G,设置初始化模糊聚类中心ci(i=1,2,…,n),n为初始化聚类数目;⑥由式(3)—(4)更新模糊划分矩阵U={μij}和聚类中心C={ci};⑦基于式(5)和式(10)计算temp,即

temp=|J(t)-J(t-1)|

(10)

当temp<ε或t>Tm,结束聚类,否则t=t+1,转到第⑥步;⑧得出分类结果I′result;⑨再将I′result作为输入数据,采用8邻域连通区域方法,移除I′result中面积小于等于单个像素点的对象,从而得到精分割结果Iresult。

3 实验结果及讨论

实验采用数据为丹江口水库2016年10月份影像数据,图像大小为923像素×597像素,研究区内包括林地等植被区、水库区与居民区等不同区域。除本文算法外,采用8种其他分割算法做对比,分别为:FCM算法、OTSU算法、区域分裂合并算法、MRF(markov random field)算法、水平集+数学形态学算法、二维OTSU算法、OTSU+核聚类算法和蚁群+聚类算法。预处理后的图像及各种算法的实验结果如图1所示。

(a) 预处理后图像 (b) FCM算法 (c) OTSU算法

(d) 区域分裂合并算法 (e) MRF算法 (f) 水平集+数学形态学算法

(g) 二维OTSU算法 (h) OTSU+核聚类算法 (i) 蚁群+聚类算法

(j) 本文算法

3.1 目视解译

从主观方面评价实验结果可以看出,OTSU算法、区域分裂合并算法和MRF算法在对噪声抑制上效果较差,且区域分裂合并算法有严重的误分割现象(图1(c)—(e));二维OTSU算法在噪声抑制上较一维OTSU有明显改进,但对环境复杂的丹江口库区SAR图像的水陆分割仍旧受噪声干扰严重(图1(g));水平集与数学形态学算法虽在噪声处理方面具有较好的效果,但对于局部区域的支流存在漏分割(图1(f));由于SAR图像的噪声主要是斑点噪声,OTSU+核聚类算法中所使用的线性核聚类和高斯核聚类,在抑制噪声方面效果一般,对于支流及居民区部分存在误分割(图1(h));FCM算法仅利用了图像中的灰度信息,因此算法本身对于噪声没有较好的抑制(图1(b));文献[22]中提出的算法,由于自适应蚁群算法的引入在算法运行时间上有了较大提升,对于小区域的分割结果取得了较好效果(小区域环境背景单一),但对于丹江口水库大区域SAR图像来说,并不适用(图1(i));本文算法结果在支流与其他非水域区域分割中相比较于其他算法得到了精度较高的结果(图1(j))。

3.2 整体精度及Dice系数定量分析

采用文献[23]和文献[24]中所使用的客观评价标准,将本文算法与现有的分割算法从分割准确率A、召回率R、总体精度指标F以及Dice系数方面进行分析。A和R分别是分类里面的度量值,一般用来评估分类结果的好坏。这2个指标的计算示意图如图2所示。该图为图像中某一部分像素分布图,其中黑色为目标区域。

(a) 带人工标记的原图像 (b) 分割后的图像

A=(TP+TN)/(TP+FN+FP+TN),

(11)

R=TP/(TP+FN)

(12)

式中:TP为被找到的相关样本(6块);FP为被找到的不相关样本(2块);FN为相关未找到的样本(1块);TN为不相关未被找到的样本(33块)。

另外,F值(F-measure)为总体精度,同一性能评价度量指标,即

F=(α+1)AR/(αA+R)

(13)

式中α为影响因子。F值避免了过度追求查全率和精度的情况,F值的高低可以评价分割算法的优劣。

评价指标结果如表1所示。

表1 SAR图像分割评价结果指标

仅从10月库区影像分割结果及性能指标数据可以看出,本文分割算法优于其他8种算法。

为进一步讨论本文算法的适用性,另对3幅其他相同格式,不同时期、不同大小的该库区影像进行分类,所有图像信息如表2所示。

表2 丹江口水库 SAR 影像信息表

其他3幅不同时期水库影像如图3所示。

(a) 2016年3月 (b) 2016年6月 (c) 2017年5月

Dice系数(dice similarity coefficient,Dice-DSC)又称Dice重复率,是一种集合相似度的衡量指标,即

(14)

式中:Sg表示原始图像目标域的面积;Sm表示算法分割后图像目标域的面积;N()表示在该区域像素点的个数;DSC为Dice系数,其值越接近1,则分割的结果越好。

本文采用的GT(groud truth)图像为丹江口水库SAR图像的人工分割结果,如图4所示。

图4 人工分割结果

不同时期该库区分割结果的Dice系数如表3所示。

表3 不同时期SAR图像分割结果Dice系数

从Dice系数可以看出,对于不同时期和包含不同流域的图像,本文算法的分割效果在整体上均高于文中对比的其他算法。结果表明,本文算法具有较好的适应性与精确性,适用于地物种类丰富、支流较多的SAR图像,且分割结果均能有效克服噪声抑制和阴影对水域分割的影响。

4 结论

1)针对丹江口水库SAR图像的水陆分割问题,提出了基于SAR图像的混合模糊水陆分割算法,将模糊聚类与最大类间方差法进行了改进和有效结合,优化了聚类中心的选择,改善了分割效果。在噪声较多且包含较多细小支流的水域遥感影像中有较大优势。

2)采用4景不同时期的丹江口水库影像进行实验验证,结果表明本文算法对于背景环境复杂、噪声较大的SAR图像能得到较好的效果,且有良好的适应性。

3)本文的不足之处表现在模糊聚类中各类与聚类中心相似度的计算上。传统相似度计算采用的是欧式距离,在今后的进一步研究中,可以考虑在本文基础上相似度计算过程中加入其他相关因子进一步细化各类差别,改善影像分割效果,提高遥感影像分割质量。

猜你喜欢
丹江口水库灰度聚类
采用改进导重法的拓扑结构灰度单元过滤技术
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
基于K-means聚类的车-地无线通信场强研究
丹江口水库的水资源管理与保护概述
水库移民农地流转与生计恢复问题及对策研究
基于ETM+数据的水体信息提取
基于最大加权投影求解的彩色图像灰度化对比度保留算法
丹江口水库河南外迁农村移民安置效果研究
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现