基于优化FGFCM方法的滑坡遥感影像自动提取

2023-04-29 00:44谭秋焰吴彩燕贾菊桃朱新婷廖军
西南科技大学学报 2023年1期
关键词:滑坡聚类算法

谭秋焰 吴彩燕 贾菊桃 朱新婷 廖军

摘要:为实现滑坡遥感影像的自动提取,以贵州省水城县为研究区,运用GF-1遥感影像数据,剔除明显非滑坡地物后,应用云变换计算样本区影像像元亮度值,统计得到聚类中心值和聚类个数,结合快速广义模糊C-均值聚类算法进行像元聚类,提取出128处准确滑坡,kappa系数达0.752,总体精度达0.880。该方法可自动提取出滑坡范围,减少工作量和主观影响,提高了基于遥感影像进行滑坡识别的效率和精度。

关键词:滑坡遥感影像快速广义模糊C-均值聚类算法云变换

中图分类号:P237;P642.22文献标志码:A文章编号:1671-8755(2023)01-0054-07

Abstract:Inordertorealizetheautomaticextractionoflandslidefromremotesensingimages,ShuichengCounty,GuizhouProvince,wastakenastheresearcharea.UsingtheGF-1remotesensingimagedataandremovingtheobviousnonlandslidefeatures,theimagedigitalnumberinthesampleareawascalculatedbycloudtrasforation,andtheclustercentervalueandclusternumberwereobtainedstatistically.AndcombinedwiththefastgeneralizedfuzzyC-meansclusteringalgorithmforpixelclustering,128accuratelandslideswereextracted.Thekappacoefficientwas0.752,andtheoverallaccuracywas0.880.Thismethodcanautomaticallyextractthelandsliderange,reducetheworkloadandsubjectiveinfluence,andimprovetheefficiencyandaccuracyoflandsliderecognitionbasedonremotesensingimages.

Keywords:Landslide;Remotesensingimages;FastgeneralizedfuzzyC-meansclusteringalgorithm;Cloudtransformation

滑坡屬于我国最常见的地质灾害类型之一,分布广泛,发生率高,威胁着人类的生命和财产安全[1]。传统的滑坡调查是依靠人力现场调查,在易发生滑坡的山区中,往往因灾害造成的交通堵塞而不能及时到达现场。遥感技术具有成像快、范围广的优势,能够快速准确地获取滑坡灾害的位置、数量、大小等信息,现已作为调查滑坡的基本手段被广泛应用[2]。通过目视解译对遥感影像上的目标地物进行提取耗时耗力且易有主观误差。

自1976年Kettig[3-5]首次对遥感影像分割进行了简单阐述以来,国内外学者对其进行了更加深入的研究,并将遥感影像分割引入到滑坡提取的应用中[4-5]。模糊聚类作为一种多元分析方法,可根据对象间的模糊关系将其自动分类,在具有模糊性和不均匀性的遥感影像上,能够抑制噪声,更好分割影像[6]。该方法被广泛运用到滑坡灾害相关的研究中,如监测滑坡变形[7-8]、调查滑坡影响因素和破坏机制[9]、滑坡敏感性评价[10]等。

对高分辨率遥感影像进行面向对象分割,可以更好地提取地物,Cai等[11]提出应用快速广义模糊C-均值聚类算法(FastgeneralizedfuzzyC-meansclusteringmodel,FGFCM)可利用影像中局部区域像素间的灰度信息和距离关系定义一个新的线性加权和影像,能准确反映影像包含的空间结构信息,在该影像灰度直方图上进行影像聚类,可得到抗噪能力强的影像分割成果。在FGFCM算法中,选择的聚类中心初始值和聚类数目一般是由经验决定的,主观因素会对结果产生较大影响。而针对影像分割,云变换作为一种可转换定性定量信息的算法,可以很好兼顾影像信息的模糊性与算法的稳定性,弥补传统“硬分割”算法无法处理不确定性问题的缺点[12-13]。

本文以贵州省水城县为研究区,基于高分1号(GF-1)影像,运用逆云变换算法计算滑坡影像像元亮度值的聚类初始中心值和聚类数目,以克服人为选择该值的主观影响,结合FGFCM聚类算法进行影像分割,提取该区的滑坡信息,可为当地防灾减灾工作提供参考依据。

1研究区概况及数据来源

1.1研究区概况

1.1.1地理位置

水城县隶属于贵州省六盘水市,位于滇东高原向黔中丘原和广西丘陵的过渡地带,地处乌蒙山脉东北段之东南,境内总体地势是北西高、南东低。全县南北长97km,东西宽69km,总面积3605km2,总人口86万人。

1.1.2滑坡发育情况

研究区因水系切割,地形以山地为主,受地壳层运动的影响,区内经历多次间歇性掀斜抬升,形成了多级夷平面,地形起伏较大。研究区地质构造复杂,岩体内片理和裂隙普遍发育,抗风化能力弱,结构松散,地质灾害易在褶皱密集和断裂交汇等构造部位发生。境内采矿活动突出,山体裂缝常直达地表,导致一些原本平稳的边坡成为不稳定的斜坡。降水集中的6-8月,暴雨容易造成土石层饱水、滑体重量增加、岩土层抗剪强度降低,最终导致滑坡。

水城县地质灾害分布如图1。主要类型包括:崩塌、滑坡、不稳定斜坡、地裂缝、地面塌陷、泥石流等,其中滑坡155处,占该县地质灾害总数的53.82%。研究滑坡自动提取方法对提高滑坡识别效率具有重要意义。

1.2数据来源

高分一号(GF-1)影像数据具有大面积、高精度、时效性强等特点。本文选取2018年5月份6景GF-1遥感影像融合成的2m分辨率遥感影像,包含水城县大部分区域。水城县滑坡灾害点是通过遥感影像目视解译、野外排查验证得到的可信数据。

2研究方法

2.1FGFCM算法

模糊集理论是通过对传统非此即彼分类的集合理论中加入过渡区间,使针对单体分类的间断过程变成对区间分类的连续状态。由Ruspini[14]提出的FCM(模糊C均值)算法是依据最小二乘原理,通过迭代对目标函数进行优化,从而对数据集进行模糊划分。将FCM算法引入影像分割,需要把影像的像素灰度值视为数据集的样本点,将影像分割问题转换为FCM目标函数优化问题。

FGFCM算法针对FCM算法计算复杂度高的问题,通过利用原始影像中局部区域像素间的灰度信息和距离关系定义一个新的线性加权和影像,在该影像灰度直方图上进行聚类,可大大减少计算量,且最终能得到抗噪能力强、精度高的影像分割成果。

该算法将局部区域像素间的灰度信息和距离关系以相似度量值转为线性表达,这一步骤使该算法对噪声具有鲁棒性,其公式为[15]:

通过引入云变换,将样本影像的定量信息转换为定性概念,能更科学地计算出FGFCM聚类时使用的聚类参数。

2.3基于云变换优化的FGFCM聚类

使用遥感影像像元亮度值(Digitalnumber,DN),即地物的灰度值作为基本单元,可将不同类别地物在遥感影像上的像元亮度频率以不同云变换表示,每一个云视为一类,将遥感影像视为云共同叠加组成的[17]。本文通过统计滑坡候选物的影像DN值进行逆云变换计算,得出滑坡地物的初始聚类中心值与聚类个数,算出单个或组合的DN值对每个聚类中心的隶属度,然后进行聚类,实现影像分割,提取滑坡范围。

3滑坡提取及精度验证

本文重点在于通过基于云变换优化的FGFCM聚类方法在GF-1影像上提取滑坡信息,主要步骤为:(1)剔除水体、植被、道路、建筑物等非滑坡地物;(2)选择训练样本,应用云变换计算聚类参数,通过FGFCM聚类提取滑坡信息;(3)使用kappa系数进行精度验证。

3.1提取滑坡候选物

在提取滑坡信息前对具有明显影像特征的非滑坡地物进行剔除,可避免后期将其误分为滑坡,对提高滑坡识别的整体精度有很重要的作用。本文基于eCognition软件,选取NDVI、光谱特征、形状特征、纹理特征等作为对非滑坡地物提取的主要特征信息,剔除了水体、植被、道路、建筑物4类非滑坡地物。

(1)水体。水体提取主要依靠在该方面具有优势的红外波段,通过调整阈值范围,设置红外波段值小于27提取水体,除部分河道两旁的阴影容易被误分外,提取效果理想,如图2(a)所示。

(2)植被。植被对归一化植被指数NDVI及绿色波段具有较高的敏感度,结合两者设置阈值测试得出,NDVI参数值为0.5~1.0、绿波段均值为50~110范围的植被能基本被提取出来,如图2(b)所示。

(3)道路。基于道路在遥感影像上宽度均匀、与周围地物色差大等特征,本文选取亮度值范围[120,255]、坡度<30、横向系数≥1.5、长宽比≥4、形态参数0.3进行道路提取。除部分因植被阴影影响断裂或与相邻建筑物合并的情况,整体效果较为理想,如图2(c)所示。

(4)建筑物。基于建筑物在遥感影像上几何形状分明、集中的特征,通过控制变量法选取分割参数,最后选择蓝波段均值85~165、分割面积35、形状因子1.5~3.5、紧致度0.8对建筑物进行提取,最终提取效果理想,如图2(d)所示。

对水体、植被、道路、建筑物进行剔除后就能得到滑坡候选物的影像,从而进行基于FGFCM算法的样本训练和滑坡提取。

3.2基于FGFCM的滑坡自动提取

剔除非滑坡地物后,在滑坡候选物区域选择滑坡样本训练和滑坡识别。本文将水城县划分为27个格网,选择其中发生滑坡数量较多的两个格网作为样本区。

提取流程为:在ENVI系统中导入样本区滑坡候选物的影像,提取影像DN值,获取单个DN值的个数和出现的频率。应用云变换计算可得出样本区滑坡候选物影像DN值的聚类中心值和聚类个数。随后在MATLAB软件中导入实验区滑坡候选物影像,基于云变换算法得出的样本区聚类参数,应用FGFCM聚类算法进行像元聚类,实现影像分割和滑坡提取。

基于云变换改進FGFCM聚类方法的实现步骤如下:

(1)统计像元的亮度值频率。以影像的亮度级数为x轴,各亮度级在影像中出现的频率为y轴,生成数据分布函数f(x)。

(2)寻找数据分布函数曲线f(x)的波峰值位置T。设定一个邻域范围W,以点T为中心将影像中DN值落在(T-W,T+W)范围内的所有数据点利用逆向云发生器算法生成云模型C(Ex,En,He)表示的定性概念,并用式(10)计算云模型的分布函数fi(x):

y=e-(x-Ex)22En2(10)

从f(x)中减去该云模型的数据分布fi(x),得到新的数据分布函数f′(x)。

(3)重复步骤(1)、步骤(2),直至波峰值小于频率阈值ε时停止,最后得到云模型的期望值,也就是初始化聚类中心值,分别为0,22,47,86,105,141,181和223,得到共8个云模型的数据分布函数。聚类过程主要是通过计算分析每个像元的空间位置与周围像元所示地物在纹理、光谱上的差异性,赋予每个像元属于每个聚类中心的隶属度,最后合并隶属度最相近的像元,得到滑坡提取结果。图3为提取滑坡结果示意图,图中蓝线为自动提取的滑坡边界,红线为目视解译的滑坡边界,橙色为漏提取边界,绿色为过提取边界。

3.3滑坡提取的精度验证

如图3所示,本文提出的自动提取方法所提取出的滑坡区域与准确灾害点数据所显示的滑坡区域基本一致,在具体面积上存在过提取和漏提取的问题。这是因为人类开采矿物或进行建筑修建时造

成的裸地易被误提取为滑坡,或一些较早发生的滑坡表面已被植被覆盖,影像特征弱化而未被识别出。

本文对滑坡正确提取、漏提取和过提取的面积进行了统计。实地调查统计得到的滑坡共152处,总面积1664432m2。自动提取统计得到的滑坡共157处,面积1714671m2。128处滑坡提取面积与准确灾害点数据基本一致;漏提取滑坡12处,面积共136863m2;过提取滑坡17处,面积共187102m2。

kappa系数在评价遥感分类方面应用广泛,本文用于分析基于FGFCM自动提取的滑坡信息和已有滑坡数据的一致性。通过建立如表1所示的自动提取结果和滑坡数据的转换矩阵,根据式(11)计算得到kappa系数值。

式中:a表示滑坡自动识别和灾害数据相一致的面积;b表示滑坡漏提取面积;c表示滑坡过提取面积;d表示非滑坡类型提取结果和灾害数据相一致的面积,n为总数。P0表示两者相一致的概率,即总体精度,Pe表示两者偶然相一致的概率。

kappa指数评价一致性通常可以分为5个级别[17],0.61~0.80范围则为高度一致,本文将滑坡面积统计相关的数据带入表1,计算得到kappa系数达0.752,总体精度达0.880,可见基于云变换优化的FGFCM滑坡自动提取方法可以满足实际应用的要求。

4结论

本文以高分1号(GF-1)为主要数据源,通过云变换优化的FGFCM方法对贵州省水城县的滑坡进行提取,对结果进行评价,得出以下结论:(1)在进行滑坡提取前对明显非滑坡地物的剔除,提高了对目标地物提取的精度,加快了计算聚类参数及聚类过程的运算速度。(2)应用云变换算法计算FGFCM聚类中要使用的聚类中心值和聚类数目,避免了主观对该聚类参数选择的影响,使最终提取结果更有效可靠。(3)滑坡提取结果经计算验证,kappa系数为0.752,总体精度为0.880,与实地调查统计结果高度一致,因此通过该方法可以快速准确识别滑坡及其范围,有效提高遥感解译的效率和精度。

本文使用的滑坡自动提取方法准确提取了整体滑坡位置,可应对实际应用需求,但在单体滑坡面积精度上存在误差,有待改善。在算法方面,对模糊聚类算法还可以基于自适应滤波、局部空间限制、邻域加权等方法进行改进。在数据处理方面,本文是在剔除了其他明显非滑坡地物后的高分影像上进行滑坡提取,易漏提取植被覆盖的滑坡,可以采用激光雷达等技术获取穿透植被的地表信息数据,从而对植被覆盖密度较大的古滑坡进行提取,弥补传统方法的不足。

参考文献

[1]朱新婷,吴彩燕,谭秋焰,等.基于熵权法的滑坡危险性评价——以贵州省晴隆县为例[J].桂林理工大学学报,2022,42(1):100-108.

[2]徐濤,张峰,张桂林,等.基于GIS的玉林-铁山港公路地质灾害危险性评价[J].桂林理工大学学报,2012,32(1):55-62.

[3]WILKINSONGG.AreviewofcurrentissuesintheintegrationofGISandremotesensingdata[J].InternationalGeographicalInformationSystems,1996,10(1):85-101.

[4]TAVAKKOLIPS,SHAHABIH,JARIHANIB,etal.Landslidedetectionusingmultiscaleimagesegmentationanddifferentmachinelearningmodelsinthehigherhimalayas[J].RemoteSensing,2019,11(21):2575.

[5]陈婷,李百寿,康弋,等.基于遥感阴影与财产密度的城市房屋滑坡灾害风险评估方法——以广西梧州市为例[J].桂林理工大学学报,2017,37(1):154-162.

[6]路彬彬,贾振红,何迪,等.基于新的遗传算法的模糊C均值聚类用于遥感图像分割[J].激光杂志,2010,31(6):15-17.

[7]LEIT,XUED,LVZ,etal.Unsupervisedchangedetectionusingfastfuzzyclusteringforlandslidemappingfromveryhighresolutionimages[J].RemoteSensing,2018,10(9):1381.

[8]邓勇,张正禄,谢年生,等.模糊聚类及其在滑坡监测中的应用研究[J].测绘科学,2010,35(4):163-165.

[9]ALIMOHAMMADLOUY,NAJAFIA,GOKCEOGLUC.EstimationofrainfallinducedlandslidesusingANNandfuzzyclusteringmethods:acasestudyinSaeenSlope,Azerbaijanprovince,Iran[J].Catena,2014,120:149-162.

[10]LIY,WANGH,CHENJ,etal.DebrisflowsusceptibilityassessmentintheWudongdedamarea,ChinabasedonrockengineeringsystemandfuzzyC-meansalgorithm[J].Water,2017,9(9):669.

[11]CAIW,CHENS,ZHANGD.FastandrobustfuzzyC-meansclusteringalgorithmsincorporatinglocalinformationforimagesegmentation[J].PatternRecognition,2007,40(3):825-838.

[12]姚红.多步逆向云变换算法在图像分割中的应用[J].电脑知识与技术,2015,11(12):202-205.

[13]孟晖,王树良,李德毅.基于云变换的概念提取及概念层次构建方法[J].吉林大学学报(工学版),2010,40(3):782-787.

[14]RUSPINIEH.Anewapproachtoclustering[J].InformationandControl,1969,15(1):22-32.

[15]王小鹏,张永芳,王伟,等.基于自适应滤波的快速广义模糊C均值聚类图像分割[J].模式识别与人工智能,2018,31(11):1040-1046.

[16]孙鸿鹄,程先富,倪玲,等.基于云模型和熵权法的巢湖流域防洪减灾能力评估[J].灾害学,2015,30(1):222-227.

[17]王军.Kappa系数在一致性评价中的应用研究[D].成都:四川大学,2006.

猜你喜欢
滑坡聚类算法
滑坡推力隐式解与显式解对比分析——以河北某膨胀土滑坡为例
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
进位加法的两种算法
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
浅谈公路滑坡治理
一种改进的整周模糊度去相关算法
基于Fluent的滑坡入水过程数值模拟
“监管滑坡”比“渣土山”滑坡更可怕