基于模糊频率比与熵指数的滑坡易发性评价
——以崇义县为例

2022-09-01 07:21何书胡萌杨志华鲜木斯艳阿布迪克依木陈康
有色金属科学与工程 2022年4期
关键词:易发滑坡频率

何书,胡萌,杨志华,鲜木斯艳·阿布迪克依木,陈康

(江西理工大学,a.资源与环境工程学院;b.离子型稀土资源开发及应用教育部重点实验室,江西 赣州 341000)

0 引 言

滑坡是一种常见的多发性地质灾害,具有突发性强、危害大等特点,开展滑坡预测预报对于灾害防控,以及避免可能造成的重大生命财产损失具有重要的现实意义[1-2]。据2020 年《全国地质灾害通报》统计,全年发生地质灾害7 840 起,其中滑坡4 810 起,占地质灾害总数的61.35%,直接经济损失达数十亿元。近二十年来,基于RS 和GIS 技术的滑坡易发性研究已成为滑坡研究领域的热点问题之一[3]。滑坡易发性研究能够对未知区域或地段进行滑坡空间预测[4],为滑坡防治提供科学依据。

滑坡的产生与多种因素有关,易发性研究的根本任务在于对各种影响因子进行综合考虑,并根据各因子的权重,建立易发性等级分区。基于对滑坡历史数据的统计分析,大量的易发性评价方法和模型被提出,包括频率比法[5]、熵指数[6]、信息模量[7]、逻辑回归[8]、支持向量机[9-10]、随机森林[11]等,均被证实是行之有效的滑坡易发性评价方法。随着信息技术进步和相关研究不断深入,越来越多的学者意识到,将多种评价方法耦合,可有效提高易发性评价的精度。常见的耦合方法包括:粗糙集与神经网络、粒子群优化与支持向量机、确定性系数与逻辑回归、逻辑回归与信息量、MIV 与BP 神经网络、熵指数与支持向量机、SOM 与随机森林等耦合模型,耦合的目的在于解决指标权重确定方法的主观性[12],同时弥补单一方法的不足,提高空间预测精度[13]。

频率比法是一种常见的计算每个影响因子在不同分级区间内滑坡发生概率的方法[14],其计算基础在于获取不同分级区间历史滑坡数量。由于在划分分级区间时带有强烈的主观性,滑坡各指标数据具有显著的离散性,同一分级区间内的滑坡点隶属于本区间的程度并不相同。一般地,指标值距离分级界限值越近,其模糊性越强,隶属于本区间的程度相对越低。然而,现有统计方法并未对此给予充分考虑,忽略了历史滑坡数据在分级分区过程中存在的模糊性,从而造成滑坡信息量的损失。因此,本文将模糊信息分配的原理应用于频率比计算,得到模糊频率比值,然后与熵指数值进行耦合,以解决上述问题,从而达到更为高效利用滑坡历史数据信息及提高滑坡易发性评价精度的目的。

1 评价模型

1.1 频率比与模糊频率比模型

频率比(Frequency ratio(FR))是通过计算滑坡每个影响因子在不同分级区间内滑坡发生概率来表示的[15],大小等于滑坡面积比与分类面积比的比值。其中,滑坡面积比等于各分类滑坡面积比与研究区滑坡总面积比的比值,分类面积比等于各分类面积与研究区总面积之比[16]。因此,在统计计算研究区频率比时,每个滑坡点的面积是必须已知的。然而,对于滑坡历史数据而言,由于滑坡范围可能会发生一定的演变,使现有滑坡周界所确定的范围与实际滑坡规模有较大出入,因此,准确统计每个滑坡的面积并非易事。同时,当研究范围相对较大,滑坡点数量较多时,滑坡面积统计工作量将大大增加。为此,本次研究采用滑坡相对频率代替滑坡面积比,频率比计算公式如式(1):

式(1)中:FR 为频率比值;Pij为第i 个影响因子的第j类的滑坡数量;Pr为研究区滑坡总数量;Aij为第i 个影响因子的第j 类的面积;Ar为研究区总面积。

由式(1)可知,滑坡相对频率与各影响因子在不同分类中的滑坡数量密切相关,各分类的滑坡数量则与指标的分级有关。由于忽略了滑坡面积,每个滑坡具有等量的历史信息,滑坡信息量全部属于其所在分类。然而,在定量化影响因子中,不同滑坡指标值距离分级界限的距离不一样,其隶属于所在分类的程度有所不同,因此具有一定的模糊性。本文将模糊信息分配引入频率比的计算中,以提高各影响因子中滑坡分类分级的准确性。将每个滑坡的信息量视为“1”,根据各影响因子指标值与相邻分级界限的关系为各分类赋予相应信息量,方法如下:

式(2)中:uij+为滑坡分配到第i 个影响因子第j 类的滑坡信息量;ui(j+1)+为滑坡分配到第i 个影响因子第j+1类的滑坡信息量。

根据各影响因子的分类标准,计算每个滑坡对应的uij+,然后再各分类进行累计计算得到基于模糊信息分配的滑坡相对频率Nij,用Nij代替式(1)中的Pij,可计算得到模糊频率比:

式(4)中:FFR 为模糊频率比值;Nij滑坡模糊相对频率;其余参数同式(1)。

1.2 模糊频率比-熵指数模型(IOE)

频率比表示研究区各影响因子在不同分类中的滑坡发生概率,但没有考虑各影响因子的权重。熵指数法是一种客观权重确定方法,熵值的大小反映了系统的不确定性程度,利用熵值可计算指标体系权重。该方法充分利用信息本身,避免评价主体主观性对权重计算的影响,已被证明是一种有效的权重确定方法[17-18]。结合滑坡模糊相对频率,权重计算方法如下[19]:

式(5)—式(9)中:Wi为第i 个指标的权重,Ii为评价指标信息率;Ni为滑坡概率密度;Himax、Hi表示熵值;Si为第i 个指标的分级数。

2 崇义县滑坡易发性评价

2.1 研究区概况

研究区为崇义县全域,位于江西省西南部,位于东经113°55′~114°38′、北纬25°24′~25°55′之间,总面积约2 206.27 km2(图1)。区内山脉纵横交错,地貌类型大致可分为中山、低山、高丘陵、河谷阶地4 种类型,地势由西南向西北倾斜。研究区属中亚热带季风湿润区,因地形复杂,不同地区的气候差异明显,年平均温度约为17.9 ℃,年平均降雨量约1 600 mm。区内褶皱和断裂活动强烈,岩浆活动频繁,广泛发育从震旦系到白垩系的各地质年代地层,岩性以变质岩、砂岩、粉砂岩、砂砾岩、灰岩、花岗岩类为主。区内地质灾害较发育,以小型滑坡、崩塌为主,降雨和路堑边坡开挖是主要的诱发因素,滑坡沿道路分布的规律较为明显。

图1 研究区地理位置及滑坡空间分布Fig.1 Location of the study area and landslide distribution

2.2 数据来源

主要数据来源包括: ①Landsat8 影像2 景和GDEMV2 30M 分辨率数字高程数据来源于地理空间数据云,用于提取坡度、坡向、水文、植被指数、土地利用分类等信息;②1∶20 万区域地质图(来源于全国地质资料馆) 用于提取地层岩性分布; ③历史滑坡数据,来源于中国地质环境监测院编制的中国典型县(市)地质灾害易发程度分区图集、遥感数据解译及野外滑坡编录;④Google 卫星地图,用于道路提取及水文校正。

2.3 指标体系及相关性分析

2.3.1 指标体系

滑坡是内因和外因共同作用的结果,其发育受多种因素影响[20]。滑坡易发性评价影响因子的选择通常根据研究区的滑坡发育特征而定[21],同时需要分析各影响因子之间的相关性,以保持评价因子的相对独立性[22]。崇义县地处赣南山区,地形复杂,构造作用强烈,滑坡灾害发育。现有研究[23]认为,区内地形地貌、地质构造、地层岩性、水文、植被以及人类活动等因素与滑坡发育密切相关。综合现场地质调查、遥感影像识别与校正及前人研究等成果,共选取坡度、坡向、高程、地层岩性、NDVI(归一化植被指数)、到水系的距离、到道路的距离、到断层的距离、剖面曲率、平面曲率、TWI(地形湿度指数)共11 个影响因子,其中,坡向和地层岩性为离散型因子,其余皆为连续型因子。对坡向和全部连续型因子,基于模糊信息分配方法对频率比进行处理,获取模糊频率比,地层岩性对应的频率比保持不变。

表1 影响因子的频率比值Table 1 Frequency ratio of all impact factors

1) 地形地貌因子

地形地貌因子主要包括坡度、坡向、高程、剖面曲率和平面曲率,采用30 m 分辨率的数字高程数据提取。从统计结果看,滑坡主要分布在坡度相对较低地带,随着坡度增加频率比值逐渐降低(表1,图2(a))。研究区中坡度较低地区人类活动相对强烈,人工开挖诱发滑坡可能性更大;坡度较高地区岩体自稳能力较强,因此滑坡发育相对较少,这与现场调查结果相符。坡向为北向、南向、西南和西向,对滑坡发育具有明显影响,其中,北向频率比和模糊频率比分别达到1.455 8 和1.827 9(表1,图2(b)),是最易发生滑坡的斜坡方向。滑坡频率比在高程与坡度的分级区间变化规律近于一致,随高程增加而相对减小,频率比及模糊频率比大于1 的地区高程均低于400 m(表1,图2(c))。剖面曲率表征沿斜坡最大斜率方向的起伏变化,滑坡易发生范围主要分布在0.29~0.73 之间(表1,图2(i));平面曲率表征垂直于最大坡度方向的起伏变化,滑坡易发生范围主要分布在-0.62~0.55 之间(表1,图2(j))。

2) 基础地质因子

基础地质因子包括地层岩性和到断层的距离2 个指标,不同地质年代的地层,岩石类型及力学性质均有显著差异。将研究区共分为9 类地层岩性,石炭系、泥盆系及奥陶系为滑坡易发地层,主要岩性包括砂岩、页岩和灰岩,共同特征为裂隙发育、风化强烈,在降雨或人工诱发下,易发生滑坡。研究断层由区域地质图提取,长度从数公里到数十公里不等,为区域性大断层,对区内地质构造及岩体裂隙发育具有控制作用,在距断层1 200 m 范围内,频率比及模糊频率比均大于1,表明对滑坡发育存在重要影响(表1,图2(h))。

表1(续) 影响因子的频率比值Table 1(continued) Frequency ratio of all impact factors

表1(续) 影响因子的频率比值Table 1(continued) Frequency ratio of all impact factors

3) 植被与水文因素

植被覆盖与滑坡发育密切相关,分析表明,归一化指数(NDVI)小于0.75,植被对滑坡发育均存在影响,其中在0.18~0.24 范围内,频率比及模糊频率比分别达到2.148 3 和2.919,影响最为明显(表1,图2(e))。水系分布对滑坡空间发育具有重要影响,在降雨或河流作用下,发生斜坡冲刷与地表侵蚀,引起岩土体软化,强度性质降低。基于DEM 数据进行水文分析,选择研究区主控性干流及中小型支流,进行缓冲区分析。在距离水系400 m 范围内,对滑坡发育的促进作用较大(表1,图2(f))。地形湿度指数(TWI)是区域地形对径流流向和蓄积影响的物理指标,能够量化地形对斜坡冲刷的影响。随着地形湿度指数增加,对斜坡冲刷愈加明显,频率比及模糊频率比均逐渐增加,对滑坡的促进作用逐渐增强(表1,图2(k))。

图2 影响因子频率比值等级Fig.2 Impact factor frequency ratio rating chart

4) 人类活动

人类活动是研究区发生滑坡的主要诱发因素,选择区内乡道及以上级别道路作为评价因子,以100 m为间隔,进行缓冲区分析。在距离道路100 m 范围内,频率比及模糊频率比分别达到4.645 7 和4.631 9,对滑坡发生的促进作用极其明显,随着距离增加,频率比及模糊频率比逐渐减少,道路对斜坡稳定性的控制作用逐渐减弱,超过400 m,频率比及模糊频率比均小于1,道路对滑坡的影响不再明显(表1,图2(g))。

2.3.2 指标体系相关性分析

为确保各评价因子的相对独立性,保证评价模型的可靠性和精度,需对影响因子进行相关性分析。基于MATLAB 平台,采用Pearson(皮尔森)相关系数分析影响因子的相关性,当系数值大于0.5 时,认为因子之间存在相关性,对评价结果准确性将产生影响。计算结果如表2 所列,各指标皮尔森相关系数值最大为0.45,存在于高程和地层岩性之间,其余均小于0.5,说明各指标相对独立性较强,可用于滑坡易发性评价。

表2 影响因子相关性分析Table 2 Correlation analysis of influence factors

2.4 滑坡易发性评价

2.4.1 模型构建及评价流程

基于ArcGIS10.2 软件平台,选取25 m×25 m 栅格作为评价单元,研究区共划分3 515 712 个栅格单元。收集和现场调查滑坡样本共计562 个,因大部分滑坡规模偏小,易发性评价过程中未考虑滑坡的实际面积。将评价因子数据导入ArcMap 平台,制作相应专题图,用于提取频率比计算所需信息,提取的相关信息详见表1。根据式(1)—式(4)计算影响因子各指标分类的频率比和模糊频率比。频率比经归一化处理后,基于熵指数法原理,根据式(5)—式(9)分别计算频率比和模糊频率比对应的评价因子权重,结果见表3。最后,利用ArcGIS 叠加功能分别制作单独频率比模型(FR)、频率比-熵指数模型(FR-IOE)和模糊频率比-熵指数模型(FFR-IOE)的滑坡易发性评价图。

表3 影响因子权重Table 3 Impact factor weight

2.4.2 易发性评价结果及分析

滑坡易发性评价结果见图3 和表4,易发性共分5 个等级,分别为极低、低、中等、高和极高。3 种模型的评价结果表明,总体上均体现了研究区滑坡沿道路、沿水系分布发育的特点,滑坡沿道路广泛分布说明人为因素是滑坡发育的重要诱发因素。单独的频率比模型(FR)没有考虑各影响因子的权重大小,位于高和极高易发区的滑坡数量为246,占滑坡总量的43.77%,滑坡频率比占总量的80.3%。频率比—熵指数模型则利用计算权重对频率比模型进行优化,高和极高易发区的滑坡和滑坡频率占比提高,分别达到52.49%和81.65%。经模糊信息分配处理的模糊频率比-熵指数模型在高和极高易发区的滑坡和滑坡频率占比较之前面两种模型,均有明显提高,分别达到60.14%和85.98%。从滑坡易发性分级的面积分布看,频率比(FR)、频率比—熵指数 (FR—IOE)、模糊频率比—熵指数(FFR—IOE)3 种模型,高和极高易发区总面积分别为313.86、328.11、464.65 km,模糊频率比—熵指数模型划分的面积相对较高。

表4 滑坡易发性评价等级结果统计Table 4 Result statistics of landslide susceptibility evaluation grade

图3 滑坡易发性分区结果Fig.3 Zoning Map of landslide susceptibility

选用成功率曲线对3 种评价模型进行校正,曲线由滑坡易发性指数分级百分比和滑坡累计发生频率百分比确定,线下面积越大,越接近1,说明滑坡预测精度越高[24-25]。由图4 可知,频率比、频率比—熵指数、模糊频率比—熵指数3 种模型的线下面积(AUC)分别为0.803 2、0.833 7 和0.863 7。

图4 滑坡易发性成功率曲线Fig.4 Success rate curves of landslide susceptibility indexes

结果表明,3 种模型的AUC 值均大于0.8,表明预测精度均较高,但模糊频率比-熵指数模型预测精度明显高于另外两种模型,说明对频率比的模糊校正是有效的,有助于提高滑坡预测精度。

3 结 论

1)利用模糊信息分配的原理,对滑坡频率比的计算方法进行了改进,建立了模糊频率比的计算方法。与传统频率相比,模糊频率能更充分地体现历史滑坡数据与评价因子等级划分之间的关系。

2)将模糊频率比与熵指数法相结合,实现了对滑坡易发性评价指标权重的定量计算。与单一的频率比、频率比—熵指数法两种模型相比,预测精度可分别提高3.6%、7.5%,为优化和完善基于频率比的滑坡易发性评价方法提供了重要途径。

3)以江西省崇义县为例,基于模糊频率比—熵指数模型的滑坡易发性评价结果,高和极高易发区的滑坡频率占比达到85.98%,预测成功率曲线AUC 值达到0.863 7,均优于未进行频率比模糊优化的评价方法,表明该方法是一种有效且可靠的滑坡易发性评价方法。

猜你喜欢
易发滑坡频率
2001~2016年香港滑坡与降雨的时序特征
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
夏季羊易发疾病及防治方法
处理器频率天梯
冬季鸡肠炎易发 科学防治有方法
振动与频率
无线电频率的特点
浅谈公路滑坡治理
一类非线性离散动力系统的频率收敛性