基于熵权TOPSIS和神经网络复合方法的厦门市雨洪灾害风险评估*

2022-02-05 13:43罗紫元丁锶湲
灾害学 2022年4期
关键词:雨洪脆弱性厦门市

罗紫元,田 健,丁锶湲,王 宁,2,曾 坚

(1.天津大学 建筑学院,天津 300072; 2.厦门市城市规划设计研究院,福建 厦门 361012)

降雨产生的洪涝灾害是城市环境中最常见、最具破坏性的自然灾害之一,对居民生活和财产构成多方面威胁。有效绘制灾害风险图,能够为精准施策、减轻灾害风险提供依据[1]。

参考联合国国际减灾战略(UNISDR)的灾害风险评价模型[2-4](式1)对城市雨洪灾害风险进行评估。

Risk=H×V×E。

(1)

式中:H、V、E分别指代风险评估的三个维度,H代表灾害危险性[5],即在诱发因素作用下产生雨洪灾害的可能性;V代表城市系统的应灾脆弱性[6],即城市物质环境和社会经济面对雨洪灾害影响的固有敏感性;E表示风险暴露度[6],即系统暴露在雨洪灾害下引发生命财产损失的程度。

以往研究多采用多准则评价的方法对雨洪灾害风险的各维度影响因子进行赋权,进而通过GIS叠加计算研究区的整体灾害风险[7-8]。应灾脆弱性和风险暴露度的影响因子选取多集中在风险源空间分布、救援疏散能力和人口经济分布等方面。但灾害危险性涉及的影响因子复杂,较难确定各项因子的实际贡献,很大程度上影响着灾害危险性的评价准确性。此外,雨洪灾害危险性的评价与雨洪淹没数据最直接相关,而所用雨洪灾害数据的全面性和准确性仍有待提升,以上两方面都意味着灾害危险性的评价精度仍有进一步提升的空间。近年来,逻辑回归[1]、随机森林[9]、粒子群和支持向量机[10]等机器学习方法在城市暴雨洪涝灾害危险性和易感性等评价中得到大量应用,其通过直接建立影响因子与洪涝发生可能性之间的关系,避免主观因素的影响,提高模拟评价的准确性。

因此,本研究在以往多准则评价的基础上,采用了一种机器学习与GIS多准则决策相结合的雨洪风险评估方法,以熵权TOPSIS模型评估厦门市的雨洪应灾脆弱性和风险暴露度,以神经网络模型模拟评价灾害危险性,最终实现对厦门市雨洪灾害风险的评估。其中主要对雨洪淹没数据的获取和雨洪灾害危险性影响因子的筛选进行了创新。

1 研究区与数据来源

1.1 研究区

厦门市位于福建省东南沿海,是厦漳泉闽三角城市群的中心城市,市辖思明区、湖里区、海沧区、集美区、同安区和翔安区6个城区(图1)。2000年以来,厦门市社会经济活动高速发展、城镇建设及人口高密度聚集,截至2020年全市排水管道长度已达到4 427.7 km,基本实现全覆盖。但面对越来越难以预测的雨洪灾害,城市仍存在排水系统压力过载等沿海地区典型的城市问题,部分城区受到风暴潮、洪水、内涝积水的严重威胁。

图1 研究区所在区位示意图(该图基于中国标准地图(GS(2021)6026号)和福建省标准地图(GS(2017)1268号)绘制,底图无修改,下同)

1.2 数据来源

1.2.1 雨洪淹没数据

雨洪灾害风险评估的准确性很大程度上受到雨洪淹没数据的影响。以往研究中常采用历史洪涝信息[11]、无源淹没算法[12]、水文水力计算[13]或遥感影像解译[14]的方式获取雨洪淹没信息,开展灾害危险性模拟评价,而这些方法一定程度上受到数据的影响和限制。在实际雨洪过程中,淹没往往以面的形式存在,但历史洪涝信息仅以坐标点的形式记录各雨洪淹没面的质心[11]。此外,受观测点和数据完整性等方面影响,较难确定其他地点是否存在雨洪淹没,也就意味着历史洪涝信息中存在大量被省略和未统计的淹没点,较难完整全面地表达实际灾情。无源淹没算法仅考虑降雨导致的水位上涨,而不考虑地表径流的流动情况和城市排水系统的作用,计算得到的淹没范围往往与实际存在一定差距。同时,无源淹没算法的输入数据与DEM、坡度、坡向等常用的影响因子存在较高的同源性,较难反映真实的雨洪淹没情况。水文水力计算的结果通常具有较高的准确率,但其对水文和管线数据要求较高[10]。这些数据的获取存在一定难度,因此较少能够在研究中普遍运用。遥感影像解译为获取实际雨洪淹没范围提供了经济、便捷的方式,其误差主要来源于水体识别过程中水体悬浮物、植被、山体阴影等产生的干扰。此外,未排除河流湖泊等永久性水体也会导致模型拟合度异常增高。

综上,研究以卫星遥感影像获取厦门市多年期(2010—2020年)的雨季(4—9月,包括梅雨季和台风雨季)遥感影像[15],经过解译并剔除常水位的永久性水体后,镶嵌形成厦门市雨洪淹没范围。研究一方面选取解译准确度较高的影像结果,另一方面从镶嵌的雨洪淹没范围中剔除淹没频次小于3次的斑块,以减少遥感解译误差可能带来的影响。这虽然可能带来一定淹没范围的损失,但同时也能够排除其他因素导致的偶然性淹没。研究以淹没频次作为灾害危险性的划分标准,淹没频次越高意味着发生雨洪灾害的可能性越高,雨洪灾害的危险性相应增加。将淹没频次3次以上的斑块,以自然间断点分级法分为从Ⅰ级偶发到Ⅴ级频发的5类。统计结果表明,Ⅰ级偶发型淹没是厦门市雨洪灾害淹没范围的主体,占比65.9%,而Ⅲ、Ⅳ、Ⅴ级较多发区域占比14.5%。对非淹没区和Ⅰ~Ⅴ级雨洪淹没区随机采取300个采样点用于机器学习模型训练模拟,其中随机选取70%的采样点作为训练集,用于模型训练验证,另30%作为测试集,用于模型测试。

1.2.2 雨洪灾害风险评价指标体系

根据公式(1),选取评价脆弱性、暴露度和危险性的指标因子(表1)。表1中汇总整理了既有研究中涉及的雨洪灾害危险性指标因子,但指标因子种类繁多,因子自相关等潜在问题对机器学习准确模拟雨洪灾害危险性存在较大影响。较少有研究在机器学习模拟前开展因子筛选[16],减轻模型的冗余和过拟合等问题[17-18]。因此研究在机器学习模拟雨洪灾害危险性前,通过统计学和随机森林算法等筛选适合研究区的雨洪灾害危险性指标因子。

脆弱性是承灾体的内在属性,由影响人类社会面对灾害敏感性的自然生态和社会经济两个方面要素决定(图2)。自然生态系统中,城市受雨洪灾害的影响与水系河网的分布密切相关,河网密度越高,与水体间的距离越小,用地受到雨洪灾害影响的可能性越大。社会经济系统中,城市的应灾脆弱性与城市应灾疏散能力的强弱有关,道路密度高、距离道路距离近的地区具有更好的应灾疏散能力,面对雨洪灾害的脆弱性相对更小。

雨洪灾害风险的暴露度与承灾体的人员、资源、生计、环境服务以及经济、社会和文化资产的状况有关。自然生态系统的价值损失可以表征为生态系统提供生态服务价值的降低。结合暴雨洪涝灾害的影响特征,研究选取生态系统服务价值中的气候调节、水文调节、土壤保持和生物多样性作为暴露度评价的指标因子。社会经济系统产生的灾损与人口集聚、开发建设密度、经济发展水平等密切相关,研究选取人口密度、经济水平(GDP)、夜间灯光指数、农业生产价值、美学景观价值作为反映城市社会经济状况的指标(图3)。

表1 厦门市雨洪灾害风险评价指标体系

图2 厦门市雨洪灾害应灾脆弱性评价指标因子

图3 厦门市雨洪灾害风险暴露度评价指标因子

2 研究方法

2.1 基于熵权TOPSIS方法的雨洪应灾脆弱性和风险暴露度评价

本研究整合多准则决策分析中的熵权法和TOPSIS法对城市雨洪灾害的脆弱性和暴露度进行评估。熵权法根据指标自身的数据离散程度确定权重,是一种相对客观的赋权方法[21],数据离散程度大的指标能够提供相对较多的信息,从而影响综合评价结果,因而被赋予更大的权重。TOPSIS法从一系列方案中选取解决方案,使所选方案与正理想解的距离最小,与负理想解的距离最大[22]。以熵权法确定各因子权重,继而将指标因子与权重的乘积作为新的数据,通过TOPSIS模型度量新数据中各指标值与最优解间的距离,从而按距离进行综合排序,其相较于传统TOPSIS法更为客观[22]。研究通过以下步骤实现熵权TOPSIS方法:

(1)数据标准化。根据测度对象涵盖的m个类别和n项指标因子建立评价系统的原始数据矩阵(式2)。通过极差标准化法对数据进行标准化处理(式3)。

(2)

(3)

(2)熵权法确定指标因子权重。根据数据标准化结果,采用式(4)计算第i个类别中第j项指标的比重Yij,按式(5)至式(7)计算第j项指标的信息熵Ej和信息冗余度dj,从而计算指标权重ωj(式8)。

(4)

(5)

(6)

dj=1-Ej;

(7)

(8)

(9)

(10)

(11)

(12)

(13)

(14)

2.2 基于机器学习方法的雨洪灾害危险性评价

研究首先通过多重共线性分析、地理探测器和随机森林算法筛选雨洪灾害危险性指标因子,随后采用3种常用的机器学习方法进行模型训练,从中选取效果最优的机器学习方法模拟雨洪灾害危险性。

2.2.1 基于多重共线性分析筛选指标因子

多重共线性是一种统计学指标,意味着模型中的某些解释变量以线性形式高度相关,从而可能导致模型估计失真[10]。通过方差膨胀因子 (VIF)和容忍值(TOL)分析多重共线性强度,剔除存在强自相关的因子能够提高模型的计算能力。理论上,当VIF>10或TOL<0.1表示因子中存在多重共线性问题[23]。表2中显示了剔除高度自相关因子后的多重共线性分析结果。

表2 剔除高自相关因子后的多重共线性分析结果

表3 雨洪灾害危险性与所选因子间相对重要性的q、p值

2.2.2 基于地理探测器和随机森林算法筛选指标因子

地理探测器不需要线性假设即可度量变量间的统计关系[24],但分析结果易受到因子多样性、数据离散化等因素影响。随机森林能够处理多因子的高维数据并维持较好的准确性。综合2种方法筛选因子以提高后续机器学习模拟的运算能力。

采用地理探测器分析雨洪灾害危险性Y与表2中各指标因子X间的相对重要性,其相对解释程度以q值(式15)表示。其中,N表示模型单元数,σ2表示Y值的方差,A表示X分层数,q取值在0~1之间,q值越大表示因子对Y的影响越大。

(15)

采用正则化随机森林(Regularized Random Forest,RRF)算法对雨洪灾害危险性的评价指标因子重要性进行排序。随机森林算法能够通过多决策分类树判别输入变量的重要性,而正则化能够降低过拟合,其效果优于单一分类器[25]。

综合地理探测器和随机森林算法的分析结果,研究选取了表3所示的13项指标因子,其随机森林模型拟合优度为74.3%,效果较好。

尽管土地覆盖、降雨量等因子被证明和以往研究一样是影响雨洪灾害危险性的相对重要因素,但并非以往研究中采用的所有评价因子都对厦门市雨洪灾害危险性具有较强的影响,如:沉积物输送指数、平面曲率等。此外,本研究根据研究区特点补充的沿海压力和以道路系统代替的排水系统相关指标因子也表现出较高的重要性。

2.2.3 机器学习模型的选择和开发

在MATLAB中构建了包括支持向量机、提升决策树和神经网络的多种机器学习模型进行雨洪灾害危险性评估,比较其模拟效果。

(1)支持向量机。支持向量机是一种基于结构误差最小化原理的机器学习算法[26],具有出色的非线性分区能力,是在雨洪灾害风险评估中得到大量运用的机器学习模型之一[17]。该算法的目的是确定一个最佳的分割超平面,对数据进行按维度分类,以减少泛化误差并最大化不同类别数据之间的差异。

(2)提升决策树。提升决策树通过融合决策树算法和提升方法,以决策树为基础分类器,将弱分类器组合成强分类器[27]。该算法在每次迭代中每一棵回归树以之前回归树的结论和残差进行训练,拟合形成当前的残差回归树,已经被证明是一种具有高效率和低偏差的强大分类模型[22,28]。

(3)神经网络。神经网络模型是模拟真实神经系统的简单建模,广泛用于解决各种科学问题。其能够在不同尺度上执行运算,解决高复杂性非线性问题,而不需要特定的统计分布优势,已被应用于自然灾害风险评估[12,15]。本研究根据数据特征选择了由1个输入层、1个隐含层和1个输出层组成的神经网络。

3 结果分析

3.1 厦门市雨洪应灾脆弱性

通过熵权TOPSIS法评价应灾脆弱性,根据理想解相对贴近度绘制厦门市雨洪灾害应灾脆弱性图,并按照自然间断点分级法分为从极低到极高的5类(图4)。结果表明有29.1%的用地雨洪脆弱性较高或极高,主要分布在河网水系附近且距离救援疏散道路较远的地区。在建成区范围内,海沧区贞岱、浦边等村庄、集美区大东山附近以及翔安区马巷镇表现出较高的应灾脆弱性,厦门岛的雨洪脆弱性较低。

图4 厦门市雨洪灾害应灾脆弱性图

3.2 厦门市雨洪风险暴露度

同理绘制厦门市雨洪灾害风险暴露度图,并按自然间断点分为从极低到极高的5类(图5),厦门市雨洪暴露度的高值区占比38.9%,主要集中在市域东部的同安区和翔安区。

图5 厦门市雨洪灾害风险暴露度图

3.3 厦门市雨洪灾害危险性

以拟合优度R2作为判别机器学习绩效的指标,R2越接近1表示模型拟合效果越好。支持向量机、提升决策树和神经网络模型的R2依次为0.63,0.68和0.71。结果表明:神经网络模型在模拟预测厦门市雨洪灾害危险性上具有较好的表现。

根据经验公式和实际模拟效果,采用神经网络工具箱构建指标输入层节点数为13,隐含层节点数为17,评价输出层节点数为6的单隐含层神经网络,设置最大迭代次数为1 000,采用Sigmoid激活函数和贝叶斯正则化算法对模型进行训练和测试。训练和测试集准确率分别为0.906,0.825,模型总准确率达到0.885,表明该模型能够捕获指标因子与灾害危险性之间的关联,网络辨识精度较高。

根据训练的神经网络模型,计算厦门市当前雨洪灾害危险性作为模型的输出。绘制厦门市雨洪灾害危险性图,采用自然间断点分级法将危险性分为图6所示的5类。厦门市雨洪灾害危险性较高区域主要分布在河流及海岸沿线,如海沧区嵩屿街道、集美区集美街道、同安区大同镇、西柯街道、翔安区前浯村、新店镇等,其中,同安区及翔安区的雨洪灾害危险性明显高于其他城区。对于厦门岛内地区,思明区湖滨南片区、厦港街道、沙坡尾和湖里区五缘湾片区、金山街道发生雨洪淹没的可能性较高,与实际的城市洪涝情况较一致。这些区域不仅距离水体等风险源较近,且地形相对平坦、建筑物密集、地表不透水率较高,导致排水能力较弱。极低易感地区主要分布在海拔较高、地表透水性较好的林草地和耕地处。此外,马銮湾、杏林湾等水体湿地也表现出较低的雨洪灾害危险性,并且随着水体向岸线逐渐过渡,受降雨汇流等导致水深增加等影响,雨洪淹没的危险性增加。结果表明:本研究中以淹没频次划分的雨洪淹没数据能够保证较高的模型拟合优度,并在避免将既有水体错误识别为高危险区的基础上,较准确的将水体附近的易淹没区划分为风险区域,从而取得较贴合实际的灾害危险性评价结果。

图6 厦门市雨洪灾害危险性图

3.4 厦门市雨洪灾害风险评价

根据式(1)中的风险评价模型进行厦门市的雨洪灾害风险评价制图(图7)。结果表明,厦门市大部分地区雨洪灾害风险较低,占比56.7%,雨洪灾害风险较高的区域占比5.9%,主要分布在同安区和翔安区,少量分布在集美区和思明区,其中有1.8%的地区雨洪灾害风险极高,分布在同安区祥平街道、西柯街道及翔安区马巷镇和新店镇。

图7 厦门市雨洪灾害风险图

4 结论与讨论

4.1 结论

研究采用熵权TOPSIS与神经网络构建的复合模型评估厦门市雨洪灾害风险,其中以熵权TOPSIS法评估厦门市面对雨洪灾害的应灾脆弱性和风险暴露度,以神经网络模型模拟评价灾害危险性。

(1)通过多重共线性检验、地理探测器和正则化随机森林算法可以筛选具有研究区针对性的危险性指标因子,除土地覆被和降雨量等因子外,本研究采用的沿海压力和排水系统相关指标因子也表现出较高的重要性。沿海城市有必要考虑将沿海压力纳入雨洪灾害风险评价指标体系,排水管网高度普及的城市可以根据指标实际情况,将道路系统作为排水系统的数据替代。

(2)神经网络模型在本研究的灾害危险性评价中表现出最优的训练精度(0.885),基于多年期雨季淹没频次的雨洪淹没图在取得符合实际的评价结果同时能够保证较高的拟合优度。

(3)河道附近和远离道路的用地应灾脆弱性较高,占全市用地的29.1%。同安区和翔安区的用地风险暴露度较高,占比38.9%。厦门市56.7%的区域处于低雨洪风险,5.9%的区域雨洪风险较高,其中1.8%的用地面临极高风险,分布在同安区祥平街道、西柯街道及翔安区马巷镇和新店镇。

本研究对雨洪灾害风险的评价可以作为雨洪灾害管理的第一步,为高风险区的识别与施策提供支持。

4.2 讨论

(1)本研究在整理常用的雨洪灾害危险性评价因子的基础上,结合研究区特点加入沿海压力因子,并通过多重共线性检验、地理探测器和正则化随机森林算法开展指标筛选,相比以往研究中根据经验选取评价因子一定程度上提高了科学性。

(2)本研究根据解译的多年期雨季遥感影像获取雨洪淹没数据,并按淹没频次制作了雨洪淹没图,在一定程度上规避了历史洪涝信息、无源淹没算法和水文水力计算中存在的数据局限,但本研究的雨洪淹没图也存在自身不足。一方面,受卫星重访周期限制,研究所获遥感影像的时期并不一定是处于最大淹没范围的时期,解译也只能取得淹没面积,而无法获取淹没时长信息。另一方面,雨洪淹没范围随时间推移和城市雨洪管理也呈现一定变化,而多年期遥感影像叠加获取的淹没范围弱化了这种动态性。

(3)由于目前对应灾脆弱性和风险暴露度评价结果尚没有公认的检验方法,本研究仅能够对雨洪灾害危险性采用机器学习方法进行模拟和检验,仍沿用多准则评价的方式评价应灾脆弱性和风险暴露度。

猜你喜欢
雨洪脆弱性厦门市
工控系统脆弱性分析研究
基于集对分析的德州市雨洪资源潜力研究
七彩屋 福建省厦门市翔安区舫山第二小学
厦门市妇联打造“爱在厦门”交友联谊互动平台
组织祭扫活动 缅怀革命先烈
低影响开发中植物应用研究
基于DWT域的脆弱性音频水印算法研究
海绵城市概念在景观规划设计中的应用探究——以哈尔滨群力雨洪公园为例
丘陵地区大学校园景观在雨洪应对中的作用
煤矿电网脆弱性评估