Logistic回归模型在滑坡易发性制图中的应用

2017-06-30 21:39王茂胜梁松涛郭俊强宋宁高朋
中国科技纵横 2017年10期
关键词:白龙江危险度危险性

王茂胜+梁松涛+郭俊强+宋宁+高朋

摘 要:利用GIS技术,对Logistic回归模型在区域滑坡灾害危险性评价的应用进行了改进,弥补了同类研究中直接使用标准的多元回归或者聚类分析的不足;对滑坡影响因子数据采用的新的处理方式,避免了滑坡危险性Logistic 回归模型評价使用虚拟变量所带来的缺陷。在白龙江武都河段的实例应用表明,研究结果对防灾减灾具有实际的指导意义。

关键词:地理信息系统;Logistic 回归模型;滑坡灾害;易发性制图

中图分类号:X43,P208 文献标识码:A 文章编号:1671-2064(2017)09-0210-03

Abstract:Using GIS technology, the Logistic regression model in the application of the regional landslide hazard assessment is improved, and make up for the study of its kind directly using the standard multiple regression or the lack of clustering analysis; For landslide impact factor data using the new approach, to avoid the landslide risk evaluation of Logistic regression model using virtual variables caused by defects. In the bailong river Wudu Segment all instances of the application shows that the results of the study has practical guiding significance to the disaster prevention and mitigation.

Key words:GIS; Logical Regression; Landslide Hazard; Susceptibility Mapping

1 引言

滑坡灾害易发性评价方法可以分为定性方法和定量方法。定性方法主要依赖于评价人员的主观经验对滑坡的变形失稳危险性进行定性描述,对个人专业知识背景有较高的要求,在过去20年的文献中很突出。进入20世纪80年代后,随着计算机技木的发展和GIS的兴起,在危险性评价中越来越多研究使用定量方法[1],如统计方法。定量方法是一种典型的数据驱动的方法,因此具有很高的客观性和需要更少的专家知识,但这些方法的成功使用依赖于数据的数量、质量和可靠性。

利用多元回归模型进行滑坡灾害易发性评价,已有的研究对于定量的要素如坡度和高程等,大多数是划分成若干等级,对每个等级作为一个虚拟变量参与评价。而且使用标准的多元回归或者聚类分析进行滑坡灾害易发性评价,多数的研究均忽略了多元分析方法中样本数据的正态分布假设。

本文基于GIS技术和Logistic回归模型实现了一种较为客观的滑坡危险度评价定量模型,在一定程度上克服了定性模型和已有的定量模型的主观性较强、准确性较差等缺陷。并以白龙江滑坡灾害较严重的地区之一的武都河段为样区,进行实证研究。

2 Logistic回归模型

2.1 Logistic回归模型简介

设P为某事发生的概率,取值范围为[0,1],1-P为该事件不发生的概率,将比数P/1-P取自然对数ln(p/1-p),即对P作logit转换,记为logitP,则logitP的取值范困在(-∞,+∞)之间、以P为因变量,建立线性回归方程[2]:

该模型即为Logistic回归模型。他实际上是普通多元线性回归模型的推广,但它的误差项服从二项分布而非正态分布,模型中α为常数项,βi为Logistic回归系数,普遍采用最大似然估计法确定。当样本可能为非正态分布时,使用卡方分布(-2log(likelihood ratio)≈x2)对回归方程进行检验。

2.2 Logistic回归模型改进应用

使用Logistic 回归模型进行滑坡危险性评价,已有的研究对象坡度等定性变量先人为地划分为若干类,然后同定量变量一起以类属或分级的代号使用虚拟变量,作为新的属性值[3-4]。这些研究中使用虚拟变量来进行模型运算本身就具有很大的局限性,指定虚拟变量仅适合变量的数目较少的情况,如果进入模型的自变量的数目很多,将形成复杂度较高的回归方程,它们之间也容易产生多元共线性这样的问题。而且对定量变量的划分缺乏理论依据。针对已有研究存在的不足,在GIS技术的支持下,对应用Logistic回归模型进行滑坡灾害危险性评价,采用新的滑坡影响因子数据处理方式:定量变量直接进入模型,定性变量量化之后再进入模型的。对定量变量直接进入模型避免了对定量变量人为主观的类属划分。对定性变量量化之后再进入模型,这样就避免了使用虚拟变量所带来的诸多缺陷。

3 白龙江武都河段滑坡危险性评价实例

3.1 研究区域概况

研究区域为白龙江流域,白龙江武都河段是滑坡灾害严重的区域之一。研究区域面积为924km2,包括三个小流域,其中滑坡分布面积为14.78km2。

3.2 GIS滑坡空间数据库

3.2.1 滑坡影响因子数据库

对研究区内已有的图件、报告、文献等资料数据进行了搜集和整理,建立了滑坡影响因子数据库,主要包括以下影响因子。

研究区域地层和岩性。地形数据:有关地形因子均是从数字高程模型(DEM)中派生提取。从1∶50,000GRID DEM中提取高程、高差、坡度、坡向和地面形态等地形地貌因子。土地覆被:土地覆被等信息数据以研究区域2000年7月31日美国LandSat卫星TM遥感数据为基础数据源,经过波段选择与组合、几何精纠正、人机交互目视解译判读或模型模拟等遥感技术进行土地覆被、植被覆盖等信息提取。普通地图要素数据缓冲区划分:普通地图要素包括行政边界、行政区域、水系、交通网、居民点等。它们通常作为专题制图的地理底图要素。研究区域没有铁路和高速及一级公路,交通运输线主要有长江水运航道线、县级公路和乡级公路。研究区域居民点按照等级可以分为县城、乡镇居民点和一般居民点。这部分数据包括了到河流距离、到公路的距离和到居民点的距离三个评价因子。

3.2.2 滑坡体种子网格数据库

目前国内外计算滑坡等山地敏感性系数和进行危险性评价的方法可归纳为两类:将滑坡等山地灾害作为面状灾害考虑的面积分析方法[6]和将滑坡等山地灾害作为点状灾害考虑的灾点分析法[7]。在进行滑坡敏感性分析时,因滑坡活动具有流域特性,较适合面积分析方法。对滑坡和崩塌而言,在进行大比例尺(≥1:10,000)敏感性评估时,可将滑坡和崩塌视为面状灾害,采用面积分析方法最重要的步骤就是要正确地提取作为因变量的滑坡空间范围分布图。通过遥感影像、野外人工调查和直接矢量化滑坡分布图来得到已经发生的滑坡空间范围,这些处理过程中产生的主要误差在于不能精确地标识出滑坡边界的位置[8],导致了大量相关研究中作为因变量的滑坡空间范围分布图既包括了已经发生滑坡的区域,也包含了部分没发生滑坡的区域[9]。由于包含了没有发生滑坡的区域,降低了判别规则中有效参数的效果,这样在危险度评价过程中就降低了判别规则的质量。本项研究的滑坡原始数据为1:10,000的滑坡体的分布图,需要推求滑坡发生前的范围。

3.3 Logistic回归模型评价实现

3.3.1 样本随机采样

代表发生滑坡区域网格的数量为16442个,在滑坡不发生区域随机选择16442个网格(图1),把二者合并作为总样本进行模型参数的估计。之后把16302个总样本分成模型建立和模型验证两组数据集输入模型,二者各占80%和20%的样本。

3.3.2 共线性检验

与线性回归一样,拟合logistic回归模型时也对自变量中存在的多元共线性敏感[10]。估计的容忍度和VIF指标是多元共线诊断的两个最重要的指标。容忍度的值小于0.2说明自变量之间存在多元共线性,而且容忍度的值小于0.1说明自变量之间存在较严重的多元共线性[11]。估计的容忍度和VIF指标见表1,剔除VIF指标大于2和容忍度小于0.4的自变量[12]。

3.3.3 模型实现

自变量的共线性检验,剔除了高程、到居民点的距离2个滑坡影响因子,使用剩余的影响因子参与Logistic回归建模,在分析过程中采用前向逐步条件参数似然比检验的方法筛选变量,对进入模型的10个滑坡影响因子最后保留了到断层的距离、到河流距离、土地覆被、地层、多年日平均降雨量和坡向6个因子进入回归模型。另外,建立模型的过程中滑坡发生的预测精度为88%,滑坡不发生的预测精度为80%,总体预测精度为84%;验证模型的过程中滑坡发生的预测精度为88%,滑坡不发生的预测精度为80%,总体预测精度为84%。图2为Logistic回归建模获得的滑坡空间概率分布图。

3.3.4 危险度等级制图

目前国内外相关文献关于危险度分级标准的问题很少提及,多数采取的是依照专家个人的经验对滑坡危险度评价结果进行分级。目前对滑坡灾害危险性评价结果的危险度分级方法国际上都没有统一的标准。在GIS 软件支持下,全自动对评价结果进行百分位、自然断点、等间隔和标准差的分级划分对比实验。实验表明百分位分类划分的同一级包括的危险性概率值的范围太宽;尽管自然断点的结果可以接受,但数据值会出现很大的跳跃,不适合我们的评价结果的分级;等间隔分级由于过分强调级与级之间范围的一致性,更不适合對评价结果的分级;最后实验得出标准差的分级划分方法最适合。根据危险度分级方法的选择,对比实验选择了标准差的分级划分方法。以最终评价结果的平均值为基准点,之后加上或减去评价结果的标准差作为分级边界,将结果分为很低、低、中等、高、很高5级,得到滑坡危险度评价成果图(图3)。

图3中,红色表示很高等级,橙色表示高等级,绿色表示中等等级,蓝色表示低等级,灰色表示很低等级。

4 结语

在过去的30多年,许多学者致力于评价滑坡灾害和绘制滑坡危险度图来描述滑坡的空间分布,但至今尚未建立通用的评价方法。本文在GIS技术的支持下,对Logistic 回归多变量模型进行了改进应用,克服定性模型和已有的定量模型的主观性较强、准确性较差等缺陷。并以白龙江流域滑坡灾害较严重的地区之一的白龙江武都河段为样区,进行实证研究。对该研究区滑坡危险性评价方法和模型方面的深入探讨对白龙江武都河段的研究具有示范作用,对整个白龙江流域滑坡灾害在空间上的预测具有重要的现实意义,同时对于移民工作的合理规划和布局也具有很重要的意义。所以本研究对防灾减灾具有实际的指导意义。

参考文献

[1]Su¨zen ML, Vedat Doyuran, A comparison of the GIS based landslide susceptibility assessment methods: multivariate versus bivariate, Environmental Geology,2004,45:665-679.

[2]王济川,郭志刚.Logistic回归模型-方法与应用[M].北京:高等教育出版社,2001.

[3]Lee, Min, K. Statistical analysis of landslide susceptibility at Yongin, Korea, Environmental Geology[J], 2001,40:1095-1111.

[4]邢秋菊,赵纯勇,高克昌,等.基于GIS的滑坡危险性逻辑回归评价研究[J].地理与地理信息科学,2004,20(3):49-51.

[5]白世彪,闾国年,盛业华,等.基于GIS的长江白龙江武都河段滑坡影响因子分析[J].山地学报,2005,23(1):63-70.

[6]Uromeihy A, Mahdavifar M R. Landslide hazard zonation of the Khorshrostam area,Iran [J], Bull.Eng. Geo. Environ. ,2000,58: 207-213.

[7] Ze-zhong, He Yi-ping, et al. Gis-based mapping and zonation of landslide hazards in Xiaojiang alley of Southwestern China[J].Wuhan University of Natural Sciences, 2003, 8 (3b):1021- 1028.

[8] Van Westen, C. J, Application of Geographic Information System to landslide hazard zonation: a review of principles and practice, ITC Publication No. 15, ITC, Enschede, The Netherlands,1993,245.

[9]Guzzetti, F., Cardinali, M., Reichenbach, P., et al., Comparing landslides maps:a case study in the Upper Tiber basin, Central Italy [J],Environ.Manag,2000,25(3):247–263.

[10]Hosmer, D.W., Lemeshow, S., 1989. Applied Regression Analysis. Wiley, New York, p. 307.

[11]Menard, S.W., 1995. Applied Logistic Regression Analysis. SAGE Publication, Inc., Thousand Oaks, CA.

[12]Allison, P.D., 2001. Logistic Regression Using the SAS System: Theory and Application. Wiley Interscience,New York.288pp.

猜你喜欢
白龙江危险度危险性
胃间质瘤超声双重造影的时间-强度曲线与病理危险度分级的相关性研究
O-3-氯-2-丙烯基羟胺热危险性及其淬灭研究
An Annotated List of Lizards (Sauria:Squamata) Recorded from the People’s Republic of China
输气站场危险性分析
胃间质瘤的MRI诊断及侵袭危险度分析
基于AHP对电站锅炉进行危险性分析
白龙江畔菜花香
能谱CT定量参数与胃肠道间质瘤肿瘤危险度的关系
白龙江畔
白龙江流域生物多样性保护面临的主要威胁及工作对策