基于GIS和Logistic回归模型的土地利用空间模拟与分析
——以龙海市为例

2017-07-18 11:12林晓丹范胜龙孙巧燕汤俊红张转转
关键词:龙海市栅格格局

林晓丹, 范胜龙, 孙巧燕, 汤俊红, 张转转

(福建农林大学资源与环境学院,福建 福州 350002)



基于GIS和Logistic回归模型的土地利用空间模拟与分析
——以龙海市为例

林晓丹, 范胜龙, 孙巧燕, 汤俊红, 张转转

(福建农林大学资源与环境学院,福建 福州 350002)

基于2014年龙海市土地利用变更数据、DEM数据和社会经济数据,借助GIS空间分析技术,共设计7个模拟尺度,运用Logistic回归模型选取对试验区有重要贡献的10种驱动因子进行空间统计分析,并对龙海市土地利用空间格局进行模拟.试验结果表明,龙海市模型的最佳模拟尺度为125 m×125 m,在该尺度下耕地、园地、林地、建设用地的空间分布格局模拟精度分别为:82.73%、76.65%、69.52%、88.49%.龙海市土地利用类型与各驱动因子具有显著相关性,高程、人口、可达性因素是决定龙海市土地利用空间格局形成与演变的重要因素,可为研究龙海市未来土地利用动态模拟提供依据.

土地利用; 二元Logistic回归模型; 空间模拟; 多尺度; 龙海市

土地利用变化是一个复杂的非线性过程,在不同时空尺度上受到自然、社会、经济等驱动机制的影响,现已成为全球环境变化的研究热点之一[1-2].土地利用变化动态模拟是探索尺度转化和深入了解土地利用变化过程、驱动机制以及环境影响的重要手段[3-5].目前,研究土地利用变化的动态模拟模型较多,具有代表性的CLUE-S模型可以从地形地貌、人口、社会经济等方面模拟土地利用时空动态,但其注重分析宏观层面,难以模拟土地利用微观格局[6-7].Agent模型仅仅从社会人文因素对土地利用变化的决策作用进行模拟,对自然和社会因素等综合因素作用下的土地利用变化模拟准确度较低[8].二元Logistic回归方法预测的是分类变量与多因素间关系的概率,充分考虑了自然、社会、经济等多因素的作用,不仅能对多因素进行拟合分析,实现对各土地利用类型的模拟预测,还能应用于土地利用格局变化的区域案例中[9-11].

目前土地利用空间模拟研究主要集中在县级以上地区、经济发达地区、以及生态敏感区[12-14],对沿海经济发展“低谷地带”的报道较少.本试验以龙海市作为研究区域,运用二元Logistic回归统计模型,选取自然、社会及可达性3方面的驱动因子对2014年龙海市土地利用空间格局进行模拟与分析,旨在揭示龙海市土地利用空间格局形成与演变的重要因素.研究结果不仅为龙海市土地利用的科学管理提供决策依据,而且也增补土地利用与土地覆盖变化课题的区域案例,为相似研究单元提供借鉴.

1 研究区概况

龙海市地处福建省东南沿海(东经117°29′—118°14′,北纬24°11′—24°36′),闽南经济区东南部,全市土地总面积1 315 km2,东南部临海,中部为平原,其他面环山.

2 数据来源与预处理

2.1 数据收集

本试验使用的数据包括土地利用现状数据和自然及社会经济统计数据.土地利用现状数据来源于2014年龙海市土地利用变更与遥感监测数据库.DEM数据来源于2008年中国地理空间数据云(http://www.gscloud.cn/),空间分辨率为30 m.社会经济数据(人口和人均GDP)来源于中国科学院资源环境科学数据中心.

2.2 数据处理

2.2.1 土地利用现状数据处理 参考国家《土地利用现状分类》标准,重新把现有用地类型分为7种,即耕地、林地、园地、草地、水域、建设用地和其他用地.利用Arcgis 10.2,将各用地类型分别单独成层,形成7个Shp文件,导入已建立好的数据以备后续使用.鉴于文章篇幅,本研究只分析耕地、园地、林地、建设用地4类用地.

2.2.2 驱动因子数据处理 土地利用变化是多种因素综合参与的动态过程,根据龙海市土地利用现状特点,选取对龙海市土地利用格局的形成与演变产生直接与间接影响,涉及自然、社会和可达性3方面的10种驱动因子.由于Logistic回归模型对自变量间的共线性问题敏感度很高,因此采用容许值(TOL)和方差膨胀因子(VIF)相结合的方法诊断自变量的多重共线性问题,剔除共线性严重的驱动因子.为建立土地利用空间模拟模型,首先对GIS进行地形地貌分析,根据DEM数据生成坡度、坡向和高程数据.其次,通过GIS掩膜处理得龙海市网格人口和人均GDP数据.再次,从土地利用数据库中提取主要公路、铁路、河流、城镇和村庄等要素单独成层,计算试验区内各像元中心距离主要公路、铁路、河流、以及城镇和村庄的最近距离.

表1 龙海市土地利用变化驱动因子描述与计算

2.2.3 数据格式处理 所用的栅格与矢量数据按照统一的投影坐标系统和空间分辨率处理.将各驱动因子与现状数据转化为栅格TIF格式,再用GIS的Raster to ASC II工具将所有栅格文件转换成ASC II文件.最后用Dyna-clue软件将ASC II文件转为单一记录文件,文件中一个地类对应10种驱动因子数据,以此作为构建土地利用结构模拟模型的基础数据.

3 试验方法

二元Logistic回归模型主要用于预测多因素影响事件发生的概率,是对普通多元线性回归模型的进一步扩展,属于非线性模型,能有效解决因变量是分类变量而不是连续变量的问题.本试验的目标变量(土地利用类型)是根据栅格图形数据得出的二分类变量,即某种土地利用类型出现或者不出现这两个变量,解释变量包括自然、社会及可达性3个方面10种驱动因子.

3.1 土地利用结构模型

采用二元Logistic回归方程构建土地利用结构模型,将因变量(每种土地利用类型出现的概率)与自变量(10个驱动因子)的关系利用Logistic逐步回归,运用回归方程生成的回归系数和驱动因子与土地利用类型的相关性,建立每个栅格内出现某种土地利用类型的概率,公式如下:

(1)

式中,pi为每个栅格出现土地利用类型i的概率;Xn,i为与土地利用类型i相关的第n个驱动因子;β0为常量,β为Logistic回归方程的关系系数,β值越大,驱动因子与土地利用类型的相关性越大.

3.2 空间模拟

根据公式(1)推导出公式(2),用于计算土地利用的空间分布概率,求出每个栅格内出现某种土地利用类型的概率.

(2)

pi的含义与(1)式相同, exp(β)的值等于事件的发生比率,是β系数以e为底的自然幂指数.发生比率是事件发生频数与不发生频数的比值[15],是衡量解释变量对目标变量影响程度的重要指标.本试验中,发生比率表示解释变量(驱动因子)每增加一个单位,目标变量(土地利用类型)发生比率的变化情况,即exp(β)<1,发生比减少;exp(β)=1,发生比不变;exp(β)>1,发生比增加.

3.3 模型拟合与统计水平的计算

为避免空间数据的自相关效应干扰模拟模型的解释能力,根据模拟尺度以及相应网格总数,分别使用随机抽样和距离阈值控制的方法从原样本集抽取10%的统计水平用于回归建模分析,通过逐步回归方法剔除未通过0.05%显著性水平检验系数的解释变量,保留显著变量,同时确定各显著变量之间的定量关系和作用大小.

运用ROC(relative operating characteristics)曲线检验Logistic回归结果,ROC曲线下面积(Az)也称ROC值,用于检验回归方程对土地利用结构模拟的拟合度[16-17].ROC值范围0.5~1.0,一般认为当ROC值大于0.7时模型拟合度较好.表达式如下:

(3)

其中:

(4)

式中,

xai(i=1,2,…,na)——异常组中的na个值观察;

xbi(i=1,2,…,nb)——正常组中的nb个值观察值.

3.4 尺度的选择与转换

适宜的模拟尺度可以有效提高区域土地利用格局模拟的精度.为构建试验区土地利用动态模拟的最佳尺度,选择50 m×50 m、75 m×75 m、100 m×100 m、125 m×125 m、150 m×150 m、175 m×175 m、200 m×200 m 7个模拟尺度,应用SPSS 19.0软件,分别计算7种尺度下各地类与驱动因子的回归方程,再根据模型的ROC值选出构建试验区土地利用动态模拟的最佳尺度.在进行尺度转换时,以50 m×50 m栅格数据为基础,采用重采样方法,对分类型的地类栅格图层采用“最邻近分配法”变换,对连续型的栅格数据采用“双线性内插法”变换.

4 结果与分析

4.1 最佳模拟尺度的选择

图1 不同模拟尺度下主要地类的ROC值Fig.1 ROC values of main land use types under different analog scales

由图1可知,随着模拟尺度的增大,ROC值呈现先上升后递减的趋势,说明土地利用类型与各驱动因子在不同空间尺度下具有一定的相关性,呈现“尺度效应”的特征.125 m×125 m模拟尺度下主要地类的ROC值的拟合优度达到最高值(耕地0.825,园地0.726,林地0.735,建设用地0.843).为此,将125 m×125 m尺度作为龙海市土地利用空间格局变化中“尺度转换”的最佳模拟尺度.

4.2 空间Logistic回归模型分析

以最佳模拟尺度125 m×125 m(网格点共79 808个)为设计模拟尺度,运用Logistic回归模型分别构建耕地、园地、林地、建设用地的回归方程,二元Logistic回归模型结果如表2所示.

表2 125 m×125 m尺度下主要地类的Logistic回归模型1)

1)回归方程自由度均为1.

4.2.1 耕地Logistic回归模型分析 由表2可知,龙海市耕地格局受自然因素和区位因素影响较大,主要受高程、人口、距村庄距离、距主要公路距离、距河流水面距离的影响.从方程回归系数看,耕地仅与人口呈正相关,相关系数为0.283,与其他显著变量均显著负相关,说明随着人口密度的增大,对耕地的需求也逐渐加大,符合龙海市人口增长对耕地需求增加的趋势.从发生比率看,人口驱动因子每增加1个单位,耕地的空间转化概率增加1.000 087倍.

4.2.2 园地Logistic回归模型分析 园地分布主要受距城市建制镇距离、距村庄距离、距主要铁路距离、距河流水面距离、人口变量的影响.表明区位因素与社会因素共同影响着龙海市园地格局的变化.从方程回归系数看,园地与距城市建制镇距离、距村庄距离、距主要铁路距离、人口均呈负相关,说明园地分布在人口较稀少地区,同时随着距城市建制镇距离、距村庄距离、距主要铁路距离的增大,园地呈减少的趋势.

4.2.3 林地Logistic回归模型分析 林地分布主要受高程、人口、距城市建制镇距离,距村庄距离,距主要公路距离变量的影响.林地与高程、距城市建制镇距离,距村庄距离,距主要公路距离呈正相关,与人口呈负相关,说明龙海市林地主要分布在高程较高,人口密度较小,距离城市建制镇、村庄和公路较远的区域.同时,高程每增加一个单位,林地的空间转化概率增加0.997 697倍.

4.2.4 建设用地Logistic回归模型分析 建设用地分布主要受人口,距城市建制镇距离、距村庄距离、距主要公路距离、距主要铁路距离、距河流水面距离的影响.表明建设用地格局受社会因素与区位因素共同影响.建设用地与人口呈正相关,相关系数为0.350.人口密度每增大一个单位,建设用地的空间转化概率增加1.000 087倍,说明人口密集的地区促进了建设用地扩张的需求.同时随着距城市建制镇、村庄、主要公路距离的增大,建设用地发生的概率比原来降低,说明区位因素决定了龙海市建设用地发展的方向.

4.3 土地利用最佳空间模拟

对比2014年龙海市土地利用实际图与空间概率模拟图(图2),可以看出模拟效果与实际情况基本相符,模拟出的概率分布较高的地方同样是某种土地利用类型分布比较高的地方.并且实际分布格局与模拟的空间分布格局的吻合效果与ROC值密切相关,ROC值越高,吻合效果也越好.其中建设用地的ROC值最高,其模拟结果与真实情况基本吻合.从定量分析看,为更进一步确定各用地类型模拟的准确率,在ROC检验方法的基础上,运用逐点对比的方法来分析和计算模拟精度[18-19].将2014年各土地利用类型的空间概率图与实际图进行迭合逐点对比,得到实际图与模拟图一致的栅格数,将预测一致的栅格数除以实际栅格数即得模拟精度(表3).试验中的预测模拟精度中,林地的预测精度最低,在模拟的空间分布概率图中,同样可以看到位于九龙江流域出海口林地的分布与实际情况不太相吻合,造成这种模拟偏差的原因在于试验中只选取对土地利用类型共性的驱动因子,而对于林地的影响因子还存在其他如降水量、蒸发量、林地流转政策等难以空间量化的因素.

图2 龙海市2014年土地利用实际图(上)与空间概率模拟图(下)

地类类型实际与预测一致栅格数2014实际栅格数模拟精度/%耕地 126221525782.73园地 136051775076.65林地 139842011569.52建设用地125921423088.49

5 讨论

本试验综合运用GIS技术和二元Logistic回归模型对试验区土地利用格局进行回归结果分析,并根据最佳模拟尺度对2014年龙海市4种主要土地利用类型的空间分布格局进行模拟,试验结果表明模拟的耕地、园地、林地和建设用地与龙海市2014年实际空间格局具有较好的一致性,说明Logistic回归模型能够较好地模拟龙海市土地利用空间分布格局.Logistic回归模型结果揭示高程、人口、可达性因素是土地利用类型的主要解释变量,它们是决定龙海市土地利用空间格局形成与演变的重要因素.

但本研究中2014年龙海市土地利用空间分布格局模拟在局部地区与实际情况仍存在不相符的地方,一方面是由于栅格数据在尺度转换过程中存在空间自相关效应问题,使得回归模型在计算中存在一定不可避免的误差.另一方面是由于模型的解释变量在选取方面不够全面,没有考虑气温、降水、蒸发量等自然因素和政策、科技等人文因素影响,这些数据的缺失可能是造成模拟结果与实际情况有所偏差的原因.因此,在驱动因子选择方面要尽量全面且可以量化,这是进一步试验的重点内容.

[1] 骈宇哲,姜朋辉,陈振杰,等.LUCC研究进展及其对干旱区生态环境的意义[J].水土保持研究,2015,22(5):358-364.

[2] 刘晓娜,封志明,姜鲁光.中老缅泰“黄金四角”地区土地利用与土地覆被变化研究进展[J].地理科学进展,2013,32(2):191-202.

[3] 游炯,张景雄.土地覆盖信息尺度转换的判别空间方法[J].武汉大学学报(信息科学版),2013,38(11):1 349-1 352,1 363.

[4] WICKRAMASURIYA R, CHISHOLM L A, PUOTINEN M, et al. A method to dynamically subdivide parcels in land use change models[J]. International Journal of Geographical Information Science, 2013,27(8):1 497-1 513.

[5] 田义超,陈志坤,梁铭忠,等.土地利用最佳模拟尺度选择及空间格局模拟[J].计算机工程与应用,2014(24):244-249.

[6] 戴声佩,张勃.基于CLUE-S模型的黑河中游土地利用情景模拟研究——以张掖市甘州区为例[J].自然资源学报,2013,28(2):336-348.

[7] ANPUTHAS M, JANMAAT J A, NICHOL C F, et al. Modelling spatial association in pattern based land use simulation models[J]. Journal of Environmental Management, 2016,181:465-476.

[8] 余强毅,吴文斌,唐华俊,等.复杂系统理论与Agent模型在土地变化科学中的研究进展[J].地理学报,2011,66(11):1 518-1 530.

[9] 王美霞,任志远,王永明.千河流域土地利用空间格局模拟及其影响因素分析[J].测绘科学,2013,38(4):34-36,151.

[10] DESSEL W V, ROMPAEY A V, SZILASSI P. Sensitivity analysis of logistic regression parameterization for land use and land cover probability estimation[J]. International Journal of Geographical Information Science, 2011,25(3):489-508.

[11] 田媛,许月卿,郭洪峰,等.基于多分类Logistic回归模型的张家口市农用地格局模拟[J].资源科学,2012,34(8):1 493-1 499.

[12] 韩会然,杨成凤,宋金平.北京市土地利用空间格局演化模拟及预测[J].地理科学进展,2015,34(8):976-986.

[13] 杨俊,解鹏,席建超,等.基于元胞自动机模型的土地利用变化模拟——以大连经济技术开发区为例[J].地理学报,2015,75(3):461-475.

[14] LI T H, LI W K. Multiple land use change simulation with Monte Carlo approach and CA-ANN model, a case study in Shenzhen, China[J]. Environmental Systems Research, 2015,4(1):1-10.

[15] 王济川,郭志刚.Logistic回归模型:方法与应用[M].北京:高等教育出版社,2001.

[16] 宇传华.SPSS与统计分析[M].北京:电子工业出版社,2014.

[17] 刘荣,高敏华,谢峰.基于Logistic回归模型的土地利用格局模拟分析——以新疆吐鲁番市为例[J].水土保持研究,2009,16(6):74-78.

[18] 黎夏,叶嘉安.知识发现及地理元胞自动机[J].中国科学,2004,34(9):865-872.

[19] 任志远,李冬玉,杨勇.关中地区土地利用格局模拟与驱动力分析[J].测绘科学,2011,36(1):105-108.

(责任编辑:苏靖涵)

Spatial simulation and analysis of land use pattern based on GIS technology and Logistic regression model: a case study in Longhai City

LIN Xiaodan, FAN Shenglong, SUN Qiaoyan, TANG Junhong, ZHANG Zhuanzhuan

(College of Resource and Environment, Fujian Agriculture and Forestry University, Fuzhou, Fujian 350002, China)

To rationalize land use of Longhai City and provide information on city planning, data on land use changes, DEM data and social economic data of Longhai in 2014 were interpreted by GIS. Then 10 driving factors, selected by spatial statistical analysis, were interpreted by Logistic model under 7 simulation scales. At last, model with the optimum scale was used to predict spatial pattern of land use changes of Longhai. The results illustrated that the optimum simulation scale was 125 m×125 m. Under this scale, simulation accuracies of spatial distribution patterns of cultivated land, orchards, forest land, and construction land were 82.73%, 76.65%, 69.52% and 88.49% respectively. Land use of Longhai was highly correlated with driving factors, with elevation, population density, and accessibility being the most determinant factors for the formation and evolution of spatial pattern of land use in Longhai.

land use; binary Logistic regression model; spatial simulation; multi-scale levels; Longhai City

2016-08-02

2016-08-16

福建省自然科学基金资助项目(2015J01624).

林晓丹(1990-),女,硕士研究生.研究方向:土地资源可持续利用.Email:385684690@qq.com.通讯作者范胜龙(1976-),男,副教授.研究方向:土地资源可持续利用.Email:14412885@qq.com.

F301.2

A

1671-5470(2017)04-0468-06

10.13323/j.cnki.j.fafu(nat.sci.).2017.04.018

猜你喜欢
龙海市栅格格局
基于邻域栅格筛选的点云边缘点提取方法*
龙海市人社局推进山海协作,助力脱贫攻坚
格局
联手共建 努力打造大调解工作格局
甜玉米空秆的原因与防止措施
小人物的大格局
不同剖面形状的栅格壁对栅格翼气动特性的影响
基于CVT排布的非周期栅格密度加权阵设计
福建省龙海市空中云水资源分析
栅格中间层数据在数字地形分析中的应用