基于Alpha Shape 算法的分散式乡村聚落形状划分及其形成研究
——以米脂县龙镇为例

2022-05-30 08:36王天宇惠怡安芮盼盼
干旱区地理(汉文版) 2022年3期
关键词:轮廓高程斑块

王天宇, 惠怡安, 芮盼盼, 师 莹

(西北大学城市与环境学院,陕西 西安 710127)

黄土丘陵沟壑区是典型的半干旱区,也是实现黄河流域生态保护与高质量发展的重要地区。该区域沟壑纵横、地形破碎,分散式乡村聚落众多[1]。识别乡村聚落形态的特征及其影响因素对于理解乡村聚落的形成,规划乡村聚落物质空间,合理配置基础设施、公共服务设施具有重要作用。集中式聚落由于其形态较为完整,相关研究已经较为成熟,而分散式聚落由于聚落轮廓难以识别其形态亦鲜有研究涉及。

目前识别乡村聚落形态主要有2 种方法:人工识别和机器识别。人工识别一般依据特定的规则,对聚落形状或边界进行手动提取,比如浦欣成[2]以建筑斑块的顶点生成连接线,通过设定100 m、30 m、7 m 的长度得到不同精度下的聚落边界,谢丹等[3-4]基于这一方法分别对海南省北部和贵州喀斯特山区乡村形态进行了研究。这种方法需要基于村庄地形图人工提取村落边界,且对于散点式的聚落并不适用。机器识别是指人工设定识别规则,利用计算机对聚落形状进行提取,该类方法能够克服人工提取工作量较大的问题。董一帆通过Delaunay三角网计算建筑物之间影响距离,叠加建筑物之间的凸包来提取村落轮廓[5],该研究同样需要聚落CAD平面图,对数据精度要求较高。

对于乡村聚落形状类型划分及其影响因素研究,早期研究一般使用定性方法对聚落形态类型进行人为划分,且划分标准较多涉及聚落环境、人口规模等非形态特征[6],金其铭[7]根据聚落的规模、密度、耕作半径将江苏省农村聚落形态分为团聚状和条带状。定量研究一般综合聚落经济环境、空间格局等指标,通过聚类分析等方法对聚落类型进行划分[8-10],如马晓冬等[8]使用系统聚类对聚落7种景观格局指数进行分析,从而划分团簇、宽带、条带等8种形态类型。此类研究虽然定量程度有所提高,但是聚类分析的结果往往难以对形态类型进行直接判断。对于聚落形态影响因素,已有研究表明自然环境因素是聚落形态形成的基础因素,其中高程、坡度对于聚落形态影响较大[11-12],水资源对于干旱区聚落形态有较强的约束作用[13-14]。此外,社会因素如风水、宗族、政策、经济水平等也对聚落形态存在一定程度影响[15-16],如王浩锋[17]基于空间句法研究了聚落空间形态和经济、社会组织之间的规律性。整体来看,对于影响因素的研究主要通过线形回归等方法分析地形、交通等因素和聚落形态特征间的相关性[12,15,18],然而聚落形态和各类影响因素之间并非完全线性相关,对于非线性关系的研究较为缺乏。

综上,目前对于分散式聚落形态识别的方法较为欠缺,已有方法存在计算量较大、数据要求较高等问题,此外对于形态类型的划分定量程度不高,且针对形态的非线性影响因素探讨较少。因此,本文以黄土丘陵沟壑区的米脂县龙镇为例,尝试使用Alpha Shape算法提取分散式聚落的聚落边界,在此基础上将城市形态研究中的Boyce-Clark(BC)指数引入乡村研究,提高形状类型划分的科学性,最后结合多元线性回归和回归树,探讨并分析聚落形状与影响因素之间线性、非线性关系,以期补充该区域乡村聚落形态研究。

1 研究区、数据与方法

1.1 研究区概况

本研究选取的区域为榆林市米脂县龙镇,龙镇位于米脂县西北部,距县城25 km,总面积136 km2。该区域属于典型的黄土丘陵沟壑区,5 a平均年降水量552 mm。龙镇位于无定河中游西侧,整体地貌形态为一川两沟(图1),一川即无定河的川道,两沟即马湖峪沟(当地称龙来沟)和杨正沟(当地称黑石窑沟),两沟均为无定河的支流。交通条件较为便利,榆(林)商(洛)高速从镇区东部边沿经过,出入口亦在本镇,神(木)延(安)铁路穿越镇域东部。研究区经历过大规模迁村并点后行政村数量只有28个,考虑到合并之后的行政村包含自然村过多,分布范围过大,并不适合作为形态分析对象,本文采用合并之前的聚落作为分析对象,共计58个自然村。

图1 龙镇地形图Fig.1 Topographic map of Long Town

1.2 数据来源

本研究数据包括空间矢量、栅格数据。矢量数据为榆林米脂县龙镇行政边界和米脂县龙镇2019年土地利用数据,该数据由龙镇政府提供,地理坐标系为CGCS2000 和西安80 坐标系。栅格数据为2012 年米脂县1 弧秒分辨率SRTM 数字高程数据,来源于地理空间数据云(http://www.gscloud.cn/)。

1.3 研究方法

1.3.1 Alpha Shape 算法Alpha Shape 是计算散点轮廓的算法。假设空间中有S个点,若是求S个点的最小凸包会得到一个包含所有点的封闭平面的交集(图2a)。可以看出,点集的最小凸包并不能较好描述散点的轮廓,因为凹陷处并没有被体现出来。Alpha Shape算法实际上是基于通过任意2点的半径为a的圆生成的,在给定半径a时,过任意2 点能够画出2 个圆,算法规定当画出的圆内不包含其他点时这2 点可以被看作为边界点,对所有的点进行计算可以得出散点边界。当半径a过大时算法得出的轮廓较为粗糙,接近最小凸包,而当a足够小时轮廓细节则会更多,甚至包括点集内部的空洞。图2b深色部分是在给定半径a的情况下利用Alpha Shape 算法得到的散点轮廓,可以看出该轮廓明显小于最小凸包,并且对散点凹陷处刻画较好。由于半径a为固定值,因此当2 点距离过大时在算法中会被舍弃,如果不对a进行设定,那么默认情况下a为最小值,即平面所有点中距离最近2 点间距的一半。在实际应用中需要调整a的值以保证大部分居住用地可以被轮廓覆盖。

图2 散点最小凸包和Alpha Shape算法结果对比Fig.2 Comparison of minimum convex hull and Alpha Shape results

半径a可以看为建筑的影响范围,即外部空间的范围。浦欣成[2]根据人与人之间的关系、乡村空间实际情况将距离分为100 m、30 m、7 m,其中100 m是社会性视域的最高限。此外,研究比较了50 m、70 m、100 m、150 m半径对聚落形状的提取效果,其中50 m、70 m会导致聚落多轮廓概率提升,150 m和100 m 在聚落轮廓数量上差别不大,但提取精度较低,因此本研究采用100 m 作为外部空间的范围。具体计算步骤是,使用ArcGIS中的渔网工具创建点阵,与建筑物斑块相匹配。将点坐标以数值矩阵的格式导入Matlab,利用Alpha Shape 函数计算轮廓。通过Matlab的Boundary Facets函数生成边界坐标矩阵,导入ArcGIS 后得到边界点集,当存在多个面时需要手动连接各点。

1.3.2 Boyce-Clark指数对于边界形状的测度,目前方法较多,BC 指数被认为是一种较好的方法,该指数是将聚落边界形状与基于特定半径生成的标准圆进行对比得出[19]。标准圆圆心的选择对计算结果影响较大,本研究采用面的质心作为标准圆圆心。在计算过程中,从圆心出发的辐射线(半径)可能与边界有多个交点,因此需要对此进行定义,为了保证聚落所有范围均能覆盖,将距离圆心最远的交点定义为半径,具体计算公式如下:

式中:BC 为Boyce-Clark 指数;n为某一轮廓内从质心出发的辐射线数量;ri为从面的质心到图形边缘的第i条半径长度(km)。

BC 指数精度取决于n值的大小,n值越大表明生成的辐射线间隔角度越小,计算结果越精确。本文参照相关学者研究,将n设置为32,辐射线间隔为11.5°[20]。计算过程在ArcGIS的python界面完成,首先确定各个聚落轮廓面的质心,接着基于质心以11.25°间隔生成辐射线,计算每个辐射线长度代入上述公式中计算,得到每个轮廓面的BC 指数。对于拥有2 个轮廓面的聚落,根据不同情况采取不同处理方法。当2种轮廓面BC指数较为接近时,采用面积加权的方式计算平均值,当轮廓面BC 指数相差较多时,可以将该村落定义为组合形态,并单独分析各个面的BC指数。面积加权方法公式如下:

式中:BCa为平均BC指数;A1、A2分别为轮廓面1和2的面积(km2);A为总面积(km2);BC1和BC2分别为轮廓面1和2的BC指数。

聚落形状不同,相应的BC 指数也不同,根据相关学者研究,聚落形态可以分为15 种标准形态[21](表1)。圆形的空间形态最为紧凑,其BC指数为0,随着形态变化BC 指数依次上升,直线的BC 指数最高达到187.5。

表1 BC指数对应的标准形状Tab.1 Standard shape corresponding to the BC index

2 结果与分析

2.1 Alpha Shape算法计算结果

2.1.1 乡村聚落边界提取结果从Alpha Shape 算法的结果来看,该算法对于居民点分布均匀且相对紧凑的聚落边界提取效果较好(斑块平均间距<135m),图3a 是聚落居民点斑块,图3b 是边界提取结果。100 m 提取半径下,具有明显轮廓的聚落占总数的76.1%,其中具有单一轮廓的聚落占总数的44.8%,具有2个轮廓的聚落占总数的31.3%(表2)。

表2 聚落轮廓提取结果Tab.2 Extraction results of settlement contour

图3 鲍庄村的居民点和100 m半径下Alpha Shape算法轮廓Fig.3 Residential area in Baozhuang Village and the contour of Alpha Shape algorithm under a radius of 100 m

聚落轮廓面数量主要受斑块平均间距标准差影响。单一轮廓聚落其平均斑块间距标准差为60,双轮廓聚落平均斑块间距标准差为69,这2 类聚落在斑块平均间距上仅相差4 m。因此,聚落轮廓面的数量在聚落整体间距相似的情况下,主要受间距分布影响,即标准差越大,聚落斑块间距波动越大,聚落轮廓数越多。

此外,由于龙镇地处黄土丘陵沟壑区,地形复杂,因此部分聚落居民点分布极为分散,通过100 m半径生成的聚落轮廓难以维持单一轮廓,导致多个轮廓面(3个及以上)的形成,此类聚落占23.9%。轮廓面较多的情况下,对形状的研究难以展开,因此选择轮廓面较少(少于3)的聚落进行进一步分析,共计41 个自然村。这些自然村的空间分布能够覆盖龙镇各个地形区域,包括北部河滩区域以及中部沟道、梁峁区域。

2.1.2 聚落形状指数计算及类型划分根据各个面BC指数计算结果,龙峁村、李圪堆村、西高庙山村这3 个村庄2 个轮廓面的BC 指数较为接近,可以被近似看为单一形状,其采用面积加权的方式计算的平均BC指数分别为52.248、21.362、48.701。从具有单个轮廓面聚落的BC 指数数值来看,最小值为皮条峁村(17.032),最大值为黑石窑村(107.030),皮条峁村为矩形和星形过渡形态,黑石窑村为线状矩形。随着BC 指数提高其聚落形状逐渐趋于线形或线形组合形状,参考上文的标准形态BC指数,大致可以将研究区单一轮廓特征的聚落形状分为以下几种类型(图4):

图4 研究区聚落标准形状类型Fig.4 Standard shape types of settlements in the study area

(1)块状矩形或块状变种形(星形),BC数值范围为17.032~33.032。其特征为,随着数值升高聚落形状从块状向外扩展,具体表现为聚落某一部分向外延伸,当向多个方向同时扩展时类似于星形,由于扩展程度不高因此BC 指数也不高。这一形状的聚落有皮条峁村、苏家沟村、冯庄村、马湖峪村、李圪堆村。

(2)延伸形,包括2 点延伸、3 点延伸形等,BC数值范围为37.438~53.288。该种形状由块状变种形状生成,由于其形状扩展程度较高因此BC 指数较高。这一形状的聚落有山硷楞村、贺家坡村、丰富墕村、沙畔村、樊兴庄村、塔占村、龙峁村、西高庙山村。

(3)串珠形或哑铃形,BC 数值范围为55.775~70.644。其特征为2 个或2 个以上的延伸形聚落的组合,导致在带状聚落的部分节点处聚落面积突然增大,当由2个部分组成时形如哑铃,由3个及以上部分组成时形如串珠。这一形状的聚落有麻地沟村、高庄村、鲍庄村、赵家畖村、常兴庄村、老榆山村、安寨村、白渠村、曹山村、杜家畔村、麻山村。

(4)带状矩形或带状延伸形,BC 数值范围为78.256~99.868。其特征为单条带状矩形或多条带状矩形相交形成的带状延伸形,相比于多点延伸形和串珠形,其延伸距离更远,且不存在大面积的节点。这一形状的聚落有郭家砭村、艾家墕村、东坪墕村、后张兴庄村。

(5)线形,符合该种形状的聚落只有黑石窑村,其BC指数为107.030,如图中所示,其形状为一条线状矩形。

其余具有2个轮廓面的村庄可以被看为不同形状的组合。从数值来看,BC 指数范围为15.400~79.270。参照上文对于单一轮廓形状的分类,可以将具有组合形状的聚落分为以下几种:块状矩形/星形和哑铃形/串珠形的组合,代表性聚落有玉皇阁村、寨山村、崖窑沟村、新窑沟、黄家畖村;块状矩形和2 点/3 点延伸形组合,包括张家湾村、张兴庄村、前中庄村;2点延伸形和哑铃形/串珠形组合,包括赵兴庄村、老庄村;2 点延伸形和带状矩形组合,包括狼后沟村、陈家墕村。

2.2 聚落形状影响因素

2.2.1 影响因素选择及计算在影响因素选择方面,聚落规模是聚落形态的重要特征之一,一般情况下,当聚落空间规模增加或减少时,其形状也相应发生变化。因此首先选择聚落空间规模作为形状的影响因素之一。其次,研究区属于黄土丘陵沟壑区和半干旱区,地形条件和水资源可获取性在聚落演变过程中可能存在较强的作用。此外,在聚落形态的形成过程中,交通可达性的强弱对于聚落形态也可能存在影响。最后,已有学者研究表明宗族观念能够影响聚落形态[16],该区域村落姓氏数量分布差异较大,因此宗族观念强弱对于聚落形态也可能存在影响。基于此,本文选取聚落规模、地形因子、水资源可获取性、交通可达性、宗族观念作为影响聚落形状的待选因素。

具体来看,聚落规模主要通过聚落面积表征;地形因子主要包括高程、坡度、坡向几大类,以及与这几类相关的细分地形因子,本研究选取高程、坡度、高程变异系数、地形起伏度、地表切割度、地表粗糙度、剖面曲率这7 个地形因子以刻画龙镇地形特征,分析其与聚落形态的相关性;水资源可获取性方面,以水面栅格为源,采用成本距离函数计算居民点斑块到源的累计耗费距离,用以衡量各个栅格点取水的累计耗费成本,累计耗费距离越大可获取性越低;交通可达性使用各居民点斑块到最近公路(不包括村庄内部道路,在研究区主要为乡道)的平均里程表征,聚落平均里程越低表明聚落交通可达性越高;宗族观念使用各村姓氏数衡量,姓氏数量越低表明宗族观念越强。

以聚落BC 指数为因变量,先通过多元线性回归的方式大致确定待选因子的重要程度,去除共线性极大的因子[为了提高指标代表性,剔除方差膨胀系数(VIF)大于30的因子],再通过回归树的方式对多元线性回归的结果进行验证。采用回归树的原因是该模型对非线性关系有较好的拟合效果,并且不受数据共线性的影响,能够对多元线性回归结果进行补充[22]。影响因子均服从正态分布或接近正态分布的单峰分布,并且通过了方差齐性检验。

2.2.2 多元线性回归结果从检验结果来看(表3),调整后决定系数(R2)为0.344,表示影响因子总共能解释聚落形状指数34.4%的变化,模型拟合效果满足研究要求。从影响因子来看(表4),坡度、高程变异系数、地形起伏度、地表切割深度、VIF 值均大于30,且和聚落形状指数不存在显著相关性(P<0.05),因此后续使用回归树进行验证时去除这些因子。与聚落BC 指数存在显著相关性的因子有高程和水资源可达性。高程和聚落BC 指数存在显著正相关关系,高程越高,聚落BC 指数越高,即随着高程增加,聚落形状逐渐从团块状向线状转变;水资源可获取性和聚落BC 指数整体呈现正相关,即随着聚落水资源可获取性提高,聚落BC指数有增加趋势,但不明显。

表3 多元线形回归模型摘要Tab.3 Summary of multiple linear regression model

表4 影响因子、标准化系数、显著性和VIFTab.4 Impact factors,standardized coefficient,significance and VIF

2.2.3 回归树计算结果及因子作用机制根据多元线性回归的结果,选取高程、面积、曲率、交通可达性、水资源可获取性、人口、宗族作为影响因子,使用回归树判断影响因子对于BC 指数的影响程度。从样本中选取25%作为测试集、75%作为训练集用来建立模型,通过比较均方根误差(RMSE)在R Studio 中对回归树进行剪枝(图5)。图中椭圆框内是各影响因子,因子靠前表明对于聚落BC 指数影响越大,高程、水资源可获取性对于聚落BC指数影响较高,这与多元线性回归的结果一致。

图5 回归树剪枝结果Fig.5 Pruning results of regression tree

高程和地形相关性较高,而地形直接影响聚落形状类型,高程越高聚落形状越偏向线形及其组合形状,高程越低聚落形状越偏向于团块状。研究区高程较高的区域一般为梁峁顶地,位于此处的聚落地形条件较差,缺少大面积开阔区域,因此居民点只能沿道路分布,造成聚落整体BC 指数偏高。高程较低的区域除了北部的河滩区域还有2条川道区域。河滩地区地形平坦,水资源可获取性较高,因此其聚落形态倾向于BC 指数较低的团块状,并且由于可灌溉农田面积较大,人均收入也较高,成为过去10 a聚落规模扩张最大的地区。川道区域是高等级公路分布的区域,相比于梁峁顶地附近的环状乡村道路,其道路线形直线部分更多,因此聚落居民点分布更加紧凑或形成一些大的节点,容易形成带状矩形或哑铃形等形状。

相比于多元线性回归的结果,回归树表明水资源可获取性对聚落BC 指数的影响并非是线性的和正相关的。在聚落高程低于883.57 m 时,水资源可获取性对聚落BC 指数的影响较差,水资源可获取性主要影响高海拔的聚落的BC 指数,高海拔聚落随着水资源可获取性的提高,其聚落BC 指数在降低,表明聚落形状偏向紧凑。研究区水资源分布不均匀,除了雨水,主要水源为河水和水库。河水主要分布在低海拔地区,因此低海拔地区聚落的水资源可获取性差异并不大,导致对于聚落形状的影响程度不高。高海拔区域水源主要为水库,但由于水库分布不均匀导致水资源可获取性差别较大,因此高海拔区域随着水资源可获取性的提高,聚落形状紧凑程度有提高的趋势。

此外,聚落面积对于聚落BC 指数也有影响。结合回归树的节点可以看出,当聚落面积较小时聚落BC 指数值也较小,因为小型聚落一般以散点式的团块出现,而当面积开始增大时,聚落BC指数开始提高,因为聚落向外蔓延程度增加。当聚落规模大于0.02 km2(为了防止模型过拟合该节点被剪枝)时,随着聚落规模提高,BC指数呈现下降趋势,即形状向团块状转变。当聚落面积达到0.036 km2时,随着聚落面积的提高,聚落BC指数重新增加,聚落形状向带状发展。该趋势揭示了该区域乡村聚落的扩张规律,即小规模聚落并非向四周均匀扩张,而是朝一个或多个方向扩张,在这个过程中BC 指数提高,扩张到一定程度后,聚落内部的空洞逐渐被填充,BC指数得到降低。由于该区域地形以梁峁顶地为主,这种模式不能持续,因此当聚落向外扩张到一定程度之后只能沿交通线路扩展,造成BC 指数重新升高。

3 讨论

研究使用Alpha Shape 算法计算了散点的平面轮廓,没有考虑到高程对于聚落形状的影响。在聚落实际分布中,可能存在一些特殊情况,即居民点斑块距离较近,但高程相差较大,此时从外部空间的角度来说,这些居民点不能被划为整体。此外,本文以龙镇作为研究对象,乡村聚落数量有限,对于多元线性回归和回归树来说,样本数不算高,未来希望通过分层抽样的方式在陕北黄土丘陵沟壑区选取乡村聚落,提高样本数量及其代表性。

对于政策制定来说,该研究能够为聚落生活空间布置、建筑红线的划定提供参考。规划聚落生活空间,首先需要确定聚落生活空间的边界,在确定边界的基础上规划居民点空间布局及其面积。以100 m作为半径,既考虑了建筑之间社会性联系,又满足了空间距离的要求,对聚落边界有较好的提取效果。当然,对于其他区域来说,该距离可能要发生变化,比如在平原地区,半径应该远大于100 m。对于居民点分布较为集中的聚落,确定生活空间边界后,该边界可以作为管控建筑物无序蔓延的依据,引导乡村聚落集约化扩张;对于分布散乱,向心性不强的聚落,通过确定生活空间边界,可以划定发展区域,引导聚落向多组团的“串珠式”聚落发展;对于完全分散的聚落,通过多个聚落轮廓面积能够确定聚落的中心,引导距离中心较远的居民点向中心迁移。

4 结论

本文以米脂县龙镇乡村为例,使用Alpha Shape算法和BC 指数提取了分散式乡村聚落边界、划分了其形状类型,最后结合多元线性回归和回归树分析了聚落形状类型影像因素,结论如下:

(1)Alpha Shape 算法对于分布距离适中(斑块平均间距<135 m)的散点式聚落形状提取效果较好,能够概括研究区76.1%乡村聚落的形状特征。在不考虑竖向因素影响的情况下,当滚动半径设定为100 m 时,能够提取出明显轮廓(轮廓面≤2)的聚落占总数的76.1%,其中单一轮廓的聚落占总数的44.8%,双轮廓的聚落占总数的31.3%。

(2)在整体聚落斑块间距较为接近的情况下,Alpha Shape 算法提取的聚落轮廓面数量主要受斑块间距标准差影响。斑块间距标准差越大,聚落斑块间距波动越大,聚落轮廓数越多。

(3)研究区聚落形状类型可以划分为块状矩形及其变种、延伸形、串珠形和哑铃形、带状矩形及其组合、线形5种类型,对应的BC指数分别为17.032~33.032、37.438~53.288、55.775~70.644、78.256~99.868、107.030。双轮廓面聚落的形状主要为这5 种形状的组合。

(4)多元线性回归和回归树的结果表明,高程对于聚落形状的影响程度最高,高程与聚落BC 指数存在显著正相关的关系,高程越高,聚落BC指数越高,聚落形状紧凑程度越低。水资源可获取性、聚落面积与聚落BC 指数呈现非线性相关。当高程低于883.57 m 时,水资源可获取性对聚落形状没有影响,高程高于这一数值时,水资源可获取性与聚落BC指数呈现负相关,即水资源可获取性越高,聚落BC 指数越低,形状越趋于紧凑。聚落面积小于0.02 km2时,面积和聚落BC指数呈负相关,当聚落面积达到0.036 km2时,聚落面积和BC指数呈正相关。

猜你喜欢
轮廓高程斑块
责任斑块狭窄度及颅内斑块总数与复发性卒中相关:基于高分辨血管壁成像的单中心病例对照研究
场景高程对任意构型双基SAR成像的影响
海南省北门江中下游流域面积高程积分的应用
颈动脉的斑块逆转看“软硬”
一篇文章了解颈动脉斑块
8848.86m珠峰新高程
跟踪导练(三)
有颈动脉斑块未必要吃降脂药
基于二次曲面函数的高程拟合研究
儿童筒笔画