基于POI数据的成都市五城区空间聚类研究

2019-09-10 05:30曾月
青年生活 2019年31期
关键词:空间布局聚类分析

曾月

摘要:随着信息化的发展和数据源的增多,越来越多的大数据被应用于城市规划研究中,但由于大多数数据具有难获取,不易分析等特点,使得相关的技术方法在实际项目中运用较少。本文采用较易获得POI数据对成都市五城区的空间布局进行聚类分析,描绘各类功能分布,并提取城市空间结构,用POI的城市规划研究能够提供一种新的方法和角度对城市进行认知,在城市规划前期帮助、中期分析、后期跟踪等方面有一定的应用前景[1]。

关键词:POI数据;成都市五城区;空间布局;聚类分析

1.引言

随着信息化的发展和大数据时代的到来,城市规划研究中不再满足于传统数据的分析应用,运用大数据进行的城市分析逐渐增多,主要集中在手机信令、微博数据、出租车、地铁或公交车刷卡数据等,从城市人群的动态分布反映真实的城市运行状态。龙赢等[2](2012)利用公交刷卡数据,对北京市公交持卡人的居住地、就业地和通勤出行的识别结果在公交站点和交通分析小区(TAZ)尺度上进行汇总。陈映雪等[3](2014)以南京为例,借助新浪微博获取海量签到数据,从居民活动这一社会化的视角,再探究旧有的城市空间功能组织方式。钮心毅等[4](2014)以上海中心城为例,提出了利用手机定位数据识别城市空间结构的方法,并对上海市手机用户密度、城市公共中心等级职能、功能区进行识别。这些研究对大数据在城市研究中的运用进行了尝试,提供了更多新的技术方法。但由于以上研究的数据获得门槛较高,在城市规划实际工作中应用较少。

本文以成都市的部分POI 数据为支撑,采用聚类算法,借助ArcGIS 软件,全面对成都市五城区的总体及各行业空间布局进行研究,以克服传统官方数据的弊端,拓宽了城市空间格局研究的视野;提炼数据的特征,以期为更多种类的大数据在城市规划中的实际应用提供思路与借鉴。

2.研究方法与数据来源

2.1 研究区概况

2017年8月31日举行的“成都国家中心城市产业发展大会”上,成都打破圈层结构,将中心城区范围扩大至原一二圈层的11个行政区加高新区、天府新区,形成“老中心城区+郊区新城”的空间层次。将成都市城区大致划分为三个类别:老中心城区(主城五区)、功能经济区、新中心城区。本文选取老中心城区,即锦江区、青羊区、金牛区、武侯区、成华区五城区为研究对象,具有相对丰富健全的公共服务空间,具有较大的研究价值。

2.2 数据来源

POl数据泛指一切可以被抽象为点的地理实体,尤其是与人们生活密切相关的设施,是电子地图上的某个地标,并包含经纬度、地址、名称、类型等属性信息。电子地图中每一个地名、建筑、公园、学校、医院、公司、商场等都是一个兴趣点。本研究参照相关文献分析、《城市居住区规划设计规范》GB 50180-93(2016年版)以及居民的日常需求,将生活设施分为七类,分别是餐饮、交通设施服务、科教文化服务、生活服务、体育休闲服务、医疗保健服务、政府机构机关及社会团体。本研究通过城市数据团获得成都市生活设施POI数据,每条POI数据至少包括名称、经度、纬度、地址等4个属性信息。经过去重、纠偏与空间匹配,得到生活设施现状数据量共114726条

2.3 研究方法

2.3.1 方法原理

K-means 算法属于聚类方法中一种典型的划分方法,以数据划分的类别数作为数据聚类的依据,同类间相似性高,不同类间相似度低。K-means 算法的基本假设为:对于一个簇,选出一个中心点,使簇中的所有点到该中心点的距离小于到其他簇中心的距离。给定一组n个样本X,將其分成K个不相交的簇C,每个簇由样本均值uj描述,即使同一簇内和平方最小。[5]

本文提出的空间聚类方法包括3个步骤:①对位置数据进行预处理;②利用聚类分析探索空间分布;③根据聚类结果分析空间分布特征。具体操作为:将poi数据导入Arcgis中,进行坐标转换,并筛选数据,再将关联到地图中划分为562个渔网格。最后进行聚类分析,并配合相关性进行整体特征分析。

3.空间布局分析

3.1数据格网化

基于十五分钟生活圈的原理,即居民十五分钟步行可达范围约为一平方公里,将成都市五城区范围划分为562个渔网格,再将poi数据关联到渔网格上。并基于此开展后续分析。

3.2迭代聚类分析

由于格网数据在空间具有连续性,可通过聚类分析探索格网的空间分布模式,以反映格网属性在空间的分布规律。为了使K-means 算法的聚类结果能更真实反映聚类特征的空间划分,以下式中目标函数为迭代依据,将聚类数K作为自适应参数,迭代确定聚类中心数。自适应迭代聚类的思想为:假设数据集合为(x1,x2,…,xn),每个xi为多维的向量,K-means聚类的目的是在给定分类组数k(k ≤ n) 的条件下,将原始数据分成k 类:S={S1,S2,…,Sk},K-means所要最小化的目标函数为:

式中,n为样本数;xn为第n个样本;μk为第k个中心点。将样本分为k类,若第n个样本点属于第k类,则rnk=1 ;若第n个样本点不属于第k类,则rnk=0.

3.3 聚类结果空间分布分析

通过对各类POI进行相关性分析,探索同一类中聚类特征与各类POI 之间的关系,并采用spss计算得到各类POI之间相关系数均为0.7以上,具有相关性。且这表明在聚类区域内,某一类POI的数目与其他具有显著的正相关性,利用某一类公共服务设施能探测不同种类的POI在空间上的大致分布情况。因此,结合格网中空间特征的聚类方法,有利于探索人们行为活动在城市空间中的规律。

本文结合POI 数据和位置数据,采用聚类方法挖掘了公共服务设施空间分布特征信息。首先,通过聚类方法探索各类POI在空间的聚类模式;然后,探索各类POI之间的相关关系,以反映POI在城市生活中的吸引程度,为城市布局的合理规划提供帮助。然而,该方法只考虑单一时间段的POI情况,没有考虑随着时间变化各类POI在空间中分分布变化情况,对数据的时空挖掘还不够深。且在对现有数据进行分析时,还不够深入。

参考文献

[1]索超, 丁志刚. POI在城市规划研究中的应用探索[C]// 新常态:传承与变革——2015中国城市规划年会论文集(04城市规划新技术应用). 2015.

[2]龙赢,张宇,崔承印.利用公交刷卡数据分析北京职住关系和职勤出行[J].地理学报,2012,10(67):1339-1352.

[3]陈映雪,甄峰.基于居民活动数据的城市空间功能组织再探究—以南京市为例[J].城市规划学刊,2014,(05):72-78.

[4]钮心毅,丁亮,宋小冬.基于手机数据识别上海中心城区的城市空结构[J].城市规划学刊,2014, (06): 61-67.

[5]刘辉, 黄新, 王京晶. 基于位置数据和POI的聚类方法[J]. 地理空间信息, 2017, 15(11):46-49.

基金项目:成都市哲学社会科学规划项目,项目题目:基于大数据的成都市公共空间发展均衡性问题研究,项目编号:2018R53

猜你喜欢
空间布局聚类分析
浅谈通信基础设施(传输部分)空间布局规划
湖南省区域增长极布局研究
成都市中心城区保障性住房空间分布问题研究
沈阳故宫的营建与空间布局特色分析
自然与建筑
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究
南阳市主城区星级饭店空间布局研究