基于广义城熵聚类模型的城市节点分类方法

2014-09-06 09:32董道建
山东交通学院学报 2014年3期
关键词:广义江西省聚类

董道建

(西南交通大学 交通运输与物流学院,四川成都 610031)

基于广义城熵聚类模型的城市节点分类方法

董道建

(西南交通大学 交通运输与物流学院,四川成都 610031)

从传统城熵的缺点出发,提出广义城熵聚类模型并运用于整个城市圈的城市节点分类,该模型从城市发展的差异性角度进行科学合理地分类,可以更好地指导城市的长远发展,促进相关政策措施的有效落实。

城市圈;城市节点;广义城熵;聚类分析;广义城熵聚类模型;可持续发展

城市圈是国家生产力发展最好的地区,是国家经济最发达的地区,也是到目前为止城市发展的最高阶段[1]。省域范围内的城市圈中包含着若干个重要的节点,一般是大、中城市以及大型能源、原料基地。这些节点不但对省域范围内的经济发展起着举足轻重的作用,也对交通数量或运输数量的生成有着不可替代的功能。几条运输干线的交叉点,有大量客货流集散,具有优越的地理位置和方便的交通运输条件,从而形成交通节点[2],同时也会进一步发展成重要的城市节点。此类节点的形成和发展,会带动交通运输条件的进一步改善,并促进工业、农业布局和商业贸易的发展。

城市圈规划发展过程中,需要根据城市节点的共性和差异性进行归类总结,以便有针对性、有步骤地对各个城市做出更好的发展规划与布局,也能制定出因地制宜的发展战略和措施。城市节点分类如果科学而可行,会有力地促进整个城市圈的协调可持续发展;而城市节点分类如果没有遵循应有的发展规律,会在某种程度上阻碍子城镇合理的发展轨迹和进程。因此,合理而有效的城市节点分类是整个城市圈发展规划过程中极为重要的基础性环节。

1 传统城熵

熵是一种对对象事物不确定性(或称多样性)的测度[3]。当城市发展成为大型、超大型城市时,就会开始向“母子”状结构演化,这种“母子”状结构正是一种多样特征。用来测度这种“母子”状结构的城熵计算公式为

(1)

式中Hc为城市圈城熵;Pi为第i个子城镇的相对规模(多用人口作为相对规模测度);n为城市圈内所包含子城镇数量。

Pi的计算式为

式中Qi为第i个子城镇的绝对规模(多指人口数量)。

一般地,Pi之间差别越小,则熵越大;n增多时,熵也增大[4]。

2 广义城熵聚类模型及实施步骤

2.1广义城熵聚类模型

2.1.1 广义城熵[5]

(2)

式中H0为某一分类没有子城镇时对应的城熵,H0=min(-PjlnPj),(0

2.1.2 基于广义城熵的聚类分析

1)基于广义城熵聚类模型[6]

聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。基于广义城熵的聚类模型结合广义城熵与K-means算法[7]对城市节点进行分类,采用距离作为相似性的评价指标。其流程为:① 初始化。设定聚类数K,选取初始样本点均值作为初始聚类中心;② 循环。按就近原则将其余记录向聚类中心聚集,计算出各个新类的聚类中心位置,并用它们重新进行聚类,反复循环直至聚类中心位置收敛。

选择欧式距离d作为衡量相似程度高低的标准,计算方法为

式中Xi为某一类中第i个子元素的取值, 1≤i≤m;Xj为某一类第j个子元素的取值,1≤j≤n;m,n分别为给定类别中所含子元素的数量。

2)聚类效果评价

为了满足聚类要求,选择评价指标λ评价聚类效果,λ越小,聚类效果越好。λ的计算式为

λ=Din/Dou,

2.2广义城熵聚类模型实施步骤

1)统计各个城市的城市发展相关指标,按照K-means算法进行初步聚类;

2)根据式(2)计算各类城市节点的广义城熵;

3)根据第2)步得到的广义城熵值和K-means算法进行二次聚类;

4)根据第3)步得到的二次分类计算新分类的广义城熵;

5)根据第4)步得到的广义城熵和K-means算法进行第3次聚类;

6)以此类推,经过若干次聚类(直至聚类效果满足λ<ε,ε为事先规定的精度)得到1个整体城市圈的城市节点分类结构图。

3 算例分析

3.1江西省已有的城市节点

江西省辖11个地级市,将这11个地级市视为整个待分类系统的节点城市,以这11个节点城市的人均GDP作为初始样本,根据广义城熵聚类模型提出的思路进行分类。

3.2江西省各个城市节点国民经济指标统计

2010年江西省各个城市国民经济指标统计如表1[8]所示。

表1 2010年江西省各个城市国民经济指标统计

3.3广义城熵聚类模型的运用

3.3.1 按照人均GDP划分

根据人均GDP,将各城市分为A类(人均GDP为48 000~60 000元)、B类(人均GDP为36 000~48 000元)、C类(人均GDP为24 000~36 000元)、D类(人均GDP为12 000~24 000元)、E类(人均GDP为0~12 000元),如表2所示。[9]

3.3.2 聚类

根据广义城熵聚类模型(选取聚类精度ε=0.5),得到基于人均GDP的各个城市节点分类的城熵如表3所示。

表3基于人均GDP的各个城市节点分类广义城熵

类别城市城熵1A类新余市0.3194B类南昌市0.3194C类鹰潭市、景德镇市、萍乡市1.3298D类九江市、抚州市、宜春市、吉安市、上饶市、赣州1.7346E类无0.1442

表4基于广义城熵1的城市节点分类

类别子类城熵2A1类D类2.4421B1类C类2.0373C1类无0.1442D1类A类、B类、E类1.6255

表5基于广义城熵2的城市节点分类

类别子类城熵3A2类A1类、B1类3.4382B2类D1类1.9793C2类C1类0.1442

表6基于广义城熵3的城市节点分类

类别子类城熵4A3类A2类3.9362B3类B2类、C2类2.4773

最终整个系统的广义城熵为5.488 2,可得基于广义城熵的聚类谱系图如图1所示。

图1 江西省城市节点聚类谱系图(基于广义城熵聚类模型)

3.3.3 聚类效果评价

1)聚类效果数值分析

聚类谱系图中第1~5层的入值分别为0.202 9、0.427 7、0.422 1、2.198 1、1.000 0。

① 广义城熵聚类模型的聚类效果总体上满足聚类精度要求,前3层的λ值均在0.5以内,这说明该模型在城市节点分类中具有一定的适用性和可操作性;

③第5层是最高层,只含1个元素,λ取值恒为1。

2)江西省城市节点聚类谱系图分析

根据城熵的实际意义和聚类结果,对江西省城市发展可得到以下结论:

① 九江市、抚州市、宜春市、吉安市、上饶市和赣州市6个城市的发展阶段比较一致;鹰潭市、景德镇市和萍乡市3个城市的发展状态比较一致;前6个城市、后3个城市在城市发展规划中应统筹考虑,并制定协调统一的共同发展战略;

② 从长远来看,C、D类城市节点(共计9个城市)应以系统的角度统筹规划其未来的发展;新余市和南昌市应统一考虑,协调规划。

4 广义城熵聚类模型适用性分析

广义城熵聚类模型是结合了广义城熵和K-means聚类思想的全新城市节点分类方法,通过上述算例的运用可知[10]:

1)由该模型得出的分类谱系图可以发现,对已有的城市节点的分类应打破地域范围上的物理界限,从更加尊重城市自身发展规律的角度,对发展稳定状态最接近的城市节点应统筹规划和协调发展;

2)该模型是城市节点分类方法的全新探索,打破了传统城熵思维,对聚类分析方法也是一种创新,具有很好的运用前景和发展空间;

3)该模型得到的分类谱系图建立于人均GDP样本数据,可用于指导新的城市经济社会发展规划和发展战略的制定;该模型的初试样本数据不只限于人均GDP等国民经济指标,若选取交通运输业的相关指标作为分析样本,得出的结果可用于新的城市交通发展规划和发展战略的制定。

然而,广义城熵聚类模型也存在以下不足:

1)该模型提出的聚类方法比传统的聚类分析方法复杂,数据处理的效率不高;

2)该模型每次分析的数据指标有限,不能更加全面地考虑各种聚类数据指标;

3)模型中分类数K的确定没有明确的确定方法,这导致不同的K会得出不同的聚类结果。

5 结语

改革开放以来,我国的城市化进程逐步推进,城市发展进入极化效应阶段。根据城市发展自身的演进规律,对城市圈内重要的城市(交通)节点进行合理而有根据的聚类分析显得尤为重要,文中得出的聚类谱系图为城市规划、城市发展战略的制定提出了打破传统地域限制、根据城市发展的稳定程度统筹协调考虑的探索。

本文提出的广义城熵聚类模型为城市节点的聚类分析是一种全新而可行的思路,但不能全面考虑各种聚类数据指标,分类数的确定也未提出明确可行的方法,这是进一步研究的方向。

[1] 朱文铜,卞兆洋,李海鹏,等.基于信息熵TOPSIS的公交线网优化方案排序[J].交通科学与工程,2013,29(3):72-76.

[2]王首续,杨静,郑秀珍.基于熵权的公路BOT项目建设风险的模糊综合评价[J].交通科学与工程,2010,26(3):89-94.

[3]王首续,朱鹏,乔鹏,等.基于PCA-Entropy的区域公路交通发展水平综合评价[J].交通科学与工程,2011,27(2):74-79.

[4]管楚度.交通区位论及其应用[M].北京:人民交通出版社,2000:34-37.

[5]王利娜,吴豪光.熵值估计法在城镇体系分析中的应用[J].西北建筑工程学院学报:自然科学版,2002,19(1):41-43.

[6]周月超.浅议交通节点区域的经济发展[J].物流技术,2006,26 (10):103-105.

[7]刘洋,马寿峰.基于聚类分析的非参数回归短时交通流预测方法[J].交通信息与安全,2013,31(2):27-31.

[8]江西省统计局.江西省统计年鉴2011[R].北京:中国统计出版社,2011.

[9]秦芳,周鹏飞.基于聚类的港口吞吐量预测方法及其适用性分析[J].水道港口,2011,32(3):223-228.

[10]李迅.中国城市演进中的区域差异及其对策[J].城市规划,2000,24(7):28-31.

CityNodeClassificationMethodBasedonClusteringModelofGeneralizedCityEntropy

DONGDao-jian

(SchoolofTransportationandLogistics,SouthwestJiaotongUniversity,Chengdu610031,China)

This paper starts from the shortcomings of traditional city entropy and puts forward the clustering model of the generalized city entropy to apply the city nodes′ classification to the entire urban circle. Based on the difference of urban development, the model is more scientific and reasonable and it can give better instruction to the cities′ long-term growth and promote the effective implementation of relevant policies and measures.

urban circle; city node; generalized city entropy; clustering analysis; generalized city entropy clustering model; sustainable development

郎伟锋)

2014-05-19

四川省科技支撑项目软科学计划(2010ZR0021)

董道建(1989—),男,江西上饶人,西南交通大学硕士研究生,主要研究方向为城市公交.

10.3969/j.issn.1672-0032.2014.03.006

TU984.191

A

1672-0032(2014)03-0026-05

猜你喜欢
广义江西省聚类
模拟成真
Rn中的广义逆Bonnesen型不等式
《江西省志•审计志》顺利通过验收
考了个大的
基于K-means聚类的车-地无线通信场强研究
从广义心肾不交论治慢性心力衰竭
基于高斯混合聚类的阵列干涉SAR三维成像
有限群的广义交换度
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例