基于多元ANOVA和主成分分析对我国城市交通健康的评价①

2020-02-28 05:08
关键词:城市交通延时健康状况

(安徽财经大学统计与应用数学学院,安徽 蚌埠 233030)

0 引 言

城市交通是一项密集而又复杂的工程。交通不仅关系到人们的日常出行和生活质量水平,也是提升城市功能、增强城市活力、促进城市经济稳定发展的重要因素。而随着社会经济的持续发展,城市交通的建设和规划也出现了一些问题,如私家车数目的增多导致城市交通系统瘫痪[1];红绿灯、斑马线等基础设施不完善导致交通事故的发生;道路资源分配不合理、交通监管不到位对机动车的秩序造成重大影响;司机、行人交通意识不强产生一些重大安全隐患等等。虽然很多城市在交通政策、建设、管理等方面做了很多努力,但从实际情况来看,大多数城市交通状况依然不容乐观。因此,本文拟用多元ANOVA、K-W检验以及主成分分析等方法,对我国部分城市的交通健康状况进行评价,根据所得结果提出参考性意见,希望能对各城市的交通规划起到一定的帮助。

1 城市地面道路交通健康评价指标体系的建立

1.1 指标体系建立

随着社会经济的发展,城市交通也变得越来越复杂。传统的单一评价指标已然不适用于当下的城市交通。本文融合考虑道路交叉口的延误时间,结合高德地图公布的数据,从时间、空间、效率三方面依次选取路网高峰行程延时指数、高延时运行时间占比、拥堵路段里程比、路网平均车速、道路运行速度偏差率和常发拥堵路段里程比共6个指标[2],对城市交通的健康状况进行全方位的评价分析。其中拥堵延时指数指的是乘客实际出行与畅通状态下所用时间的比值[3];高延时运行时间占比指代城市拥堵延时指数大于1.5的累计时长占比;拥堵路段里程比是根据城市道路网中各等级道路分别处于拥堵、严重拥堵的路段里程比例加权求和所得;高峰平均速度指的是城市道路网中驾车行驶的平均速度;道路运行速度偏差率指代道路网中平均速度标准差与平均速度的比值。具体指标体系如图1所示。

1.2 数据来源及假设

本文所用数据均来源于高德地图智慧交通业务中心发布的人口定位和交通流量大数据,主要包括香港、深圳、广州、哈尔滨等15个城市的交通数据,时间跨度为2019年4月1日至2019年6月30日,具体数据见高德地图智能CT实时诊断平台(https://report.amap.com)。为了便于问题的分析,本文需对所用数据做出以下假设:(1)各城市交通流量数据均服从正态分布;(2)各城市数据总体方差相等;(3)各城市之间的观测数据相互独立,不受彼此影响。

图1 “六宫格”-城市交通健康综合诊断

2 基于多元ANOVA对不同地域下城市交通健康的研究

2.1 理论基础

方差分析是研究自变量不同处理情况下,对因变量是否具有显著影响的统计分析方法,通过分析数据误差来源于随机误差还是系统性误差,从而判断出不同总体的均值是否相等[4]。若各总体均值相近,那么系统误差和随机误差就很接近,比值趋于1,当比值大到某种程度时,就说明不同总体之间存在着较大的差异,也就是不同的处理对因变量有显著影响。利用方差分析可以对不同城市的交通健康状况进行比较,其中自变量为各城市,因变量为各城市的交通流量指标。

2.2 研究方法及思路

本文拟从时间、空间、效率三个角度对城市交通健康状况进行研究,采用单因素多元方差分析法,根据香港、深圳、广州、哈尔滨等城市所处的地域,将各城市划分为东部、中部、西部城市三类[5],在前述假定条件成立的情况下,检验不同地域(经济带)的交通健康是否存在差异。与一元方差分析类似,首先建立原假设与备择假设:

H0:各地域交通健康状况无差异H1:各地域交通健康状况存在明显差异

即:H0:μ1=μ2=…=μk

H1:至少存在i≠j,使得μi≠μj

其次计算出各地域交通指标的均值向量:

然后计算出全部城市交通指标的均值向量:

最后将各平方和转化成离差阵:

组间离差阵

组内离差阵

总离差阵

用似然比原则即可构造威尔克斯统计量[6],利用F分布近似表示为:

将F统计量与临界值进行比较即可得出结论。

2.3 结果分析

将各城市交通指标数据导入SPSS软件,进行多元ANOVA分析,结果见表1。

表1 多变量检验表

由表可以清楚地看出,不同地域分类下,四种统计量的F值均大于1,概率P值均小于显著性水平0.05,模型通过了显著性检验,说明不同地域下城市的交通健康状况存在明显差异,即意味着我国东部、中部、西部城市的道路交通发展水平不均衡。软件同时输出了主体间效应检验表,可以看出地域的分类对城市交通延时指数等指标是否具有影响,具体输出结果见表2。

表2 主体间效应检验表

由表2可以看出,路网高峰行程延时指数、高延时运行时间占比和拥堵路段里程比3个指标的P值分别为0.014,0.040和0.005,均小于显著性水平0.05,而路网平均车速、道路运行速度偏差率和常发拥堵路段里程比3个指标的P值分别为0.723,0.671和0.500,均大于0.05,说明前三个指标在不同的地域中差异显著,后三个指标在不同地域无明显差异,而前者反映的是不同城市在时间、空间维度的交通状况,后者反映的是不同城市在效率维度上的交通状况,这就验证了前文所述不同地域下城市的交通健康存在明显差异的结论。一般来说,中东部地区由于经济基础较为雄厚,基础设施较为完善,路网密度更加复杂,人流量以及车辆数目也较西部增多,因此乘客的高延时时间以及拥堵路段所占比例均比西部大,中东西部交通情况也就存在一定的差异。而由于西部地区地貌、土壤以及交通设施等方面的弱势,路网建设较为缓慢,乘客驾车出行的速度往往受到一定的限制,因此中东西部城市的平均驾车车速也就相差不大。

3 基于Kruskal-Wallis检验对不同城市交通拥堵延时指数的比较

3.1 研究方法及思路

K-W检验是非参数统计方法中用于检验多个独立总体位置参数是否相同的一种检验方法[7],因其限制条件少、不受限于数据分布的优点被广泛应用于实际生活中。拥堵延时指数指的是乘客实际出行时间与畅通状态下所用时间的比值,某种程度上可以代表某个城市的交通状况,比值越小则说明该城市的交通状况越为健康。因此本文拟用K-W检验法对不同城市的拥堵延时指数进行比较,分析不同城市的交通健康差异情况。

3.2 分析过程

(1)秩统计量的计算

以香港、深圳、广州、哈尔滨等15个城市一周内的拥堵延时指数数据为基础,原假设为各城市延时指数不存在明显差异,计算出混合样本后各观测值的秩,整理后部分结果见表3。

表3 部分城市秩统计量表

其中各城市一栏,上面一行为各城市一周的交通拥堵延时指数,下面一行为计算出的各观测值的秩,由此即可计算出各城市的组间平方SSB和与组内平方和SSE,进而计算出均方误差,具体结果见表4。

表4 多元ANOVA分析结果

(2)计算结果及分析

利用公式即可计算出H统计量的值及伴随概率:

P=chi2tail(dfb,H)=chi2tail(14,61.8076)≈0

由于伴随概率趋于0远小于0.05,因此有充分的理由说明这15个城市的交通延时指数存在较大的差异,也就是说不同城市间的交通健康状况显著不同,结合各城市一周平均延时指数(图2所示)可以发现,武汉市的一周平均延时指数为1.48,远低于其他城市,说明武汉市的交通状况最为健康,而广州、哈尔滨、上海以及贵阳的交通拥堵延时指数均在1.8左右,说明这四个城市的交通状况较差,其余城市处于中间位置,交通健康状况一般。

图2 15个城市交通拥堵延时指数图

4 基于主成分对不同城市交通健康的排名分析

4.1 理论基础

主成分分析类似于因子分析,是多元统计领域中常用的方法之一,在最大程度上保留原始变量信息的情况下,简化变量的个数,通过综合得分对样品进行排序分析和评价[8]。随着多元统计方法的深入与发展,主成分分析已被应用于多种经济效益评价问题。本文采用主成分分析法,计算出香港、深圳等15城市的主成分得分,在此基础上计算出综合得分并排名,从而做出全方位的交通健康评价。

4.2 研究方法及思路

主成分分析模型可简述为:样本x=(x1,x2,…,xp)′为P维随机向量,均值为E(x)=μ,协差阵为Var(x)=Σ,对原始变量进行一系列线性变换,得到新的一组随机变量,即:

y1=a11x1+a12x2+…+a1pxpa1′x

y2=a21x1+a22x2+…+a2pxpa2′x

yp=ap1x1+ap2x2+…+appxpap′x

计算出的得分排名即反映出各样品在所有样品中的地位。

4.3 过程分析

(1)可行性分析

主成分分析主要将原来一组相关变量线性变换成一组新的相互无关的变量,因此原始变量间必须要有较高的相关性[10]。利用软件对数据进行KMO检验,输出KMO值为0.673,说明这六个变量间存在一定的相关性,因此可以对样本数据进行主成分分析。

(2)主成分提取

分析前先对变量数据进行标准化处理,SPSS软件输出了主成分的提取结果以及每个主成分的方差贡献率,详细结果见表5。

表5 总方差解释

可以发现,前2个主成分的特征根均大于1,累计方差贡献率达到了84.428%[11],且公因子方差表显示6个指标的信息提取率均为80%左右,说明大部分信息已被提取,因此提取2个主成分较为合适,将软件输出结果进行整理,得出第一、二主成分表达式为:

Y1=0.5326x1+0.4323x2+0.3565x3-

0.0456x4+0.3775x5+0.5077x6

Y2=0.0052x1-0.1889x2+0.5338x3+

0.7115x4-0.3929x5+0.1367x6

(3)主成分得分及综合得分计算

在上述主成分提取结果的基础上,使用EXCEL软件计算出15个城市的第一主成分得分和第二主成分得分,并以各方差贡献率加权求和,计算出综合评价得分,整理后的结果见表6。

表6 各城市主成分得分及综合得分

4.4 结果分析

本文在计算各城市得分时,对逆向指标做了正向化处理[12],因此得分越高说明该城市的交通健康状况越为理想。由表6可知,综合得分排名前三的城市分别为武汉市、合肥市和西宁市。武汉市作为国内最大的水陆空交通枢纽,具有得天独厚的区位优势,结合原始数据可以发现,武汉市无论在延时指数、运行时间占比还是拥堵路段里程比方面,数值均比其他城市小,说明武汉市的交通健康状况在15个城市中最优,且主成分排名结果与上述K-W检验结果一致,说明了结论的稳定性。合肥市处于华东腹部,交通十分方便,并且全市航空、铁路、公路设施互相衔接,已形成立体化交通网络,并且合肥市正在施行的“大建设”项目增修了数十条新建道路、桥梁,因此合肥市的交通状况处于健康状态。西宁市地处青海东部,四面环山,城市道路设施总投资高达20亿,城市东西川和南北川的“十字规划”对于西宁市的交通发展起到了一定的作用,交通情况也较为乐观。反观排名靠后的重庆市以及贵阳市,由于人口和交通流量的快速增长,城市道路面积建设过慢,导致路网和车辆增长比例不合理,干道系统和交通层次模糊不清,道路利用率较低,交通设施缺乏前瞻性,市政府虽努力做了许多改善工作,但总体来说,效果并不显著。将两个城市的各项指标数据绘制成“六宫格”分布图,如图3所示。

图3 贵阳市与重庆市“六宫格”分布图

图中蓝色线表示贵阳市的交通指标数据,橙色线表示重庆市的交通指标数据,指标越接近顶点则说明该城市交通状况存在越重的偏差。由图3可以发现,两个城市的指标数据与标准数据比较,均存在较大的偏移,六宫格的形状均偏向一侧。贵阳市拥堵路段里程比指标偏差较大,高峰平均速度、路网高延时运行时间占比指标较为良好;重庆市高峰延时指数较为突出,且骨干道路速度偏差率波动较大,高峰平均速度相对较好,说明这两个城市的交通规划在效率方面表现良好,但是空间利用方面均存在一些缺陷,需要进行针对性的措施,如加大路网建设等等。由此看来,两个城市的交通健康状况仍需改善,主成分分析结果较为合理。

5 结 语

通过对各城市的“六宫格”分布图进行比较,发现得分较低的城市普遍在空间、时间两个维度上存在显著偏差,因此,本文针对这两方面拟对部分城市提出参考意见,主要有以下几条:

(1)完善交通基础设施,优先发展公交战略

完善基础设施,发展公共交通是世界各国解决城市交通的共识。一方面,基础设施的完善会提高道路通行效率,另一方面,公交车数目的增多会导致私家车数量的减少,这样既可以减轻交通拥堵的时间性,也可以缓轻交通拥堵的空间性。市政府应该对有缺陷的公共交通基础设施进行维修改进,如合理设置红绿灯、斑马线、公交车停靠点以及停车道,维修或增设新的桥梁路段等等。

(2)制定城市交通规划,调整公交管理体制

制定好城市的交通规划也是改善城市交通状况的重要环节,关键是要实现资源和效率的最佳配置。市政府应该综合考虑城市的道路建设情况以及公交车数量,以定性定量相结合的方式,分析出每种交通的占比,得出优先配置方案。此外,市政府应该积极建设现代化公共交通网络,调整相关的公交政策与体制,加大对公交建设的投入,从而提高公共交通的效率。

(3)充分发挥交通职能,提高部门管理水平

城市交通拥堵的现状也体现出该城市交管部门的管理水平。因此,充分发挥相关部门的交通职能,提高管理水平也是优化城市交通系统的关键所在。市政府应该加大对交管部门的投入力度,努力建设一支纪律严明、作风优良、为人民服务的交管部队,做到依法执法,为民执法。

(4)改善城市空间结构,建设多中心网络城市

大多数的城市都是“中心-放射”状城市布局[13],处于郊区及边界的居民都具有向市中心发展的趋势,由此一系列“社会经济聚焦“活动就会强化城市核心,导致城市出现交通拥堵、城乡两极分化等社会问题,所以城市空间布局是否合理也会影响着交通的健康状况。因此,市政府必须深入研究城市的布局构造,建设多个副中心,形成“中心-副中心”的现代化城市网络布局,合理配置城市资源,层层优化城市的功能分区,进而有效缓解城市的交通压力。

猜你喜欢
城市交通延时健康状况
昆明市大学生口腔健康状况调查
基于级联步进延时的顺序等效采样方法及实现
老龄化背景下关于城市交通适老化对策的思考
持续跟踪 精准发力 充分发挥世行在城市交通建设中的引智引资作用
日光灯断电关闭及自动延时开关设计
共享单车对城市交通的影响
共享单车对城市交通的影响
围绕城市交通出行,博世打造兼具软件和服务的数字化企业
宋湘延时答妙对
桑塔纳车发动机延时熄火