基于网约车数据的级联城市区域分析框架研究

2024-01-07 08:36李小楠白燕娜
关键词:级联栅格出租车

于 娜, 李小楠, 白燕娜

(1.河北师范大学 计算机与网络空间安全学院,河北 石家庄 050024;2.宣化科技职业学院 信息工程系,河北 宣化 075100; 3.河北师范大学 职业技术学院,河北 石家庄 050024)

0 引 言

城市区域在人类生活中起着重要作用,合理聚集城市区域可以帮助人们更好地理解城市.地理空间数据(如手机数据、出租车出行数据、公共自行车租赁记录、网约车数据)提供了大量的信息,推动了对城市区域分析的研究.Pedro等[1]探讨了如何利用手机数据分析门到门的出行时间.Dujardin等[2]利用移动电话数据研究城市气候变化.Zhao等[3]通过深度模型统一Uber和出租车数据,预测出租车乘客需求,感知全市人群流动.Charles Alba等[4]使用手机数据研究在COVID-19流行期间,美国国家公园的访问模式在有色人种社区之间发生的变化.

与上述地理空间数据相比,出租车出行数据不仅能更准确地反映城市地区的出行特征,而且能更灵活地反映城市地区的真实交通流量.出租车数据记录了大量的GPS轨迹点,很多研究利用出租车出行数据中上车点和下车点信息分析城市.Qin等[5]基于出租车GPS数据识别出租车的区域级通勤模式.Liao等[6]利用移动出租车留下的部分GPS轨迹预测出租车乘客的目的地.Zhang等[7]利用出租车轨迹数据中出租车出行次数构建单元网络研究出租车出行需求.

上述城市区域相关研究倾向于从上车点和下车点的出行频次进行分析,而忽略时间因素对区域的影响.此外,现有的城市区域研究大多侧重于在某一方面(城市功能、城市空间格局等)进行分析,对城市区域从不同层次进行评价和分析的研究较少.因此,本文首先提出了一个区域时空行为指标(ABI),在分析区域关系时既考虑了地理空间上来往的通勤次数,也考虑了通勤所花费的时间代价.并在此基础上提出了使用多种指标分析城市区域的级联框架(CUAAF),帮助人们从不同层次了解城市区域的动态变化,获得更详细的城市区域信息.

1 研究区域和数据

石家庄是河北省的省会,它发挥着河北省商业和金融中心的作用,城市化发展迅速.本文的研究区域是石家庄市全部22个区.

随着创新交通服务的不断增加,网约车服务因其便捷和优惠的价格具有很高的竞争力[8].本文使用的数据是石家庄一周的网约车数据.在对原始数据进行预处理后,每条数据记录包含上车位置 (经纬度)、下车位置 (经纬度)、开始时间、结束时间等6个字段,如表1所示.

表1 数据格式Tab.1 Data Format

2 CUAAF级联城市区域分析框架

2.1 ABI时空指标

人们通常用空间关系来分析城市区域,时间信息容易被忽略.为了解决这个问题,本文提出一个新时空指标ABI来计算栅格之间的相关性.ABI既考虑了2个栅格之间来往的通勤次数,也考虑了2个栅格通勤所花费的时间代价.其定义为:

(1)

其中,Cc(i,j)表示栅格i和栅格j之间的紧密程度,Ct(i,j)表示栅格i和栅格j之间的皮尔森相关性.具体公式如下:

(2)

(3)

图1 ABI流程示意图Fig.1 ABI Flow Schematic Drawing

当计算出ABI之后,每一个栅格当作节点,ABI是连接节点之间的权重,构建栅格区域行为网络.最后,运用Louvain算法,对该网络进行分析得到相应的聚类结果.

2.2 CUAAF框架

为了分层地反映城市区域的实际社会活动,本文提出了一个级联分析框架(CUAAF),通过分析网约车数据,研究城市区域的时空特性,对城市区域进行聚类.该框架过程如图2所示.

图2 CUAAF框架图Fig.2 CUAAF Frame Diagram

首先,城市被划分为多个地理栅格.任意2个栅格之间的相关性由区域行为指数(ABI)来评估.接着,根据相关性得到一个相关矩阵,它描述了每个栅格对之间的相似性水平.然后,可以得到一个加权栅格网络,其中每一个节点代表一个栅格,栅格之间的相关性是节点之间的权重.最后,采用社区发现技术分析其微观结构,获得聚类区域.

近年来,社区发现算法已经在很多领域得到应用[9-14].本文采用社区发现算法中的Louvain算法[14]获得聚类结果.该算法在网络分析中的优点是不需要事先输入聚类数量,因此减少了主观因素的影响.此外,本文采用默认参数进行运算,避免了调参给算法带来的不确定因素.

图2a和图2b显示城市被划分成多个栅格.图2c对于每个栅格,使用框架下的指标ABI来计算任意一个栅格与其他栅格之间的相关性.图2d是相关性矩阵.接着通过相关性矩阵来定义无向加权网络图2e,该网络使用Louvain算法进行聚类,结果绘制在城市地图图2f上.

3 实验结果

3.1 使用ABI指标CUAAF的聚类结果

为了理解城市区域的时空关系,用ABI指标分析了石家庄全部的22个行政区,结果如图3b所示,城市地区被聚类成多个社区.

图3 石家庄区域划分(a)石家庄行政区域划分结果(b)使用ABI得到的聚类结果Fig.3 Shijizhuang Regional Division (a)Administrative Division of Shijiazhuang (b)the Clustering Result Obtained by ABI

与图3a石家庄行政划分图相比,大多数社区的地理分布与行政区域相似.然而,可以发现,一些社区与行政区域不同,特别是在发展较快的市中心区域.新华区、桥西区和鹿泉区的一些地区属于同一个社区(图3b红色).长安区和裕华区都被分为两部分,长安区的一部分和裕华区的一部分成为一个社区(图3b蓝色),其余的长安区和裕华区成为另一个社区(图3b浅灰色).可以看到,随着经济和交通的影响,某些行政区域会打破界线,产生时空关系,成为联系紧密的社区.

3.2 使用级联CUAAF的聚类结果

上述分析区域覆盖范围大,结果相对宏观,针对某些小范围区域,比如图3b中的蓝色区域,可以将蓝色区域再次输入到CUAAF模型中,进行下一级分析.级联模型的各级指标既可以用ABI指标,也可以选择具有其他功能的指标.因此,级联CUAAF模型有多种级联方式,可以分析各区域间不同类型的关系.

在本文的级联示例中,第一级采用区域活跃模式指标(area active pattern index,AAPI),第二级采用区域功能指标(area function index,AFI)进行级联分析.AAPI用来分析区域活跃模式,其定义为:

AAPI=Pearson(li,lj),

(4)

其中,li是描述栅格i每小时上下车次数总和变化的列表.

AFI用来分析区域功能.AFI具体计算公式如下:

(5)

本文以AAPI+AFI为例进行级联分析目的在于探索同一活跃模式的区域在功能上有哪些异同.使用级联指标AAPI+AFI聚类得到了13个社区(分别是0_0到4_1.其中,前面的数字表示的是区域活跃模式,后面的数字表示的是区域功能).为了较准确的识别区域功能,本文对级联指标得到的社区进行了POI统计,统计结果如图4所示.

图4 级联指标POI占比图Fig.4 Proportion of Cascade Index POI

颜色的深浅代表着每一类中POI的占比,颜色越深,表示POI占比越高,反之,表示POI占比越低.由图4可知,每一个社区POI频次的占比并不相同,属于同一活跃模式的社区,它们的POI占比也并不相同.为了更好的标识,对属于同一活跃模式的社区2_0和社区2_1流出量(上车频次-下车频次)进行了对比,流出量对比图如图5所示.

图5 社区2_0和社区2_1流出量对比图Fig.5 Comparison of Outflow from Community 2_0 and Community 2_1

横坐标表示一天24小时,纵坐标是归一化之后的流出量,范围是-1到1之间.社区2_0在早上8点到9点流出量是0.58达到了一天的最大值,在下午17点到18点以后流出量几乎都为负值.与此同时,在图4的POI占比图中,社区2_0地产小区(residence)的占比超过或者接近总数的一半(0.48),可见,社区2_0是住宅区.与社区2_0在早上大部分人离开,下午到达的趋势相反,社区2_1在早上8点到9点之间,流出量是-0.72达到了一天中的最小值.在下午17点到18点之间,社区2_1流出量是0.23达到了一天中的最大值,这是典型的工作区模式.

3.3 工作日和周六日对比

我们分别在工作日和周末应用该框架进行分析.ABI指标在工作日得到的聚类城市区域与周末大体上是相似,但是在某些区域仍存在差异.图6显示了工作日和周末社区的详细比较.

图6 ABI聚类结果对比图 (a)工作日聚类结果 (b)周六日聚类结果Fig.6 Comparison of ABI Clustering Results (a)Weekday Clustering Results (b)Weekend Clustering Results

图6a红色社区所示,位于鹿泉区的一些地区(地理位置划分如图3a所示)在工作日与市中心区(新华区、桥西区)属于同一个红色社区.耐人寻味的是,在图6b中,这些地区的一部分和鹿泉区的其他地区在周末成为一个黄色社区.这可能是因为周边的人们选择周六日去鹿泉的景点游玩,导致周末这些区域关系紧密且属于同一个社区.

4 结束语

本文提出的CUAAF框架从区域时空关系对城市区域进行级联聚类分析.在分析区域时空关系上,提出了一个新的综合指标ABI,不仅考虑了来往的通勤频次,还考虑了花费的时间代价.使用该指标获到聚类区域后,可以将感兴趣的区域再次输入到CUAAF中,使用指标进一步分析细节信息.该过程可以反复进行,形成级联分析的结果.

通过构建基于网约车数据的级联框架,深入了解区域之间的关系,从时空角度研究城市区域的动态变化,并从不同层次分析城市区域,获得不同分辨率的城市信息.同时,也提出了城市规划和城市功能优化的参考性建议以促进城市的科学发展.未来的研究可以集中在以下方面:首先,可以尝试采用路网相关的区域划分方法预处理数据.其次,可以引入相关的融合数据来分析城市区域,例如出租车,公交车和共享单车等.

猜你喜欢
级联栅格出租车
基于邻域栅格筛选的点云边缘点提取方法*
乘坐出租车
凭什么
级联LDPC码的STBC-OFDM系统
基于级联MUSIC的面阵中的二维DOA估计算法
开往春天的深夜出租车
李书福炮轰出租车
不同剖面形状的栅格壁对栅格翼气动特性的影响
基于CVT排布的非周期栅格密度加权阵设计
LCL滤波器在6kV级联STATCOM中的应用