轨道交通站点聚类及其对客流预测的影响分析

2023-12-28 02:54户佐安邓锦程杨江浩赵妍
交通运输系统工程与信息 2023年6期
关键词:进站高峰客流

户佐安,邓锦程,杨江浩,赵妍

(1.西南交通大学,a.交通运输与物流学院,b.综合交通大数据应用技术国家工程实验室,c.综合交通运输智能化国家地方联合工程实验室,成都 611756;2.成都信息工程大学,资源环境学院,成都 610225)

0 引言

随着城市结构不断升级,城市轨道交通已成为大中城市不可或缺的公共出行工具。截止2022年底,我国城市轨道交通累计投运车站总数达5875座,年客运量达193.02 亿人次[1]。城市轨道交通车站不仅是其网络的关键节点,也是城市结构的重要构成,站区出行活动与土地利用具有深度耦合关联,受出行活动和土地利用的演化与交互作用,各站点特性具有显著性差异,对站点进行精细化分类,进而精准推测不同类型站点的客流演化趋势,为车站精细化运营管理及周边设施建设提供参考。

城市轨道交通站点聚类方面,涉及特征提取和聚类方法等内容。特征提取类型可以分为客流特征、土地利用特征和网络特征等。客流特征中,一类是,从时序数据中计算指标进行刻画,例如,尹芹等[2]关注客流的形态特征和结构特征,计算进出站峰值、偏度、不均匀系数及高峰小时系数等指标;李子浩等[3]关注客流的时间分布特征,提取不同时段客流比例、不同天数客流比例和换乘客流比例等特征。另一类是,直接对时序数据近似表示,进行降维处理,并保留局部特征,例如,ZHANG 等[4]引入符号集合近似(Symbolic Aggregate approximation,SAX)方法对时序数据有效降维,并建立基于小波变换和SAX 的多变量时间序列的两阶段聚类模型。土地利用特征通过计算站点辐射区兴趣点(Point of Interest,POI)统计指标表征用地强度、均匀性以及多样性等。网络特征通过计算网络性质指标反映交通能力,例如,高勃等[5]以度和介数两个物理拓扑指标以及客运量为特征对站点和区间进行分类。一些研究组合了上述特征,例如,XU 等[6]基于客流和土地利用双重视角提取特征,包括基于时序数据的统计特征、基于动态时间规整(Dynamic Time Warping,DTW)的时序类型特征、基于POI 数据的统计特征和环路位置特征;ZHOU 等[7]基于网络和客流双重视角提取特征,其中,网络方面,提取度和介数中心性等特征,客流方面,从进站客流、出站客流和基于PageRank 算法的通过流中提取特征。聚类方法可以分为基于划分的聚类、基于层次的聚类和基于模型的聚类等。基于划分的聚类常见方法有K-means及其衍生算法,例如,蒋阳升等[8]采用K-means++算法,通过肘部法则确定簇数。基于层次的聚类常见方法有分裂型和凝聚型层次聚类,例如,LI等[9]采用凝聚型层次聚类,并以赤池信息量准则确定簇数。基于模型的聚类常见方法有高斯混合模型和神经网络模型聚类,例如,李清嘉等[10]采用高斯混合模型聚类,并用期望最大算法求解,通过贝叶斯信息判别标准确定簇数。

客流预测方面,目前,多数研究试图开发复杂模型充分挖掘站点间时空关系,以提升预测性能,这需要大量数据用于训练,以增强模型的表达能力。在有限的数据集下如何提升简单模型的预测性能是值得探索的问题,对于常态客流而言,其具有较强的平稳性,即在一定时间范围内,出行模式相对稳定,同一站点未来客流变化与历史客流呈现相似的趋势,通过聚类使用相关性强的数据将更好地训练预测器。已有研究表明,结合聚类方法对数据集进行预处理有效提升了预测性能,例如,ZHANG等[11]通过聚类算法将具有多变量特征的日期划分为不同的簇,并为每个簇建立具有注意力的Seq2Seq 模型预测风能,验证了聚类与预测方法结合使用,提高了预测准确性;SHAHZADEH 等[12]通过3种特征提取方式对用户进行聚类,并为每个集群训练神经网络模型预测用电负荷,相比于单独的预测模型,聚类后均显著提高了预测精度;ZHANG等[13]通过两步聚类模型对轨道交通站点进行聚类,通过相似性和平稳性测试推荐各簇预测粒度,并验证了基于集群的LSTM 优于独立的LSTM 模型。聚类虽然降低了样本量和训练模型泛化能力,但增强了数据集的相关性,对于平稳性强的数据集而言,聚类后再预测的思路具有普遍有效性,在一定预测期内有助于提升模型性能。

依托大数据和结合机器学习方法解决轨道交通站点分类及客流预测问题是研究趋势所在,站点聚类方面,目前,研究多从客流层面挖掘特征,然而,站点间时空异质性是多层面因素作用的结果,鲜有研究综合多源数据,提取多类特征实现站点精细化分类;客流预测方面,目前,研究多从捕获时空相关性入手提升预测性能,关于站点聚类对于客流预测性能的效用探讨较少。基于此,本文统筹考虑地铁刷卡数据、POI 数据以及地铁网络数据,客流层面,除考虑客流时间分布特征外,还考虑出行模式及日期类型差异等;土地利用层面,从POI 数据中挖掘站点辐射区用地强度和均衡性指标;网络特征方面,从站点自身特征和影响能力考虑,提取度中心性、接近中心性和介数中心性指标,基于K-means++聚类算法对站点精细分类,并揭示不同类型站点多维度特性。在此基础上,建立多元时序预测模型,设计簇内联合预测和整体联合预测策略,探究站点聚类对客流预测性能的影响。

1 数据处理与特征提取

1.1 地铁刷卡数据处理与客流特征提取

使用2022 年5 月23 日~29 日连续一周以近邻节假日成都市地铁刷卡数据,并做如下预处理:

(1)删除冗余和错误的刷卡记录,剔除刷卡记录不完整的站点,最终选择262个轨道站点作为研究对象。

(2)以6:30-22:30 为研究时段,1 h 为时间间隔统计进出站客流,共16个时段,构建各站点进出站时序序列。

(3)为避免站点间客流差异大和站点进出站客流不均衡问题,将进出站时间序列拼接后,采用Min-Max方法按站点归一化处理,构建各站点进出站差值时间序列。

考虑客流的时变特征,各站点客流在时间分布上存在差异,主要体现于不同时段和不同日期。为刻画不同时段进出站客流分布的差异性,计算各站点各时段进站和出站客流占比,由于工作日与周末各自出行模式相对固定,其客流分布具有较强的一致性,为避免维度灾难,计算工作日与周末各时段客流占比的平均值。计算式为

各站点承担的客运量存在差异,为刻画各站点吸引和产生客流量的差异性,计算工作日和周末各站点进出站客流量占全部站点进出站客流量比例,计算式为

此外,站点差异不仅反映在客流时间分布和客运量上,还体现于出行活动模式,在客流层面,表现为进站与出站的时变差异。为刻画各站点出行活动模式差异,基于进出站差值时间序列,计算各站点各时段的累计客流差,计算式为

通过对工作日的累计客流差平均值进行聚类,分析各类站点在工作日出行活动模式的差异,如图1所示。类型1的站点全天进出站客流处于相对均衡状态;类型2 和类型3 的站点表现为早高峰出站集群增加,晚高峰进站集群增加,这类站点呈现出明显的工作地通勤特征,其中,类型2 的站点在平峰期恢复稳定,进出站客流处于均衡状态,类型3 的站点在平峰期略有波动;类型4 的站点早高峰进站集群增加,而晚高峰无明显进出站集群现象,类型5 和类型6 的站点表现为不同程度的早高峰进站集群增加和晚高峰出站集群增加,呈现出明显的居住地通勤特征。

图1 6类站点工作日累计客流差平均值的时间分布Fig.1 Time distribution of average cumulative passenger flow difference on weekdays at 6 types of stations

上述特征以常规一周的客流数据提取,而一些站点的客流特征在节假日更加凸显,例如,风景区辐射站点引发客流聚集。为刻画日期类型差异引起的客流特征差异,计算节假日各站点各时段客流占比、累计客流差和各站点客流总量占比等指标。

1.2 POI数据处理与土地利用特征提取

为与客流数据在时间上保持一致性,使用2022年高德地图的POI数据和OpenStreetMap的轨道交通站点线网数据。其中,影响出行活动的POI分为12类,包括:餐饮、公司企业、购物、交通设施、金融、酒店住宿、科教文化、旅游景点、商务住宅、休闲娱乐、医疗保健和运动健身。

为刻画站点辐射区的土地利用水平,需建立站点缓冲区作为站点辐射区,站点辐射范围一般根据10 min 步行距离设置,本文将缓冲区半径设为800 m[14]。计算站区各类型POI 数量与均值之比反映站区的用地强度,优势度指数反映站区的用地均衡性程度,计算式为

式中:Zj为站点j辐射区的土地优势度指数;为站点j辐射区第c类POI占比;u为POI类型总数。

出行活动和土地利用具有深度耦合关联。不同类型POI与不同时期客流空间分布如图2所示。

图2 不同类型POI与不同时期客流空间分布Fig.2 Spatial distribution of different types of POIs and passenger flow in different periods

图2(a)和图2(c)为商务住宅和公司企业两类POI在各站区的分布情况。总体来看,市中心站区两类POI 均密集,此外,商务住宅在大部分轨道交通线路端部站区较为密集,公司企业密集区呈现由市中心向四周拓展的特点,且向南拓展最为显著。图2(b)和图2(d)为工作日7:30-8:30 站点进出站客流的空间分布情况。对比图2(a)和图2(d)发现,7:30-8:30 进站客流分布与商务住宅密集区空间分布类似,7:30-8:30出站客流分布与公司企业密集区空间分布类似。此外,服务类POI密集的站区更能吸引周末客流,图2(e)和图2(f)分别为站区餐饮、购物和休闲娱乐这3 类POI 总数的空间分布情况,以及站点周末出站平均小时客流的空间分布情况,两者空间分布类似,说明餐饮、购物和休闲娱乐这3类POI密度高的站区对周末客流有一定的吸引作用,即使站点离市中心区较远。

站区城市功能中的差异会在特定时段体现于其服务的客流层面上,但具有时空异质性,即客流与土地利用性质的关联性在时空上存在差异,例如,工作日就业类用地密度高的区域出行活动强度大,非工作日服务类用地密度高的区域出行活动强度大,土地利用特征能够更好反映站区的城市功能,因此,辨析站点类型时融合土地利用特征是有效的。

1.3 网络特征提取

根据成都市地铁网络构造拓扑图,记为G=(V,E),其中,V代表站点的集合;E代表边的集合,若站点j和站点n在任意一条地铁线路上相邻,则构造边ej,n,j,n∈V。

网络特征能有效地刻画站点的连通性和重要性。先考虑站点自身特征,提取度中心性(Degree Centrality,DC)和接近中心性(Closeness Centrality,CC)两个指标。DC 用来刻画站点邻居的数量,反映乘客在站点可选择的出行方向。CC考虑站点与其他站点的接近度,即到其他站点的平均最短距离,反映站点在整个网络中的连通性。计算式为

式中:Dj和Cj分别为站点j的度中心性和接近中心性;为站点j的度;dj,n为站点j和站点n的最短路径距离;N为站点数。

此外,除了站点自身特征以外,站点对其他站点的影响能力也应纳入考虑。例如,多个OD(Origin-Destination)对的最短路径经过同一个站点,则这个站点承担的运输功能至关重要,若其失效会影响大量站点的客流状态。提取介数中心性(Between Centrality,BC)指标,用来刻画站点在客流传播时的影响能力,即网络中所有节点对最短路径中经过某个节点的条数。计算式为

式中:Bj为站点j的介数中心性;nmn为站点m和站点n的最短路径数;为站点m和站点n的最短路径且经过站点j的条数。

站点的网络特征差异一定程度上反映在进出站以外的客流层面上,例如,度中心性和介数中心性大的站点会产生更多的换乘客流和形成高断面客流,因此,辨析站点类型时,融入网络特征能更好地刻画其承担的运输功能。

2 特征降维与聚类分析

综上所述,从多源数据中提取了166个特征刻画站点间多层面异质性,其中,包括:工作日、周末和节假日不同日期类型下的150个客流特征,13个土地利用特征和3 个网络特征。实现站点精细分类及分析的整体思路如图3 所示,包括:特征提取与降维、聚类和结果分析,其中,结果分析包含客流分布分析、特征指标分析和预测分析。

图3 站点聚类及分析框架Fig.3 Framework for station clustering and analysis

2.1 特征降维

由于提取的特征数和样本量接近,为提高聚类效果,降低冗余特征的影响,采用主成分分析(Principal Component Analysis,PCA)实现特征降维。PCA通过对协方差矩阵进行特征分析,选择主成分方向以保留大部分方差信息。PCA 的主要步骤如下:

(1)对样本所有特征进行Z-score 标准化处理,消除各特征量纲的影响,假设标准化处理后的特征矩阵为X=[x1,x2,…,xp] ∈RN×p,其中,p为特征的个数,xp为全部站点的第p个特征。

(3)对样本的协方差矩阵进行特征分解。

(4) 选择最大的q个特征值对应的特征向量W=[w1,w2,…,wq] ∈Rp×q,其中,wq为第q个特征值对应的特征向量,将特征矩阵X映射到W构成的q维空间中,即新特征矩阵为X'=[Xw1,Xw2,…,Xwq] ∈RN×q。

2.2 K-means++聚类算法

K-means 算法以簇内误差平方和(the Sum of Squares due to Error,SSE)为目标,采用欧式距离作为相似性度量,将数据划分为预定义的K簇。K-means++算法改进了初始聚类中心的选取策略,核心思想是选取距离尽可能远的样本作为初始聚类中心,以提升聚类的准确性[15]。K-means++算法需预先确定簇数,本文通过综合考虑SSE、轮廓系数(Silhouette Coefficient,SC)和Davies-Bouldin 指数(Davies-Bouldin Index,DBI)等指标确定,其中,SSE反映簇内样本与簇中心的紧密程度,SC和DBI反映簇内密集程度和簇间分散程度,计算式为

式中:ct为第t簇中心;S1,S2和S3分别为SSE,SC和DBI 指标值;Ot为第t簇样本集合;O为全部样本集合;nt为第t簇样本的个数;z为簇数;为样本o与第t簇中心ct距离的平方;ao为样本o与簇内其他样本的平均距离;bo为样本与最近簇样本的平均距离;σt为第t簇样本到簇中心的平均距离;为第t簇中心ct与第x簇中心cx的距离。

2.3 客流分布及特征指标分析

各评价指标随簇数的变化趋势如图4所示,当簇数为10时,SSE下降趋势变缓,且SC和DBI均处于较优值,因此,将站点划分为10簇最合理。根据聚类结果,绘制各簇站点不同日期类型客流比例时间分布曲线如图5所示,每个时段以箱线图反映簇内不同站点的波动情况。各簇特征指标热力图如图6 所示,包括:各类型POI 数量与均值之比的占比、POI总数与均值之比、度中心性、介数中心性和接近中心性。

图4 不同簇数对应的评价指标曲线Fig.4 Evaluation index curves corresponding to different cluster numbers

图5 各簇不同日期类型进出站客流比例时间分布Fig.5 Time distribution of proportion of inbound and outbound passenger flow of different date types in each cluster

图6 各簇特征指标热力图Fig.6 Heat map of characteristic indicators of each cluster

簇1~簇4 站点在工作日呈现不同程度的进站早高峰和出站晚高峰的单峰潮汐特点,其中,簇4站点高峰特征最为显著,进站早高峰小时中位数客流比例达到28.52%,出站晚高峰小时中位数客流比例达到24.62%,且早高峰进站持续时间长,为7:30-9:30,此类站点居住导向特征明显;在周末和节假日,高峰特征均明显减弱,其中,簇1站点在节假日呈现出站早高峰,但高峰时段向后推移,为9:30-10:30,簇2 和簇3 站点以弹性出行需求为主,较为均匀地分布于各时段,其客流分布差异主要体现在节假日出站,簇4站点在节假日和周末均出现出站晚高峰,且持续时间相较于工作日延长,为17:30-20:30。

结合站区土地利用和站点网络性质分析,总体而言,簇1~簇4站点土地开发强度和网络性质处于较低水平,其中,簇1站点购物消费用地占比高,对于周末和节假日客流具有一定吸引力,但此类站点接近中心性最低,说明此类站点基本位于线路端部车站,客流吸引范围较小;簇2和簇3站点建成环境较为类似,各类用地均衡,满足多样化出行需求;簇4站点餐饮美食、科教文化、商务住宅和运动健身等用地占比高,因此,在居住返程客流和环境吸引客流共同作用下容易造成客流聚集。

簇5和簇6站点在工作日呈现不同程度的出站早高峰和进站晚高峰的单峰潮汐特点,其高峰特征均显著,其中,簇5和簇6站点出站早高峰小时中位数客流比例达到33.42%和32.17%,且簇6 站点早高峰出站持续时间长,为7:30-9:30,此两类站点工作导向特征明显;在周末和节假日,高峰特征均明显减弱,其中,簇5 站点在周末和节假日呈现与工作日相似的单峰潮汐特点,相较于周末,高峰特征在节假日被进一步削减,而非高峰时段客流比例进一步增加,簇6站点在周末和节假日出站呈现与工作日相反的高峰特征,说明此类站点能吸引除工作以外出行目的的客流。结合站区土地利用和站点网络性质分析,总体而言,簇5和簇6站点土地开发强度和网络性质处于较高水平,其中,簇5 站点建成环境综合化水平高,公司企业、金融机构和酒店住宿等用地占比高,且此类站点接近中心性处于较高水平,说明此类站点土地开发完善,城市中心功能显著。簇6站点就业相关要素用地优势显著,公司企业和金融机构占比最高,且此类站点介数中心性处于最高水平,此类站点在工作日轨道交通服务使用率高,承载着大量通勤客流和换乘客流。

簇7和簇8站点在工作日呈现相对均匀的早晚高峰双峰特点,进出站客流分布类似,其中,簇7站点早高峰进出站客流略高于晚高峰,簇8站点进出站早晚高峰客流均衡,进站早晚高峰小时中位数客流比例分别为15.53%和12.91%,出站早晚高峰小时中位数客流比例分别为14.09%和13.21%。此两类站点既具有居住导向特征,又具有工作导向特征,在高峰时段产生和吸引相近的客流,形成通勤客流的错位出行;在周末和节假日,高峰特征均明显减弱,簇8 站点进站呈现稳步递增趋势,并在夜间持续弱高峰,出站非高峰时段客流比例显著增加,说明此类站点服务于频繁的夜间出行和弹性出行。结合站区土地利用和站点网络性质分析,总体而言,簇7 和簇8 站点土地开发强度和网络性质处于中等水平,其中,簇7无显著优势用地类型,公司企业和商务住宅用地均衡,簇8 餐饮美食、旅游景点和休闲娱乐等用地占比高,此两类站点网络连通性较好,站区用地多样化程度高,生活及生产功能完备,满足多样化出行目的。

簇9 站点进站无明显高峰特征,且工作日、周末和节假日进站客流分布相似,各时段客流比例波动较小,工作日出站出现早高峰特征,周末以及节假日出站整体呈现早高峰后逐步减缓趋势。结合站区土地利用和站点网络性质分析,此类站点交通设施用地占比高,且度中心性、介数中心性处于较高水平,说明此类站点具有一定的区位优势,交通便捷性好,站区通过多种交通方式聚集和疏散客流,一般为大型交通枢纽。

簇10 仅1 个站点,即春熙路站,此站点客流强度大,客流分布和土地利用不同于其他簇。客流分布方面,在工作日呈现就业导向单峰客流特征,在周末和节假日,进站呈缓慢增长趋势,在晚间到达峰值,但无明显减缓趋势,出站客流比例在8:30-18:30持续稳定;此站点土地开发强度大,网络性质处于较高水平,商业业态成熟,购物消费、酒店住宿、旅游景点和休闲娱乐等用地占比高,在周末和节假日各时段均能吸引相对稳定的客流,承担着重要的交通功能。

3 基于站点聚类的客流预测分析

由于站点特征具有多样性,聚类将相似度高的站点合并为簇,有效降低数据噪声和增强数据规律,基于此,设计簇内联合预测和整体联合预测实验,探究预测性能的变化,簇内联合预测将同一簇特征相似的站点分别训练模型,整体联合预测将全部站点训练一个模型,即簇内联合预测值输出与相似性站点的历史时序相关,而忽略特征差异大的站点;整体联合预测值输出与所有站点的历史时序相关。选择多层感知器(Multi-Layer Perception,MLP)、长短时记忆(Long Short Term Memory,LSTM)和时间卷积网络[16](Temporal Convolutional Network,TCN)这3 种时序预测模型进行测试,其中,MLP 由两个隐层和RELU 激活函数组成,隐层单元数均设置为32;LSTM由LSTM层和全连接层构成,其中,LSTM 层的隐层单元数被设置为32;TCN由TCN层和全连接层构成,其中,TCN层中卷积核大小设置为3,卷积核数量设置为16,卷积层数设置为3。

为保证数据量充足,使用262 个站点2022年5月16日~20日和23日~27日连续两周工作日刷卡数据,以5 min 为间隔统计各站点进站客流量作为预测数据集,前8 d 的数据作为训练集,后2 d 的数据作为测试集,通过当前时刻前12 个时间步的客流值预测未来1 个时间步的客流值。预测数据集只包含工作日进站客流信息,因此,考虑工作日进站相关客流特征、土地利用特征和网络结构特征对站点重新聚类,划分为5 簇。用均方误差(Mean Squared Error,MSE)作为训练的损失函数,并用平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Squared Error,RMSE)评估模型的性能,计算式为

式中:E1,E2和E3分别为MSE,MAE 和RMSE 指标值;yj为站点j客流的实际值;为站点j客流的预测值。

(1)各簇预测性能对比

各簇和总体的预测性能指标总结如表1所示,总体而言,相较于整体联合预测,簇内联合预测策略对3 种模型预测性能均有改进,MLP 改进率较高,RMSE降低了15.63%,MAE降低了8.40%,TCN改进率相对较小。3种模型对于各簇和总体的改进率如图7 所示,其中,MLP 和LSTM 对各簇均有改进,TCN对簇3和簇5 有改进,且各模型对簇4和簇5的改进均显著,保持了一定的一致性。说明通过对站点聚类,联合相关性强的站点进行预测,这种间接捕获空间相关性的方式对于提升预测性能是有益的。

表1 不同模型不同策略下各簇和总体预测性能Table 1 Each cluster and overall prediction performance under different models and different strategies

图7 簇内联合策略对各簇预测性能的改进率Fig.7 Improvement rate of intra-cluster joint strategy on prediction performance of each cluster

(2)不同时段预测性能对比

对于出行者和管理者,高峰时段的客流预测更受关注,对出行规划和运营调度具有重要意义。因此,需对比高峰时段(7:30-9:30,17:30-19:30)和平峰时段预测性能。高峰和平峰时段预测性能指标总结如表2 所示,总体而言,通过簇内联合预测策略改善了3种模型高峰时段的预测性能。图8对比了簇内联合预测对于高峰和平峰时段预测性能的改进率,相较于平峰时段,MLP 和LSTM 在高峰时段的改进率更佳,RMSE 分别降低了18.37%和12.24%,MAE分别降低了9.25%和7.92%。在工作日,大多数站点客流分布差异主要体现于早晚高峰,通过簇内联合预测捕获更多的相似的高峰特征信息。

表2 不同模型不同策略下各时段预测性能Table 2 Forecast performance of each time period under different models and different strategies

图8 簇内联合策略对不同时段预测性能改进率Fig.8 Improvement rate of intra-cluster joint strategy for forecasting performance in different time periods

(3)典型站点预测性能对比

选择两个典型站点分析预测性能。第1 个是天府三街站,是典型的就业导向型站点,如图9(a)所示,此站点呈现晚高峰特点,由于站点的特征显著,平峰无明显波动,各模型拟合效果均较好。从17:30-19:30 来看,相较于整体联合预测,簇内联合预测均获得了更优的效果;第2 个是火车北站,是典型的交通枢纽站点,如图9(b)所示,此站点呈现早晚双峰特征,但在平峰时段波动较大,客流分布规律不显著,从11:30-13:30 来看,相较于整体联合预测,簇内联合预测更能捕获客流的波动。因此,簇内联合预测策略能够有效提升不同特征站点的预测性能。

图9 典型站点预测值与真实值对比Fig.9 Comparison of predicted value and actual value of typical stations

4 结论

以成都市轨道交通站点为案例,本文得到的主要结论如下:

(1)充分挖掘多类特征能够获得更加精细化的聚类结果,考虑全部客流特征时划分为10簇,仅考虑工作日进站客流特征时划分为5簇,说明客流特征差异会体现于日期类型和出行活动模式。站区土地利用及站点网络特征会在一定程度上反馈站点客流出行模式,居住型单峰潮汐特征站点土地利用和网络性质处于较低水平,工作型单峰潮汐特征站点土地利用和网络性质处于较高水平,职住错位型双峰特征站点土地利用和网络性质处于中等水平,结合土地利用及站点网络特征分析能进一步提升聚类结果的可解释性,未来可以进一步量化站区用地特征、站点网络特征与客流特征之间的关系,并结合其他出行方式数据深入探讨城市建成环境与多模式出行间的交互关系。

(2)与整体联合预测相比,通过聚类将特征相似度高的站点集群后训练模型,有效提升了预测性能,整体上看,各模型均方根误差平均降低9.04%,平均绝对误差平均降低4.94%,MLP和LSTM模型对高峰时段预测性能的改善优于平峰时段,且各模型能有效提升不同客流特征站点的预测性能,但各模型对于簇内联合和整体联合训练策略的响应具有差异,其中,MLP 模型改善显著,TCN 模型无明显改善,MLP 模型通过簇内联合预测与LSTM 和TCN模型通过整体联合预测的性能接近,结合聚类使高偏差模型取得了更佳的性能,相比于开发一个复杂模型充分挖掘所有站点信息而言,簇内联合预测方式简单且有效。

猜你喜欢
进站高峰客流
客流增多
病毒病将迎“小高峰”全方位布控巧应对
石庆云
进站口上下行载频切换时引起ATP制动问题分析
春运期间北京西站共有154.8万人次刷脸进站
地心游记(四)一位向导
基于自学习补偿的室内定位及在客流分析中的应用
雨天早高峰,自在从容时。
人工免疫算法在电梯客流时段划分的应用
重庆轨道交通三号线列车进站警示功能接口电路的分析