信息机制对出租车司机服务供给行为的影响

2020-06-16 02:06陈小鸿
关键词:载客长距离时段

叶 倩,张 华,陈小鸿

(1.同济大学 道路与交通工程教育部重点实验室,上海 201804;2.同济大学国家磁浮交通工程技术研究中心,上海 201804)

随着移动互联网在城市出行服务中的应用发展,乘客通过叫车平台告知出行起终点和时刻信息后,由司机响应订单请求的服务模式被广泛使用。相比传统的街道巡游运营模式,新的网络预约出租车服务被认为有望改善打车的便捷程度和服务质量。然而,一段时期以来,关于司机诱导加价、乘客高峰时期或短距离出行等服务需求难以获得及时响应的现象仍广泛存在,传统模式下的打车难、绕路拒载等问题并没有得到解决[1]。

有观点认为[2],在获得乘客出行信息条件下,出租车运营仍然存在挑客现象,实质上是由于司机或平台利用信息优势,倾向性地愿意响应或歧视某类乘客出行需求。理论上,司机提供服务的动机是追求利益最大化,即获得更高收入。在运营实践中,出租车服务计费结构与距离直接关联,司机更加愿意响应长距离出行需求;同时,获得同等收入所需要的时耗也是司机服务决策的重要因素,以更快速度将乘客送达目的地能够提高司机在单位时间内的收入。因此,司机选择优先服务那些道路交通状况较佳的载客位置或出发时刻的服务需求非常有可能。

1 出租车服务歧视和司机行为

出租车服务歧视(taxi discrimination)问题[3]可以追溯到20世纪末,关注焦点集中于种族和性别歧视、价格歧视、目的地或地区歧视等。近来一些研究从司机群体细分的角度探究了其服务供给行为的特殊性,得到出租车司机行为模式和收入水平呈现显著相关的结论。例如,Liu等[4]表明高收入司机更加关注订单时耗,在载客和空驶状态下均比一般收入司机行驶速度快,以期最高效地利用运营时间;Naji等[5]发现该群体倾向于挑选经济活动更活跃的时间和地点进行巡游和停靠;Zhang等[6]验证了高收入司机在寻客时存在拒载行为,且他们的上下客位置多样性偏低,以保证高效的运营服务。

目前大多数针对司机行为倾向性的研究都仅考虑司机主观经验带来的服务优势,本文以网络预约的出租车服务模式为对象,分析信息机制条件的变化对司机服务供给行为的复杂和动态的影响。基于司机不同信息获知程度下的运营数据,验证出租车司机的服务供给行为是否存在时间-空间分布的差异性,再通过订单距离解析司机行为,分析其在出发时刻、载客地点的选择倾向性。研究可为面向服务公平的移动出行市场的信息管制设计及市场评估提供参考。

2 数据与方法

2.1 数据来源

本研究涉及三类数据。第一类是由出租车公司提供的上海市2015年1周的出租车运营数据,主要是由司机巡游载客完成,含占比约30%的网络预约订单。数据采集间隔10~20 s,包括车辆编号、司机编号、轨迹点的经纬度坐标、载客状态、瞬时速度和时刻等信息。第二类是网约车平台提供的上海市2016年1周的出租车订单数据和对应轨迹数据,全部是由司机借助叫车平台完成。轨迹每间隔6 s采集,订单数据包括订单编号、车辆编号、司机编号、订单起讫点经纬度坐标、订单开始和结束时刻等信息,轨迹数据包括订单编号、时刻、经纬度坐标、瞬时速度等信息。为便于分析,按照传统巡游和网络预约运营模式下司机获知乘客出行信息的差异,将两类数据分别称为“30%司机获知信息-巡游平台混合”订单和“100%司机获知信息-仅平台机制”订单。第三类是上海路网和513个分析小区的地理信息,其中,以上海市内环线、外环线作为中心区、中心城和市域的边界[7]。

2.2 数据预处理

研究的空间范围是上海市域大陆部分(不包括崇明区)。数据清洗遵循以下6个步骤[7]:①删除信息不完整或错误的数据;②删除较少轨迹点、出行时间过短的订单;③删除相邻轨迹点间隔过大(间隔长于60 s)的订单;④删除行程距离或行程时间过短的订单(行程时间短于2 min或行驶距离小于200 m);⑤删除起讫点相同的订单;⑥删除绕行较大的订单(行程距离3 km以下且非直线系数大于2.5或者行程距离超过3 km且非直线系数大于2)。由于数据的轨迹点采集间隔较短,计算订单行程距离是对轨迹序列中前后两个轨迹点的平面坐标求欧式距离并累加得到,如下式:

式中:Dnx为数据集x中第n个订单的行程距离,每个订单轨迹序列包含M个轨迹点 ;(Xnx,i,Ynx,i)和(Xnx,i+1,Ynx,i+1)分别为相邻两个轨迹点i和i+1的平面坐标。

2.3 分析方法

文章分析遵循以下假设:相邻年份的城市空间结构和居民出行特征(例如,出租车市场)未发生显著变化;且出租车服务均是由具备相似驾车技能、城市街道熟悉程度的司机群体完成。因此,认为“30%司机获知信息-巡游平台混合”和“100%司机获知信息-仅平台机制”两类订单所体现的差异主要是由于信息机制非司机服务供给行为带来的影响所致。

首先,对两类订单数据进行描述性统计分析,选取打车供需矛盾更突出、出行需求更刚性的工作日,分析出租车服务供给基本特征,包括响应时刻、行程距离、行程速度和区域分布等;使用K-S非参数检验(Kolmogorov-Smirnov test)测试不同信息获知程度下出租车订单距离的分布差异,基于累计概率分布曲线将订单划分为长距离组和短距离组。

其次,借助ArcGIS软件的空间统计(spatial statistics)和空间分析(spatial analyst)工具描述出租车订单在空间的分布特征。前者是基于矢量数据进行推断统计的,本文使用方向分布(标准差椭圆)工具分析订单空间分布的方向性和服务范围,使用空间自相关工具验证订单距离的空间模式是否具有统计学显著性意义的聚集、离散或随机模式。后者用于分析和研究栅格数据,本文使用核密度分析对细分距离的订单进行像元量值计算并拟合为光滑锥状表面,结合栅格计算器和重分类模块对核密度栅格图层进行地图代数运算,得到不同信息获知程度下服务密度增减的空间面积和幅度数值。

3 信息差异下的服务供给基本特征

3.1 订单量时刻分布

信息差异下的工作日出租车订单响应时刻分布如图1所示。传统巡游模式为主时,订单在早上8:00时之后分布较均衡。而在平台机制下,单位小时司机完成的订单具有明显的单峰,7:00~10:00时段完成的订单比例明显多于全日其他时段,在7:00~8:00达到全日峰值;13:00~16:00时段的订单波动较大且比例较低。由此可知,在完全获知乘客出行信息的情况下,司机在出行早高峰时段响应了更多需求,而在凌晨时段接单降低。

图1 订单量时变曲线Fig.1 Percentage of taxi orders satisfied per hour on weekdays

3.2 行程距离时变和区段分布

图2是按小时计算的平均行程距离和增幅曲线。整体而言,部分信息获知和完全信息情形下的订单距离在全天呈单峰和双峰趋势,前者在4:00~6:00达到峰值,后者峰值出现在4:00~6:00和20:00~22:00。

司机由巡游-平台混合机制向仅平台机制转变时,所完成订单的平均距离从8.0km增长到10.2km,均高于同年份上海市巡游出租车的平均乘距(7.28km和7.55km)[8]。按小时增幅来看,全日各时段数值均大于0,表明司机在完全获取信息情形下各时段内服务订单的行程距离均比巡游模式为主的订单距离长。其中,白天8:00~16:00时段(除11:00~12:00)和晚上18:00~22:00时段增幅最大(最大增幅3~4km);全日订单距离峰值4:00~6:00和16:00~18:00距离增幅最小。

图2 行程距离和增幅曲线Fig.2 Average distance and growth rate on weekdays

进一步对订单距离进行分组统计,见图3。整体上呈现中部低两端高的趋势,其中,巡游模式为主时,超过80%的订单距离在12km以下,大于15km占12.8%;而司机在平台机制下完成的订单主要集中在9km内和15km以上(占比达到80%)。平台机制过渡后,3~6km的订单比例下降明显,距离大于12km的订单比例明显增加。

图3 行程距离分组占比Fig.3 Taxi order percentage grouped by distance

3.3 平均行程速度波动

行程速度是每笔订单的行程距离和时长的比值。图4是按小时统计的订单平均行程速度随时刻的波动曲线。信息差异下,全日出租车速度呈现基本同步的波动趋势,最快订单速度出现在凌晨4:00~6:00,达到35~45 km·h-1;早、晚高峰(7:00~9:00和16:00~18:00)的订单平均速度最低,其中晚高峰仅为20.0~22.2 km·h-1。对比发现,除去自由流交通条件的凌晨,其余各时段由网约车平台生成的订单的行程速度均明显高于巡游模式为主的速度值,增幅达到4~7 km·h-1;且早、晚高峰的订单速度明显得到提高,其中,早高峰达到25.9~29.7 km·h-1。

图4 平均行程速度时变曲线Fig.4 Average speed on weekdays

由城市交通网络数据可知,连续两年的道路交通运行状况和工作日拥堵区域差异不大[8]。因此,推断出租车平均行程速度明显提高的原因,一方面,叫车软件内置的路径规划导航降低了司机寻路、绕路的可能性,然而由于出租车司机长期从事全职运营服务,具备较强的巡游驾驶经验,不太可能在相邻两年间造成如此明显差异;另一方面,是司机运营服务的行为所致,例如,平台司机在响应乘客需求时有意避开常发生拥堵或实时拥堵严重的路段,从而在交通状况较好的区域运营,提高订单效率。这一推断将在下文中结合订单空间分布深入分析。这个推断可以解释多数公众反映的叫车平台内“巡游车难叫”的现象[9]——叫车高峰期,由于网约车信息不对称,除非出行需求本身非常“优质”(即出行距离长或者起讫点位置的交通状况良好),否则通过平台呼叫出租车往往难以得到响应。

3.4 空间范围和方向分布

运用核密度和方向分布分析,得到信息差异下的订单热力图和标准差椭圆图,见图5。核密度分析参数设置为:输出像元大小500(将研究区域划分为500m×500m的网格[10]);搜索半径设置为3 km(取自上海路网图层长边和宽边中较小值的1/30);采取自然间断点分类,密度分为5个等级(见表1)。方向分布中输出椭圆大小为1倍标准差。

表1 订单生成区域热力图密度分级Tab.1 Density grade of heatmap of pick-up locations

图5 订单生成区域热力图和方向分布Fig.5 Kernel density heatmap and direction of pick-up locations

当司机从部分获知乘客出行信息向完全获知信息转变时,出租车服务订单的空间分布形态由集聚中心城变为散布于市域范围,高密度等级的面积比例明显降低(例如,等级1~3的面积由4.54%降至2.41%),而在城市外围区域和新城新区的出租车服务区域明显增多。以密度最强的等级1为例,巡游-平台混合机制下,司机主要服务于虹桥枢纽、陆家嘴商务区、五角场等人口密集的交通枢纽或商务片区;而在叫车平台中的出租车服务,分布在陆家嘴、人民广场和南京西路等几个高密度区域。通常而言,尽管中心区出行需求更多,但城市外围区域的出行需求往往距离更长,交通状况更佳,因此对司机也具有较强吸引力。与此同时,方向分布的结果是,1倍标准差椭圆面积由256.0 km2增加到922.5 km2,扁率由0.26降低至0.08。由此可知,在平台机制下,出租车司机的服务供给在空间上呈范围增大但方向性降低的特点。

此外,基于城市分区可以进一步比较信息差异下出租车服务供给在区域内和区域间的分布。图6是基于起讫点的上海中心区、中心城和市域的订单分布,其中,跨区域订单平均分配给两个区域。出租车服务主要发生在城市区域内部,跨区域订单服务比例约占10%。全部转为平台机制后,城市中心区、中心城内部的出租车服务需求响应比例大幅下降,而市域内部服务比例增幅显著,达到26%。

图6 区域内和区域间的订单分布Fig.6 Taxi order percentage grouped by spatial areas

因此可以认为,信息差异下的出租车服务供给在出发时间、行程距离、行程车速、空间范围和密度指标上均有明显差异,证实了提前获知乘客出行信息对出租车司机的服务供给行为的影响。为进一步探究服务订单差异所反映的司机行为规律和潜在的服务歧视问题,下节将聚焦直接影响司机收入的距离,开展行程距离、出发时刻、载客位置的分析,以发掘平台机制下司机响应需求时的选择倾向性。

4 距离分组的司机行为倾向性分析

4.1 订单距离分组

订单距离直接关系到司机收入。图7绘制了司机在不同信息获知程度下,完成订单的行程距离频率分布和累积频率分布。为分析两类订单的距离分布是否具有相似性,进一步利用K-S检验。结果显示P值是9.26×10-243,无限接近0,说明司机在两类机制下的服务订单具有显著的距离分布差异性。

图7 行程距离频率直方图和累积频率分布曲线Fig.7 Frequency distribution and cumulative frequencies of taxi order distance

为了便于讨论,将订单按距离划分为不同组别,分组阈值分别取两条曲线的50%、75%、95%分位值并取二者均值,以此分为短距离组(<6.5km)、中距离组(6.5~12km)和长距离组(12~25km)。结合3.2节中对订单距离结构分析,可知中距离订单比例基本保持不变,因此下文仅关注明显减少和明显增加的短距离组和长距离组的订单。部分获知信息时司机所完成的长、短距离订单占总体的15.2%和57.6%,完全获知信息下司机所完成的长、短距离订单占比是25.1%和43.4%。

4.2 长距离订单的出发时刻选择

按照出发时刻将全天分为上午(6:00~12:00)、下午(12:00~18:00)和晚间(18:00~24:00)3个时段,统计司机在获取信息差异下的长距离订单的运营特征,见表2。随着司机由巡游模式向借助平台机制响应服务转变时,长距离订单的各项运营指标均有所变化。例如,行程距离略有提高,从16.7km增加到16.9km;行驶速度从29.3~37.1 km·h-1大幅提高到32.5~38.9 km·h-1。

为进一步探究长距离订单特征变化的原因,以20min为时间间隔分别统计其出发时刻(图8)和行程时间分布(图9)。出发时刻方面,司机在上午和晚间完成的长距离订单比例明显提高,尤其8:00~10:00和 21:00~23:00,单位间隔订单量占全日2.5%以上;而长距离订单完成比例的最低值出现在15:00~17:00时。订单时长方面,上午和下午时段长距离订单分布曲线近似一致。巡游模式为主时,长距离订单的行程时间集中于25~50min(占比约75%);当完全处于平台机制下,约77%的订单时长为20~45min,略有降低。而在晚间时段,长距离订单的耗时由25~40min(占比74.8%)提高至2016年的30~50min(占比 80.2%),与3.2节中20:00~22:00订单行程距离增幅最大的结果一致。

表2 长距离订单运营特征指标Tab.2 Operation index of long-distance taxi orders

图8 长距离订单出发时刻曲线Fig.8 Percentage of departure time of long-distance taxi orders

图9 长距离订单行程时间分布曲线Fig.9 Empirical distribution of duration of longdistance taxi orders

总体来说,司机在完全获知乘客出行信息条件下,响应长距离出行需求时具有出发时刻选择倾向性,即在8:00~10:00和21:00~23:00(可称之为出租车服务供给的早、晚高峰时段)完成了更多订单。尽管各时段的订单行程距离显著增加,但司机驾驶速度更快,因而缩短了订单的平均耗时。可以推断,订单距离增加和完成速度更快使得司机在平台机制下收入更高。

4.3 载客地点选择倾向性

为判断出租车订单的生成位置和行程距离在空间是否具备统计学意义的集聚现象,本文采用ArcGIS空间自相关工具。所基于的零假设是,不同行程距离的出租车订单在研究区域是随机分布的。参数设置如下:空间关系的概念化选择反向距离(INVERSE-DISTANCE),距离法选取Manhattan距离,距离阈值设置为500m。输出结果包括表征空间自相关强弱的Moran I指数、表征标准差倍数的Z得分和P值等。

模型结果是,两类信息获知程度下的订单距离Moran I指数分别为0.11和0.07,说明订单的行程距离与其生成位置有关;Z得分为165.5和10.3,说明不同距离的订单在空间呈集聚型分布;P值均为0,证明结果可信。由此可知,无论司机是部分还是完全获知乘客出行信息,其所完成订单的行程距离均与空间具有较强的相关性,并且部分获知信息情形下的空间集聚现象更显著。

为探究信息差异下不同距离分组的司机服务供给行为的空间相关性,下文针对两个问题继续分析:①长、短距离订单分布的位置是否有差异,服务供给是增加还是减少;②结合出发时刻探究,在司机倾向完成更多长距离订单的出租车服务供给的早、晚高峰(8:00~10:00和21:00~23:00),是否存在载客地点的转移,即倾向于选择“收益更佳”的区域。

4.3.1 长短距离订单的空间分布

图10是以上海市分析小区为空间单元统计出租车服务的距离均值,以起点落在小区内为计算规则。司机在部分信息获知时,订单距离在研究区域整体上呈圈层化分布,即从城市中心向外依次是中距离、长距离、短距离,行程距离超过25km的订单分布于临港新城、浦东机场等小区。相比之下,司机完全获知乘客出行信息时,服务的长距离订单的小区间隔散布于整个市域范围,距离超过25km的小区数量由9个减少为3个。

由此可知,平台机制下城市出租服务的最大变化是,城市中心区短距离小区集聚的现象基本消失(如杨浦区附近),以长距离订单为主的小区比例增长至近1/3,该发现与3.2节和3.4节的分析相符合。

图10 基于分析小区的出租车服务行程距离Fig.10 Taxi order distance within analysis zones

4.3.2 服务高峰时段的订单密度转移

运用与3.4节相同规则的核密度方法,以距离分组和出发时刻(仅关注出租车服务供给早晚高峰)作为分析维度,得到出租车服务载客位置热力图和描述信息获知程度转变后影响的密度变化图。信息机制变化后,基于出发时刻和距离分组的出租车服务供给的密度分布呈现以下规律:

(1)由图11可知,出租车服务供给早高峰时段,长距离订单的载客地点存在空间转移,高密度载客区域的分布由集聚中心区变为中心城带状分布,服务响应密度低的区域从中心城延伸到近郊区。此外,36%的栅格载客密度增加,增幅较大的栅格在空间呈散点和块状,主要分布在近郊区和浦东内外环之间;栅格密度降低的区域较为集中,分布在内环内、外环内普陀区、长宁区-虹桥枢纽。

(2)由图12可知,出租车服务供给晚高峰时段,长距离订单的载客地点分布变化不大。载客位置密度降低的栅格数量约占75.3%,明显多于密度增加的栅格。密度提高的栅格在空间呈带状分布,主要集中在内环内及徐汇、长宁和浦东新区;虹桥枢纽至内环附近的载客密度降低明显。值得注意的是,在部分获知信息时,可观察到虹桥枢纽是司机提供出行服务的高密度区域;然而,在完全获知出行信息后,载客密度明显降低。

(3)由图13可知,出租车服务供给早高峰时段,短距离订单的载客位置密度分布发生明显变化,高载客密度的区域基本消失,中低载客密度的区域呈散点分布于整个市域范围。载客密度增加和减少的栅格各占一半;除张江附近,中心城内的载客密度均略有降低,城市近、远郊出现多个载客密度明显增加的点状区域。

综合上述分析可知,出租车司机在不同程度获知乘客出行信息时,其服务供给行为在出发时刻和载客位置分布均具有明显差异。具体而言,传统巡游模式为主时,司机响应出行需求的空间分布与出发时刻、行程距离无明显关联;但当全部转变为借助平台提供服务后,出租车司机在服务供给早晚高峰对长、短距离出行需求的响应呈现出空间差异化。供给早高峰时段,城市中心区的长、短距离出行需求响应均有所降低,在城市外围区域和远郊区则明显提高;供给晚高峰时段,变化规律刚好相反,司机对中心区的长距离出行需求响应增强。

5 结论

本文从司机服务供给行为视角切入,量化分析了出租车运营模式前后变化。揭示了信息机制对服务响应的时-空影响,以及移动出行市场供-需匹配的动态博弈过程。研究结果表明:

(1)信息机制差异下,相邻年份的出租车订单在响应时刻、行程距离、空间密度和城市区域分布上均可观测到明显转移。因此,本研究证实了网络预约模式的信息优势对出租车司机服务供给行为的影响。

(2)信息优势下,司机对长距离订单的响应比例增多,且呈现出发时刻和载客位置的选择倾向性。一方面,出租车服务供给的早、晚高峰时段是8:00~10:00时和21:00~23:00时,这期间司机集中完成了更多的长距离订单;并且他们的驾驶速度更快,实际上缩短了订单的平均耗时,使得司机在平台机制下收入更高。另一方面,司机在服务供给早高峰时段降低了对城市中心区的出行需求响应,而增强了对城市外围区域和远郊区的响应;而在服务供给晚高峰时段,对中心区的长距离出行需求响应增强。

研究回答了出行平台的机制设计是否需要监管规制这一政策议题,为未来制定移动出行市场更加精细化的信息管制措施和市场公平性评估提供了量化支持。

猜你喜欢
载客长距离时段
2021年第1季度,我国新注册登记载货汽车同比增长100.99%,新注册登记载客汽车同比增长58.53%
长距离PC Hi-Fi信号传输“神器” FIBBR Alpha
探讨给排水长距离管道的顶管施工技术
第70届黄金时段艾美奖主要奖项提名
“太空摆渡车”首飞载客成功
我国最长距离特高压输电工程开工
山区长距离尾矿库回水输送管道设计
西藏文物 迎来大修时段
模型飞机的结构与飞行原理(二)