考虑灵活车次的混合票制下巢式Logit选择行为建模与估计

2023-11-06 04:17左大杰骆泳吉王子康
铁道学报 2023年10期
关键词:巢式车次旅客

左大杰,刘 璐,骆泳吉,王子康

(西南交通大学 交通运输与物流学院,四川 成都 610031)

随着我国高速铁路(以下简称“高铁”)运营里程的不断增加,铁路运力供不应求的现象得以缓解,尤其在客流淡季,运力供给大于运输需求的问题尤为突出。在此背景下,探索多样化的票制不仅可以提高铁路客运市场竞争力,还能有效刺激旅客出行需求,改善铁路企业效益。长期以来,我国铁路车票主要以指定车次、指定席别、固定费率和票价递远递减的方式出售,这种票制相比民航业及欧洲铁路运输行业的票制较为单一,也不够灵活。民航业早在本世纪初就提出了灵活产品(Flexible Products)[1],这种产品以较低的价格售出,但其航班号不能由旅客自主选择,而是由航空公司在多个航班中灵活分配。欧洲铁路运输行业也有各种形式的灵活产品,英国国铁集团(Great Britain Railway,GBR)推出的随时车票(Anytime Tickets)[2]取消了往返行程的时间限制,德国联邦铁路(Deutsche Bahn)推出的灵活车票(Flex Fare DB Tickets)允许旅客选择一天内的任意车次出行,甚至还有区域票(Länder-Ticket)供团体旅客在相同州内一定时间范围旅行。最近,闫振英等[3]提出以折扣价格出售的铁路灵活车次产品,这种产品在售出时不明确指定开行车次,具体车次在一段时间后兑现。上述灵活产品无疑为我国铁路客运产品体系的进一步丰富和完善提供了有益参考。

铁路客运产品的核心利益是旅客位移服务,产品的具体形式则取决于车次、发车日期、席别等属性。如果产品的各个属性在售出时已被明确指定,则该产品属于常规产品;若产品的某些属性在售出时未被明确指定,则该产品可视为灵活产品,几种典型铁路客运产品形式见表1。其中,灵活产品可以有多种具体形式,最为常见的是灵活车次产品,该产品是在售出时不指定车次属性,在一段时间后提供,以价格折扣的方式补偿旅客购票时损失的这部分信息(民航的灵活产品、德国联邦铁路的灵活车票、文献[3]中的灵活车次均属此类)。此外,也可同时灵活产品的多个属性,例如只指定席别,而旅客出行时间和车次则灵活为某个范围(英国国铁的随时车票、德国联邦铁路的区域票均属此类)。

表1 几种典型铁路客运产品形式

然而,既有关于灵活产品的研究和应用还未能解决铁路领域加入灵活产品后的需求建模与预测问题,即使是灵活车次这一最为典型的形式。在民航领域的灵活产品需求建模预测方面,文献[1,4]建立了只考虑票价影响的消费者选择模型来刻画需求;文献[5]通过多项Logit模型刻画旅客选择行为,但本质上仍然只考虑了机票的价格因素。上述文献的需求模型无法直接应用于铁路运输领域,主要原因是铁路有相比于航空更加密集的开行频率,不能在旅客选择过程中忽略开行时间等因素的影响。当铁路运输企业同时为旅客提供指定车次和灵活车次两种车票时,对旅客的需求建模预测会因其购票选择行为变得复杂。尽管已有文献对铁路旅客选择行为展开研究,但大多建立在单一票种的多项Logit模型基础上。文献[6]将多项Logit成功应用于铁路旅客选择行为估计;文献[7]区别于以往的SP(Stated Preference,SP)调查,采用“受限”客票销售数据估计旅客选择偏好;文献[8]将旅客出发时段偏好效用量化,应用多项Logit模型估计京沪旅客出行选择概率;文献[9]将个体选择偏好纳入旅客乘车选择,评价旅客的不同特性对出行选择的影响程度。旅客对混合票制产品的选择具有层次结构,而多项Logit模型将所有产品视为相似程度一致的产品,故上述研究难以刻画混合票制下的旅客选择行为。

为克服上述问题,考虑引入巢式Logit模型,该模型是GEV(Generalized Extreme Value)模型的一种,是更为一般的Logit形式,通过将不同类似程度的产品划分到不同巢中,反映产品之间的相似程度差异。巢式Logit在交通出行中应用较广:文献[10]构建基于出行时段和出行方式的联合巢式Logit模型,验证对于有层次结构的选择行为采用巢式Logit模型较多项Logit模型有更好的统计学特征;文献[11]通过多层次复杂巢式Logit模型构建居民出行链的选择行为,证明了巢式Logit是更为一般形式的Logit模型;文献[12]通过对路径选择和出行方式的巢式Logit模型构建,验证单枝层次的可行性。上述文献在具有层次的选择行为结构中应用了巢式Logit模型,但与铁路产品中存在外部选项进行需求转移的现象又有所不同。

鉴于民航灵活产品需求模型无法直接应用于铁路,并且既有文献还未对铁路混合票制下的需求问题展开研究,本文探索加入灵活车次后的混合票制下的需求建模预测问题。首先,分析旅客选择行为特征,基于巢式Logit模型构建选择行为模型,并引入外部选项以刻画部分需求转移旅客。在此基础上进行参数估计,以极大似然估计思想,将选择概率函数转化为对数似然函数,并用多元牛顿迭代法(Newton-Raphson,NR)使对数似然函数极大值化,综合同时估计和分阶段估计,求取参数。最后以京沪高铁为实例,开展出行意愿调查,先对混合票制下选择行为进行参数估计,再结合对比模型进行模型验证,最后分析不同折扣率下各产品的分担率,验证模型及参数的有效性。

1 选择行为模型构建

通过分析混合票制下旅客选择行为特征,建立考虑外部选项的巢式Logit选择行为模型。

1.1 混合票制下旅客选择行为特征

混合票制下旅客购票决策过程见图1。首先,旅客在准备购票时,将接收有指定车次和灵活车次两类票可售的信息,旅客将选择其中一种票种的出行方案,如所选票种无余票时,旅客将放弃出行或者转移到外部出行选项(除开铁路运输企业提供的产品,在选择结构中还应包含旅客放弃出行或选择其他出行方式的选项,这部分选项设为“外部选项”)中致使购票失败。然后,当旅客接受灵活车次车票并支付票价后即购票成功,对于选择指定车次车票的旅客则还需要选择具体车次,当所选车次无余票或是票价超出旅客出行心理预期,同样会导致旅客放弃出行或者更换交通工具出行,而旅客完成所有选择条件即购票成功。

图1 混合票制下旅客购票决策过程

旅客在选择指定车次和灵活车次两类产品时,不同类别产品的购票决策过程存在差异,其产品属性也存在差异,选择灵活车次产品无需进一步选择车次,因此该产品对出行时间等因素并不敏感,而选择指定车次产品需要考虑出行时间以及列车的旅行时间,使得指定车次产品间以及指定车次与灵活车次产品间的相似程度不一致,指定车次与灵活车次产品间不满足IIA(Independence from Irrelevant Alternatives)假设,但两者又具有一定的共性,灵活车次和指定车次两类票种的销售都受到票价影响,票价超出旅客心理预期,旅客即会放弃购票,这种相似程度又满足IIN(Independence from Irrelevant Nests)假设。最后灵活车次和指定车次两类车票均会受到票额容量的制约,当余票不足时,无论其效用多高,旅客均无法成功购票。针对指定车次各个产品之间满足IIA假设,指定车次产品与灵活车次产品之间满足IIN假设的特点,本文应用巢式Logit模型划分两个层次研究选择行为。

1.2 基于巢式Logit的选择行为模型

基于巢式Logit模型对混合票制下的旅行出行行为进行建模。由1.1节可知,混合票制下旅客备选集见图2。

图2 混合票制下旅客备选集

对于上述旅客购票决策过程,旅客n对任意层次j中方案k的选择效用值Unk为

Unk=Ynj+Xnk+nk

(1)

式中:n∈N,N为产生高铁出行意愿的旅客集;j为上层选择方案,j∈J,J为上层选择方案集,本文中分别是指定车次、灵活车次和外部选项3项;K为下层方案选择集,即指定车次条件下具体车次k和外部选项的方案选择,K={k|k=1,…,k′},k′为总车次数;Ynj为受上层模型影响的固定效用,即票价;Xnk为受下层模型影响的固定效用,即票价、开行时间和旅行时间的组合;nk为无法观测到的随机效用,集合n服从累计分布,即

(2)

通常以线性组合的方式表示Ynj、Xnk,即

Ynj=α0+αTyj

(3)

Xnk=β0+βTxjk

(4)

式中:λj为层次j中其下包含的所有方案的不相关系数(Dissimilarity Parameters),在本模型中仅取上层和下层,故简写为λ1和λ2,取值在[0,1],灵活车次和外部选项只有一种方案,该值为1[13];α0、β0分别为选择高铁出行和指定车次票种出行的基础效用;yj,xjk分别为上下层的已知属性向量,如票价、旅行时间、开行时间等;θ为待估参数,θ=(α0,α,β0,β)。

外部选项以角标o标记,表示选择除铁路运输企业外其余选项的总和,并假设其确定性效用和Uo=0、Ujo=0。

根据巢式Logit模型推导概率公式[14],旅客选择铁路运输产品概率为

(5)

(6)

上下两层选择外部选项的概率分别为

(7)

(8)

式中:Ij为包含价值(Inclusive Value),表示选择层次j所获得其所有方案效用和。

对于相对参数λ1和λ2,需要固定其中一项,本文固定λ1,令λ1=1,这样能够避免两层的巢式Logit模型参数估计时因相对参数产生的分式求导,减少了算法中的不可行区域,而λ2需要落在[0,1]之间,才能保证备选集结构合理。

2 参数估计

本节在第1节建立模型的基础上解决了模型中参数估计问题,即通过对数似然函数的构建,应用分阶段和同时估计法混合估计参数。

2.1 对数似然函数构建

(9)

则其对数似然函数L为

(10)

2.2 分阶段和同时估计法混合估计

巢式Logit模型参数估计有两种方法,即分阶段估计法和同时估计法。两者各有优劣,分阶段估计是把似然函数上下层单独分开,把下层参数先单独提出来估计,再将所得估计值代入上层估计上层参数,该方法能保证对数似然函数为凸[15],但是有效性较低。同时估计则关注式(5)本身,通过使L最大化确定各参数取值,同时估计所得参数具有无偏性、渐进正态性及有效性[14],但是同时估计中效用函数与参数估计之间并非像多项Logit那样呈线性关系,虽然其非线性对极大似然估计无影响,但这会导致对数似然函数不是凸函数,需要寻找多个初值,取其中最大初值作为结果。为了缩短对较优初值的寻找,本研究结合分阶段估计,采用同时估计来进行参数标定,即先用分阶段估计计算参数,得到一个范围,在该范围内设置多个初值,应用同时估计得到参数取值。

基于上述分析,对数似然函数L非线性,且结构复杂难以直接求解,故本研究采用多元牛顿迭代法求取近似解。求解步骤如下:

Step1计算L的Jacobian矩阵J和Hessian矩阵H。

Step2初始化迭代次数i和局部最优解迭代次数i′,根据分阶段估计生成初值θ(i),以及初值对应的对数似然函数值L(θ(i)),并令之为L(θ)m。

Step3计算J(θ(i))和H(θ(i))。

Step4标记点集A(i),其坐标为(θ(i),J(θ(i))),则这些点切线方程为J(θ)-J(θ(i))-H(θ(i))·(θ-θ(i))=0,求切线与θ轴交点θ(i+1),即θ(i+1)=θ(i)-H(θ(i))-1·J(θ(i))。

Step6判断i′>η是否成立,(η反映极值的迭代次数,可根据精度要求设置),若成立,则输出θ(i+1),计算结束,若不成立,则返回Step2重新寻找初值。

3 实例

对模型和参数估计进行实例验证,输入京沪高铁出行意愿调查数据,进行参数估计和模型验证,并分析不同折扣率下旅客选择概率情况。

3.1 数据输入

表2 巢式Logit模型影响因素

选取京沪高铁北京南至上海虹桥方向作为研究OD,围绕表2的各项影响因素设计SP调查问卷,设置正交组合实验[17],避免属性之间出现多重线性问题产生较大的标定误差,为研究指定车次与灵活车次两大类产品间的选择偏好,设置灵活车次9折、8折、7折3个折扣档位分别与对应折扣下指定车次选择的选择情形,即设置灵活车次、指定车次和放弃出行3种选项;为研究下层价格因素的选择偏好,设置一等座二等座的选择情形,即设置选择一等座、二等座和放弃出行3种选项;为研究下层旅行时间与开行时段的影响,设置特征车次7趟的选择情形,即G1、G3、G7、G145、G157、G133、G93和放弃出行8种选项,涵盖所有开行时段,并设置不同的旅行时间。选择情形涉及共计17种运输产品,部分产品属性及变量见表3。这里对旅行时间的处理是将旅行按照一天的上限取值为1,下限取值为0,即0时取值为0,24时取值为1,进行归一化处理,例如取值0.218 75换算为时间为5 h 15 min。

表3 部分产品属性及变量

根据上述选择情形设计调查问卷,调查问卷采取网络问卷的形式面向有出行需求的人群,于2022年3月15日至17日分3次收集有效出行意愿调查问卷共415份,统计并整理结果见图3。

图3 出行意愿调查结果

由图3(a)可知,对灵活车次设置不同的价格折扣会对旅客的选择产生影响,如灵活车次票价设置为9折、8折、7折,则选择灵活车次的占比分别为52.48%、58.42%、72.28%。与此同时,选择外部选项的人较少,始终不超过5%。总之,随着灵活车次票价降低,选择该车票的人数增加。而在指定车次旅客对一等座和二等座的选择上,由图3(b)可知,总体两者的比值接近2.37,从这个角度可以反映下层模型中价格对旅客选择的影响。同时,针对不同车次旅客间的选择,整理结果见图3(c),可知选择G3的旅客最多,占比达28.13%,其次分别为G145和G7,反映了旅客对中午和下午较早时段的偏好。同时也能注意到旅行时间最长的G133尽管一部分时间处于下午时段,但是受到旅行时间的影响,仍鲜有旅客问津。而处于早上时段出发的G1,选择概率较旅行时间较短但处于晚上时段开行的G93略高,反映了开行时间与旅行时间的耦合效果。

3.2 数值结果与分析

根据上述数据,由Matlab 2020b在4核处理器Intel(R) Core(TM)i5-7300HQ 2.50 GHz,16 GB内存的环境下求解,NR法部分迭代过程见表4。

表4 NR法部分迭代过程

NR法部分迭代过程见表4,由表4可以得到各参数估计结果,并由此对参数进行t检验,以验证参数对旅客出行行为影响的合理性,结果见表5。

由表5可知,各层截距代表各个出行方案的隐含价值,其值为正数,时间、价格影响因素均是越大,则对该出行方案的效用越不利,故其值应为负,从各开行时间段来看,人们的出行倾向时间段集中在10:00—17:00,因而相应时间段取值较早晚段大。而不相关系数取值为0.237 9,该值在(0,1)中,证明了选择树结构的合理性。同时,各参数的t绝对值均大于2.576,说明在99%的可靠性水平上认为该参数对因变量对选择概率产生影响,对于参数λ2,通过对两侧取值界限进行t检验,可认为只能在1%的显著性水平上放弃假设H:λ2=0或λ2=1。

此外,还需要对模型整体的拟合优度进行检验,拟合优度反映了模型对数据的适应程度可用其检验各个模型的优劣程度。为了体现巢式Logit模型在刻画混合票制下选择行为的合理性,设置两类多项Logit模型(为方便说明,分别以ML1、ML2表示,巢式Logit在下表以NL表示)进行对比分析。其中两个ML模型均只有一层的选择结构,即指定车次中的具体车次和灵活车次在同一个选择枝中,ML1指的是灵活车次选项不包含开行时间影响因素,其余假设与巢式Logit一致,ML2指的是灵活车次选项包含开行时间影响因素,但4个时段权重均取0.25,其余假设也与巢式Logit一致,拟合优度检验结果见表6。

McFadden系数表示响应旅客出行中选择发生变化的能力,由于旅客的出行行为伴随着很大的随机性,且研究对于出行影响因素的认识并不完备,始终难以准确的预测模型,该值取值落在[0.2,0.4]间,可认为模型非常精确[18]。对于本模型该值为0.207 8,在出行预测类的模型中拟合效果较优,且均优于两类多项Logit模型,说明NL模型刻画混合票制下旅客的选择行为优于铁路出行选择行为研究常用的多项Logit模型。同时,相对偏差刻画的是所有运输产品中,实际调查数据与模型预测数据间的加权相对差为6.11%,低于20%,说明估计参数能够较好地拟合收集的出行意愿数据。

验证模型和参数的正确性后,将该模型应用于京沪高铁某日实际开行25列车的选择情形中,假定铁路运营方在该线路上采用了混合票制,设置0.55至0.95共9种折扣率,分析在不同折扣下旅客对各个产品的选择概率,见图4和表7。

图4 京沪高铁部分OD灵活车次产品选择概率

表7 北京南—上海虹桥OD指定车次产品选择概率 %

图4中,随着灵活车次折扣率的降低,旅客更偏好选择灵活车次产品,导致指定车次产品和外部选项的选择概率下降,说明灵活车次产品能够节省的票额支出越高,旅客越倾向于选择该产品。此外,灵活车次产品在长程OD(如北京南—上海虹桥)中的表现较短程OD(如北京南—徐州东)更佳,这是在相同折扣下长程OD带来的折扣收益更高和短程OD旅客更倾向于确定自己乘车信息出行导致的。可见灵活车次产品更适用于中长程OD场景。

表7中,由于折扣率的降低,确定性产品的总体选择偏好处于下降态势,反映了灵活车次产品对确定性产品的蚕食。同时,G5、G7、G15、G17、G19、G25次标杆车由于停站次数少,其旅行时间较短,选择概率较高,最高的G15、G17、G19次均超过6%,而G5、G25次列车开行时段处于早上和晚上时段,旅客不倾向于该时段出行,因此选择概率又相对较低,其他列车由于停站次数较多,选择概率普遍较低,这些列车的选择概率有高有低,集中在2%左右,是旅行时间与开行时段耦合作用的结果。总体而言,需求在平行车次间出现了较大的失衡现象,有待进一步地调整灵活车次产品。

4 结论

实施考虑灵活车次的混合票制不仅能够刺激运输需求、改善运输企业效益,还能均衡车次间客流量,是推进铁路运输企业市场化发展的有效手段之一。本文研究混合票制下旅客选择行为建模和估计方法,通过建立引入外部选项的双层巢式Logit模型,并构建对数似然函数,应用多元牛顿迭代法使对数似然函数极大值化,采用分阶段估计和同时估计、混合估计的方法处理参数估计问题。实例表明,双层巢式Logit模型可以有效估计混合票制下旅客对铁路运输产品的出行选择偏好,为预售期前的票额分配的需求输入以及预售期内席位控制的调整策略提供依据。未来可进一步研究多种形式灵活产品的最优组合问题以及混合票制下的席位控制问题。

猜你喜欢
巢式车次旅客
ATS 车次窗显示方法的研究
调度集中系统车次号技术的研究
非常旅客意见簿
动车所车次号处理逻辑存在问题分析与对策
小鼠诺如病毒巢式PCR 检测方法的建立及应用
我是人
CTC系统自动变更折返车次号功能的实现
给小旅客的礼物
基于牙釉质基因巢式PCR性别鉴定超微量DNA检测方法的建立
脑胶质瘤MGMT启动区甲基化PCR检测方法的对比分析