基于演化博弈的民航安检有效性提升研究

2023-12-28 09:44冯文刚

复杂系统与复杂性科学 2023年4期

陈陶,冯文刚

(中国人民公安大学国家安全学院,北京 100038)

0 引言

当前,中国的民航安检主要依照企事业单位内部保卫的单位负责方针,由机场自身实施、负责,机场公安扮演的则主要是政府监管部门的角色,对机场的行为进行奖惩,对违反法规的旅客实施处罚。而根据民航局的统计,每年七成以上的民航安保事件发生于安检现场,这也说明,即便在机场和政府投入大量资源在旅客安检当中的当下,仍然会出现旅客违反民航安检规定的安检低效现象。如何进一步减少安检低效情况,提高安检有效性,成为民航安防领域不可忽视的重点。

在当前民航安防领域的研究中,通过建立模型、模拟仿真的方法对安检工作进行分析,提高安检效率的研究成为学者们重点关注的内容。在民航安检领域,国内外学者们主要运用排队论、概率论等方法研究如何优化安检通道的配置,降低成本、提高旅客通过量,从而达到提升安检效率的目的。例如胡艳敏等[1]基于Petri网和排队论给出开放安检通道数量优化的措施,降低安检的成本。赵振武等[2]运用排队论和概率论分析国外学者提出的2阶段安检系统的有效性。Lee等[3]对多级机场检查站安全系统的排队过程进行了建模,将最大安全性和吞吐量双重目标的问题用非线性规划来解决。Doran等[4]认为,对安检人员进行培训、更新设备器材虽然能有效在保证安全的前提下提升安检的速度,但额外需要投入的费用使得这样的方式不切实际,于是提出基于离散时间马尔可夫链(DTMC)分析的端到端完成时间模型,捕获通过安全检查点体系结构的概率客流,期望提升现有安检点的效率、预测旅客进入到离开安检点的时间。Sankaranarayanan等[5]比较美国的亚特兰大、芝加哥以及洛杉矶3座城市机场的航班到达、乘客数量等数据,根据历史数据预测旅客安检等待时间,并将其可视化,从而达到提升旅客对安检的满意度、提高安检效率的目的。

排队论、概率论等方法主要聚焦的是如何削减实施安检所需的成本,如何使通道能够通过更多旅客,从而发挥理想状态下安检通道的效率,应用该方法过程中,研究者不一定会考虑到安检过程中旅客可能出现违反安检规定的情况。民航旅客安检领域对此方面的研究并不深入,但在其他领域的类似问题中,有学者采用博弈的方法对被监督、管理者的违规行为的成因与制止进行了探讨。文军等[6]研究了机场与政府监管部门的策略选择对机场安全运行的影响。李德龙等[7]构建了地铁安检部门与潜在袭击者之间的地铁安检反恐博弈模型。得到地铁安检中,针对不同情况安检部门适宜采取的策略方法,从而达到保证安全性的前提下减少安检成本的目的。冯文刚等[8]构建了民航公安、风险旅客和机场航司三方的民航安保演化博弈模型,得出民航安保中需要机场公安与机场航司协作打击旅客不守法行为的结论。张颖等[9]运用动态演化博弈,以一线矿工和安检员等有限理性的群体作为参与方,将参与者对策略得失的感知作为前景价值,作出相应模型假设、构建演化博弈模型,寻求抑制旷工违章行为的方法。谭钦文等[10]构建政府监管部门与工贸企业之间的博弈模型,发现社会监督率大于2/3时能有效改善安全监管博弈系统。Chen Hong等[11]就煤炭行业监管寻租机制构建三方博弈模型进行分析,根据博弈仿真结果给出降低监管成本、提升政府部门工资等建议来避免煤炭行业的寻租行为。

相对其他领域来说,目前针对民航旅客安检中监管部门、安检实施主体以及旅客三方之间具体如何相互影响的研究很少,这不利于我们对各个安检参与主体行为的理解、不利于我们从整个安检过程上分析造成安检低效的制因机理。可以明确的是,通过改进设备器材、调整安检流程能够起到加快安检速度提升安检效率、效能的作用。但安检速度加快是基于旅客的配合实现的,如果旅客趋向于实施携带违禁物品等违反安检规定的行为,那么安检的实施从根本上还是低效的。因此,本文拟采用演化博弈理论,同时将机场公安、安检员、旅客三者之间在机场安检中的关系纳入考虑,对旅客是否遵守民航旅客安检规定,机场公安是否加强监管,并进行处罚,安检员是否严格实施安检的三方策略选择通过演化博弈来进行分析研究,从而更好地理解旅客安检中三者在不同情境下作出的抉择,为机场公安监管制度与方式的调整提供依据,最终达到减少旅客违反规定造成安检低效的情况,使旅客安检更加高效,保证机场与空中的安全与治安秩序稳定。

1 民航旅客安检的演化博弈模型

演化博弈是演化理论与博弈理论的结合,不同于传统博弈论(假设博弈主体完全理性),它从有限理性的角度找到突破口[12],能够更好地分析和解决问题[8]。笔者基于演化博弈理论研究机场公安与旅客在旅客安检中相互影响的机制,首先需要模拟现实中影响机场公安与旅客策略选择的因素,构建博弈模型。根据模型进行计算得到模拟旅客和机场公安行为不再变化、趋于稳定的均衡点,进而分析得到不同情况下模型的演化稳定策略(ESS)。

1.1 模型假设

根据传统条件下民航旅客安检的规定和实施方式作出假设:

假设1旅客为参与人1,机场公安为参与人2,机场安检员为参与人3。三方均是有限理性的参与主体,策略选择随时间逐渐演化稳定于最优策略。

假设2旅客的策略空间α=(α1,α2)=(遵守民航旅客安检规定,违反民航旅客安检规定),其中选择α1的概率为x(0≤x≤1),选择α2的概率为(1-x)。机场公安的策略空间β=(β1,β2)=(加强监管,放松监管),机场公安以y(0≤y≤1)强度对机场的安检状况进行监管,(1-y)的值代表机场公安工作的懈怠程度。机场安检员的策略空间γ=(γ1,γ2)=(高强度安检,放松安检),其选择γ1的概率为z(0≤z≤1),选择γ2的概率为(1-z)。

假设3旅客的选择遵守民航旅客安检规定,例如将携带的打火机、酒精等违禁物品寄存、丢弃,可能损失的成本为Cp。旅客违反民航旅客安检规定时,实施违反民航旅客安检规定,逃避、扰乱安全检查的投机行为需要投入相应投机成本Ct,Ct

假设4机场公安履行监管职责,加强监管需要承担更多的监管成本Cg,此时机场安检员的放松安检行为会被机场公安发现。若发现安检员的违规行为则会告知其所属单位,并相应对违规行为作出处罚Pga。若机场公安放松监管,则无法获知机场安检员的策略选择信息,此时机场公安不对安检员作奖惩。若安检员发现旅客的违规行为,并通知机场公安,机场公安则会对违规旅客作出相应处罚Pgp。

假设5机场安检人员实施安检工作获得的工资收入为R,安检人员合规实施安检时旅客的违规行为能够被机场安检部门检出。安检员违规进行安检、放松安检要求时消耗的劳力更少,减少的劳力消耗为L。机场安检员违规实施安检时会接受违规旅客的贿赂Cb,Cb

假设6安检中所有安全隐患被检出,没有发生由于机场安检问题造成的不安全事件,机场公安会获得名誉或上级奖励等收益,可获得的收益为Rg,机场则会因安全性高得到旅客的好评和青睐,机场安检员也会因其检出旅客的不安全行为而受到奖励,安检员检出旅客不安全行为可获得的收益为Ra。安检员放松安检,无法检出旅客的不安全行为,存在概率θ发生不安全事件,安检员工作存在的漏洞会被查明,相应安检员需要担责,安检员为此付出的成本为Da;机场公安还需要进一步支付成本Dg来进行不安全事件的处理;此外旅客也需要承担发生不安全事件的责任Dp。

表1 模型参数说明

1.2 模型构建

在1.1假设的基础上可以构建出机场公安、旅客与安检员的策略博弈矩阵,如表2所示。

表2 策略博弈矩阵

1.3 模型分析

在表2博弈矩阵的基础上,分析每个参与主体对不同策略选择的适应度(即选择该纯策略期望获得的收益,博弈主体将不同情境下期望收益/成本相加即可得到),进一步根据复制动态方程[13]可得到博弈主体对不同策略选择的变化率。

根据表2,旅客选择遵守民航旅客安检规定时,旅客对安检员高强度安检、机场公安加强监管这一情景的适应度为[zy(-Cp)];旅客对安检员放松安检、机场公安加强监管这一情景的适应度为[(1-z)y(-Cp)];旅客对安检员高强度安检、机场公安放松监管这一情景的适应度为[(1-y)z(-Cp)];旅客对安检员放松安检、机场公安放松监管这一情景的适应度为[(1-z)(1-y)(-Cp)]。旅客选择遵守民航旅客安检规定的适应度为Eα,则

Eα=zy(-Cp)+(1-z)y(-Cp)+(1-y)z(-Cp)+(1-z)(1-y)(-Cp)=-Cp

(1)

同理,选择违反民航旅客安检规定的适应度为E1-α:

E1-α=yz(-Pgp-Ct)+(1-y)z(-Pgp-Ct)+y(1-z)(-Ct-θDp)+

(1-y)(1-z)(-Ct-θDp)=z(θDp-Pgp)-Ct-θDp

(2)

旅客策略选择的平均适应度Ex为

Ex=xEα+(1-x)E1-α

(3)

根据Malthusian动态方程,旅客选择遵守民航旅客安检规定的增长率为旅客选择遵守民航旅客安检规定的适应度Eα与旅客策略选择的平均适应度Ex之差。设时间为t,则表示旅客策略选择变化率的复制动态方程为

(4)

同理可计算得出机场公安和安检员的策略选择变化率。

机场公安选择加强监管的适应度为Eβ,选择放松监管的适应度为E1-β,有

Eβ=x(Rg+θDg)+z(Rg+Pgp+θDg-Pga)-xz(Rg+θDg+Pgp)+Pga-Cg-θDg

(5)

E1-β=x(Rg+θDg)+z(Rg+Pgp+θDg)-xz(Rg+Pgp+θDg)-θDg

(6)

机场公安策略选择的平均适应度Ey为

Ey=yEβ+(1-y)E1-β

(7)

由此,表示机场公安策略选择变化率的复制动态方程为

(8)

安检员选择高强度安检的适应度为Eγ,选择放松安检的适应度为E1-γ,则有

Eγ=R+Ra(1-x)

(9)

E1-γ=y(-Pga-Ca)+x(θDa-Cb)+R+L+Cb-θDa

(10)

安检员策略选择的平均适应度Ez为

Ez=zEγ+(1-z)E1-γ

(11)

因此,表示安检员策略选择变化率的复制动态方程为

F(z)=z(1-z)[y(Pga+Ca)+x(Cb-θDa-Ra)-L-Cb+θDa+Ra]

(12)

综上,式(4)、(8)和(12)等3个复制动态方程组成了传统旅客安检的演化系统:

(13)

传统旅客安检的演化系统描述了整个传统旅客安检流程中各主体博弈演化的群体动态,各复制动态方程反映了不同博弈主体策略变化的速度和方向,当其数值为零时表明博弈主体的策略选择不再变化,此时博弈达到一种相对稳定的均衡状态。令F(x)=0,F(y)=0,F(z)=0,得到传统旅客安检博弈系统的8个纯策略均衡解,分别为:X1=(0,0,0),X2=(1,0,0),X3=(0,1,0),X4=(0,0,1),X5=(1,1,0),X6=(1,0,1),X7=(0,1,1),X8=(1,1,1)。

根据Friedman理论可构建该传统旅客安检的演化系统的雅克比矩阵:

其中,A=z(Pgp-θDp)+Ct+θDp-Cp,B=0,C=(Pgp-θDp),D=0,E=-zPga+Pga-Cg,F=-Pga,G=Cb-θDa-Ra,H=Pga+Ca,I=y(Pga+Ca)+x(Cb-θDa-Ra)-L-Cb+θDa+Ra

根据李雅普诺夫间接法,当均衡点的值带入雅可比矩阵时,若矩阵的特征值均为负实部,则该均衡点渐进稳定点;若只有值为0和负实部的特征值,则该均衡点稳定性不能根据特征值符号确定;若矩阵有为正实部的特征值,则该均衡点不稳定。各均衡解的局部稳定性分析如表3所示。

表3 均衡解的局部稳定性分析

根据表3,可以得到推论1～推论6:

推论1当Pga

推论1表明:若机场公安加强监管需要付出的成本高于对放松安检员的惩罚额,同时旅客遵守安检规定的损失大于投机成本与其需承担的发生不安全事件的损失之和,并且安检员选择放松安检时可以减少耗费的精力与可能收受的贿赂之和大于其可能因违规行为不能查出旅客违反民航旅客安检规定情况时承担的发生不安全事件的损失与未能获取的绩效奖励之和,机场公安的选择会朝向放松监管发展,安检员的策略选择也会朝着放松安检的方向发展,旅客的策略最终也会是违反民航旅客安检规定。

推论2当PgaCp时,系统存在均衡点X2=(1,0,0)。

推论2表明:若机场公安加强监管需要付出的成本高于对放松安检员的惩罚额,同时旅客遵守安检规定的损失小于投机成本与其需承担的发生不安全事件的损失之和,旅客的的策略选择会朝向遵守民航安检规定发展,机场公安以及安检员则分别会趋向于放松监管和放松安检。该情况是十分理想的状态,不需要机场的高强度安检工作也不需要机场公安的严格监管,就能够达到旅客遵守安检规定的状态。

推论3当Pga>Cg,(θDp+Ct)(Pga+Ca+θDa+Ra)时,系统存在均衡点X3=(0,1,0)。

推论3表明:若机场公安加强监管需要付出的成本低于对放松安检员的惩罚额,并且旅客遵守安检规定的成本大于违反安检规定的投机成本与发生不安全事件的损失之和,此外安检员放松安检减少的精力消耗与可能收受的贿赂之和大于其违规行为不能查出旅客违反民航旅客安检规定情况时受到的行政处罚额、绩效处罚额、承担的发生不安全事件的损失以及未能获取的绩效奖励之和,机场公安的选择会朝向加强监管发展,安检员的策略选择则会朝着放松安检的方向发展,旅客的策略则最终会朝着违反民航旅客安检规定发展。

推论4当(θDa+Ra)>(L+Cb),(Pgp+Ct)

推论4表明:若安检员选择放松安检时可以减少耗费的精力与可能收受的贿赂之和小于其可能因其违规行为不能查出旅客违反民航旅客安检规定情况时承担的发生不安全事件的损失与未能获取的绩效奖励之和,同时旅客遵守安检规定的成本大于违反安检规定的投机成本与发生不安全事件的损失之和,安检员的策略选择则会朝着高强度安检的方向发展,旅客的策略则最终会朝着违反民航旅客安检规定发展,机场公安的选择最终会朝向放松监管发展。

推论5Pga>Cg,(θDp+Ct)>Cp,L>(Pga+Ca)时,系统存在均衡点X5=(1,1,0)。

推论5表明:若机场公安加强监管需要付出的成本低于对放松安检员的惩罚额,并且旅客遵守安检规定的成本小于违反安检规定的投机成本与发生不安全事件的损失之和,同时安检员放松安检减少的精力消耗大于其违规行为不能查出旅客违反民航旅客安检规定情况时受到的行政处罚额、绩效处罚额之和,机场公安的选择会朝向加强监管发展,安检员的策略选择则会朝着放松安检的方向发展,旅客的策略则最终会朝着遵守民航旅客安检规定发展。此状态下,旅客不会违反安检规定,安检员也能够轻松地实施安检,是我们相对希望达到的安检状态。

推论6当Pga>Cg,(θDp+Ct)>Cp>(Pgp+Ct),(θDa+Ra-Cb)>L>(Pga+Ca)时,系统存在稳定均衡点X5=(1,1,0)和稳定均衡点X4=(0,0,1)。

推论6表明:推论4与推论5的条件可以同时满足,当二者同时满足时,均衡点X5=(1,1,0)和X4=(0,0,1)均可能达到稳定状态,具体会因主体策略初始选择的变化而有所不同。如果此时要避免博弈主体的策略选择朝向(违反旅客安检规定,放松监管,加强安检)的状态发展,机场公安必须加大对违规旅客的处罚额度、使旅客认识到违反安检规定的严重后果,从而使条件不再满足稳定点X4达到均衡的要求。

综上,旅客安检中机场公安、安检员、旅客三方的行为策略选择主要受到Cg,Pgp,L,Cb,Pga,Ca,Da,Ra,Cp,Dp、Ct,θ等12个参数的影响。要想避免旅客倾向选择违反民航旅客安检规定的安检低效情况的发生,就需要尽可能使博弈向稳定均衡点X2=(1,0,0)或X5=(1,1,0)方向发展,根据表示旅客策略选择变化的公式(4),Cp,Dp,θ等因素大都是由旅客可能实施的违反民航旅客安检规定行为的类型所决定,很难通过采取措施来调整。Pgp,Ct等参数却能够通过政府、机场采取措施等外力来改变,因此初步认为可能可以采取如下措施来实现博弈趋向稳定均衡点X2=(1,0,0)或X5=(1,1,0):适当提高对安检员放松安检行为的处罚力度;严厉处罚违反民航安检规定的旅客;增加旅客违规行为不被检出的难度,使旅客违规的投机成本提高。

2 演化仿真

上述促使旅客倾向选择遵守旅客安检规定的措施是否有效,需要通过仿真模拟来证实。

2.1 稳定策略仿真

为了更加直观、准确地分析旅客安检中造成安检低效的影响因素的作用,本文基于专家建议以及现实情况,设定了两数组,具体为

数组1Cg=100,Pgp=150,L=500,Cb=50,Pga=200,Ca=200,θDa=200,Ra=20,Cp=200,θDp=150,Ct=100。该数组满足推论4、不满足推论3的要求。

数组2Cg=100,Pgp=50,L=500,Cb=50,Pga=200,Ca=200,θDa=250,Ra=350,Cp=200,θDp=150,Ct=100。该数组满足推论5的要求。

将模型赋予数组1与数组2的数值,用MATLAB R2016b分别从不同初始策略组合出发随时间演化50次,仿真结果如图1和图2所示。

图1 数组1模拟结果

图2 数组2模拟结果

由图1可知,推论5要求下,随着时间的变化,机场公安、旅客与安检员三方的策略选择趋向于(遵守民航旅客安检规定,加强监管,放松安检)的稳定状态。而由图2可知,随时间变化,机场公安、旅客与安检员三方的策略选择根据初始策略的不同而分别趋向于(遵守民航旅客安检规定,加强监管,放松安检)、(违反民航旅客安检规定,放松监管,高强度安检)的稳定状态。综上仿真结果可见,仿真分析与各方策略稳定性分析结论均一致且具有有效性。

2.2 影响旅客策略选择主要因素的变化

在现实影响旅客策略选择的因素中,本文在数组1的基础上,分别调整参数Pgp、Ct,起始策略设置为(0.2,0.8,0.8),观察旅客策略选择变化的情况。

设置Pgp的数值分别为350,250,200,150,50,仿真结果见图3和图4所示。此时博弈主体的策略选择趋向于(1,1,0),各参数数值满足前文中推论3的条件,结果与推论3相符。虽然能够使旅客的选择更快趋向于遵守民航旅客安检规定,但变化的幅度却并不明显。此外,调整的数值大小也不会出现旅客倾向于选择不遵守民航旅客安检规定的情况,也即Pgp的数值无法影响旅客策略选择的整体趋势。总体来说,在当前的安检模式中要克服安检低效问题,加大对旅客的处罚力度的效果并不明显。

图3 Pgp对参与主体策略的影响

图4 Pgp对旅客策略的影响

设置Ct的数值分别为120,90,60,30,0,仿真结果如图5和图6所示。越大的Ct能够实现旅客选择越快地向遵守民航旅客安检规定发展,而过小的Ct值则会致使旅客不遵守民航旅客安检规定。因此,如果寻求方法提高旅客违反民航旅客安检规定的难度,使其投机成本增加,倾向选择违反民航旅客安检规定的安检低效稳定状态。达到这一目的,一方面在于提升安检设备器材的灵敏度与精度,另一方面在于通过培训、考核等方式提高安检人员整体识别旅客异常行为的能力和对违禁物品敏感性等。

图5 Ct对参与主体策略的影响

3 结论

根据前述分析和仿真结果,得出结论及建议:1)根据对复制动态方程的分析,民航旅客安检中,旅客策略选择主要受到Pgp,Cp,Dp,Ct,θ等5个参数的影响。其中Cp、Dp和θ受旅客实施的违规行为类型的影响较大,相对固定,不易受机场安检、机场公安管理的影响,而Pgp、Ct等参数则能够通过机场公安、机场对机场安检的管理手段、设备的调整来改变。2)机场公安对旅客违规行为实施的处罚Pgp的大小,并不像直观上我们认为的,能够大幅影响到旅客的策略选择,Pgp的大小在仿真中仅仅使旅客的策略选择产生了小幅度的变化,并且不能直接改变旅客的策略选择倾向。因此旅客安检现状下,对旅客的处罚数额并不需要作过多调整。需要注意的是,Pgp数值较小时,参数可能符合推论6的条件,数值较小时有可能随着各个参与主体初始策略的变化而趋向策略(0,0,1),这显然不是我们希望达到的目标,适当提高Pgp数值可以使参数不再满足推论6,转而仅仅符合推论5,从而避免旅客违反安检规定的低效安检稳定状态的出现。因此在民航旅客安检实践中,为了预防安检低效的发生,我们可以提高对违规旅客的处罚力度,以避免旅客违反安检规定稳定状态的出现。3)旅客付出的投机成本Ct虽然一定程度上受到旅客选择遵守规定的损失Cp的限制,但尽可能提高旅客成功逃避安检所需的Ct的值不仅能够避免旅客违规的稳定情况出现,也能够更有效地促使旅客选择遵守安检规定。利用新兴技术手段、创新安检管理方法,促进人防、物防水平,提高安检准确度,是提升安检有效性的关键方法。