地方政府竞争视角下跨区域环境规制的演化博弈策略研究

2020-08-25 02:50张振华张国兴
关键词:严格执行情形规制

张振华,张国兴

(兰州大学 管理学院, 甘肃 兰州 730000)

一、引言

近年来京津冀及周边六省市、长三角和珠三角等典型区域的地域性、频次多、程度重的环境污染事实表明,中国跨区域环境污染治理任重而道远。由于能源资源的稀缺性、环境产品的公共属性、环境问题的负外部性、环境产权的模糊性以及信息的不对称性使得仅靠市场难以实现治污减排的目标,因此需要地方政府环境规制来弥补“市场失灵”的缺陷。环境规制是为了纠正环境污染的负外部性,社会公共机构通过一系列法律法规、方针政策的制定和执行对微观经济主体直接或间接地加以约束、干预,通过改变市场资源配置以及企业和消费者的供需决策来内化环境成本,从而实现减少污染物排放、保护环境、促进社会福利最大化的制度安排。[1]地方政府环境规制作为环境治理的重要组成成分在环境治理体系中处于基础和核心地位。不断优化环境规制策略是地方政府提升环境治理成效、促进绿色经济发展的核心工作。

在跨区域环境规制的演化和博弈分析中,从20世纪末开始,学者们从地方政府竞争角度展开了激烈的学术讨论,取得了丰硕的研究成果。Breton[2]首先给出了关于“地方政府竞争”的一个较全面的定义,它指的是某个区域内部不同经济体的政府利用环境政策等手段,吸引资本、劳动力和其他流动性要素进入以增强经济体自身竞争优势的行为。在地方政府竞争的背景下,区域内各类环境规制存在相互竞争的特征,其形成原因之一即是跨区域环境污染问题。[3]Fredriksson等[4]与Woods[5]认为由于环境污染具有外部性,能够在地区之间传递,即使本地区实行严格的环境规制也不一定会减少环境污染带来的损失,因此相比于其他政策,环境规制政策更易引发区域内的“逐底竞争”行为。Konisky[6]根据1985—2000年美国各州环境污染控制法规,以策略互动模型为基础,通过引入非对称效应实证分析探讨了环境污染防治政策下区域政府间“逐底竞争”理论;而且,Konisky[7]基于美国的经验证据还发现,区域内州的规模越小,环境污染治理的竞争压力越大。在地方政府污染控制竞争过程中,具有短期行为倾向的地方政府或河流中下游地区的地方政府倾向于采取“搭便车”战略。[8]为了争夺企业资源和扩大税基以获得区域优势,地方政府甚至主动降低环境标准。[9]李永友等[10]利用跨省工业污染数据分析环境规制政策效果时,发现临近地区环境污染控制的严厉程度对本地区污染控制决策具有显著影响,地区间环境污染控制决策呈现出明显的策略性特征。朱平芳等[11]与张文彬等[12]分别探讨了中国地方政府间环境污染治理的策略性博弈以及大气环境规制强度的省际竞争形态。王宇澄[13]选取中国31个省级地区的面板数据,通过空间计量方法,证明了中国地方政府间环境规制竞争的存在性,并指出中国省际环境规制具有跨界溢出效应。张华[14]及张可等[15]则发现地区间环保投入存在明显的策略性互动和地区交互影响。傅强等[16]与李胜兰等[17]则基于地方政府竞争的视角,分别提出推动各级地方政府跨区域环保合作及推行多元化政绩考核的政策建议。

通过回顾已有研究成果,可以发现以下研究特点。第一,在研究内容上,不同规制主体竞争的相关研究可以分为两个方面:一个是研究环境规制竞争的存在性和类型,另一个是考察环境规制竞争的后果。二者之中,以前者为主,后者为辅,前者尤其关注环境规制的“逐底竞争”议题[18],即地方政府竞争对环境污染治理的负面影响,而对于不同地方政府之间的环境规制策略行为及其影响因素的研究相对匮乏。第二,在研究方法上,大多数现有研究都是以博弈参与方的完全理性为基本前提假设。然而,由于现实环境污染问题复杂、参与方信息不完整以及计算能力和认知水平有限,实际上很难达到完全理性。博弈参与方的策略选择通常是不断学习和调整的结果。在环境规制执行博弈中,不同地方政府并不能仅通过一次博弈就能找到最优策略,而是不断调整以寻找更好的策略,最终形成稳定的策略。[19]因此,基于有限理性来研究地方政府环境规制策略行为及其影响因素更具现实意义。

随着中国财政分权和市场化改革的推进,地方政府逐渐具有了独立的利益诉求和行为能力。在环境规制的执行过程中,利益目标的冲突使得中国不同地方政府之间存在演化博弈关系。考虑到跨域环境规制中成本分担和收益共享问题尤为突出,本文在地方政府竞争视角下,通过构建中国地方政府之间的演化博弈模型来探究环境规制执行中不同地方政府的策略选择规律和相关影响因素,以期探析中国环境污染问题的深层原因以及环境规制失灵的内在机理,为促进环境规制的严格执行提供理论依据。

二、模型假设与符号说明

(一)模型基本假设

假设1:在环境监管体系方面,中国在中央政府的统一监管下实行地方政府责任制,地方政府负责辖区内的环境质量。[20]在不同地方政府辖区内,博弈参与方为两个不同的地方政府。地方政府严格执行环境规制时需要承担一定的执行成本。

假设2:在中国财政分权制度的现实背景下,经济分权为地方政府提供了一定的决策自由与施政空间。地方经济发展指标和地方环境质量指标在地方政府政绩考核体系中的权重,能够影响地方政府环境规制的最终决策方向。不执行环境规制的地方政府与严格执行环境规制的地方政府相比,会承担更多的环境损失,但也会得到更多的经济收益。

假设3:在地方政府竞争条件下,当博弈参与方选择不同执行策略时,严格执行环境规制的地方政府要承担工业转移损失。地方政府与地方政府的演化博弈是在随机配对条件下相邻参与方的重复博弈,策略选择包括严格执行和不执行环境规制,策略集为{严格执行,不执行}。

(二)基本符号说明

CA(CB)为地方政府A(B)严格执行环境规制时的执行成本;QA(QB)是地方政府A(B)不执行环境规制与严格执行相比环境损失的变化;GA(GB)是地方政府A(B)不执行环境规制与严格执行相比经济收益的变化;γA(γB)为地区A(B)对地区B(A)的外部环境影响系数,0<γA<1,0<γB<1;δ1(δ2)为环境(经济)指标在政绩考核体系中的权重,0<δ1<1,0<δ2<1;RA(RB)为当地方政府B(A)不执行环境规制而地方政府A(B)严格执行环境规制时所承担的工业转移损失,RA和RB刻画了地方政府竞争的激烈程度;εA(εB)是从地区A(B)到地区B(A)的工业转移比例,0<εA<1,0<εB<1。

三、地方政府间环境规制演化博弈模型

(一)演化博弈模型构建

考虑2×2演化博弈,地方政府A和地方政府B可以随机独立地选择策略“严格执行”和“不执行”。本文使用复制动态机制[21]模拟地方政府之间的博弈过程。假设地方政府A选择严格执行策略的比例为yA,则选择不执行策略的比例为1-yA; 地方政府B选择严格执行策略的比例为yB,则选择不执行策略的比例为1-yB。地方政府A和B的博弈支付矩阵如表1所示。

表1 地方政府A与地方政府B的博弈支付矩阵

地方政府A选择严格执行策略的期望收益是:

U1=yB(-CA)+(1-yB) (-CA-δ1γBQB-δ2RA)

(1)

地方政府A选择不执行策略的期望收益是:

U2=yB[-δ1(1-γA)QA+δ2(GA+εBRB)]+

(1-yB) [-δ1(1-γA)QA-δ1γBQB+δ2GA]

(2)

地方政府A的平均收益是:

(3)

基于Malthusian方程[22],地方政府A选择执行环境规制策略的复制动态方程为:

yA(1-yA)(U1-U2)

(4)

将U1和U2代入到复制动态方程,可以得到:

(5)

地方政府B选择严格执行策略的期望收益是:

U3=yA(-CB)+(1-yA) (-CB-δ1γAQA-δ2RB)

(6)

地方政府B选择不执行策略的期望收益是:

U4=yA[-δ1(1-γB)QB+δ2(GB+εARA)]+

(1-yA) [-δ1(1-γB)QB-δ1γAQA+δ2GB]

(7)

地方政府B的平均收益是:

(8)

同理,地方政府B选择执行环境规制策略的复制动态方程为:

(9)

将U3和U4代入到复制动态方程,可以得到:

(10)

联立方程(5)和(10),可以得到地方政府A和地方政府B的复制动力系统:

(11)

利用Jacobian矩阵[23]可以分析复制动力系统(11)均衡点的渐进稳定性,并由此得到演化稳定策略(Evolutionarily Stable Strategy,ESS)[24],该系统的Jacobian矩阵是:

(12)

则矩阵J的行列式为:

detJ=(1-2yA)[-CA+δ1(1-γA)QA-δ2(GA+RA)+δ2(RA-εBRB)yB](1-2yB) [-CB+δ1(1-γB)QB-δ2(GB+RB)+δ2(RB-εARA)yA]-yA(1-yA)δ2(RA-εBRB)yB(1-yB)δ2(RB-εARA)

(13)

矩阵J的迹为:

trJ=(1-2yA)[-CA+δ1(1-γA)QA-δ2(GA+RA)+δ2(RA-εBRB)yB]+(1-2yB)[-CB+δ1(1-γB)QB-δ2(GB+RB)+δ2(RB-εARA)yA]

(14)

(15)

(16)

令πA=-CA+δ1(1-γA)QA-δ2(GA+RA)(πB=-CB+δ1(1-γB)QB-δ2(GB+RB)),其中πA(πB) 是与不执行环境规制相比,地方政府A(B)选择严格执行环境规制的净收益。进一步地,πA+δ2(RA-εBRB) (πB+δ2(RB-εARA)) 是在竞争条件下地方政府A(B)选择严格执行环境规制的净收益。

将系统均衡点数值代入到矩阵行列式和迹的表达式,结果如表2所示。

表2 系统(11)均衡点对应的矩阵行列式和迹表达式

(二)演化博弈模型分析

情形1:πA>0,πB>0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)>0

情形2:πA>0,πB<0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)>0

情形3:πA>0,πB<0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)<0

情形4:πA<0,πB>0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)>0

情形5:πA<0,πB>0,πA+δ2(RA-εBRB)<0,πB+δ2(RB-εARA)>0

情形6:πA<0,πB<0,πA+δ2(RA-εBRB)<0,πB+δ2(RB-εARA)<0

情形7:πA<0,πB<0,πA+δ2(RA-εBRB)<0,πB+δ2(RB-εARA)>0

情形8:πA<0,πB<0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)<0

情形9:πA<0,πB<0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)>0

表3 类别Ⅰ均衡点局部稳定性

由于情形9的特殊性,即具有两个演化稳定策略ESS,本文用图1进一步表征情形9的局部稳定性。此外,在总结类别Ⅰ均衡点局部稳定性的基础上,本文提炼出类别Ⅰ的情况下地方政府之间博弈的演化策略,如表4所示。

图1 情形9时系统的演化相位图

结论1 情形6、7、8中,地方政府A和B实行环境规制的净收益均为负,且最多只有一个地方政府A或B在竞争条件下实行环境规制的净收益为正,此时,地方政府A和B均会选择不实行环境规制,最终导致“公地悲剧”①。

表4 类别Ⅰ不同情形下地方政府之间博弈的演化稳定策略

结论2 情形9中,地方政府A和B实行环境规制的净收益均为负,且地方政府A和B在竞争条件下实行环境规制的净收益均为正,此时,地方政府A和B均会选择不实行环境规制或均会选择实行环境规制。这是“协调博弈”②的结果。

结论3 情形3和5中,当地方政府A(B)实行环境规制的净收益与竞争条件下实行环境规制的净收益均为正,而地方政府B(A)的两种净收益均为负,此时,地方政府A(B)会选择实行环境规制,而地方政府B(A)会选择不实行环境规制。这是“占优策略”③的结果,容易催生“搭便车”行为。

结论4 情形1、2、4中,地方政府A和B在竞争条件下实行环境规制的净收益均为正,或最多只有一个地方政府实行环境规制的净收益为负,此时,地方政府A和B均会选择实行环境规制,达到“帕累托最优”④的状态。

情形10:πA>0,πB>0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)>0

情形11:πA>0,πB>0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)<0

情形12:πA>0,πB<0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)<0

情形13:πA<0,πB>0,πA+δ2(RA-εBRB)<0,πB+δ2(RB-εARA)>0

情形14:πA<0,πB>0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)>0

情形15:πA<0,πB>0,πA+δ2(RA-εBRB)<0,πB+δ2(RB-εARA)<0

情形16:πA<0,πB>0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)<0

情形17:πA<0,πB<0,πA+δ2(RA-εBRB)<0,πB+δ2(RB-εARA)<0

情形18:πA<0,πB<0,πA+δ2(RA-εBRB)>0,πB+δ2(RB-εARA)<0

在总结类型Ⅱ均衡点局部稳定性的基础上,提炼出类别Ⅱ的情况下地方政府之间博弈的演化策略,如表6所示。

表5 类别Ⅱ均衡点局部稳定性

结论5 情形17、18中,地方政府A和B实行环境规制的净收益均为负,此时,地方政府A和B均会选择不实行环境规制,最终导致“公地悲剧”。

结论6 情形11、12中,地方政府A实行环境规制的净收益与竞争条件下实行环境规制的净收益均为正,而地方政府B在竞争条件下实行环境规制的净收益为负,此时,地方政府A会选择实行环境规制,而地方政府B会选择不实行环境规制。这是“占优策略”的结果,容易催生“搭便车”行为。

表6 类别Ⅱ不同情形下地方政府之间博弈的演化稳定策略

结论7 情形13、15中,地方政府A实行环境规制的净收益与竞争条件下实行环境规制的净收益均为负,而地方政府B实行环境规制的净收益均为正,此时,地方政府A会选择不实行环境规制,而地方政府B会选择实行环境规制。这是“占优策略”的结果,容易催生“搭便车”行为。

结论8 情形16中,地方政府A实行环境规制的净收益为负,竞争条件下实行环境规制的净收益为正,而地方政府B实行环境规制的净收益为正,竞争条件下实行环境规制的净收益为负,此时,最终的演化结果带有随机性,地方政府A和B选择实行环境规制和选择不实行环境规制的行为共存。这是“混合策略”⑤的结果。

结论9 情形10、14中,地方政府A在竞争条件下实行环境规制的净收益为正,而地方政府B实行环境规制的净收益与竞争条件下实行环境规制的净收益均为正,此时,地方政府A和B均会选择实行环境规制,达到“帕累托最优”的状态。

四、参数讨论与结果分析

表4和表6分别展示了类别Ⅰ和类别Ⅱ不同情形下地方政府间演化博弈的进化稳定策略。当πA>0时(类别Ⅰ的情形1、2、3以及类别Ⅱ的情形10、11、12),地方政府A倾向于选择严格执行环境规制。当πA<0时,对于类别Ⅰ的情形5、6、7、8以及类别Ⅱ的情形13、15、17、18,地方政府A倾向于选择不执行环境规制。当πA<0时,对于类别Ⅰ的情形4以及类别Ⅱ的情形14,由于地方政府B严格执行的净收益以及竞争条件下严格执行的净收益都大于0,地方政府B总是会选择严格执行环境规制;由于竞争条件下地方政府A严格执行的净收益大于0,所以地方政府A也倾向于选择严格执行环境规制。当πA<0时,对于类别Ⅰ的情形9,当地方政府A和B实行环境规制的净收益均为负,且地方政府A和B在竞争条件下实行环境规制的净收益均为正,出现“协调博弈”的结果,地方政府A和B均会选择不实行环境规制或均会选择实行环境规制。当πA<0时,对于类别Ⅱ的情形16,当地方政府A实行环境规制的净收益为负,竞争条件下实行环境规制的净收益为正,而地方政府B实行环境规制的净收益均为正,竞争条件下实行环境规制的净收益为负,出现“混合策略”的结果,最终的演化结果带有随机性,地方政府A和B选择实行环境规制和选择不实行环境规制的行为共存。

依据表4和表6的结果,本文发现在地方政府间环境规制演化博弈下,中央政府如果要使不同地方政府都“严格执行环境规制”,则必须满足 :

因此,分析对πA+δ2(RA-εBRB)和πB+δ2(RB-εARA)有积极正向影响的参数变化才具有现实意义。

在地方政府间环境规制演化博弈中,提高环境指标在政绩考核体系中的权重、降低经济指标在政绩考核体系中的权重、降低地方政府严格执行环境规制时的执行成本、增大地方政府不执行环境规制与严格执行相比环境损失的差距、降低一个地区对邻近地区的外部环境影响系数、降低地方政府不执行环境规制与严格执行相比经济收益的差距、降低当一个地方政府不执行环境规制而临近地方政府严格执行环境规制时所承担的工业转移损失、降低从临近地区到当地的工业转移比例等,都能够使πA+δ2(RA-εBRB)和πB+δ2(RB-εARA)得到相应提高。

五、结论与政策建议

本文在地方政府竞争视角下以博弈参与方有限理性为前提,运用演化博弈模型分析了中国跨区域环境规制中不同地方政府的策略选择规律和相关影响因素。本文研究结论如下。

在地方政府环境规制演化博弈中,环境(经济)指标在政绩考核体系中的权重、地方政府严格执行环境规制时的执行成本、地方政府不执行环境规制与严格执行相比环境损失的变化、一个地区对邻近地区的外部环境影响系数、地方政府不执行环境规制与严格执行相比经济收益的变化、当一个地方政府不执行环境规制而临近地方政府严格执行环境规制时所承担的工业转移损失以及从临近地区到当地的工业转移比例等,都是地方政府环境规制决策的重要影响因素。

环境质量的持续改善亟需地方政府严格执行环境规制。为了改变各地区“竞争大于合作”的思维,改变“各扫门前雪”的现状,提高各地区环境污染治理效果,本文基于研究结论提出如下政策建议。

(1)中央政府应继续完善现有地方政府的政绩考核体系,加强制度层面的顶层设计[25]。具体来看,中央政府需要继续完善污染物减排量和公众环保满意度等政绩考核指标,逐步上调环境指标在政绩考核体系中的权重;适当降低经济指标在政绩考核体系中的权重,额外奖励经济发展与环境保护并重的地方政府。

(2)通过实施财政补贴、财政转移支付、环境规制配套资金以及将环境规制支出责任转移给上级政府等不同手段,降低地方政府严格执行环境规制时的执行成本。

(3)在中央政府的政策指导下,不同地方政府需要建立并完善不同地区之间的横向生态补偿机制,使地区间的外部环境影响内部化。

(4)持续加强科技领域环境规制政策支持力度。提供污染控制领域的科技政策支持,增大相应环境规制下的污染物减排量,从而提高地方政府严格执行环境规制时的预期收益。

(5)加强跨区域产业发展协调,促进地方政府间不同产业类型合理发展。大力发展第三产业,降低劳动与资源密集型产业的比重,从而降低地区间环境规制差异带来的工业转移损失。

注释:

① 公地悲剧:一种涉及个人利益与公共利益对资源分配有所冲突的社会陷阱。这一概念经常运用在区域经济学、跨边界资源管理等学术领域。公地作为一项资源或财产有许多拥有者,他们中的每一个都有使用权,但没有权利阻止其他人使用,而每一个人都倾向于过度使用,从而造成资源的枯竭。之所以叫悲剧,是因为每个当事人都知道资源将由于过度使用而枯竭,但每个人对阻止事态的继续恶化都感到无能为力,且都抱着“及时捞一把”的心态,这加剧了事态的恶化。

② 协调博弈:参与人对不同策略组合有相同偏好的博弈。在给定其他参与人行为策略的条件下,没有参与者有动机改变其行为策略,也没有参与者希望其他参与者会愿意改变其行为。

③ 占优策略:无论其他参与者如何反应都属于本参与者最佳选择的竞争策略。

④ 帕累托最优:是指资源分配的一种理想状态,假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好。如果经济中没有任何一个人可以在不使他人境况变坏的同时使自己的情况变得更好,那么这种状态就达到了资源配置的最优化。这样定义的效率被称为帕累托最优效率。

⑤ 混合策略:策略参与人在给定的信息情况下以某种概率分布随机地选择不同的行动,称为混合策略。参与人采取的不是明确唯一的策略,而是其策略空间上的一种概率分布。

猜你喜欢
严格执行情形规制
主动退市规制的德国经验与启示
避免房地产继承纠纷的十二种情形
从规则本源出发,强化班级课堂纪律管理
四种情形拖欠劳动报酬构成“拒不支付”犯罪
保护与规制:关于文学的刑法
严格执行党纪政纪处分条例
论《反不正当竞争法》的规制范畴
出借车辆,五种情形下须担责
确保管道安装工程质量之我见
内容规制