基于蜈蚣悖论的不完全信息动态博弈研究

2016-10-20 07:10刘奇玄莉

商情 2016年6期

关键词：悖论

刘奇玄莉

【摘要】蜈蚣博弈（centipede game）是博弈論（Game Theory）中的一种经典模型，在经济学、国际关系、军事战略等学科都有广泛的应用。传统上采用的逆推法在分析完全且完美信息的动态博弈时无疑是有用的工具，然而在蜈蚣博弈问题上逻辑严密的逆推法得到的结论却与直觉相悖。笔者认为经典案例与现实的最大差异在于现实中存在的都是不完全信息的博弈，并举经济学中的海盗分金模型和中国古代三国时期的孙刘联盟分别作为完全和不完全信息之例加以辅证，以期使之在现实生活中得到更广泛的应用。

【关键词】蜈蚣博弈，悖论，不完全信息动态博弈，海盗分金

“蜈蚣博弈”是罗森塞尔（Rosenthal）于1981年提出的一个动态博弈问题，由于其扩展形很像一条蜈蚣而得名。两个博弈方A和B，轮流进行策略选择，可供选择的策略有“合作”或“背叛”，我们假设A和B均为完全理性人，博弈次数是有限次，且支付给定如下：

A ------ B ------ A --………….-- A ------ B ------ A ------ B ------ （10，10）

| * * * | * * * | * *………* * | * * * | * * * | * * * |

（1，1）（0，3）（2，2）（8，8）（7，10）（9，9）（8，11）

博弈从左向右进行，横向表示合作，纵向表示背叛，括号中表示（A的收益，B的收益）。考虑最后一步：B选择背叛的收益为11，大于合作收益10，则B一定选择背叛；A知道B这样想，所以在上一步时不会选择合作，如此推论下去，结论是A在一开始就不会选择合作，两人收益各得1，博弈结束。而直观上看，如果合作下去两人的收益似乎都要更多更有利，因此逆推法的逻辑和直觉出现了悖论。

另外一个利用逆推法的经济学模型是海盗分金。5个海盗抢了100枚金币，他们通过抽签来决定顺序，每人提出一个分配方案进行全体投票表决，超过半数的人赞成则方案通过，否则提出方案者就要被扔到海里喂鲨鱼。假定所有海盗都是聪明的理智人，还是从后往前推：当1至3号都被扔到海里只剩4号和5号时，无论4号提出何种方案5号都可以投反对票以独吞所有金币，4号必死无疑，因此他定会无条件支持3号的方案。3号知道4号的想法，因此轮到他时，会提出（100，0，0）的方案，这样虽然4号一枚金币都得不到仍然会投赞成票，再加上自己的票，3号的方案会获得通过。而2号也洞悉了3号的想法，他会提出（98，0，1，1）的方案，这样4号和5号的结果比3号主持分配时要好，因此2号得到了两人的支持，方案获得通过。1号推知2号的方案后，会提出（97，0，1，2，0）或（97，0，1，0，2），这样3号能得到一枚金币，比2号的方案要好，4号或5号也能比原先多得到一枚金币，因此会支持1号的方案，最终结果1号独得97枚！这样，排在最前面的人看似不利，有着更高被扔到海里的风险，结果成为这场博弈的最大赢家；而最后的人看似安全，甚至能坐收渔翁之利，却不得不接受别人的方案只能分得一小杯残羹。海盗分金可谓是逆推法在完全信息动态博弈中应用的经典案例，但许多人不禁要问：其他四个海盗真的会眼睁睁看着1号把绝大部分金币收入囊中吗？其实，我们在这个模型中假设了所有博弈方均能完全了解其他人的策略，倘若有人不，那么博弈定不会在第一步就结束，这就涉及到了不完全信息动态博弈。笔者认为这种情况要比完全信息在现实中利用的更为广泛，不妨举三国鼎立时期的孙刘联盟为例分析。

公元208年，孙刘两家联手抗曹，合作时间越长越有利，但其中有个诱使联盟破裂的因素——荆州。两人都可以选择一开始就撕破脸皮开打，这样协议撕毁，两人都无法从合作中取得收益。他们也可以选择搁置争议，先合作下去，但荆州在刘备手里，搁置时间越长孙权要回来的可能性就越小。不妨假设N年后，孙权就永远要不回来了。博弈者孙权想，不如在第N-1年的时候撕毁协议把荆州抢回来，孙刘少联盟一年损失也不太大。另一博弈方刘备想，与其等到第N-1年的时候孙权把荆州抢了，不如先下手为强，在第N-2年的时候翻脸，联盟时间少那么一年对打败曹操影响也微乎其微。博弈就这么进行下去，直到孙权想，孙刘联盟对抗曹操起码要维持11年，在这之前刘备不敢跟我翻脸，那11年一到，就让吕蒙抢了荆州。而刘备是博弈中占优的一方，因为他具有荆州的实际控制权，因此行动更为保守，他估计的联盟时间要比孙权长，孙权担心时间太久荆州要不回来，故比较激进，终于在公元219年直取荆州，孙刘联盟破裂。在这个例子中，博弈双方不知道对方的底线，所以最终只能是在某一时间点一方选择背叛。孙权除了夺回荆州别无选择，而刘备不得不继续占据，否则两者的地位就会互换，刘备将面临和孙权一样的窘境。

其实对于蜈蚣悖论，西方研究博弈论的专家已经尝试通过实验来寻求解答。实验发现，不会出现一开始选择“不合作”策略而双方各得收益1的情况，双方会自动选择合作性策略，从而走向合作。这种做法违反逆推法的结论，然而我们会发现，即使双方开始能走向合作，这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑，肯定在某一步采取不合作策略。逆推法肯定在某一步要起作用，使得合作不能进行下去。蜈蚣悖论在现实中的对应情形是，参与者不会在开始时确定他的策略为“不合作”，但他难以确定在何处采取“不合作”策略，孙刘联盟破裂的例子就是典型。

参考文献：

[1]张峰. 蜈蚣博弈悖论引发的思考[J].湖南科技大学学报（社会科学版），2005.

[2]严天秀. 蜈蚣博弈悖论的探析[J].大观周刊，2012.