模糊性情形下互动决策的行为探析1

2020-10-23 07:22姚东旻王麒植庄颖

经济学报 2020年3期

姚东旻王麒植庄颖

0 引言

决策选择问题毫无疑问是经济学研究的核心问题之一。但在现实中，由于信息不完全等原因，人们往往面临不确定的决策情形，例如金融危机、股票涨跌以及转基因食品安全性等问题。针对某些不确定性情形，决策者可以用概率分布来刻画未知信息，进而将不确定性问题转化为概率期望问题。但大多数情况下，未知信息是无法用概率来表示的。为了区别这两种未知，Knight(1921)将可以通过概率刻画的不确定性称为风险(risk)，将不能通过概率刻画的不确定性称为模糊性(ambiguity)(1)实际上Knight直接将非概率的未知称为“不确定性”(uncertainty)，“模糊性”一词是由Ellsberg(1961)提出的。目前决策理论的习惯用法是用“不确定性”来统称风险和模糊性。。

虽然Knight对风险和模糊性概念进行了区分，但是之后半个多世纪中沿着此方向进行的研究却屈指可数。Savage(1954)指出事件的客观概率往往是未知的，真正影响个人决策的是主观概率，并尝试将决策者的信念建立在各种可能的概率分布上，提出主观期望效用(Subjective Expected Utility，简称SEU)理论。主观期望效用理论的提出被认为成功解决了决策中的信息问题，用概率描述全部不确定性事件也成为经济学的惯例。然而，Ellsberg(1961)摸球实验证明了现实中存在相当部分违反主观期望效用的决策情形。之后，学者才将更多的目光放在对模糊性情形的解释上，运用匹配概率来刻画决策者的模糊性态度，提出了诸如Choquet期望效用(Choquet Expected Utility，简称CEU)、最大最小化期望效用(Maxmin Expected Utility)等模型。

关于模糊性模型和理论的发展为本文解释现实经济中普遍存在的模糊性情形提供了基础：一方面，决策者常常面临各种模糊性情形，需要根据其模糊性态度进行行为决策。那么，模糊性态度作为决策者对未知信息的心理反应，在相似的模糊性情形下是否保持一致是值得研究的。换句话说，当模糊性来源类似时，我们是否能将在某一模糊性情形中测得的模糊性态度运用到另一相似情形中，以应对纷繁复杂的现实经济问题。另一方面，在个人决策中，通过如Ellsberg摸球实验等方法能较易测得决策者的匹配概率，进而刻画模糊性态度对行为选择的影响。而在互动决策中，模糊性对决策者行为选择的影响较为复杂，决策者的效用受到对手行为选择的影响，必须猜测对手的信念，猜测对手对决策者自身行为选择的信念，猜测对手对决策者对对手行为选择的信念……基于此，本文试图回答能否运用在个人决策中测得的模糊性态度解释互动决策中决策者的行为选择。

图1 研究框架图

图1为研究框架。本文的内容安排如下：第1部分对个人决策和互动决策下行为模式的关系进行梳理，并提出匹配概率来衡量决策者的模糊性态度。第2部分通过Ellsberg摸球实验测量决策者在个人决策中的模糊性态度，并运用猎鹿博弈测量决策者在互动决策下的行为选择。第3部分计算匹配概率对互动决策下行为选择的理论预测值，与猎鹿博弈中的实际行为选择作对比，以获得本文的核心结论。第4部分总结。经过上述分析，本文结论显示：Ellsberg摸球实验中的匹配概率不能预测猎鹿博弈中决策者的行为选择，即使模糊性来源相似，决策者在个人决策和互动决策中的行为选择仍然存在差异。在互动决策中，被试行为选择不仅仅受到模糊性态度的影响，不能简单地通过个人决策来判断决策者在互动决策中的选择。

1 文献述评与研究假设

1.1 模糊性态度测度

尽管Knight在1921年就对风险和模糊性的概念做了正式的区分，但直到19世纪80年代末，也尚未出现关于模糊性的决策模型。随着Gilboa(1987)、Gilboa and Schmeidler(1989)等对新模型的不断探索，如Choquet期望效用(Choquet Expected Utility)模型、最大最小化期望效用(Maxmin Expected Utility)模型、J-P容度下的CEU(CEU with J-P capacity)模型和非极端可加性容度下的CEU(CEU with neo-additive capacity)模型等逐渐提出，对模糊性下决策者的效用和行为选择的刻画不断深入。利用Choquet积分和容度(capacity)γ处理模糊性下非可加的主观概率是模糊性模型中常用的一种工具。容度既体现了决策者对现实的判断，又决定了决策者对各个状态的决策权重。因此，可以很方便地通过构造合适的容度来捕捉模糊性感知(ambiguity perception)和模糊性态度(ambiguity attitude)对决策的影响。

以非极端可加性容度下的CEU模型为例，

)1(

模糊性模型的运用是以决策者的模糊性态度为基础的。当决策者规避模糊性时，则表现为模糊性厌恶的(ambiguity adverse)；当决策者乐于承担模糊性时，则称为模糊性喜好的(ambiguity loving)；当决策者的行为决策不考虑模糊性时，则视为模糊性中性的(ambiguity neutral)。但在衡量模糊性态度之前，需要控制决策者对事件本身的可能性信念(likelihood belief)，以获得决策者真实的模糊性态度(Baillon et al.，2018)。可能性信念的重要性在于如果在两个事件中决策者选择了模糊性事件，这并不一定反映了决策者是模糊性喜好的，而可能是由于他对该事件赋予了更高的可能性信念。目前在人为实验中较易获得模糊性事件的可能性信念。如Ellsberg摸球实验，决策者并不知道模糊性箱子中不同颜色球的比例，但可以通过对称(symmetry)的风险箱子中不同颜色球的比例来近似得到，进而控制可能性信念。然后，通过匹配概率(matching probability，下文用mp表示)来测量决策者的模糊性态度。

匹配概率是目前模糊性理论中最常用的衡量模糊性态度的指标，最早可追溯到Kahn and Sarin(1988)和Viscusi and Magat(1992)等人的研究。在给定激励支付的情况下，当决策者认为在事件E下获得x元与以概率P获得x元无差异时，概率P则为事件E的匹配概率。匹配概率通过寻找未知概率的模糊性事件和已知概率的风险事件的无差异条件，运用风险事件的概率来无限近似得到模糊性事件的概率。匹配概率包含了决策者的模糊性态度和可能性信念，其优势在于简单易算，能将风险态度在衡量匹配概率的方程中消掉(Dimmock et al.,2016a)，因此不需要对风险态度、效用水平或者概率加权等因素进行测量(Karni，2009)。匹配概率越高，决策者越模糊性喜爱，越倾向于选择不确定性程度高的行为；匹配概率越低，决策者越模糊性厌恶，越倾向于选择安全行为。现有研究运用匹配概率，通过基于模糊性指数的方法(Dimmock et al.，2013)、基于最小二乘回归的方法(Abdellaoui et al.，2011)和基于指标计算的方法(Baillon et al.，2018)，对模糊性情形下影响决策的两个因素模糊性感知和模糊性态度进行分析并带入到模型中，对决策者模糊性情形下的效用进行探寻，并对行为选择进行判断。

匹配概率对决策者模糊性态度的刻画，以及在此基础上对决策者效用大小和行为选择的判断，使其成为模糊性情形下决策理论的重要组成部分。本文将运用匹配概率对决策者在个人决策中的模糊性态度进行测量，并将测得的匹配概率带入到CEU模型中获得决策者理论上的行为选择，以对互动决策中的行为选择进行解释。

1.2 个人决策与互动决策行为模式

未知信息会对决策者行为选择产生影响。当决策者面临的对手是中性自然时，模糊性来源于不知道真实状态和信息，此时决策者进行的是个人决策；当决策者面临的对手是有利益需求的个人时，两个决策者进行交叉互动，模糊性来源于不知道对手行为选择，此时决策者进行的是互动决策。现有研究指出，在面临个人决策环境和互动决策环境时，决策者的行为模式既有相似性又有差异性。

一方面，决策者在不同情形下的选择存在相似性。Luce and Raiffa(1957)较早指出：“在不确定性下的个人决策问题可以视为对手为自然的一人博弈。其中的某些观点可以被间接运用到对手是真实个人的互动决策问题中。” 可以看出，在个人决策中运用的某些概念和方法可以运用到互动决策中来分析决策者的行为选择。Kadane and Larkey(1982)认为决策者在博弈中面临的问题和在个人决策中面临的问题相似。他们提出在博弈中每个决策者都会以一种不确定、不受限的方式构建对手策略选择的概率分布，如同在个人决策中对自然状态的判断一样，并在此基础实现效用最大化。Aumann and Dreze(2008)持有相同的观点：随着研究的不断深入，简单将决策者在个人决策和互动决策中的行为选择割裂开是不恰当的。事实上，两者在原则上非常相似，在某种程度上可等同视之。Aumann and Dreze提出决策者应该赋予对手策略选择以主观概率，并在此基础上做出行为选择。值得注意的是，Savage(1954)提出的SEU模型中，主观概率具有一定概率分布且和为1的特征，仅能反映概率已知的风险情形；而对于缺乏更多信息的概率未知的模糊性情形，主观概率对现实的描述存在一定偏差。如果将决策者的主观概率理解为其认定某事件发生的意愿，那么决策者在如Ellsberg实验中的选择具有不可加性，需要借助Choquet积分和容度等工具对其进行处理。此时，模糊性情形下决策者在个人决策和互动决策中的行为选择特征是否与风险情形下相似，值得我们进一步讨论。本文设置Ellsberg摸球实验作为模糊性情形下个人决策的代表，设置猎鹿博弈作为模糊性情形下互动决策的代表，通过对决策者在两个实验中行为选择的对比分析，探寻模糊性情形下决策者的行为模式特征。

另一方面，直观来看，对手类型的不同似乎暗示着决策者行为模式的差异。Mariotti(1995)认为个人决策和互动决策有着本质的区别。“自然决定我得到10元，对手得到90元”和“对手决定我得到10元，对手得到90元”带给决策者的心理感受是不同的，进而对决策者行为选择的指导也是不同的(Gilboa and Schmeidler, 2003)。在个人决策中，决策者基于效用最大化的原则对不同状态进行考量，但这并不会影响到不同状态的概率分布；而在互动决策中，决策者对任何状态的偏好都会影响到对手对该状态的信念，对手信念的改变又反过来影响决策者的行为选择，两者间的策略互动最终将达到均衡(Aumann and Dreze, 2008)。Houser et al.(2010)运用风险态度对决策者在个人决策和互动决策中的行为选择进行分析。他通过彩票实验测得决策者的风险态度和行为选择，并与对手是计算机的风险博弈和对手是随机个人的信任博弈结果进行对比，发现风险态度能解释风险博弈，但不能解释信任博弈中决策者的行为选择。Houser将决策者在两种不同不确定性中的行为差异归因于策略互动中决策者更多的情绪反映。Bohnet et al.(2008)的研究同样支持该理论：相对于个人决策中面临的不确定性，决策者在面临互动决策不确定性时，要求更高的收益，并将这额外的收益视为互动决策中对方可能背叛的补偿。对于模糊性情形下决策者的行为研究较少，Li et al.(2019)运用实验对决策者在个人决策、互动决策和信任决策中的选择进行对比分析，发现决策者在个人决策中的模糊性厌恶程度更高，在互动决策中的模糊性喜爱程度更高。决策者在个人决策和互动决策中均能很好分辨模糊性水平，对模糊性的感知程度并无显著差异。可以看出，风险情形下个人决策和互动决策中行为选择差异性的来源，主要是互动决策中决策者更风险厌恶。但在目前较少的关于模糊性情形的研究中却认为，两者行为选择的差异是因为决策者在个人决策中更模糊性厌恶。风险情形和模糊性情形下对于差异性的判断不同，可能缘于忽视了行为选择差异对比需要统一基准。两种决策环境中不确定性的来源应保持一致或相似，以更清晰辨明决策者的行为是否存在差异以及造成差异性的来源。本文设计实验将个人决策中的模糊性来源嵌套入互动决策中，通过将互动决策中决策者获得正确信息的概率与个人决策中的匹配概率结合，构建个人决策和互动决策相似的模糊性来源，正确分析决策者行为选择的特征。

总的来看，随着对模糊性情形研究的日益重视，探寻模糊性态度对决策者行为选择的影响也成为不可回避的问题，但目前尚缺乏对模糊性情形下行为特征的充分讨论。个人决策和互动决策中行为选择的差异是确实存在，还是模糊性来源不同导致？决策者在两种决策环境中的行为是否存在相似性，是否能将个人决策中的模糊性态度用到互动决策中解释行为选择？基于上述考量，提出本文的假设：

研究假设：在模糊性情形下，决策者在个人决策中的模糊性态度能够解释其在互动决策中的行为选择。

本文将进行彩票实验、Ellsberg摸球实验和猎鹿博弈，通过个人决策中得到的匹配概率对互动决策中的行为选择进行理论预测，通过理论预测和实际选择的对比，对上述假设进行检验。

2 实验设计2.1 整体实验框架

为了验证是否能通过个人决策下的模糊性态度来预测互动决策下决策者的行为选择，本文将进行彩票实验、Ellsberg摸球实验和猎鹿博弈3项实验。实验流程如图2所示。

图2 实验流程

首先，实验对被试的风险态度进行测度，并控制风险态度对被试行为选择的影响。不确定性包含风险和模糊性因素，在对模糊性下个人决策和互动决策进行分析时，需要控制风险态度对行为选择的影响。在个人决策中，匹配概率不受风险因素影响的优势使得不需要再单独讨论风险因素。但在互动决策中，被试的行为选择会受到其对两个行动风险偏好的影响，需将风险因素的影响剔除。因此，本文运用Holt and Laury(2002)的彩票实验对被试风险态度进行测度，获得其在不同中奖概率下(0.1，0.5和0.9)的无差异支付并计算被试的风险厌恶系数(具体步骤和结果见附录1)。借鉴Buyukboyacl(2014)的方法，将彩票实验获得的无差异支付作为猎鹿博弈中猎鹿行动的实际支付，使得猎鹿和猎兔对于拥有不同风险态度的被试都是等价的，以消除风险态度对行为决策的影响。

其次，实验对被试在个人决策中的模糊性态度进行测度。Ellsberg(1961)通过实验首次证明了决策者存在违反SEU模型的决策，表现出一定程度的模糊性厌恶。这也使Ellsberg摸球实验成为测度模糊性态度最常用的实验，本文亦采用该实验，通过控制不同的可能性信念(0.1，0.5和0.9)测量被试的匹配概率，以刻画被试在个人决策中的模糊性态度。

最后，构建与个人决策相似的模糊性来源，实验对被试在互动决策中的行为选择进行测度。博弈中不确定性主要来源于对手的策略选择，传统分析坚持认为所有的不确定性都可以通过概率表示，但是在现实生活中概率往往是未知的，不能用概率分布来代表互动决策中的所有不确定性。考虑到博弈论为描述策略互动提供了精确的语言，并为预测策略行为提供了一整套假设(Crawford，2016)。本文运用猎鹿博弈(stag-hunt game)对互动决策中被试的实际行为选择进行测度。为了控制可能性信念，构建同源的模糊性环境：实验将Ellsberg摸球实验作为被试获得正确信息的机制，即被试获得正确信息的概率取决于被试在摸球实验中认为已知箱子和未知箱子无差异时，已知箱子中中奖颜色球概率，以此保证个人决策和互动决策中模糊性来源相似，为对比两种决策模式下被试的行为选择统一基准。

2.2 实验一：个人决策下模糊性态度测度——Ellsberg摸球实验

2.2.1 被试

被试为参加2017年学校暑期夏令营的来自全国各大高校的46名本科三年级学生，其中男生7人，女生39人，平均年龄21.24±1.058岁。实验采用被试内设计，所有被试全部参与Ellsberg摸球实验。统计功效代表假设检验正确拒绝原假设的概率。对配对样本进行双边t检验，46个被试能在显著性α为0.05，效应大小为0.42的情况下保证统计功效超过0.8。

2.2.2 激励

运用自主开发的微信小程序，并配合实验人员PPT讲解和答疑，确保被试正确理解实验的目的和程序。实验随机选取一项视为中奖，并按照实验数额支付真实的金钱，以激励被试真实的意愿表达，保证数据质量，降低噪声。

2.2.3 实验步骤

实验一借鉴Ellsberg(1961)摸球实验，研究在不同可能性信念下被试的行为选择，以得到被试在个人决策中的模糊性态度。实验根据可能性信念的不同如0.5(双色球，摸出红球中奖)，0.1(十色球，摸出红球中奖)和0.9(十色球，摸出非红球中奖)共进行三轮实验。每轮实验中将进行数十回合的选择，通过改变已知箱子中中奖颜色球的比例，获得被试认为已知箱子和未知箱子无差异时的匹配概率(如附录2所示)。

实验中有两个箱子，均装有100个球，已知箱子明确知道球的颜色及数量，记为箱子K，未知箱子只知道球的颜色但不知道具体数量，记为箱子U。在双色球实验中，箱子K中红球50个，蓝球50个；箱子U中只知道共100个红球和蓝球(如表1)，被试任选一个箱子摸出红球为中奖，中奖获得3元，未中奖获得0元。当被试认为箱子K优于箱子U时，降低箱子K中红球的比例，反之则增加箱子K中红球的比例。实验给出已知箱子红色球比例从10%到100%共十个回合供被试选择(如表2)。当被试的选择在箱子K和箱子U间出现转折时，转折点前后两回合中箱子K中奖颜色球比例的均值，被视为两个箱子无差异时的值，即匹配概率(2)在双色球实验中，当被试在箱子K中红球比例10%～45%时都选择箱子U， 50%～100%时都选择箱子K，则认为匹配概率=47.5%(45%与50%的均值)，即盒子K中有47.5个红球时，被试认为已知箱子与未知箱子无差异。。

表1 Ellsberg双色球箱子类型

表2 Ellsberg双色球红色球比例选择表

2.2.4 结果

在三个可能性信念下，所有被试在已知箱子和未知箱子间进行选择，最终得到被试在三个可能性信念下的匹配概率。随着可能性信念的增加，选择箱子U的被试从31人，减少为1人(如表3)，表明被试厌恶模糊性的程度随着可能性信念的增加而提高。

表3 不同可能性信念下被试的行为选择

图3 不同可能性信念下被试的匹配概率

当可能性信念为0.1时，46名被试匹配概率mp(0.1)的均值为12.17±3.46%，大于可能性信念0.1，整体表现为模糊性喜爱的，匹配概率高于10%的被试占总人数的67%。当可能性信念为0.5时，被试匹配概率mp(0.5)的均值为48.64±6.81%，低于可能性信念0.5，整体表现为模糊性厌恶的，匹配概率低于50%的被试占总人数的63%。当可能性信念为0.9时，被试匹配概率mp(0.9)的均值为60.63±12.24%，远远低于可能性信念0.9，整体表现为更明显的模糊性厌恶，匹配概率低于90%的被试占总人数的98%(如图3)。可以看出，在个人决策时，匹配概率作为表示被试模糊性态度的指标，反映出被试在不同的可能性信念下持有不同的模糊性态度。模糊性态度随着可能性信念的变化也印证了可能性信念在探寻决策者模糊性态度中的重要作用。

2.3 实验二：互动决策下行为选择测度——猎鹿博弈

2.3.1 被试

所有46名被试全部参与猎鹿博弈。实验中被试被随机均等分为甲、乙两组(3)需要注意的是，虽然模糊性猎鹿博弈将被试分为甲、乙两组，但仍然为被试内实验。，根据可能性信念0.1，0.5和0.9进行三轮实验，每轮四个回合。在第一回合中，甲组被赋予身份A，乙组身份则为B。实验将两组进行无放回的随机匹配，确保每个被试都有匹配对象并且只匹配一次，形成N对(身份A，身份B)的组合。在禁止任何交流的情况下，所有被试根据获得的信息和主观态度独立做出选择。在第二回合中，甲乙两组角色互换，甲组身份为B，乙组身份为A，并重新随机匹配形成N对组合。之后重复前两个回合的实验，甲乙组身份继续互换，保证了实验的平衡性。每轮实验中，每个被试共担任2次身份A和2次身份B。三轮实验后，每个被试共担任6次身份A和6次身份B，即总共进行了3(三个可能性信念)*4(A、B身份互换)=12回合实验。

2.3.2 激励

根据真实是否有鹿以及被试配对组合的选择，决定被试获得的具体支付。所有实验完成后，被试将被告知每轮选择获得的收益，并根据实际数额进行真实的金钱支付。

2.3.3 实验步骤

如图4所示，在猎鹿博弈中存在两个猎人，定义为被试A和被试B，有两个可供选择的行动：猎鹿还是猎兔，被试将独立进行决策。鹿是大型动物，只有合作才能狩猎成功，如果被试单独狩猎，将一无所获；兔是小型动物，即使单独狩猎也能获得收益，如果合作狩猎，被试将平分猎兔收益。实验进行了预实验，保证被试对实验目的的正确理解。

图4 猎鹿博弈实验结构图

实验中，自然以p=0.5的概率决定今天是否有鹿。被试A准确获得今天是否有鹿，以作为其私人信息。被试B获得正确信息的机制与Ellsberg摸球实验摸出中奖颜色球相同，被试B仅能观察到森林中有鹿的脚印，但是对于是否有鹿的判断如同判断未知箱子中有多少中奖颜色球，因此被试B获得正确信息的概率为匹配概率。随着可能性信念的不同，被试B的匹配概率也不同，获得正确信息的概率也不同。这不仅控制了实验中的模糊性水平，也构建起猎鹿博弈和Ellsberg摸球实验相同的模糊性来源。但不同的是，此时被试进行的是互动决策，被试的收益受到对手策略选择的影响。被试均知道对方信息是否准确，但并不知道对方将获得什么信息。

如果被试单独猎兔会获得2元，如果被试同时猎兔，会平分收益分别获得1元。如果今天没鹿，那么无论被试是合作猎鹿还是单独猎鹿，都将一无所获；如果今天有鹿，被试单独去猎鹿没有收获，被试合作猎鹿将分别获得πi的支付。πi为风险实验中被试认为两个彩票无差异时的支付，每个被试面临的π是不同的，其数值等于被试在风险实验中自己选择的无差异支付。且由于中奖概率的不同，在不同的可能性水平上，同一被试面临的π也存在差异。通过将风险实验的无差异支付带入到猎鹿博弈中作为实际支付，消除了被试风险偏好对行为选择的影响，控制了被试的风险态度。在这种情况下，当被试是模糊性中性时，猎鹿和猎兔对于拥有不同风险态度的被试都是等价的。因此，如果被试认为两个行动存在差异，则反映了被试对模糊性情形的判断。具体的支付矩阵如表4所示。

表4 猎鹿博弈支付矩阵

2.3.4 结果

根据被试获得正确信息的概率和被赋予身份的不同，得到了被试在互动决策下真实的行为选择(4)本文均不考虑获得无鹿信息的情况，后文所有关于行为选择的分析均特指获得有鹿信息。因为猎鹿博弈中实验设计控制了风险态度和模糊性来源，该意图主要体现在信息有鹿时。当信息无鹿时，被试A知道真实状态，猎兔为占优策略；被试B不知道真实状态，无法有效控制风险态度对行为选择的影响。。在可能性信念为0.1时，被试A和被试B获得有鹿信息选择猎鹿的比例分别为58.5%和38.1%；在可能性信念为0.5时，被试A和被试B获得有鹿信息选择猎鹿的比例分别为43.8%和28.9%；在可能性信念为0.9时，被试A和被试B获得有鹿信息选择猎鹿的比例分别为46.7%和39.1%。(如图5)。可见，被试A收益受到对手策略的影响，信息正确与否也通过影响对手的选择间接影响被试A。在信息有鹿时，除了可能性信念0.1下猎鹿比例高于猎兔，其他情形下猎鹿比例相近且均低于猎兔比例。而被试B不仅面临对手选择的影响，也直接受到信息是否正确对其选择的影响。在获得有鹿信息时，被试B选择猎兔的人数在不同可能性信念下均高于猎鹿，可能性信念0.5下猎鹿比例较低，其他情形下猎鹿比例相近。

图5 猎鹿博弈被试猎鹿和猎兔数

3 分析与结果

在博弈中，均衡是在给定对手行为选择的基础上，决策者最大化个人效用选择的行为或策略的集合。当均衡实现时，每个玩家的选择都是对手选择的最优反应(best response)，此时每个决策者都没有任何动机去偏离均衡选择。然而，要实现均衡非常困难，即使决策者按照均衡行为选择，但也不能保障对手会按照该策略选择，最终选择往往与均衡存在偏离。Eichberger and Kelsey(2011)认为这种偏离可以用模糊性来解释，即玩家认为对手的策略选择是模糊的。现实生活中，我们往往不知道对手选择某项行动的真实概率，一旦对手的信念偏离均衡时的选择，就会导致最终策略和效用的变化(Crawford，2016)。决策者试图去猜对手的信念，猜对手如何判定玩家本身的信念等等，并在此基础上做出行为选择。

但是，决策者在进行博弈时的心理活动是未知的，决策者是按照理性个人效用最大化的原则还是根据风险最小的原则进行决策也是未知的，甚至连对手也是随机的。大多数时候，我们仅仅知道博弈的基本规则和支付以及最终的实际选择，对于决策者如何思考、如何判断、如何决策的“黑箱”却知之甚少。那么，我们应该如何解释模糊性的存在对互动决策的影响，又该如何预测博弈中决策者的行为选择呢？

个人决策中被试的行为选择由Ellsberg摸球实验测得，互动决策中被试的行为选择由猎鹿博弈测得，但由于实验类型的不同，二者并不能直接进行比较。模糊性态度是决策者对模糊性的心理反应，决策者行为选择则是对模糊性态度的直观展示。匹配概率作为模糊性态度的刻画指标能够解释个人决策中的行为选择。当在个人决策和互动决策中决策者的行为选择相似时，匹配概率同样能解释互动决策中的行为选择。基于此，本文将Ellsberg摸球实验中获得的匹配概率带入到CEU模型中，对互动决策下决策者的行为选择进行理论预测，通过理论预测与猎鹿博弈中实际选择的对比，验证本文的假设。

3.1 猎鹿博弈中行为选择的理论预测——基于个人决策的匹配概率

匹配概率刻画了被试的模糊性态度。从Ellsberg摸球实验结果中可以知道，对于可能性信念低的事件，被试表现出普遍的模糊性喜爱，匹配概率高于可能性信念；对于可能性信念高的事件，被试却表现出普遍的模糊性厌恶，匹配概率低于可能性信念。这种高估低可能性信念事件，低估高可能性信念事件的现象，导致了匹配概率之和不等于1。模糊性模型利用容度γ对匹配概率的非可加性进行解释，并运用Choquet积分测量给定行为的期望效用。Choquet积分的重要特征在于等级依赖(rank-dependent)，需要对各种状态的好坏进行排序，得到期望效用后再做出选择。因此，本文基于匹配概率，运用模糊性模型的思想对互动决策下被试的行为选择做出预测。

3.1.1 对手策略选择的影响——被试A

被试A的收益受到被试B行为选择的影响，二者行为策略的组合共同决定了被试A的效用U，而不同事件效用的权重组合则决定了被试A的期望效用和行为选择。当被试A获得有鹿信息时，真实有鹿下被试A将根据期望效用的大小选择猎鹿还是猎兔。具体来看：

等式左边U)S,S|NS(表示在真实有鹿下，被试A选鹿和被试B选鹿带来的效用。等式右边U(πA)表示效用数值的具体表达式。其他表达式含义类似。

定义事件E：被试在Ellsberg摸球实验中摸出中奖颜色球的概率。事件G：被试B在猎鹿博弈中的选择。根据假设：决策者在个人决策中的匹配概率能够解释其在互动决策中的行为选择，换句话说被试在互动决策中的行为选择类似于(as if)他在进行个人决策。用容度概念表示则为γE=γF，即被试认为在事件E中摸出中奖颜色球的匹配概率，等价于在事件G中实现最大效用的行为的权重。在此假设下，对被试A不同选择的期望效用进行计算。

按照等级依赖效用对不同行为组合带来的效用排序：当被试A选择猎鹿时，被试B猎鹿效用最高为UA(πA)，则事件G1为被试B选择猎鹿，事件G2为被试B选择猎兔。根据γE=γF，

)6(

当被试A选择猎兔时，被试B猎鹿效用最高为UA(2)，则事件G3为被试B选择猎鹿，事件G4为被试B选择猎兔。根据γE=γF，

)7(

当EA)S(>EA)R(时，被试A选择猎鹿；当EA)S(

3.1.2 对手策略选择和自然状态的影响——被试B

被试B的收益受到被试A行为选择和真实是否有鹿的影响，两者的行为选择和自然状态共同决定了被试B的效用U，被试B将根据不同行为的期望效用选择猎鹿和猎兔。具体来看：

事件E：被试在Ellsberg摸球实验中摸出中奖颜色球的概率。事件F：被试A在猎鹿博弈中的选择和自然是什么状态。与被试A情况类似，用容度表示假设为：γE=γG，即被试B认为在事件E中摸出中奖颜色球的匹配概率，等价于在事件F中实现最大效用的行为和自然状态的权重。在此假设下，对被试B不同选择的期望效用进行计算。

当获得有鹿信息，被试B选择猎鹿，按照等级依赖效用对不同行为组合带来的效用排序，被试A猎鹿且真实有鹿时效用最高为UB(πB)，则事件F1为被试A选择猎鹿且真实有鹿，事件F2为其他状态下被试B选择猎兔。此时，信息有鹿且真实有鹿的概率为mp。根据γE=γG，

)12(

被试B选择猎兔，被试A猎鹿且真实有鹿效用最高为UB(2)，则事件F3为被试A选择猎鹿且真实有鹿，事件F4为其他状态下被试B选择猎兔。此时，信息有鹿且真实有鹿的概率为mp。根据γE=γF，

)13(

当EB)S(>EB)R(时，被试B选择猎鹿；当EB)S(

3.1.3 理论预测结果

根据上述原则，对被试在互动决策中的行为做出理论预测，结果如图6所示。从图中可以看出：(1)匹配概率对被试A和被试B在互动决策中行为选择的预测相同；(2)随着可能性信念的增加，被试猎鹿人数逐渐降低。被试在可能性信念0.1下猎鹿的人数最高，在可能性信念0.9下猎鹿的人数最少，这符合匹配概率越高，被试越倾向于猎鹿的理论。可见，根据容度和等级依赖效用原则，运用个人决策中测得的匹配概率可以计算出理论上的行为选择，接下来本文将通过理论预测与被试在猎鹿博弈中实际选择的对比，判断被试行为机制是否满足假设。

图6 互动决策中被试猎鹿和猎兔的理论预测

3.2 理论预测对行为选择的解释力

匹配概率对互动决策的行为选择的理论预测，作为连接个人决策模糊性态度和互动决策实际选择的桥梁，能对匹配概率是否有预测力以及互动决策中被试是否类似于进行个人决策的问题进行回答。

从个人层面看，本文对理论预测与实际选择相同的比例进行对比计算，结果如图7所示：(1)对于被试A，匹配概率预测相同的比例均值为0.54±0.34，最低值为0，最高值为1。预测准确比例低于0.5的人数为17人，占比36.96%；预测相同比例等于0.5的人数为9人，占比19.57%；预测与实际相同的比例大于0.5的人数为20人，占比43.48%，其中全部预测准确的人数为11人，占比23.91%。(2)对于被试B，匹配概率预测相同的比例均值为0.57±0.39，最低值为0，最高值为1。预测准确比例低于0.5的人数为16人，占比34.8%；预测相同比例等于0.5的人数为7人，占比15.22%；预测与实际相同的比例大于0.5的人数为21人，占比45.65%，其中全部预测准确的人数为17人，占比36.96%。(3)可以看出，被试B预测相同比例不高于0.5的人数低于被试A，预测准确比例高的人数高于被试A。匹配概率对被试B行为选择的预测力高于被试A。

图7 理论预测与实际选择相同的比例(个体层面)

从整体层面看，根据被试身份不同和可能性信念不同，加总理论预测与实际选择相同的次数除以总次数，得到整体预测准确的比例，结果见表5：(1)对于被试A，在信息有鹿下随着可能性信念的增加，预测相同比例从0.66下降到0.49，可能性概率为0.5时，预测准确比例为0.5；(2)对于被试B，在信息有鹿下，可能性信念0.9时预测准确比例最高为0.61，可能性信念0.5时预测准确比例最低为0.51；(3)除了在可能性信念0.9下对被试A行为选择预测准确的比例低于0.5，其他情况下预测准确比例比0.5高但差异并不大，这也无法证明匹配概率对互动决策下行为选择的解释力高。

表5 理论预测与实际选择相同的比例(整体层面)

进一步地，本文对不同可能性信念下匹配概率预测猎鹿和猎兔准确的比例进行细分，表6a展示了被试A预测准确的比例，表6b展示了被试B预测准确的比例，0.71为预测猎鹿实际猎鹿的人数与预测猎鹿人数的比值，表明匹配概率预测猎鹿的精准度达到0.71。可以看出：(1)除了在可能性信念0.1下，匹配概率预测被试A猎鹿的精准度高于猎兔。其他情况下匹配概率预测被试猎兔更精准，表明匹配概率对被试行为的解释力主要来源于正确预测了被试猎兔行为。例如在可能性信念0.9下，实际猎鹿的人数分别为21人和18人，但匹配概率预测被试中仅有2人和1人选择猎鹿，并未准确预测。(2)匹配概率预测被试A获得有鹿信息时，猎鹿的概率为0.59、0.47和0.04；被试B获得有鹿信息猎鹿的概率为0.67、0.39和0.02。但实际上，当被试A获得有鹿信息时，其猎鹿的比例分别为0.59、0.44和0.47，被试B获得有鹿信息三个比例分别为0.381、0.289和0.391。可以发现匹配概率预测被试能有效区分不同可能性水平，但在互动决策中被试在不同可能性信念下的选择非常类似，无法有效区分不同的模糊性水平。总的来说，匹配概率对被试行为的预测，更多地是准确预测了被试的猎兔行为，且准确比例普遍较高。同时，被试在不同可能性信念水平上的行为选择非常类似，匹配概率却不能有效预测到该现象。

表6a 被试A获得有鹿信息的理论与实际选择

表6b 被试B获得有鹿信息的理论与实际选择

最后，本文直观展示每种情形下匹配概率与被试实际行为选择的关系，结果如图8和表7所示，根据被试猎鹿比例的高低，图中对猎鹿比例和匹配概率进行排序。(1)理论上匹配概率越高，被试模糊性厌恶程度越低，被试越倾向于猎鹿，但是下图并未表现出匹配概率越高，被试猎鹿比例越高的现象。(2)对不同可能性信念下被试猎鹿比例进行对比发现，可能性信念0.1情况下被试猎鹿比例最高，符合匹配概率高估低可能性信念事件，更倾向于猎鹿的现象；而可能性信念0.5和0.9情况下被试猎鹿相差不大，不符合匹配概率低估高可能性信念事件，更倾向于猎兔的情况。(3)随着可能性水平不断增加，匹配概率与实际猎鹿比例的正相关程度逐渐降低，正相关关系并不显著。可见，匹配概率与互动决策中的实际选择不相关，不能对行为选择进行解释。

图8 匹配概率与被试实际猎鹿比例的关系图

表7 匹配概率与被试实际猎鹿比例的相关性系数检验

总的来看，运用个人决策中测得的匹配概率不能很好预测互动决策中被试的行为选择，本文结论不支持假设。无论从被试个人层面还是整体层面，匹配概率的理论预测相同的比例均较低，不能完全解释被试的行为。同时，匹配概率对被试行为选择的预测，大部分是因为预测准了被试猎兔。最后，不存在匹配概率越高，被试实际猎鹿比例越高的现象，匹配概率与被试实际猎鹿比例不相关。可见，个人决策中测得的匹配概率不能预测互动决策中的行为选择，被试在个人决策和互动决策中的行为存在差异。即使控制了被试风险态度的影响，构建了相似的模糊性来源，也同样支持该结论。

4 讨论

匹配概率作为刻画决策者模糊性态度的指标，能对不同可能性水平上决策者或模糊性厌恶、或模糊性喜爱、或模糊性中性态度进行展示。Dimmock et al.(2013)从理论层面推导了匹配概率衡量模糊性态度的有效性。本文亦运用匹配概率对Ellsberg摸球实验中决策者的模糊性态度进行测度，结论显示：随着可能性信念的增加，决策者越模糊性厌恶。决策者普遍存在高估低可能性事件，低估高可能性事件的现象。这符合前景理论(prospect theory)的预期。Tversky and Kahneman(1992)分析了风险情形下决策权重(decision weighting)方程对非理性行为的刻画。决策者不是线性对待概率的，对于收益情况决策者在高概率事件中表现为风险厌恶，在低概率事件中表现为风险喜爱。这种决策扭曲特征在之后的研究中被不断证明(Camerer and Ho, 1994；Gonzalez and Wu, 1999)，在模糊性情形中也同样存在(Tversky and Kahneman, 1995; Abdellaoui, et al., 2011)。例如Dimmock et al.(2013)运用美国生活模块(American Life Panel)调查数据对超过3000个被试的模糊性态度进行统计分析，发现有51%的被试是模糊性厌恶的，12%的被试是模糊性中性的，37%的被试是模糊性喜爱的。Dimmock et al.(2016a)运用Ellsberg摸球实验对被试在0.1、0.5和0.9可能性信念下的行为选择进行测度，发现在0.1低可能性事件下，大部分被试(49.4%)表现为模糊性喜爱；在0.9高可能性事件下，大部分被试(53.2%)表现为模糊性厌恶。被试的行为表现证明了决策者高估低可能性事件、低估高可能性事件的决策扭曲现象。

基于匹配概率解析现实经济问题，也成为模糊性领域的重要研究方向。以金融决策为例，现有众多研究认为当投资者将股票回报视为存在模糊性时，模糊性厌恶能够解释现实经济中大部分人不参与股市的现象，即“不参与之谜”。Dimmock et al.(2013)指出决策者模糊性态度由模糊性厌恶(ambiguity aversion)和模糊性不敏感(a-insensitivity)构成，通过分解匹配概率得到这两个指标，并验证其与决策者股市参与度的关系。结论发现，模糊性不敏感程度与股市参与度的系数在统计学上不显著，但模糊性厌恶程度越高，股市参与度越低。之后，Dimmock et al.(2016b)同样运用Ellsberg摸球实验和匹配概率来衡量决策者的模糊性态度，并将决策者模糊性厌恶与其金融决策的关系进行回归分析，结论显示模糊性厌恶与外国股票持有负相关，与自有公司股票所有权正相关。且当危机发生时，模糊性厌恶的家庭更有可能积极抛售股票。现有研究结果显示，通过实验测得的匹配概率和模糊性态度能对决策者在现实经济中的行为决策进行解释。

然而，本文运用博弈实验替代现实经济决策环境，从实验层面对该问题进行回答，却得出了相反的结论。本文发现在Ellsberg摸球实验中测得的匹配概率不能解释决策者在猎鹿博弈中的行为选择，决策者在个人决策环境和互动决策环境中的行为选择存在差异，这对目前运用实验测得的模糊性态度来解释其在现实经济中的决策行为提出了挑战。虽然有大量研究论证了模糊性厌恶能够解释金融决策的难题，但是没有任何证据表明个人的模糊性态度在市场环境中同样适用(Füllbrunn et al.，2014)。决策者在个人决策中表现出明显的模糊性厌恶，但在金融市场实验中，却表现为不存在或仅存在少量的模糊性厌恶。Corgnet et al.(2013)运用能同时交易模糊性资产和风险资产的独立双向拍卖市场实验，发现模糊性溢价或模糊性效应对价格波动、交易量和最终持股，没有任何统计意义上显著的影响。Füllbrunn et al.(2014)运用资产市场实验探寻模糊性的影响，他们发现模糊性效应只有在一定限制条件下才能发挥作用：(1)大部分决策者模糊性态度的分布需要倾向于模糊性厌恶；(2)应该限制其他市场参与者对决策者行为选择的反馈。当模糊性资产获胜概率为50%或市场给予及时反馈时，市场上不存在模糊性效应。

可见，无论是在市场实验中还是现实经济生活中，在将个人决策中的模糊性态度运用到互动决策中时，都应该正视决策者在个人决策和互动决策中行为选择的差异性。在排除其他因素的影响后，探寻互动决策中模糊性态度对行为选择的真实影响。

5 总结

决策问题是行为经济理论研究的核心问题之一，在现实经济生活中，决策者往往面临不确定的决策环境。本文对模糊性情形下，决策者在个人决策和互动决策环境中的行为选择进行分析。考虑到个人决策中决策者的模糊性态度较易测度，而互动决策中决策者行为逻辑较为复杂的情况，本文运用彩票实验、Ellsberg摸球实验和猎鹿博弈探寻是否能运用个人决策中测度的匹配概率来预测决策者在互动决策中的行为选择。

本文的创新之处在于：(1)相较于目前关于个人决策中的风险态度不能有效预测互动决策中行为选择的研究，本文从模糊性情形入手，对个人决策和互动决策行为选择逻辑进行实验验证。(2)为了控制风险态度对互动决策中行为选择的影响，本文将决策者在彩票实验中测得的无差异支付带入猎鹿博弈，保证了猎鹿或猎兔对决策者来说是无差异的。(3)为了保证决策者在个人决策和互动决策中行为选择具有可比性，本文设计了实验程序让决策者在猎鹿博弈中获得正确信号的机制与Ellsberg摸球实验相同，保证了个人决策和互动决策中模糊性来源相同，但又因存在对手策略选择的模糊性而不同。通过上述设计，本文更干净、真实地反映了模糊性态度对决策者行为选择的影响，以回答个人决策和互动决策中决策者行为选择是否存在差异。

在个人决策中本文测得了决策者的匹配概率，并通过CEU模型对决策者在互动决策中行为选择做出预测。通过将理论预测与猎鹿博弈中实际选择进行对比，发现：(1)在个人层面和整体层面，理论预测与实际选择相同的比例较低，匹配概率对互动决策中实际选择的解释力较弱；(2)对预测准确比例的进一步分析发现，预测准确的部分主要是由于匹配概率正确预测了决策者猎兔；(3)匹配概率越高，意味着决策者越倾向于猎鹿，但直观来看，并不存在该现象，匹配概率与实际猎鹿比例不相关。

可见，决策者在个人决策和互动决策环境中的行为存在差异，在模糊性情况下，个人决策中的匹配概率对互动决策中的行为选择解释力较弱。在互动决策中，决策者行为不仅仅受到模糊性态度的影响，互动决策环境的复杂程度、决策者对对手策略选择的信念、决策者在互动决策中更多的情绪反映等等都可能影响决策者行为。这对当前众多运用实验测得的模糊性态度分析金融决策等问题的适用性提出了挑战。

行为决策是不可回避的问题，对决策者在类似博弈等互动决策环境中行为选择的分析更是亘古不变的话题，这需要我们不断探索。现有研究关于决策者认为他人拥有与自身相同的偏好、信念、选择的错误共识效应(false consensus effect)(Ross et al., 1977)和根据自己选择给定对手选择的自相似(self-similarity)(Rubinstein and Salant, 2016)为本文分析模糊性情形下互动决策中决策者行为选择的逻辑提供了新的思考方向。

附录

附录1 彩票实验

附录1.1 被试

所有46名被试都进行彩票实验。

附录1.2 激励

计算机随机选择一项确定中奖，并按照实验数额支付真实的金钱。

附录1.3 实验步骤

借鉴Holt and Laury(2002)彩票实验，研究在不同风险情况下被试的行为选择，通过改变中奖收益探寻被试认为两个彩票无差异时的具体支付，为猎鹿博弈中通过无差异支付控制风险态度做准备。

实验中彩票1中奖时能够获得2元，未中奖获得1元；彩票2中奖时获得π元，未中奖时获得0元(如附表1)，被试在两个彩票间进行选择。当被试认为二者存在明显优劣时，实验将改变π值直到被试认为二者无差异。当中奖概率为50%时，实验给出π值从2.5元每次增加0.1元直至3.4元10个回合供被试选择。当被试的选择在彩票1和彩票2间出现转折时，转折点前后两回合中彩票2中奖收益的均值，被视为两个彩票无差异时的值。实验根据中奖概率的不同(10%、50%和90%)进行三轮，每轮均给出10个回合不同的π值，共进行30个回合实验(如附表2)。

附表1 实验的彩票类型

附表2 彩票实验流程

续表

附录1.4 结果与风险厌恶系数

在三个不同中奖概率下，彩票实验获得了被试的无差异值。当中奖概率为0.1时，46名被试无差异支付的均值为10.946±0.436，即当彩票2中奖收益为10.946时，被试认为彩票1和彩票2无差异；当中奖概率为0.5时，被试无差异支付的均值为3.070±0.257，即当彩票2中奖收益为3.070时，被试在选择彩票1和彩票2上获得的效用相同；当中奖概率为0.9时，被试无差异支付的均值为2.232±0.278，即当彩票2中奖收益为2.232时，被试不在意选择彩票1或彩票2(如附图1)。

附图1 不同中奖概率下被试的无差异值

附图2 被试风险厌恶系数

根据中奖概率的不同，求解出被试的风险厌恶系数σ1、σ2和σ3(如附图2)。图中参考线σ=1表明被试是风险中性的，风险厌恶系数小于1为风险厌恶，大于1为风险追逐。σ1均值为1.002±0.017，最高为1.025，占比26%，最低为0.974，占比为15%；σ2均值为0.992±0.154，最高为1.422，占比4%，最低为0.838，占比为17%。σ3均值为0.835±0.465，最高为1.528，占比26%，最低为0.291，占比为20%。可以看出不同中奖概率下被试的风险态度是不同的，且随着中奖概率的增大，风险厌恶系数的均值变小，越风险厌恶。

附录2 Ellsberg摸球实验

如附表3和附表4所示，箱子U中共100个球，球颜色数和已知箱子相同，但不知道具体的数量。在第一轮双色球实验中，箱子K中有50个红球和50个蓝球，摸出红球为中奖，可能性信念为0.5。已知箱子中红色球比例从10%增加至100%共10个回合供被试选择。在第二轮十色球实验中，箱子K有十种颜色球每种颜色10个，摸出红球为中奖，可能性信念为0.1。已知箱子中红色球比例从4%增加至18%共15个回合供被试选择。第三轮实验与第二轮相同，但是摸出非红球为中奖，可能性信念为0.9。已知箱子中非红色球比例从50%增加至100%共20个回合供被试选择。

附表3 Ellsberg实验箱子类型

附表4 Ellsberg实验流程

续表