“稳赚”的原理

2022-07-23 14:59老喻
商界评论 2022年5期
关键词:赔率期望值对冲

老喻

在现实中,“稳赚”的机会极少。除了定期存款这类,我宁可相信你有“很大机会”赚1亿元,也不愿相信你能“稳赚”100万元。

当然,《稳赚的原理》并非是标新立异,而是一个关于“概率、期望值、跨期下注、选择权、对冲”的严谨而有趣的描述。若想实现“稳赚”,需具备实现它的前提条件,而这些条件又非常隐蔽,经常被忽视。

所以当你明白了“稳赚的机会原理”,就可以反向设计“稳赚”的前提条件,从而获得对手所不具备的概率优势。由此,本文将谈及“概率权”的把握和主动设计,这些智慧是投资和决策的第一性原理。

在《普林斯顿概率论读本》中,有这样一道题:

有人在拉斯维加斯下了一个赌注,押A球队能在常规赛中保持不败并赢得冠军,赔率是1 000 :1,他下注了500美元,若获胜将赢得50万美元。

他运气不错,A球队进入了总决赛,并在比赛中以微弱优势领先于对手B球队。这时候,拉斯维加斯称愿意用15万美元买走他的下注。如果他答应,可以马上得到15万美元,但可能失去赢得50万美元的机会;如果他不答应,就有机会赢得50万美元,但也可能一分钱都赚不到。

由于这位球迷对A球队很有信心,于是拒绝了“立即得到15万美元”,选择了“有机会赢得50万美元”。

这是一个真实的故事。第42届超级碗,巨人队(B球队)在终场前35秒大逆转,赢了爱国者队(A球队),这位球迷的50万美元就这样“飞走”了。

可见,胜券在握也只是一个概率问题。而这位下注者做错了什么吗?

假设A球队的获胜概率大于50%,那么下注A球队的期望值大于25万美元(50万美元×50%)。该期望值既然大于赌场给的15万美元,那么下注者选择“拒绝”似乎是对的。只是从概率的角度看,有些正确的选择未必有对的结果。

可是,对于球迷来说,用500美元获得一次赢钱机会,是难得的。如果这个“机会”无法多次重复,那么概率思维还有用吗?更不用说期望效用和损失厌恶对决策者的影响。

其实,下注者是可以“稳赢”的。米勒教授在《普林斯顿概率论读本》中给出了方法——对冲,即下注者再下注押B球队赢。如此,不管哪一方获胜,他都可以获得可观的收入。

我们来算一下:假设A球队的胜率是80%,拉斯维加斯要利用赔率差盈利,故设赔率为3。那么,当下注者对A队、B队都下注时,应该下注多少呢?

如图1所示,横坐标是B的数值,即下注B球队的金额;红线是假如A获胜的回报:50万美元-500美元-B;蓝线是假如B获胜的回报:B×3-500美元-B;纵坐标是回报金额。由于是双边下注,我们至少会获得2种结果中较小的那个回报,因此我们要令2种结果中较小的数值最大化。

图1中实线部分就是2种可能结果中的最小值,最小值的最高点是:B×3=50万美元。所以当B×3=50万美元时,不管哪一边获胜,赚到的金额都是一样的。

计算结果是:B约为16.67万美元时,下注者可以稳赚33.28万美元。

对冲之后,不仅稳赚的金额比拉斯维加斯开出的收购价15万美元要高,同时还避免了50万美元“概率收益”归零的风险。由此,我们可以将押B队赢的行为,视为给押A队赢的概率权买个保险。

请尤其留意,在给B下注时,不可避免会拉低整体期望值,原因是拉斯维加斯对赔率的控制令下注者押B球队的独立期望值为负数。比如,同时下注A队和B队的预期收益是:80%×50万美元+20%×B×3-(500美元+B);而只押注A队的期望值是:80%×50万美元-500美元。显然后者收益大于前者,那为什么我们要做“拉低期望值”的事情?

针对这个问题,我们先对上述的案例进行总结:

1. 下注者有穩赚的机会,是因为他手中拥有“概率权”,即“他花500美元以1 000 :1的赔率押A队赢”这个权利,并且该概率权按照期望值计算价值为40万美元(50万美元×80%)。

2. 赌场开价15万美元买下注者手中的“概率权”,应该属于套利行为。因为会有另外的买家愿意出高于15万美元的价格购买这个“概率权”,所以赌场可以零风险地倒买倒卖“概率权”来赚取平台收益。

3. 下注者的对冲机会是通过“跨期下注”构成的,这2个不同时空的下注,构成了某种“势能”。当然,不排除因为其他参与者们在观点和下注上的不均匀,也会产生某些局部的套利机会。

4. 对冲下注是为了让最小收益最大化。在求该值时,若只考虑赔率,没有考虑胜率(即事件不同结果的发生概率),那就是一种典型的风险意识。

5. “意外”是带来极大伤害的极小概率事件,又或是被误以为是小概率的大概率事件,又或是小概率事件因时间累积而变成大概率事件。当有较大的赔率机会,对冲可以用来形成意外事件的安全气囊。

6. 由于球类游戏充满了不确定性,且总决赛的次数有限,下注者无法像玩德州扑克那样通过大量重复令大数定律“显形”。所以,即使是在主观胜率很高的情况下,通过“保险策略”对冲尾部风险,也是值得的。

7. 上述案例中,对冲牺牲了部分期望值,换来了一些确定性,即回报分布是均匀的。

8. 上述案例中,下注者随着比赛的进程,对B球队下注对冲风险,属于某种贝叶斯更新,即根据新的信息来评估过去的决策和概率权,并更新下注。

9. 在围棋里,占据优势的一方有2种锁定胜局的方向:一是乘胜追击,放大优势;二是缩短战线,甚至主动让出一些利益,但让对手没有翻盘的机会。

10. 对冲是从优势到胜局,真正防止了“煮熟的鸭子飞掉”。至于见好就收的尺度,其实和乘胜追击一样不易把握。

此文一直强调的“概率权”究竟是什么?其实是来自我对一道趣味题的6个解答而得出的概念。

一道选择题:有2个按钮,红色按钮是100%概率可获得100万元,绿色按钮是50%概率可获得1亿元,你会按下哪个按钮?

1. 根据期望值理论,绿色按钮的价值为5 000万元(1亿元×50%)。

2. 很多人选红色按钮,因为他们无法忍受有50%概率是什么都拿不到。

3. 换言之,假如一个人无法承受“什么都拿不到”,那么也无法接受错失“得到1亿元”的机会。

4. 假如你拥有这个“概率权”,那么你可将价值5 000万元的概率权以2 000万元的价格卖给他人。

5. 进一步,为了增加“找到愿意购买概率权”的可能性,你可以以100万元的价格卖掉这个概率权,但要求购买者若获得1亿元时须与你分成。

6. 另外,你还可以把概率权做成彩票公开发行,将选择权“切碎”后零售,例如将“切碎”的选择权设定2元/张,印2亿张,头奖1亿元。这样风险更低,收益更大。

然而,买走“概率权”的人吃亏了吗?并没有,因为他有机会将概率权以更好的价格变现。就像赌场愿意用15万美元买走下注者的概率权一样,赌场具备的先天优势,可以很容易将该概率权加价转手。所以,愿意买“按钮”概率权的人,可能有大数定律帮助他实现稳定的正期望值。

当然,他也可以按照第6条的方法,把整个概率权,拆成许多个小概率权,以小投入和大赔率作为吸引力,将一个大概率权变成无数个小概率权。

简单地说,概率权是基于概率计算的未来选择权,它的框架如下:

1. 基于期望值计算的(与空间有关的)概率权。

历史上赢得了彩票的人,都是利用了彩池偶然出现的正期望值,他们抓住机会,买得越多,越接近于大数定律下的期望值,绝对收益也更大。但是,当对面为负期望值时,“勤奋”毫无意义。

2. 基于贝叶斯更新的(与时间有关的)概率权。

创业上的快速试错,是希望通过贝叶斯更新,不断优化商业模式上的概率,直至发现正期望值的套利机会。就像厉害的人,不仅从别人那里学习,自己还会不停扔骰子,去看骰子怎么“说”,这也就是蒙特卡洛的仿真模拟,即在一个可以收敛的半径内,聪明地犯错误。

3. 基于三层结构的概率权。

这三层分别是资源层、配置层、执行层,强调的是资源、决策、能力圈对概率权的影响,因为最终结果取决于三者概率相乘的结果。

4. 在一个博弈环境中制造有相对优势的(基于统计学的)概率权。

放弃追求所谓最优,只在乎发现相对的概率优势,这是一种套利思维。这种思维,有时候利用的是对概率计算的认知优势,有时候利用的是竞争对手对不确定性的恐惧感。

5. 概率权还是“无所不知者”对概率的分配权。

例如流量、IP等,其背后都是平台的概率权分配游戏。所以,最好的商业模式,尤其是平台型商业,本质上是制造了一个“赌场”,而平台就是概率权的设计者和分配者。

6. 概率权决定了资源配置和赔率设定。

决策是面向未来分配资源,包括“资金、认知、时间、劳作”等各种资源,相当于为不确定性下注。期望值的计算是未来可能性的折现,然而大部分人并非职业决策者或下注者,所以基于大数定律的期望值经常只是一个数字上的馅饼。

概率权,能够让我们更好地实现“未来可能性”的价值,也能指引我们在当下分配资源,并沿着时间线优化概率,调整赔率,找寻被他人低价甩卖的概率权以及找到平台式的低风险套利机会。

同时,不同的概率权之间会形成势能差,某些情况下可以通过对冲来赚取相对稳定的收益。

而稳定收益和时间的关系,有2个角度:

第一个角度:单次下注。如开篇案例,探索的是在一个单次游戏中,如何利用对冲去实现无法通过许多次重复而接近的期望值。

第二个角度:多次下注。一個人的财富是长期积累的结果,其多次下注的连续性构成了最终的长期复合年化回报,从而实现了复利。

是什么影响了复合年均收益率?Universa基金的马克·斯皮茨纳格尔提出了“波动率税”的概念:第1年100万元跌50%变成50万元;第2年50万元要涨100%才能变回100万元。

从算术平均值看,年均回报是25%;从几何平均值看,年均回报是0%。由此可见,假如短期大幅回撤,需要很长时间才能回复。这种收益上的不对称性,导致了负向的复利效应,从而极大影响了复合年均收益率。

那如何付出更少的“波动率税”?马克·斯皮茨纳格尔提出了尾部对冲的保险策略:例如用3%的资产购买“崩盘时能获得900%超高回报”的保险,这种保险的算术平均回报率是0%,复合平均回报率为-100%,但是却能很好地保护另外97%的资产,有效避免整体资产大幅回撤。

其原理是:通过赔率杠杆,牺牲了较小仓位资产的算术平均值回报,避免了主要仓位资产的较大回撤,从而避免了波动,提高了几何平均值回报。因为付出了更少的“波动率税”,所以降低了负向的复利效应,提高了复合年均收益率。

对比下注球队的例子,下注B球队就相当于为“概率权”买保险,而且保险本身是负期望值的。该保险就像是“空间不确定性”的保险,不管现实结果落在哪一个平行宇宙,下注人都能够稳赚。

而Universa基金的保险策略,则像是“时间不确定性”的保险,通过拉平糟糕年份的较大回撤,提高了年回报率的几何平均值。

以“保险策略”对冲不确定性,体现了马克·斯皮茨纳格尔的一种理念:不依赖于对崩盘概率的事前概率预测,从根本上解决投资者过度自信、建模误差和无遍历性的问题。也因此,这种策略能买到有较好赔率(高度非线性的赔付结构)、被错误定价的金融标的物。

然而,投资并无圣杯。AQR的创始人Asness(阿斯尼斯)就认为,通过虚值期权实现的尾部对冲在很多时候是无效的策略,并且其费用高昂、保护作用有限。

投资的第一原则是:永远不要亏(大)钱;第二条原则是:永远不要忘记第一条原则。

对于投资者而言,最重要的风险是永久损失的可能性风险。如今世界充满了不确定性,我们不得不在条件不充分的情况下行动,去做大概率正确的事情,或者根据胜率和赔率去做正期望值的投资,并期待大数定律的庇护。

所以,要在不确定的情况下做出选择或投入“赌注”时,我们既要算大概率,也要算小概率。同时,当我们做大概率正确的事情时,也要能承受发生小概率的错误。

发生在未来的事情,都具有某些不确定性,好结果还是坏结果都是未知的。

某些领域,如创新、创意、科研、教育等与希望有关的,我们不必介意坏结果,因为这类事情是否值得你去做,取决于可能的好结果。而某些领域你是否应该去做,则取决于可能的坏结果,例如投资。

然而在现实中,我们经常将二者弄反,例如在教育上过于追求让孩子不犯错,而在投资上过于相信自己美好愿望“一定会发生”。

人类的因果线性思维根深蒂固,即使是懂得概率的人也不能幸免,比如现代证券分析之父格雷厄姆曾说:“投资管理的精髓在于管理风险而不是收益,所有管理得当的组合都始于这一原则。”但格雷厄姆也经历过大萧条时期的股灾,其共同账户亏损达70%,最后一次带杠杆的抄底,令他近乎破产。

可见,我们必须用风险思维评估各种可能性,尤其是要为最糟糕结果的可能性装上“安全气囊”。

那么,投资到底是什么?通用汽车退休基金董事总经理查尔斯·钱皮恩的观点是:“投资既不是艺术,也不是科学,而是工程……我们的工作就是对金融投资的风险进行管理和工程化。”

按照字典上的定义,工程学、工程科学或工学,是通过研究与实践应用数学、自然科学、社会学等基础学科知识,以达到改良各行业中现有材料、土木建筑、机械、电机电子、仪器、系统、化学和加工步骤的设计和应用方式的一门学科。

而我更愿意将投资称为“概率工程学”。概率思维,源自赌场,而工程学是自然科学原理在现实世界中的运用。当你意识到投资是工程时,就能够让你打破幻觉,也对“人人有机会在投资上赚钱”的言论有所警惕。

工程在乎适应和应用,推崇在资源有限的条件下解决现实问题,以适当冗余来实现使用期内的牢靠;工程学不是去设计一辆车或发明一辆车,而是能大规模造出许多车,并且能穿越泥泞到达目的地。

偏偏投资是很容易产生幻觉的地方:在纸上设计出一辆车就觉得可以造车;在实验室里用“夏普比率、协方差矩阵、肥尾等”造出一辆好车,就觉得它可以进入泥地行驶……这些都基于这样一种信念:自己可以正确预测未來。

然而,人类在地球上的命运,几乎从来不依赖于预测,而在乎适应,在乎冗余,在乎鲁棒(Robust的音译,健壮和强壮的意思)性。

所谓鲁棒性,是指控制系统在一定(结构/大小)的参数摄动下,维持其某些性能的特性。而就投资而言,鲁棒性是指,我们的下注不应完全押宝于自己对未来的预测正确,而是即使你预测错误,仍能够受到保护,甚至仍能赚钱。

在“押注球队”的故事里,主动降低“整体期望值”;“保险策略”案例里,主动降低局部的算术平均值,都呼应了塔勒布的哲学:不用做预测大师,只需要改变赔付关系即可。

戴国晨对塔勒布《肥尾分布的统计效应》一书的总结中说:“金融领域风险管理的本质在于改变赔付关系,而不在于追求正确预测,因此只要在赔付关系上有利于自身,哪怕降低预测精度也无妨。”我们可以理解为,主动降低期望值和算术平均值,以及降低预测精度,都是为了形成某种冗余,以对抗不确定性。

就像SpaceX擅长用民用级元件来替代航天级元件,除了省钱,还因为多重冗余带来的概率稳定性:假如1个普通元件的稳定性是90%,2个普通元件同时出错的概率是1%,但价格可能只是稳定性达到99%的航天级元件的1/1 000。并且,很多时候对于局部精度的追求是有极限的。

这里不得不提,巴菲特从格雷厄姆那里学到的几个概念:

1. 买股票就是买公司。从长期看股价就是公司价值的体现,从本质上克服了波动性。

2. 保持安全边际。找好公司、好价格、好文化以及垄断生意,都是为了“安全边际”。

我们总说一个人应该配得上他的世俗名利,其实这句话应该倒过来说:一个人拥有的世俗名利最好配不上他这个人。而这中间,就是一个人的安全边际,这种主动退让,能够提高一个人鲁棒性,同时还会带来某种不自知的美和逍遥世间的宁静。

韩国著名棋手李昌镐,其令人印象最深刻的能力是锁定胜局的能力。

围棋是一种只要赢半目即可获胜的游戏,李昌镐就经常以半目取胜,他如此解释:“每手棋我只求51%的效率”。也许只有既懂围棋又懂投资的人,才能理解李昌镐这段话的妙处。

围棋的目的,是指最大概率追求比对手至少多半目地盘。李昌镐所说的“51%的效率”,是指从“局部、短期”看来不够充分,似乎效率只有51%的一手棋,但从全局看,一定是追求全局获胜概率最大化的一手棋。

围棋里局部最优和全局最优的矛盾,其实是个伪概念,因为评判标准只有一个:终局的胜利。

而在投资里,局部和整体的关系体现在时间、概率、赔率上,局部最优像追求年回报的算术平均值最大;全局最优像追求复合年化回报率最大(几何平均值)。

用围棋和投资互相隐喻,既能解释李昌镐的“每手棋我只求51%的效率”,又能生动描述马克·斯皮茨纳格尔局部牺牲算术平均值的“保险策略”。

要知道,李昌镐追求赢半目放弃赢20目,绝非消极防守,而是“将棋盘变小”,即获胜时他能够迅速缩短战线,将对方可能翻盘的地方一点点填平,如蟒蛇缠身般慢慢令对手窒息。

比如,押注B队对冲风险以实现稳赢,相当于将棋盘变小,B队即使获胜也不能影响下注者稳赢的收益。

马克·斯皮茨纳格尔喜欢的古训是:“防守赢得冠军”。他表示Universa基金也是建立在这一基础之上,并称:“风险管理和长期复合回报紧密联结,更像是一体的关系。”

巴菲特采用的也是防御型投资,因为对比主动进攻,防御策略似乎更牢靠,时间拉长看回报也更好。并且,防御背后是追求全局最优的大局观,是蓄势以对抗无法预测的宏观走势,是通过等待和保有大量现金去捕猎别人甩卖的概率权,以及即使是捡便宜时都还要再加上“优先股”的保护。

韩国的《围棋》月刊曾对李昌鎬有这样一段评论:对于一个职业棋手来讲,韧性不仅仅指精力和体力的持久性,它还包括对诱惑、过分自信以及轻率的时时警醒,是明察天下大势的胸怀与寸土不让的决心的有机结合。

然而,尽管围棋的变化极其复杂,它仍然是一个博弈游戏。对比而言,投资在现实生活中的随机性更强、运气成分更大,其不确定性让人不安、恐惧。

但“不安、恐惧”并非一无是处。斯宾诺莎说:“没有希望就没有恐惧,没有恐惧也就没有希望。”

可以说,人类的恐惧感是我们洞察和理解这个世界的测量仪,也是我们行动的指南针,是预测系统的一部分。因为恐惧也许产生于未知,但恐惧不仅仅只靠确定性知识和科学知识来驱逐。

而概率能让我们重新理解恐惧和风险,也能够帮助我们去计算和应对现实世界中的真实恐怖程度。“概率权”往往隐藏于“想象中的恐惧”和“实际上的恐惧”之间。

总而言之,现实像平行宇宙的花园,我们随机漫步,穿行其间。我们的努力并非是在某个平行宇宙的分支里如困兽犹斗,而是不断拓展新的可能性。所谓独立思考和独立行动,就是能够在时空的节点做出选择,并心甘情愿承担每一种后果。

猜你喜欢
赔率期望值对冲
基于改进数学期望值的沥青性能评价模型
重新审视你的期望值
村上春树登博彩赔率榜首
大骨瓣开颅减压术在对冲性颅脑损伤治疗中的应用观察
凯特 二胎成赌注
三角模糊型属性值的期望值比重规范化方法
大学生薪水期望值下降释放的信号