跳转到主要内容
类别: 策略
类型: 博弈论策略
来源: 1944年,约翰·冯·诺依曼与奥斯卡·摩根斯特恩
别名: 占优策略解、优势策略
快速回答 — 占优策略是一种无论对手选择什么都能为玩家带来更好结果的策略。当占优策略存在时,理性玩家总是会选择它——这使得博弈结果高度可预测。

什么是占优策略?

占优策略是博弈论中的”无需思考”的选择。它是一种无论其他玩家做什么都优于所有替代方案的策略。如果你有占优策略,你就应该使用它——其他所有人也应该如此,这使得博弈的结果非常容易预测。
“当占优策略存在时,策略变得简单:采用它。博弈已被解决。” — 博弈论原理
这个概念分为两种类型。强占优策略在每种可能的情况下都给出严格更好的收益。弱占优策略在每种情况下都给出更好或相同的收益,且至少有一种情况严格更好。在实践中,任何占优策略的存在都大大简化了决策。

占优策略的三层理解

  • 入门: 想象一下在两家餐厅之间选择。餐厅A总是需要30分钟上菜,而餐厅B在不忙时需要25分钟——但忙时需要45分钟。由于你无法控制客流,餐厅A(一贯30分钟)支配餐厅B。你不需要查看客流预测。
  • 实践: 在竞争市场中,一家公司可能有这样的占优策略:“始终匹配竞争对手的价格。“这保证了无论竞争对手怎么做,他们永远不会因价格竞争而失去顾客。该策略主导了任何价格领导权的尝试。
  • 进阶: 占优策略可以通过迭代消除。在复杂博弈中,你有时可以通过反复消除被支配的策略来求解均衡。这个”迭代占优”过程简化博弈,直到出现清晰的解决方案——即使没有玩家拥有明显的占优策略。

起源

这个概念源于约翰·冯·诺依曼和奥斯卡·摩根斯特恩在1944年著作《博弈论与经济行为》中的基础性工作。这本开创性著作将博弈论确立为一门正式学科,并引入了战略互动中理性行为的概念。 冯·诺依曼和摩根斯特恩认识到一些博弈有明显的解决方案——每个理性玩家都会选择的策略,无论其他人怎么做。这些”占优策略”成为理解博弈中理性行为的基础。该概念后来由约翰·纳什和其他博弈论学者改进,将分析扩展到更复杂的情景。 这个原理具有革命性意义:在有占优策略的博弈中,“理性”结果不需要对对手进行复杂推理。每个玩家只需做对自己最有利的事情,均衡自然产生。

核心要点

1

比较所有策略的收益

列出你可能采取的每种策略。对于每种策略,计算或估计在每种可能情况下(对手行动的每种组合)的收益。
2

检查强占优

强占优策略在每种可能情况下都比任何其他策略给出更好的收益。如果有一种策略在所有情况下都击败其他所有策略,你就有了占优策略——选择它。
3

检查弱占优

如果不存在强占优策略,检查弱占优:一种在所有情况下都给出更好或相等收益、且至少有一种情况严格更好的策略。弱占优策略仍然值得采用。
4

消除被支配的策略

即使没有占优策略,你也可以通过消除总是比替代方案差的策略来简化博弈。反复消除被支配的策略通常会揭示解决方案。

应用场景

商业竞争

在价格匹配保证案例中,“始终匹配竞争对手的价格”成为占优策略。无论竞争对手怎么做,该公司都能留住所有价格敏感的顾客,同时避免破坏性的价格战。

拍卖设计

在密封投标二价拍卖中,按真实估值投标是占优策略。你会在且仅当你的估值超过其他投标时获胜,且你支付的不超过必要金额。

政治策略

政治竞选在特定情况下经常发现占优策略。例如,“聚焦摇摆州”支配”聚焦安全州”——当选举人票固定时,在结果不确定的地方花时间总是有更高的预期价值。

日常决策

在职业选择中,“发展可迁移技能”通常支配”专门学习雇主特定知识”。可迁移技能无论你在哪家公司工作都有价值,而专门知识如果换工作可能变得一文不值。

经典案例

密封投标二价拍卖完美展示了占优策略。在这种拍卖形式中,投标者提交密封投标,最高出价者获胜——但只支付第二高的出价。这在结构上类似于谷歌销售广告关键词的方式。 占优策略优雅而简单:按物品对你的真实价值出价。如果你认为这件物品值100美元,就出价100美元——不多不少。原因是:如果你出价低于100美元而赢了,你的剩余(你支付少于你的价值)增加了。但如果你出价高于100美元而输了,与按真实价值出价相比你没有额外损失。而如果你出价高于100美元而赢了,你实际上亏了钱——你支付的价值超过物品对你的价值。 诺贝尔奖获得者经济学家威廉·维克瑞证明了这种拍卖形式总是产生高效结果,因为真实出价支配任何替代策略。每个理性的投标者都遵循相同的逻辑,使结果高度可预测。

边界与失效场景

占优策略在复杂的现实世界博弈中很少存在。大多数有趣的情况涉及战略互动,在这种情况下你的最佳行动取决于他人做什么——恰恰是没有占优策略的时候。该概念正因为罕见而强大;一旦发现,它立即解决博弈。 该概念还需要准确的收益计算。在实践中,估计收益涉及对对手行为、未来后果和未知变量的不确定性。基于错误假设的”占优”策略可能灾难性失败。 最后,占优策略假设所有玩家都是理性的。实际上,对手可能表现不理性、犯错或有不同的偏好。对理性对手的”占优”策略可能对混乱的对手失效。

常见误区

完全不是。许多博弈有微妙的占优策略,需要仔细分析才能发现。检查每种策略与所有情况的过程可能很复杂,尤其是在有很多可能行动的博弈中。
你的占优策略给你带来的结果取决于对手——但他们的选择仍然影响最终收益。你得到的是给定他们行动的最好可能结果,不一定是固定的绝对结果。了解对手仍然对预测结果很重要。
占优策略最大化个人结果,不一定是集体结果。在某些情况下,每个人遵循他们的占优策略会导致比协调不同结果更差的集体结果——经典的囚徒困境说明了这一点。

相关概念

纳什均衡

更广泛的概念,任何玩家无法通过单方面改变策略来改善结果。所有占优策略组合都是纳什均衡,但反之不成立。

最小最大策略

最小化最大潜在损失的保守方法,通常在零和博弈中使用。当没有占优策略时很有用。

迭代占优

反复消除被支配的策略以简化博弈并找到均衡解决方案的过程。

二价拍卖

获胜者支付第二高出价的拍卖形式,使真实出价成为占优策略。

策略空间

博弈中玩家可用的所有可能策略的完整集合。

一句话总结

当你找到占优策略——就去做它。这是博弈论中罕见的礼物:无论其他人怎么做都能获胜的选择。