跳轉到主要內容
類別: 策略
類型: 博弈論策略
起源: 1944年,馮·諾伊曼與奧斯卡·摩根斯特恩
別名: 占優策略解、優勢策略
快速回答 — 占優策略是一種無論對手選擇什麼都能為玩家帶來更好結果的策略。當占優策略存在時,理性玩家總是會選擇它——這使得博弈結果高度可預測。

什麼是占優策略?

占優策略是博弈論中的「無需思考」的選擇。它是一種無論其他玩家做什麼都優於所有替代方案的策略。如果你有占優策略,你就應該使用它——其他所有人也應該如此,這使得博弈的結果非常容易預測。
「當占優策略存在時,策略變得簡單:採用它。博弈已被解決。」——博弈論原理
這個概念分為兩種類型。強占優策略在每種可能的情況下都給出嚴格更好的收益。弱占優策略在每種情況下都給出更好或相同的收益,且至少有一種情況嚴格更好。在實踐中,任何占優策略的存在都大大簡化了決策。

占優策略的三層理解

  • 入門: 想像一下在兩家餐廳之間選擇。餐廳A總是需要30分鐘上菜,而餐廳B在不忙時需要25分鐘——但忙時需要45分鐘。由於你無法控制客流,餐廳A(一貫30分鐘)支配餐廳B。你不需要查看客流預測。
  • 實務: 在競争市場中,一家公司可能有這樣的占優策略:「始終匹配競爭對手的價格。」這保證了無論競爭對手怎麼做,他們永遠不會因價格競爭而失去顧客。該策略主導了任何價格領導權的嘗試。
  • 進階: 占優策略可以透過迭代消除。在複雜博弈中,你有時可以透過反覆消除被支配的策略來求解均衡。這個「迭代占優」過程簡化博弈,直到出現清晰的解決方案——即使沒有玩家擁有明顯的占優策略。

起源

這個概念源於馮·諾伊曼和奧斯卡·摩根斯特恩在1944年著作《博弈論與經濟行為》中的基礎性工作。這本開創性著作將博弈論確立為一門正式學科,並引入了策略互動中理性行為的概念。 馮·諾伊曼和摩根斯特恩認識到一些博弈有明顯的解決方案——每個理性玩家都會選擇的策略,無論其他人怎麼做。這些「占優策略」成為理解博弈中理性行為的基礎。該概念後來由約翰·納什和其他博弈論學者改進,將分析擴展到更複雜的場景。 這個原理具有革命性意義:在有占優策略的博弈中,「理性」結果不需要對對手進行複雜推理。每個玩家只需做對自己最有利的事情,均衡自然產生。

核心要點

1

比較所有策略的收益

列出你可能採取的每種策略。對於每種策略,計算或估計在每種可能情況下(對手行動的每種組合)的收益。
2

檢查強占優

強占優策略在每種可能情況下都比任何其他策略給出更好的收益。如果有一種策略在所有情況下都擊敗其他所有策略,你就有了占優策略——選擇它。
3

檢查弱占優

如果不存在強占優策略,檢查弱占優:一種在所有情況下都給出更好或相等收益、且至少有一種情況嚴格更好的策略。弱占優策略仍然值得採用。
4

消除被支配的策略

即使沒有占優策略,你也可以透過消除總是比替代方案差的策略來簡化博弈。反覆消除被支配的策略通常會揭示解決方案。

應用場景

商業競爭

在價格匹配保証案例中,「始終匹配競爭對手的價格」成為占優策略。無論競爭對手怎麼做,該公司都能留住所有價格敏感的顧客,同時避免破壞性的價格戰。

拍賣設計

在密封投標二價拍賣中,按真實估值投標是占優策略。你會在且僅當你的估值超過其他投標時獲勝,且你支付的不超過必要金額。

政治策略

政治競選在特定情況下經常發現占優策略。例如,「聚焦搖擺州」支配「聚焦安全州」——當選舉人票固定時,在結果不確定的地方花時間總是有更高的預期價值。

日常決策

在職業選擇中,「發展可遷移技能」通常支配「專門學習雇主特定知識」。可遷移技能無論你在哪家公司工作都有價值,而專門知識如果換工作可能變得一文不值。

經典案例

密封投標二價拍賣完美展示了占優策略。在這種拍賣形式中,投標者提交密封投標,最高出價者獲勝——但只支付第二高的出價。這在結構上類似於谷歌銷售廣告關鍵詞的方式。 占優策略優雅而簡單:按物品對你的真實價值出價。如果你認為這件物品值100美元,就出價100美元——不多不少。原因是:如果你出價低於100美元而贏了,你的剩餘(你支付少於你的價值)增加了。但如果你出價高於100美元而輸了,與按真實價值出價相比你沒有額外損失。而如果你出價高於100美元而贏了,你實際上虧了錢——你支付的價值超過物品對你的價值。 諾貝爾獎獲得者經濟學家威廉·維克瑞证明了這種拍賣形式總是產生高效結果,因為真實出價支配任何替代策略。每個理性的投標者都遵循相同的邏輯,使結果高度可預測。

邊界與失效場景

占優策略在複雜的現實世界博弈中很少存在。大多数有趣的情況涉及策略互動,在這種情況下你的最佳行動取決於他人做什麼——恰恰是沒有占優策略的時候。該概念正因為罕見而強大;一旦發現,它立即解決博弈。 該概念還需要準確的收益計算。在實踐中,估計收益涉及對對手行為、未來後果和未知變數的不確定性。基於錯誤假設的「占優」策略可能災難性失敗。 最後,占優策略假設所有玩家都是理性的。實際上,對手可能表現不理性、犯錯或有不同的偏好。對理性對手的「占優」策略可能對混亂的對手失效。

常見誤區

完全不是。許多博弈有微妙的占優策略,需要仔細分析才能發現。檢查每種策略與所有情況的過程可能很複雜,尤其是在有很多可能行動的博弈中。
你的占優策略給你帶來的結果取決於對手——但他們的選擇仍然影響最終收益。你得到的是給定他們行動的最好可能結果,不一定是固定的絕對結果。了解對手仍然對預測結果很重要。
占優策略最大化個人結果,不一定是集體結果。在某些情況下,每個人遵循他們的占優策略會導致比協調不同結果更差的集體結果——經典的囚徒困境說明了這一點。

相��概念

納什均衡

更廣泛的概念,沒有任何玩家可以透過單方面改變策略來改善結果。所有占優策略組合都是納什均衡,但反之不成立。

最小最大策略

最小化最大潛在損失的保守方法,通常在零和博弈中使用。當沒有占優策略時很有用。

迭代占優

反覆消除被支配的策略以簡化博弈並找到均衡解決方案的過程。

二價拍賣

獲勝者支付第二高出價的拍賣形式,使真實出價成為占優策略。

策略空間

博弈中玩家可用的所有可能策略的完整集合。

一句話總結

當你找到占優策略——就去做它。這是博弈論中罕見的禮物:無論其他人怎麼做都能獲勝的選擇。