跳轉到主要內容
分類: 模型
類型: 博弈論模型
起源: 約翰·納什,1950-1951
別名: 納什均衡、非合作均衡、策略均衡
快速回答 — 納什均衡是博弈論中的一個基本概念,描述了一個遊戲的狀態,在這個狀態下,沒有玩家可以透過單方面改變策略來獲益。當所有玩家都處於納什均衡時,每個人都在其他人所做的選擇下做到最好。該概念以數學家約翰·納什命名,他因此獲得了諾貝爾經濟學獎,為分析經濟學、生物學、政治科學等領域的策略互動提供了數學基礎。

什麼是納什均衡?

納什均衡是非合作博弈論中的一個解概念,定義了遊戲中沒有玩家可以透過單方面改變策略來獲益的穩定狀態。在這個均衡點上,每個玩家都選擇了一個策略,而沒有玩家會後悔他們的選擇——給定其他人的選擇,他們無法透過只改變自己的策略而其他人保持不變來改善結果。
「博弈論中的解概念是一種形式化規則,用於預測遊戲將如何進行。」—— 約翰·納什
該概念由小約翰·福布斯·納什於其1950年普林斯頓大學博士論文和1951年的論文《非合作博弈》中引入。納什在普林斯頓大學和蘭德公司的研究項目中工作,該項目還包括約翰·馮·諾伊曼和奧斯卡·摩根斯特恩等巨頭。 時機很重要。冷戰正在加劇,美國政府深入分析策略——特別是核策略和軍備談判。納什的工作提供了一種數學語言來分析無法達成有約束力協議的策略情況,這對軍事和外交策略證明是無價的。 馮·諾伊曼和摩根斯特恩早期開發了合作博弈論,假設玩家可以形成有約束力的聯盟。納什的非合作方法更加普遍,適用於不存在執法機制的情況。憑藉這項工作,納什與約翰·哈桑尼和萊因哈德·瑟爾滕共同獲得了1994年諾貝爾經濟學紀念獎。 納什的博士論文非常簡潔——不到30頁——但它包含了一個改變經濟學、生物學、政治科學和電腦科學的想法。這個概念現在在世界各地的經濟學入門課程中教授,是現代微觀經濟學的基礎。

納什均衡的三個層次

  • 入門:將均衡理解為沒有人後悔選擇的狀態。如果你在納什均衡並考慮單獨改變你的策略,你會處於更糟的境地。例子:兩家公司在市場上設定價格——如果另一家不改變,沒有一家能透過改變價格獲利。
  • 實踐:在現實策略情況中識別納什均衡。尋找每個玩家對他人策略的最佳回應與其實際策略相符的點。這些點就是均衡。例子:道路交通——每個駕駛者選擇路線,沒有駕駛者可以透過單獨切換路線來改善行車時間。
  • 進階:分析均衡是有效率還是無效率。納什均衡揭示穩定性,而非最優性。認識到一些均衡是「協調失敗」,玩家陷入糟糕的結果。理解動態博弈中的子博弈完美等精煉概念。

起源

小約翰·福布斯·納什於1950年在普林斯頓大學的博士論文及其後續1951年的論文《非合作博弈》中引入了納什均衡的概念。納什在普林斯頓大學和蘭德公司的研究項目中工作,該項目還包括約翰·馮·諾伊曼和奧斯卡·摩根斯特恩等巨頭。 時機很重要。冷戰正在加劇,美國政府深入分析策略——特別是核策略和軍備談判。納什的工作提供了一種數學語言來分析無法達成有約束力協議的策略情況,這對軍事和外交策略證明是無價的。 馮·諾伊曼和摩根斯特恩早期開發了合作博弈論,假設玩家可以形成有約束力的聯盟。納什的非合作方法更加普遍,適用於不存在執法機制的情況。憑藉這項工作,納什與約翰·哈桑尼和萊因哈德·瑟爾滕共同獲得了1994年諾貝爾經濟學紀念獎。 納什的博士論文非常簡潔——不到30頁——但它包含了一個改變經濟學、生物學、政治科學和電腦科學的想法。這個概念現在在世界各地的經濟學入門課程中教授,是現代微觀經濟學的基礎。

核心要點

1

均衡意味著穩定性,而非最優

在納什均衡中,沒有玩家可以單獨改變策略來改善——但均衡結果可能遠非對所有人都是最好的。囚徒困境中的相互背叛是一個納什均衡,但相互合作會讓兩個玩家都更好。
2

多重均衡很常見

許多遊戲有多個納什均衡。當這種情況發生時,協調變得至關重要——玩家必須以某種方式同意實現哪個均衡。「性別戰」遊戲說明了這一點。
3

並非所有遊戲都有純策略均衡

一些遊戲沒有玩家選擇確定策略的均衡。然而,混合策略均衡——玩家在選項之間隨機選擇——在有限遊戲中總是存在。
4

均衡分析揭示策略結構

尋找納什均衡強制對玩家策略如何相互作用進行嚴格分析。這種分析往往揭示關於哪些結果是穩定的以及為什麼穩定的驚人見解。

應用場景

經濟建模

分析寡頭定價、拍賣設計和市場進入決策。古諾競爭和伯川德競爭都產生預測市場結果的納什均衡。

政治策略

模擬選舉競爭、立法談判和國際談判。候選人在政治光譜上定位自己往往在相似位置找到納什均衡。

生物學與演化

解釋動物行為中的穩定模式,包括捕食者-獵物動態和交配策略。演化博弈論使用納什均衡來預測哪些策略會生存。

拍賣設計

設計引發真實出價的拍賣。維克里-克拉克-格roves機制確保真實出價是佔優策略——一種強形式的納什均衡。

經典案例

演化生物學中的「消耗戰」模型展示了自然界中的納什均衡。在許多動物物種中,爭奪資源(領地、配偶、食物)的衝突可能升級為危險的戰鬥。動物發展出一種等待的策略——持續展示直到對手放棄——來解決衝突而不進行身體戰鬥。 考慮兩隻參與展示競爭的動物。每個可以選擇立即放棄(讓步資源)或繼續展示(承擔成本)。雙方展示的時間越長,它們在能量和暴露於捕食者方面付出的代價就越多。該遊戲中納什均衡預測動物將按照資源價值成比例地展示一段時間,價值較低的動物首先放棄。 這種模式在各個物種中都有觀察到:招潮蟹展示它們的爪子,鹿展示鹿角,鳥類歌唱。均衡是不對稱的——更大或更有能力的動物可以維持更長時間的展示,因此對手根據對相對戰鬥能力的評估來放棄。關鍵的是,均衡是穩定的:給定對手的策略,兩隻動物都不會從更早放棄或戰鬥更久中獲益。 更廣泛的教訓:納什均衡為理解自然界中為何存在穩定的行為模式提供了有力的視角。看起來「非理性」的浪費(承受昂貴的展示)實際上在所有玩家遵循相同邏輯時是策略理性的——一種避免戰鬥更大代價的穩定妥協。

邊界與失效場景

納什均衡有局限性:
  • 均衡並不總是存在於純策略中:一些遊戲需要混合策略(隨機化)來實現均衡。當應用於實際決策時,這種數學必要性可能令人不滿意。
  • 多重均衡創造協調問題:當遊戲有多個納什均衡時,理論無法預測哪個會發生。需要關於玩家預期、歷史或溝通的額外假設。
  • 均衡假設理性:現實玩家可能有限理性、犯錯或對遊戲有不同的解釋。實驗經濟學經常發現偏離納什預測的行為。
  • 均衡分析可能很複雜:在有許多玩家或連續策略的遊戲中尋找納什均衡可能在數學上具有挑戰性,限制實際應用。

常見誤區

在納什均衡中,玩家只是給定其他人的選擇而不後悔他們的選擇。他們可能對結果非常不滿意——只是無法單方面改善。囚徒困境中的相互背叛是一個納什均衡,儘管對雙方都更差。
納什均衡揭示穩定性,而非效率。「公地悲劇」和壟斷中的「無謂損失」是持續存在因為沒有個人可以單獨改變結果的低效納什均衡的例子。
尋找納什均衡只是開始。我們還必須考慮均衡是否合理,玩家是否能夠協調到更優的均衡,以及均衡結果是否可取。

相關概念

博弈論

納什均衡服務的更廣泛學科。博弈論研究結果取決於所有玩家選擇的策略互動。

囚徒困境

一個經典遊戲,其中相互背叛是納什均衡,儘管對雙方來說都比相互合作更差。

佔優策略

無論其他人做什麼,對玩家都是最好的策略。如果存在佔優策略,遊戲總是達到那個結果。

帕累托效率

一種無法在不使其他玩家更糟的情況下讓任何玩家更好的結果。納什均衡通常不是帕累托有效的。

混合策略

一種涉及在行動之間隨機化的策略。納什證明每個有限遊戲至少有一個混合策略均衡。

子博弈完美均衡

動態博弈中納什均衡的精煉,要求在遊戲的每個點上威脅和承諾的可信性。

一句話總結

納什均衡揭示了競爭情境中的穩定結果是那些沒有玩家可以透過單方面改變策略來改善的結果——但穩定性不能保證效率或公平。