メインコンテンツへスキップ
Category: Models
Type: Game Theory Model
Origin: Merrill Flood and Melvin Dresher, 1950
Also known as: PD, Prisoner’s Paradox, Cooperation Dilemma
Quick Answer — 囚人のジレンマは、2人が協力するか裏切るかを選ぶ古典的なゲーム理論の状況です。2人とも協力すれば中程度の利益を得られます。2人とも裏切れば重い不利益を受けます。片方が協力し、もう片方が裏切ると、裏切った側は最良の結果を得て、協力した側は最悪の結果を被ります。ジレンマの核心は、個人にとって合理的な戦略が、全体としてはより悪い結果を生む点にあります。この逆説は、全員に利益がある状況でも協力が難しい理由を説明します。

What is Prisoner’s Dilemma?

囚人のジレンマ(Prisoner’s Dilemma)は、個人の合理性と集団の利益の緊張関係を示す、ゲーム理論の基礎モデルです。1950年にRAND CorporationのMerrill FloodとMelvin Dresherが考案して以来、経済学・生物学・政治学・倫理学における戦略的相互作用を理解する標準的な枠組みとなっています。
“In the Prisoner’s Dilemma, the strategic choice that is best for each individual leads to a worse outcome for both.” — Robert Axelrod, The Evolution of Cooperation
このモデルでは、同じ犯罪で逮捕された2人の容疑者が別々に取り調べを受けます。各人は、警察に協力して相手を裏切るか、沈黙して相手に協力するかを選びます。結果は行列で表せます。2人とも沈黙すれば軽い刑(協力の中程度の報酬)、2人とも裏切れば重い刑(相互裏切りへの罰)、片方だけが裏切れば裏切り側は解放され、沈黙側は最大刑(裏切りの誘惑とカモの利得)になります。 核心は、このゲームがゼロサムではないことです。2人とも協力した方が双方に有利ですが、相手の行動にかかわらず合理的に見える支配戦略は裏切りです。ここに、個人最適と集団福祉の根本的な緊張が生まれ、これは人間社会の多くの場面で現れます。

Prisoner’s Dilemma in 3 Depths

  • Beginner: ジレンマの構造を理解します。相互協力は双方に利益がありますが、相手に裏切られて損をすることを各プレイヤーは恐れます。合理的選択は相手予想に依存します。例:価格競争。企業が値下げを続け、全員が損をします。
  • Practitioner: 現実の囚人のジレンマを見抜きます。軍拡競争、環境協定、職場競争など、多くの状況がこの構造を持ちます。個人インセンティブと集団利益が衝突しているかを特定することが鍵です。
  • Advanced: ジレンマから脱出する仕組みを設計します。反復的な相互作用、評判効果、強制力ある合意、社会規範が、1回限りのゲームを反復ゲームに変え、協力の成立を可能にします。

Origin

囚人のジレンマは、1950年にRAND Corporationの数学者Merrill FloodとMelvin Dresherの研究を通じて定式化されました。名称は後にPrincetonの数学者Albert Tuckerが付け、別々に尋問される2人の囚人というわかりやすい設定を与えました。 このモデルがゲーム理論の中心になったのは、根源的な問いを捉えたからです。なぜ合理的で自己利益を追う人々は、相互利益があるのに協力しないのか。これは犯罪学にとどまらず、当時FloodとDresherが実際に扱っていた米ソ間の軍拡競争にも直結していました。 Robert Axelrodの1984年の名著”The Evolution of Cooperation”は、囚人のジレンマを進化論的枠組みに拡張しました。Axelrodは戦略同士を繰り返し対戦させるコンピュータ大会を実施し、「Tit for Tat(最初は協力し、以後は相手の前回行動を模倣)」が安定して勝つことを示しました。敵対的文脈でも協力が生まれうることを実証したのです。

Key Points

1

支配戦略は相互損失につながる

裏切りは支配戦略であり、相手が何をしても有利に見えます。その結果、ナッシュ均衡は相互裏切りになり、相互協力より双方にとって悪い結果になります。
2

ジレンマは心理ではなく構造にある

問題は人が非合理だからではありません。1回限りのゲームなら、ルールを完全に理解した合理的プレイヤーでも裏切ります。ジレンマはインセンティブ構造そのものから生じます。
3

反復プレイは状況を変える

ゲームが繰り返されると(反復囚人のジレンマ)、協力は持続可能になります。将来の帰結が自制の動機を生み、評判に価値が生まれます。
4

このジレンマは根本的対立を可視化する

囚人のジレンマは、個人合理性と集団合理性、短期利益と長期利益、競争と協調の深い対立を明らかにします。

Applications

Business Competition

価格戦争、特許競争、市場参入競争を囚人のジレンマとして分析できます。なぜ競合が互いの利益を削り合うのかを理解できます。

Environmental Policy

気候変動対策で各国協調が難しい理由を説明できます。各国には、他国の排出削減にただ乗りする誘因があります。

International Relations

軍拡競争、同盟形成、外交交渉をモデル化できます。国家間で繰り返される対立と協調のパターンを理解する助けになります。

Social Cooperation

知識共有、公共財への貢献、法の遵守など、日常の協力問題を理解できます。多くの社会的ジレンマは囚人のジレンマ構造を持ちます。

Case Study

1990年代の航空業界で見られた「過当競争」は、囚人のジレンマの典型例です。American AirlinesとUnited Airlinesは主要路線で激しい価格競争を繰り返し、いわゆる「Newark loop」と呼ばれる相互値下げに陥りました。 各社には明確な誘因がありました。相手が運賃を上げれば、自社は低価格維持でシェアを奪える。相手が追随しても、わずかな値差で顧客を引き寄せられる。協調解である「同時値上げ」は、一時的なアンダーカットで裏切る利益があるため維持できませんでした。 結果は双方に壊滅的でした。業界利益は急落し、1992年の米航空業界は競争激化の中で20億ドルの赤字を計上。American Airlinesは1995年に破綻寸前に追い込まれました。最終的には多くの事業者が退出・統合し、ジレンマを生む競争選択そのものが縮小しました。 教訓は明確です。囚人のジレンマは、調整できない競争市場が、当事者の誰も望まない結果を生みうることを示します。見えざる手が機能しないのは、協力より裏切りを報いる戦略的インセンティブ構造があるからです。

Boundaries and Failure Modes

囚人のジレンマには限界があります。
  • 単純化された前提: 現実の戦略状況はここまで単純ではありません。選好差、情報不完備、複数ラウンドなど、基本モデルが捉えない要素があります。
  • 競争への過度な焦点: モデルは対立を強調する一方、制度・信頼・社会規範が協力を可能にする役割を過小評価しがちです。
  • 識別の難しさ: 囚人のジレンマに見える状況の中には、実際はCoordination GameやChickenであるものもあります。ゲーム構造を誤認すると予測を誤ります。
  • 規範判断の混同: モデルは「何が起きるか」を示すのであって「何をすべきか」を直接は示しません。協力か裏切りかの選択には、モデル外の価値判断が必要です。

Common Misconceptions

むしろ逆で、1回限りのゲームでは合理的なプレイヤーほど裏切る方向に向かいます。これは非合理ではなく、インセンティブ構造の論理的帰結です。本当の問いは「なぜ協力が成立するのか」です。
コミュニケーションや約束があっても、強制や将来の反復がなければ、基礎インセンティブは裏切りを支持し続けます。
古典形は2人ですが、論理は多人数にも拡張できます(公共財ゲーム、集団行動問題)。参加者が増えるほど協力は一般に難しくなります。

Nash Equilibrium

誰か1人だけ戦略を変えても改善できない安定点。囚人のジレンマでは相互裏切りがナッシュ均衡です。

Tit for Tat

最初は協力し、その後は相手の直前行動を模倣する戦略。Axelrodの大会で、協力進化を示した代表例です。

Collective Action Problem

個人インセンティブが集団にとって劣る結果を生む問題群。囚人のジレンマはその典型です。

Free Rider Problem

公共財に貢献せず利益だけ得る問題。囚人のジレンマ構造の多人数版とみなせます。

Arms Race

他国の行動にかかわらず軍備を積み増してしまう、現実世界の典型的な囚人のジレンマです。

The Evolution of Cooperation

反復相互作用と単純戦略によって協力が生まれる過程を示したAxelrodの代表的著作です。

One-Line Takeaway

囚人のジレンマが示すのは、合理的な自己利益が自動的に集団利益を生むわけではないという事実です。協力には、反復相互作用・評判・履行強制のような構造条件が必要です。