Category: Models
Type: Game Theory Model
Origin: Merrill Flood and Melvin Dresher, 1950
Also known as: PD, Prisoner’s Paradox, Cooperation Dilemma
Type: Game Theory Model
Origin: Merrill Flood and Melvin Dresher, 1950
Also known as: PD, Prisoner’s Paradox, Cooperation Dilemma
Quick Answer — 囚人のジレンマは、2人が協力するか裏切るかを選ぶ古典的なゲーム理論の状況です。2人とも協力すれば中程度の利益を得られます。2人とも裏切れば重い不利益を受けます。片方が協力し、もう片方が裏切ると、裏切った側は最良の結果を得て、協力した側は最悪の結果を被ります。ジレンマの核心は、個人にとって合理的な戦略が、全体としてはより悪い結果を生む点にあります。この逆説は、全員に利益がある状況でも協力が難しい理由を説明します。
What is Prisoner’s Dilemma?
囚人のジレンマ(Prisoner’s Dilemma)は、個人の合理性と集団の利益の緊張関係を示す、ゲーム理論の基礎モデルです。1950年にRAND CorporationのMerrill FloodとMelvin Dresherが考案して以来、経済学・生物学・政治学・倫理学における戦略的相互作用を理解する標準的な枠組みとなっています。“In the Prisoner’s Dilemma, the strategic choice that is best for each individual leads to a worse outcome for both.” — Robert Axelrod, The Evolution of Cooperationこのモデルでは、同じ犯罪で逮捕された2人の容疑者が別々に取り調べを受けます。各人は、警察に協力して相手を裏切るか、沈黙して相手に協力するかを選びます。結果は行列で表せます。2人とも沈黙すれば軽い刑(協力の中程度の報酬)、2人とも裏切れば重い刑(相互裏切りへの罰)、片方だけが裏切れば裏切り側は解放され、沈黙側は最大刑(裏切りの誘惑とカモの利得)になります。 核心は、このゲームがゼロサムではないことです。2人とも協力した方が双方に有利ですが、相手の行動にかかわらず合理的に見える支配戦略は裏切りです。ここに、個人最適と集団福祉の根本的な緊張が生まれ、これは人間社会の多くの場面で現れます。
Prisoner’s Dilemma in 3 Depths
- Beginner: ジレンマの構造を理解します。相互協力は双方に利益がありますが、相手に裏切られて損をすることを各プレイヤーは恐れます。合理的選択は相手予想に依存します。例:価格競争。企業が値下げを続け、全員が損をします。
- Practitioner: 現実の囚人のジレンマを見抜きます。軍拡競争、環境協定、職場競争など、多くの状況がこの構造を持ちます。個人インセンティブと集団利益が衝突しているかを特定することが鍵です。
- Advanced: ジレンマから脱出する仕組みを設計します。反復的な相互作用、評判効果、強制力ある合意、社会規範が、1回限りのゲームを反復ゲームに変え、協力の成立を可能にします。
Origin
囚人のジレンマは、1950年にRAND Corporationの数学者Merrill FloodとMelvin Dresherの研究を通じて定式化されました。名称は後にPrincetonの数学者Albert Tuckerが付け、別々に尋問される2人の囚人というわかりやすい設定を与えました。 このモデルがゲーム理論の中心になったのは、根源的な問いを捉えたからです。なぜ合理的で自己利益を追う人々は、相互利益があるのに協力しないのか。これは犯罪学にとどまらず、当時FloodとDresherが実際に扱っていた米ソ間の軍拡競争にも直結していました。 Robert Axelrodの1984年の名著”The Evolution of Cooperation”は、囚人のジレンマを進化論的枠組みに拡張しました。Axelrodは戦略同士を繰り返し対戦させるコンピュータ大会を実施し、「Tit for Tat(最初は協力し、以後は相手の前回行動を模倣)」が安定して勝つことを示しました。敵対的文脈でも協力が生まれうることを実証したのです。Key Points
Applications
Business Competition
価格戦争、特許競争、市場参入競争を囚人のジレンマとして分析できます。なぜ競合が互いの利益を削り合うのかを理解できます。
Environmental Policy
気候変動対策で各国協調が難しい理由を説明できます。各国には、他国の排出削減にただ乗りする誘因があります。
International Relations
軍拡競争、同盟形成、外交交渉をモデル化できます。国家間で繰り返される対立と協調のパターンを理解する助けになります。
Social Cooperation
知識共有、公共財への貢献、法の遵守など、日常の協力問題を理解できます。多くの社会的ジレンマは囚人のジレンマ構造を持ちます。
Case Study
1990年代の航空業界で見られた「過当競争」は、囚人のジレンマの典型例です。American AirlinesとUnited Airlinesは主要路線で激しい価格競争を繰り返し、いわゆる「Newark loop」と呼ばれる相互値下げに陥りました。 各社には明確な誘因がありました。相手が運賃を上げれば、自社は低価格維持でシェアを奪える。相手が追随しても、わずかな値差で顧客を引き寄せられる。協調解である「同時値上げ」は、一時的なアンダーカットで裏切る利益があるため維持できませんでした。 結果は双方に壊滅的でした。業界利益は急落し、1992年の米航空業界は競争激化の中で20億ドルの赤字を計上。American Airlinesは1995年に破綻寸前に追い込まれました。最終的には多くの事業者が退出・統合し、ジレンマを生む競争選択そのものが縮小しました。 教訓は明確です。囚人のジレンマは、調整できない競争市場が、当事者の誰も望まない結果を生みうることを示します。見えざる手が機能しないのは、協力より裏切りを報いる戦略的インセンティブ構造があるからです。Boundaries and Failure Modes
囚人のジレンマには限界があります。- 単純化された前提: 現実の戦略状況はここまで単純ではありません。選好差、情報不完備、複数ラウンドなど、基本モデルが捉えない要素があります。
- 競争への過度な焦点: モデルは対立を強調する一方、制度・信頼・社会規範が協力を可能にする役割を過小評価しがちです。
- 識別の難しさ: 囚人のジレンマに見える状況の中には、実際はCoordination GameやChickenであるものもあります。ゲーム構造を誤認すると予測を誤ります。
- 規範判断の混同: モデルは「何が起きるか」を示すのであって「何をすべきか」を直接は示しません。協力か裏切りかの選択には、モデル外の価値判断が必要です。
Common Misconceptions
このジレンマは人間が非合理だと証明している
このジレンマは人間が非合理だと証明している
むしろ逆で、1回限りのゲームでは合理的なプレイヤーほど裏切る方向に向かいます。これは非合理ではなく、インセンティブ構造の論理的帰結です。本当の問いは「なぜ協力が成立するのか」です。
話し合えば解決できる
話し合えば解決できる
コミュニケーションや約束があっても、強制や将来の反復がなければ、基礎インセンティブは裏切りを支持し続けます。
2人ゲームにしか当てはまらない
2人ゲームにしか当てはまらない
古典形は2人ですが、論理は多人数にも拡張できます(公共財ゲーム、集団行動問題)。参加者が増えるほど協力は一般に難しくなります。
Related Concepts
Nash Equilibrium
誰か1人だけ戦略を変えても改善できない安定点。囚人のジレンマでは相互裏切りがナッシュ均衡です。
Tit for Tat
最初は協力し、その後は相手の直前行動を模倣する戦略。Axelrodの大会で、協力進化を示した代表例です。
Collective Action Problem
個人インセンティブが集団にとって劣る結果を生む問題群。囚人のジレンマはその典型です。
Free Rider Problem
公共財に貢献せず利益だけ得る問題。囚人のジレンマ構造の多人数版とみなせます。
Arms Race
他国の行動にかかわらず軍備を積み増してしまう、現実世界の典型的な囚人のジレンマです。
The Evolution of Cooperation
反復相互作用と単純戦略によって協力が生まれる過程を示したAxelrodの代表的著作です。