メインコンテンツへスキップ
カテゴリ: 誤謬
種類: 論理的誤謬
由来: 20世紀に整備された統計的考え方として定着
別名: 相関と因果の混同、偽りの原因(false cause)、疑わしい相関(spurious correlation)
簡潔な説明相関は因果を意味しない、は統計リテラシーの中心的概念です。ふたつの変数が統計的に結びついて見えても(一緒に増減するなど)、一方が他方を直接引き起こしているとは限りません。関係のタイプとしては、逆因果共通の第三要因、あるいはたまたまの重なりなど、別説明が多数あり得ます。

相関から因果を推論する誤謬とは

「相関は因果を意味しない」という言い方は、データと科学の議論で何度も繰り返されます。変数同士に統計的な結びつき(一方が大きいとき他方も大きい、など)が見えると、どちらかが原因でどちらかが結果だと話を早めがちですが、データだけからはその飛躍は正当化されません
「ふたつがともに動くことは、関係の手がかりであって、因果の証明ではない。相関の発見は調査の入口であって、結論の印ではない。」
相関が教えてくれるのは、少なくとも「ここに説明すべき関係がありそうだ」という点までです。なぜそう動くのかは、別の根拠——理論、実験デザイン、交絡の整理など——が必要です。

理解の深さを三段階で

  • 入門: アイスクリームの売上とプールでの溺水事故は、季節とともに増えます。アイスが溺水を引き起こすわけではなく、暑さやレジャー行動などの共通要因で説明できる典型です。
  • 実務: 売上とサイト流入が連動して見えても、流入が売上を押し上げたとは限りません。キャンペーンが両方を動かした、商品カテゴリが両方を形作った、といった物語のほうが妥当な場合もあります。
  • 応用: 観察研究で運動量と寿命が結びついて見えても、健康状態や社会経済的要因が背後で交絡している可能性があります。因果の主張には、研究デザインの厳密さが不可欠です。

由来

相関と因果の峻別は、20世紀初頭の統計学の発展とともに明確化しました。ピアソンやフィッシャーらは、相関を数値化しつつ、因果語りへの飛躍に警鐘を鳴らす立場でした。「相関は因果を意味しない」といった注意喚起は、方法が自然科学や社会科学に広がる過程で定着し、いまでは疫学、経済、A/B テスト、機械学習まで共通の前提になっています。それでも、報道やビジネスでは混同は依然として多いです。

要点

1

相関は記述であって、因果の完了ではない

相関は変数間の共変動を要約します。しかし「どうしてそうなるのか」は、理論とデザインの問題です。
2

少なくとも三つの枠組みを並べる

AとBが相関するとき、素朴には「A→B」「B→A」「第三のCが両者を動かす」が同時に候補になります。同じ相関パターンでも、語れる物語は複数あり得ます。
3

データが多いほど、偶然らしい線も出る

変数や切り口が増えると、意味のなさそうな強い相関も見つかりがちです。検定や探索の回数を踏まえないと、ノイズをシグナルと取り違えます。
4

因果にはメカニズムと設計が要る

因果を強く主張するには、メカニズムの整合だけでなく、交絡をどう扱うか、理想としては介入や自然実験に近い識別の仕組みが伴うことが多いです。

応用場面

データサイエンス・分析

モデルやダッシュボードは相関を可視化しやすい一方、因果語りに滑りやすい領域です。実験、疑似実験、構造化された因果推論の手続きは、その落差を埋めるためにあります。

公衆衛生

行動と健康指標の結びつきは観察で示されやすく、政策語りに直結します。交絡の残り方を説明しないまま「原因はこれ」と言い切ると、介入の優先順位を誤る危険があります。

経済・政策

国や制度の特性と経済指標が並走して見えても、政策が成長を生んだとはすぐ言えません。双方を説明する深い要因が先にある、という構図は珍しくありません。

日常の判断

サプリや習慣を始めて体調が変わった、と感じる経験は普遍です。ほかの生活変化や回復の自然推移を置けないまま因果を確定すると、再現のない自己実験になりがちです。

事例

教育と収入は長年、強く結びついて見える代表例です。「だから教育投資を増やせば所得が伸びる」と短絡しがちですが、能力、選択、ネットワーク、地域経済などが背後で交絡している可能性があります。自然実験に近い設計で得られた推定は、単純な相関をそのまま政策係数にしない、という重要な教訓を繰り返し示してきました。 教訓はシンプルです。長く続く相関でも因果と決めつけないほうが安全で、ナイーブな相関だけに乗せた政策は、意図と逆の帰結を招き得ます。

限界と失敗パターン

相関が因果の証拠になりうる場合: 例えば無作為化により群の差がほぼ一点に集中し、測定と解析が事前に固まっている実験では、相関はそのデザインのもとで因果の言葉に接続されやすくなります。問いは「どの前提のもとで因果と言えるか」です。 いちばん危険な場面: 観察データが主で、交絡の残存が疑わしい社会科学・健康・経済などでは、相関だけでの因果叙述は特に危険です。 よくある誤用: メディアが「○○する人は××になりにくい」と見出しにし、生活習慣全体や健康意識などの交絡に触れないまま、あたかも介入効果のように伝えるパターンです。

よくある誤解

実際には: 強い相関でも、逆因果や交絡で説明できる場合があります。強さは因果の代理指標ではありません。
実際には: 探索が広いほど、スパイアスに見える結びつきも出やすくなります。多重比較やデータスヌーピングへの配慮が欠かせません。
実際には: 測れない交絡や誤指定、選択バイアスは残り続けます。統制は助けにはなっても、因果を自動で保証するものではありません。

関連概念

ポスト・ホック(事後ゆえに)の誤謬

時間順だけで因果と決める古典的パターンです。相関・共起の誤用と根が通じます。

交絡変数(コンファウンダー)

見かけの原因・結果の両方を動かし、偽の関連を形づくりする第三の要因です。

疑わしい相関(スパイアス)

直接的な因果も共通原因も説明しにくい、統計上の寄せ集まりに過ぎない関連もあります。探索では特に注意が要ります。

一言で言うと

相関を見たら、因果は逆ではないか第三要因はないか偶然や探索の産物ではないかと立ち止まってください。相関は出発点であって、ゴールではありません。