跳转到主要内容
类别: 谬误
类型: 逻辑谬误
来源: 20世纪形式化的统计概念
别名: 相关因果谬误、虚假因果、伪相关
快速回答 — 相关性-因果性谬误发生在人们假设因为两个变量在统计上相关(它们一起变化),所以一个必定导致另一个时。这是统计素养中最重要的概念之一:相关性仅仅表明两件事物一起变化——它没有告诉我们为什么它们一起变化。这种关系可能是反向因果( B导致A),两个变量都可能由第三个因素引起,或者相关性纯粹是巧合。

什么是相关性-因果性谬误?

“相关性不等于因果性”这个短语是统计和科学推理的基本原则。当两个变量显示统计关系——意味着它们倾向于以可预测的方式一起变化——人们很容易得出一个导致另一个的结论。然而,这一跳跃仅仅根据数据是无法证明的。
“两件事物一起变化告诉我们的是它们的关系,而不是它们的因果性。相关性的发现是调查的开始,而不是结论。”
关键洞察是相关性只告诉我们关系存在;它不告诉我们是什么导致了这种关系。强相关性可能反映反向因果(B导致A)、共同原因(第三个变量导致两者),或者根本没有直接关系(巧合或抽样误差)。

相关性-因果性的三层理解

  • 入门级: 冰淇淋销量和泳池溺水在夏季都增加。冰淇淋导致溺水吗?显然不是——两者都是由炎热天气引起的。这种虚假相关性说明了为什么仅靠相关性无法建立因果关系。
  • 实践级: 在商业分析中,收入和网站流量可能是相关的——但更多流量导致更多收入吗?可能是,但也可能是成功的营销活动导致两者,或者奢侈品导致高收入并吸引也浏览更多的富裕客户。因果主张需要的不仅仅是相关性。
  • 进阶级: 在流行病学中,发现运动较多的人往往更长寿并不能证明运动延长了寿命。可能更健康的人运动更多,或者社会经济因素可能导致运动和长寿。需要随机对照试验来建立因果关系。

起源

相关性和因果性之间的明确区别成为20世纪初现代统计学的基石。卡尔·皮尔逊等统计学家以及后来的罗纳德·费舍尔开发了测量相关性的数学工具,同时明确警告不要进行因果解释。 “相关性不等于因果性”这个短语在20世纪40年代至50年代特别突出,因为统计方法在科学领域传播。今天,它是从流行病学到经济学再到机器学习和A/B测试等各个领域的基本概念。尽管如此,这种谬误仍然是数据解读中最常见的错误之一——出现在新闻文章、商业报告和日常推理中。

核心要点

1

相关性是描述性的,不是因果性的

相关性描述变量之间的关系——它告诉我们它们一起变化。但描述不是解释。“为什么”需要在统计关联之外进行额外调查。
2

三种替代解释

当A和B相关时,至少存在三种可能性:A导致B,B导致A,或第三个变量C导致两者。所有三种都产生相同的相关性模式。
3

巧合存在

随着足够的数据,虚假相关性不可避免地出现。互联网上充斥着荒谬的相关性(比如人均奶酪消费与死于被床单缠住的人数)——纯粹的巧合。
4

因果需要机制

建立真正的因果关系需要展示因果机制——而不仅仅是观察变量一起变化。这通常需要受控实验或详细的理论模型。

应用场景

数据科学与分析

数据科学家必须不断抵制从相关性推断因果性的诱惑。A/B测试、受控实验和因果推断方法专门设计用于超越单纯的相关性。

公共卫生

观察性研究经常显示行为与健康结果之间的相关性。但没有对照试验,我们无法知道行为是否导致结果,或者混淆因素是否解释两者。

经济与政策

经济政策经常以相关性为依据:“征收财产税的国家GDP更高。“但这种相关性很少能证明政策导致经济增长;两者都可能反映其他因素。

日常决策

在日常生活中,我们经常混淆相关性和因果性:“我吃了这种补充剂,感觉好多了,所以它一定有效。“如果不控制其他因素,我们无法知道补充剂是否帮助了我们,或者我们无论如何都会改善。

经典案例

教育与收入的关系提供了一个相关性-因果性复杂性的经典例子。数十年的数据显示,受教育程度较高的人往往收入更高。人们很容易得出结论:“教育导致更高的收入,因此我们应该鼓励每个人都接受更多的教育。” 但这种相关性可能反映多种因果故事。可能更聪明的人既追求更多教育又获得更高收入(能力偏差)。可能 prestigious 大学既选择高成就学生又提供更好的工作网络(选择性偏差)。可能某些性格特征导致教育成就和职业成功(遗漏变量偏差)。 最严格的研究试图通过寻找自然实验来分离因果关系——教育因与能力无关的原因而变化的情况。这些研究通常显示教育回报比简单相关性所显示的要小。教训是:即使一种关系持续了数十年也可能不是因果性的,基于简单相关性的政策可能严重误导。

边界与失效场景

当相关性暗示因果性时: 在某些受控背景下——比如随机实验,其中只有一组之间一个变量不同——相关性确实提供因果证据。关键是知道什么时候因果推断的方法条件得到满足。 当相关性最危险时: 相关性在最复杂的观察系统中最为危险——经济学、社会科学、健康——许多变量相互作用,未观察到的混淆很可能存在。在这里,相关性几乎不足以得出因果性结论。 常见误用模式: 媒体经常将相关性报道为因果性:“研究表明喝咖啡的人患心脏病较少。“如果不指出这可能反映更健康的人喝咖啡,或者两者都反映生活方式因素,这种报道就会传播因果性错误信息。

常见误区

现实: 无论相关性多强,都无法在没有额外证据的情况下推断因果关系。强相关性可能来自任何替代解释——反向因果、第三变量或巧合。
现实: 随着足够的数据,即使非常不可能的模式也会出现。凭借数百万个数据点,找到一些虚假相关性在数学上是必然的——这就是为什么我们不能仅依赖相关性。
现实: 统计控制可以帮助但不能完全解决混淆。我们只能控制我们可以测量的变量——未测量的混淆在观察性研究中仍然是一个持续存在的问题。

相关概念

后此谬误

假设因果关系的经典时间版本。如果B跟在A后面,A必定导致B——忽略其他因果可能性。

混淆变量

一个隐藏的第三变量,导致明显的因果两者,产生虚假相关性。理解混淆因素是正确因果分析的关键。

虚假相关性

一种特定的相关性类型,其中关系是偶然的——两个变量都不导致对方,也没有第三个变量连接它们。纯粹的统计噪声。

一句话总结

当你看到相关性时,问问自己:这可能是反向的吗?第三因素能解释两者吗?这可能只是巧合吗?相关性是调查的起点,不是结论。