跳轉到主要內容
類別:效應
類型:統計規律與解釋陷阱
來源:高爾頓家族身高研究(19 世紀 80 年代);後推廣至多領域
別名:向中庸迴歸(歷史表述)
快速回答均值迴歸(Regression to the Mean)指異常高或低的分數之後,下一次測量往往更接近總體均值——不一定因為你「做對了什麼」,而是因為極端值裡混有隨機波動。它解釋表揚/懲罰、醫療干預與運動「低潮」之後的錯覺因果。把它與治療真實效果混淆,是管理與政策裡極昂貴的思維錯誤之一。

什麼是均值迴歸?

均值迴歸(Regression to the Mean)是重複測量中的常見模式:極端結果之後,更容易出現較溫和的結果,即便世界沒有本質變化。只要極端觀測混合了真實水準雜訊,極端裡就有一部分「運氣」,而運氣很難原樣重現。
極端常常一半偶然;下一次很少同樣偶然地偏向同一側。
它廣泛見於考試分數、運動表現、企業獲利與臨床症狀。與 倖存者偏差 相互作用;與 賭徒謬誤 不同——後者錯誤期待平衡,而均值迴歸談的是向總體分佈的統計性靠攏。它與 大數法則 互補:樣本越大,平均越穩;單次極值則不然。

均值迴歸的三層理解

  • 入門:特別好或特別糟的一天之後,下一天往往更接近平常——部分因為第一天本就異常。
  • 實踐者:在極端低分之後把「進步」歸功於教練或藥物前,先問:不做任何事,樸素預測會是多少?
  • 進階:建立把極端估計向先驗均值收縮的模型——這是「迴歸」思想的統計核心。

起源

高爾頓研究父母與子女身高:特別高的父母,其子女往往仍偏高,但相對全體人群不如父母那麼極端(「向中庸迴歸」)。這不是道德說教,而是代際測量之間相關係數小於 1 的數學結果。 後來推廣到:兩變數相關不完美時,由一個極端值預測另一變數會得到較不極端的預測。心理學家強調這會製造虛假因果——人們在篩選後的樣本上看到自然回落,卻以為是自己的動作奏效。

核心要點

均值迴歸是把訊號與事後篩選雜訊分開的透鏡。
1

極端混合訊號與雜訊

創紀錄月份、發燒峰值或一次考試高分,往往高估或低估穩定水準。
2

篩選製造錯覺

只研究「最差案例」或「最佳表現者」時,即便無效干預也會出現部分回升。
3

重複測量會有部分回落

第二次測量在敘事上並非獨立——數學上常被均值拉回。
4

對照與基線不可或缺

隨機試驗與歷史基線幫助區分真實影響與統計反彈。

應用場景

用它審計表揚、責罰與「到底什麼管用」。

教育與測驗

極低分重測往往會回升一部分——輔導效果要先跑贏這層基線預期。

運動與表現

新秀爆發與低谷常向聯盟平均移動;敘事卻愛發明「撞牆」與「大心臟」。

醫療與健康

人們常在症狀高峰就醫,之後好轉部分源於自然波動——試驗需要對照。

管理與 KPI

最差季度後懲罰、最好季度後重獎,可能誤讀運氣;要看更長序列與分佈。

經典案例

高爾頓的家族身高分析是可核查的經典:中位父母身高極高時,子女身高仍相關,但相對全體人群不如父母極端——相關係數小於 1.0 的數學事實。現代教科書用同一結構提醒:任何單次極端——血壓、銷量、缺陷率——在重測時若向長期均值移動,並不自動證明你上一週做了什麼神奇的事。

邊界與失效場景

均值迴歸解釋的是變化的一部分,不是全部。 邊界一:真實干預存在
訓練、治療與流程改進可以提升真實均值——不只是統計反彈。
邊界二:極端有時意味結構突變
持續體制變化時,簡單「回到舊均值」的故事可能失效。
常見誤用:把危機後的所有改善都斥為「只是迴歸」——卻不與可信反事實比較。

常見誤區

對運氣保持謙遜,是專業素養。
事實:預測是從極端朝均值方向移動,不是所有人結果相同。
事實:賭徒謬誤誤用獨立序列;迴歸來自測量誤差與不完全相關。
事實:「前測」極端幾乎保證某種變化——實驗設計要處理這一點。

相關概念

判斷證據與篩選時,可配合閱讀:

倖存者偏差

為何你只看到贏家,看不到完整抽樣。

大數法則

樣本越大,平均越穩定。

賭徒謬誤

關於獨立序列的另一種錯誤直覺。

一句話總結

若從一個極端出發,下一個數據點往往更平常——即便你什麼也沒做。