教科書

第3章 因果関係と相関

科学的探究においては、「ある現象Aが起こると、それに伴って現象Bも起こる」という「変数同士の関連性」を見出すことがしばしばあります。しかし、この関連性(相関)が直ちに「AがBを引き起こす」(因果関係)という意味になるわけではありません。本章では、因果関係と相関の違いを明確に理解し、誤解を防ぐための考え方を学びます。これは日常生活や社会問題の分析でも極めて重要なテーマです。


1. 因果関係(Causation)とは

1.1 定義

因果関係とは、「ある事象(原因)が、別の事象(結果)を引き起こしている関係」を指します。科学的に因果を立証するためには、少なくとも以下の3つの要件を検討する必要があります。

  1. 時間的先行: 原因が結果より先に起こっていること。
  2. 共変性(共変動): 原因が変化すると結果も変化する(原因が強まるほど結果も顕著になるなど)。
  3. 交絡因子の排除: 第三の要因や別の仕組みによって結果が生じているわけではない、という確認。

1.2 科学における因果推論の難しさ

科学において、ある法則が「因果関係」を示していると確信を得るには多くの検証が必要です。例えば、ニュートン力学の万有引力微生物による感染症の説は、長年にわたる実験や観測、他の理論との整合性の確立によって広く因果関係として認められてきました。しかし、多くの現象は単一の要因だけでなく、複合的な要因が絡み合って結果をもたらすため、完全に「AがBを引き起こす」と断定できるケースは意外に少ないのも事実です。


2. 相関関係(Correlation)とは

2.1 定義

相関関係とは、2つ以上の変数が同時に変動する統計的な傾向を指します。相関を調べるためには、通常、観察データや実験データに基づいて、相関係数(ピアソンの相関係数など)を計算したり、散布図を描いたりします。

  • 正の相関: 一方が増加すると、もう一方も増加する。例:「アイスクリームの売上」と「熱中症の発症数」。
  • 負の相関: 一方が増加すると、もう一方は減少する。例:「通勤時間」と「自由に使える自宅時間」。

2.2 相関の例と解釈

たとえば、「Aという製品をよく買う人はBというサービスの利用頻度も高い」という相関がデータから示されたとしましょう。ここで「Aを買うとBを使うようになるのか?」と即断することは危険であり、因果は別にある可能性が高い。たとえば「同じ層の消費者が両方に興味を持ちやすい」という第三の要因(交絡因子)があるかもしれません。


3. 「相関」と「因果」を混同すると起こる問題

「相関があるから因果がある」と軽率に結びつけてしまうことは、多くの誤解や間違った対策を生み出しかねません。

3.1 隠れた要因(交絡因子)

  • : アイスクリームの売上と熱中症の患者数は、同じ季節や気温の上昇によって共通に変動しているだけであり、アイスを食べること自体が熱中症の原因ではない(真の要因は「暑さ」)。

3.2 逆因果の可能性

  • : 「運動不足が肥満を引き起こす」という通説は一面真実でしょうが、一部には「肥満気味だから運動しにくい・やる気が出ない」→「結果として運動不足になる」という逆方向の因果があるかもしれません。

3.3 単なる偶然の一致

大規模なデータ分析では、全く関係ないものが「たまたま統計的に相関する」ケースもよく知られています。たとえば、ある地域の「養蜂量」と「離婚率」が有意に相関しているという奇妙な例が報告されたことがありますが、現実に何の意味もない(偶然の相関)と考えられます。


4. 因果関係の特定方法

4.1 実験(介入研究)

最も確実に因果関係を裏付ける方法は、**実験(介入)によって変数を操作し、結果がどう変わるかを観察することです。医学における無作為化比較試験(RCT)**などはその典型例です。

  1. 対象集団を無作為に2つ以上に分割
  2. 一方の群に新しい治療を施し、もう一方には従来の治療またはプラセボ(偽薬)を施す
  3. 経過を観察し、両群の結果を比較

このとき、余計な要因(交絡因子)をできるだけ排除できるため、「新薬が効果に影響を与えているかどうか」を直接確認できます。ただし、人間を対象とした実験には倫理面の配慮が欠かせません。

4.2 観察研究

実験が難しい場合(例えば、喫煙の害を大規模に実験するわけにいかない)には、長期間にわたる観察研究で因果関係を示唆するデータを集めます。たとえばコホート研究で「喫煙者」と「非喫煙者」を追跡調査し、肺がんの発症率を比較するなどです。これは介入実験ほど因果推論に強いエビデンスを持たせにくいものの、長期データや複数の統計手法(多変量解析など)を駆使して交絡因子の影響をコントロールできれば、因果推論を補強できます。

4.3 統計解析・因果推論モデル

近年は、因果推論モデル(例:構造方程式モデリング、因果グラフなど)を用いて、観察データのなかから因果関係をより厳密に推論する研究が盛んになっています。交絡因子を特定のアルゴリズムで排除したり、疑似実験(疑似介入)を行う計量経済学的手法(差の差分析、操作変数法など)もあります。ただし、これらの手法を用いても「観測不能な交絡因子」が存在すれば、因果推論は完全には保証されません。


5. 実例:因果関係の考え方

5.1 喫煙と肺がん

  • 相関: 「喫煙者には肺がんが多い」という強い相関が観察される。
  • 因果関係: 長年の観察研究や動物実験、さらには生物学的メカニズムの解明(タールやニトロソアミンによるDNA損傷など)によって、「喫煙が肺がんを引き起こす主要な要因の一つ」であると確固たる因果推論が確立。

5.2 大気温度と二酸化炭素濃度

  • 相関: 大気中のCO₂濃度が増加すると平均気温も上昇する、という長期的データ。
  • 因果関係: 温室効果ガスとしてのCO₂の性質が物理学的に明確に示され、かつ過去の氷床コア分析や数値シミュレーションでも整合的に説明されることから、「人為的なCO₂排出が温暖化を加速している」という因果関係が強く支持されている。

6. 「因果関係」と「相関関係」を区別する意義

  1. 政策立案・意思決定
    • 相関関係だけを根拠に政策を打つと、予想外の副作用を招く恐れがある。因果を正しく捉えたうえで有効な対策を立案することが必要。
  2. 誤情報の拡散防止
    • メディアやSNSでは、「○○すると××になるらしい」という話が頻繁に広まるが、それが因果なのか相関なのかを見極める力が求められる。
  3. 研究の方向付け
    • 相関が見られたら「この要因が関係しているかもしれない」と仮説を立て、さらに因果を検証する、という正しいステップを踏むことで、科学的発見が積み重ねられていく。

7. 3章のまとめ

本章では、因果関係相関関係の違いを丁寧に検討し、以下のポイントを確認しました。

  1. 因果関係: 「AがBを引き起こす」という直接的なメカニズムを伴う関係。時間的先行や交絡因子の排除などが重要。
  2. 相関関係: AとBが同時に変動する統計的な関係。必ずしも因果を意味するわけではなく、隠れた要因や逆因果、偶然の可能性に注意する必要がある。
  3. 因果推論の手法: 介入実験(RCT)、観察研究、因果推論モデルなど、多様なアプローチで因果の可能性を評価する。

「相関があるからといって因果があるとは限らない」という原則は、科学的な態度を身につけるうえで極めて重要な心得です。次章以降では、集めたデータをどのように分析し、統合して全体像を把握していくかというプロセスをさらに深く学び、誤差や不確実性と上手につきあう方法についても取り上げます。日々の情報を科学的に解釈するうえでも役立つ知識を、引き続き見ていきましょう。

TOP