この記事は、因果関係と相関関係について、それぞれの意味や、両者の違いを捉えるための「反実仮想」、因果関係の特定に必要な条件である「特性の分布のバランス」について、具体的な事例をもとに解説します。
<目次>
因果関係と相関関係、それぞれの意味
「因果関係と相関関係は違う」と良く言われますが、ビジネスや政策の実務において、因果を相関と切り離して捉えることは極めて重要です。しかし、統計学について一定の知識がある人でも、相関係数の強さを因果関係が存在する証拠と考えてしまうことがあり、実際にこの両者を適切に区別することは必ずしも容易ではありません。
「因果関係」とは、2つの要因の間にある「原因」と「結果」の関係性であり、
という表現で表されます。
一方、「相関関係」は、2つの要因が「同時に発生している」「同時に変化している」という関係性であり、
Xが変化しているとき、Yも変化している
という表現で表される関係性に当たります。
例えば、「ビニール傘の販売額」と「スリップ事故の発生件数」という2つの要因の間には一定の相関関係があり、実際のデータを分析すれば強い相関係数が得られると考えられます。しかし、この2つは「雨が降る」という共通の要因によって別々に引き起こされており、両者の間に「因果関係」が存在しないことは容易に理解することができます。
このように、実際には因果関係が存在しないにも関わらず、因果関係があるように見える関係性のことを「疑似相関(見かけ上の相関)」と呼びます。
では、別の例として、ある教育NPOが地域の学校と協力し、生徒に対して学力向上のための教育プログラムを導入するケースを考えます。教育プログラムの対象となったある生徒(Aさん)のその年の定期テストの点数が上昇したとき、教育プログラムと学力の間には因果関係があったと言えるでしょうか?
両者の違いを捉えるための「反実仮想」
ここで重要なのは、教育プログラムについて、何が観測されていて、何が観測されていないかを理解することです。このケースにおいて観測されているのは、「教育プログラム導入前の昨年の定期テストのAさんの点数」と「教育プログラム導入後の今年の定期テストのAさんの点数」ですが、「教育プログラムなしでの今年の定期テストのAさんの点数」は観測されません。
そして、このケースにおいて教育プログラムの真の効果を把握するために比較すべきなのは、
「教育プログラム導入後の今年の定期テストのAさんの点数」—— 比較①
ではなく、
「教育プログラムなしでの今年の定期テストのAさんの点数」—— 比較②
です。
前者(比較①)は、教育プログラムなしでも実現していた学力の向上や、今年の定期テストが昨年の定期テストより難易度が低かった可能性など、「教育プログラム以外の要因による影響」を考慮しておらず、教育プログラムと学力の間の因果関係(教育プログラムの効果)を過大に評価する結果となっています。
作成:Intelligence In Society
この例から、因果関係の適切な把握には、実際には観測されない「教育プログラムなしでの今年の定期テストのAさんの点数」が必要であることが分かります。このように、実際には観測されなかった「反事実」について考えることによって因果関係を定義するアプローチを「反実仮想」と呼びます。
「反実仮想」では、「仮に教育プログラムを導入していなかった場合、今年の定期テストのAさんの点数がどうなっていたか」を考えることで、教育プログラムと学力という2つの要因の間に、因果関係が存在することを特定します。
反実仮想と「因果推論の根本問題」
しかし、「反実仮想」による因果関係の特定には、重大な問題があります。それは、結果としての要因Yについて、要因Xが変化した場合の状態と、要因Xが変化しなかった場合の状態を「同時に」観測することはできないということです。
上記の例では、「教育プログラム導入後の今年の定期テストのAさんの点数」が観測可能であるのに対して、「教育プログラムなしでの今年の定期テストのAさんの点数」は観測できないことを確認しました。
このように、結果である要因Yの状態について、原因である要因Xが発生した場合としなかった場合を同一条件で両方観測することは不可能であり、これを「因果推論の根本問題」と呼びます1。この問題が存在することによって、個人や個体に関する因果関係を把握することは実際には不可能であり、因果関係を特定するには、その前提について何らかの制約を置くことや、条件を緩和することが必要であることが明らかとなります。
因果関係の特定に必要な「特性の分布のバランス」
では、「因果推論の根本問題」のもとでは、どうすれば「因果関係」の特定が可能になるのでしょうか?
一つの解決策は、個人や個体における因果関係ではなく、複数の個人や個体から成る「グループ」における「平均的な因果関係」を特定することです。先の例では、教育プログラムの「Aさんの学力に対する効果」ではなく、「教育プログラムを受けた生徒全体の学力における平均的な効果」を特定することに当たります。
先の例で、Aさんが所属するクラス(仮にクラスAとします)では全員が教育プログラムの対象となり、もう一つのクラス(クラスB)では全員が教育プログラムの対象外であったとし、クラスAとクラスBの定期テストの結果を比較することで、クラスAにおける教育プログラムの平均的な効果を特定することを考えます。
2つのグループが全く同質の集団である場合
まず、クラスAにおける教育プログラムの真の効果が「+5点分」であり、クラスAとクラスBが全く同質の集団である場合を考えます。この場合、両クラスの平均点の差を生む要因は、教育プログラムの導入有無以外には存在しません。
クラスBの平均点が、昨年も今年もともに60点であったとすると、クラスAの昨年の平均点は60点程度、今年の平均点は65点程度となるはずであり、教育プログラムの効果が平均点の差として素直に観測されます2。
これは一見、当たり前のことですが、実際にはこの2つのクラスが「全く同質の集団である」ことは現実の世界ではまず有り得ません。なお、「ランダム化比較試験(RCT)」は、2つのグループが統計的に同質の集団となるようにすることで、因果関係の特定を可能にする手法です。RCTの詳細については以下の記事をご覧ください。
2つのグループの特性が異なる場合
では次に、より現実的なケースとして、結果に影響する一部の要因が2つのグループで異なっている以下のようなケースを考えます。
- 真の効果は+5点分、昨年の平均点はともに60点で同じであるものの、
- 今年から学習塾に通い始めた生徒数が両クラスで異なる(クラスA:30人中20人、クラスB:30人中4人)
- その他の特性については両グループで同一である
- 学習塾には+15点分の学力UPの効果がある
この場合、クラスAにおける真の効果は先のケースと変わらず+5点分ですが、実際に観測される平均点は、
クラスA:(60×30+5×30+15×20)÷30 = 75点
クラスB:(60×30+0×30+15×4)÷30 = 62点
となり、観測される平均点の差(13点)は、真の効果(5点)に比べて大幅に高い値となっています。
このような結果となった理由は、クラスAとクラスBの間で「今年から学習塾に通い始めた生徒数」という要因に大きな違いが生じており、平均点の差の中に、教育プログラムによる影響に加えて、その特性の違いによる影響が含まれてしまっているためです。
仮に、今年から学習塾に通い始めた生徒数がクラスBでも同じ20名の場合、クラスBの今年の平均点は70点となり、観測される平均点の差は、真の効果である5点と一致します。
このように、両グループ間で「原因となる要因以外の、結果に影響を与える他の要因の分布が変わらない」とき、別に表現では「結果に影響を与える特性の分布がバランスしている」とき、両グループの「観測される差」を「真の因果効果」と捉えることが可能となります。
疑似相関(見かけ上の相関)
一方、上記ケースにおいて仮に真の効果が「+0点(=効果が全くない)」であった場合、実際に観測される平均点は、
クラスA:(60×30+0×30+15×20)÷30 = 70点
クラスB:(60×30+0×30+15×4)÷30 = 62点
となり、教育プログラムの効果はゼロであるにも関わらず、観測される平均点には8点の差が生じます。
これは、冒頭の「ビニール傘の販売額」と「スリップ事故の発生件数」の例と同じ、「疑似相関(見かけ上の相関)」に当たります。このように、一見したところ因果関係が存在すると思われるケースにおいても、「結果に影響を与える特性の分布のバランス」が達成されていない場合、単なる相関関係を因果関係と見誤ってしまう可能性が生じます。
このように、結果に影響する特性がグループ間で異なっているという現実の状況を前提とした上で、それを様々な工夫を行ってバランスさせることで、因果関係の特定を可能にするための理論と手法の体系が、「因果推論」と呼ばれるものです。
ここまで、因果関係と相関関係について、それぞれの意味や、両者の違いを捉えるための「反実仮想」、因果関係の特定に必要な条件である「特性の分布のバランス」について解説しました。
当記事と関連する内容として、「因果関係の成立条件」について解説した記事は以下からご覧いただけます。
また、因果推論に関する全ての記事は以下からご覧いただけます。
参考文献・注記:
1. Holland, Paul W.(1986) “Statistics and causal inference,” Journal of the American Statistical Association, Vol. 81, No. 396, pp. 945-960
2. ここでは議論をシンプルにするため、各生徒の点数や、教育プログラムが各生徒に与える効果のバラつき(分散)に関する内容は省略しています。