この記事では、「統計的因果推論」とはどのようなもので、なぜ必要とされるのか、代表的手法としての「RCT」とその限界、RCTの有効な代替手法について解説します。
なお、因果推論の各手法に関するより具体的な解説は、こちらのページをご覧ください。
<目次>
統計的因果推論の意味とその目的
統計的因果推論とは何か
「因果関係」とは、ある要因Xを変化させることによって、他の要因Yも変化する、ということを指します。「統計的因果推論」は、データを用いた統計分析によって、この因果関係を明らかにすることを意味します。
因果関係を特定するにあたっては、要因Yに影響する可能性のある全ての要因のうち、要因X以外の要因については固定した上で、要因Xのみを変化させたときの、要因Yの変化を捉えることが必要となります。
ただし、実際のケースにおいては、要因Xのみを変化させることは困難あるいは不可能である場合が多く、その点を踏まえた上でいかに因果関係を正しく特定するかが、因果推論における重要なテーマです。近年の因果推論の手法の発達は、この課題を乗り越えるための様々な挑戦の過程と理解することができます。
なぜ因果推論が必要なのか
物事の因果関係を正しく把握することは、あらゆる実務や科学の領域において極めて重要です。しかし、要因間の関連が、偶然生じたものや単なる相関関係ではなく、「確かに因果関係である」ことを示すには、相応の理論的枠組みに沿った検討が必要であり、その理論的枠組みに該当するのが因果推論です。
要因Xと要因Yの間に因果関係が存在する、別の表現をすれば「(他の要因による影響ではなく)要因Xを変化させることによって、要因Yが変化する」ということを、実際のデータを用いて示していくための理論と手法を提供する枠組みと理解することができます。
このことは一見、それほど難しいことに見えませんが、実際にはこれを示すことは簡単ではありません。「要因Xが変化したとき、要因Yが変化する」という関係を示すだけでは、単なる相関関係である可能性を排除できません。なぜなら、実際には別の要因ZがXとYの両方に影響を与えており、要因Zの変化によってXとYが同時に変化していた可能性があるためです。
また、仮に一定の因果関係が存在したとしても、要因Xと同時に要因ZもYに影響を与えており、その影響を要因Xによる影響と適切に区別できていない場合、因果関係の強さや方向性を過大・過少に判断してしまう可能性があります。
例えば、「ある学習塾への入会」の、「高校受験の結果」に対する因果関係を知りたい場合に、「学習塾へ入会した生徒」と「入会しなかった生徒」の受験結果を比較し、その差を「学習塾入会の効果」と捉えることは、多くの場合、入会の効果を過大に評価することにつながります。
なぜなら、「学習塾への入会の有無」は、「家庭の経済状況」や「親の教育に対する関心の高さ」といった要因の影響を強く受けていることが考えられますが、それらの要因自体も「高校受験の結果」に直接影響している可能性が高いためです。学習塾への入会の効果を正しく評価するためには、「高校受験の結果」に影響を与える全ての要因のうち、「入会の有無」による影響のみを抽出する必要があります。
作成:Intelligence In Society
因果推論はどのように活用されてるのか
因果推論は、伝染病などの疾病について生活環境との関係や決定因子を分析する疫学などで伝統的に活用されてきましたが、近年では計量経済学において、人間の行動特性や社会の中での相互作用が生み出す特殊性を踏まえた推論手法が大きく発展しています。また、計量社会学・計量政治学などの分野でも因果推論の活用が広がっています。
これらの領域では、「特定の国や自治体において実施された事業や政策が、対象となる人々の生活水準や教育にどのような影響を与えたか」「特定の小売業者の存在が、地域の雇用や賃金水準にどのような影響を与えたか」1「新型コロナウイルスに伴うロックダウンが、人々の健康にどのような影響を与えたか」2といったテーマについて、因果推論の手法を活用した評価が行われています。
特に近年では、非営利組織や社会的企業等による事業が社会課題の解決において果たす役割の拡大や、行政におけるEBPM重視の流れなどの中で、事業や政策について、その成果(インパクト)を評価することの重要性が高まっています。「事業や政策と、その成果の間の因果関係の評価」を行う上で、統計的因果推論の手法は重要な役割を果たすことが期待されています。
因果推論の具体的手法
理論的な前提
因果推論における代表的な考え方に、「反実仮想」というものがあります。これは、上記の例で言えば、「(仮に)要因Xが変化しなければ、要因Yも変化しなかった」という表現によって、実際には観測されなかった「反事実」について考えることで、因果関係を明らかにするアプローチです。
この考え方に基づく因果推論の理論的枠組みが、Donald Rubinによる「潜在的結果モデル」(potential outcome model)と呼ばれるものです3。潜在的結果モデルは、実際には変化した要因Xについて、「要因Xが変化しなかった場合」という『反事実』を仮定し、「(他の要因は全て同じ前提で)仮に要因Xが変化しなかった場合、要因Yがどうなっていたか」という『潜在的結果』を考えることで、要因Xと要因Yの因果関係を推測する考え方です。
また、因果推論の用語では、「要因Xが変化する場合」を「処置群(treatment group)」、「要因Xが変化しない場合」を「統制群(control group)」と呼び、処置群と統制群の結果の差から、因果関係の方向性や大きさを推測します。
因果関係によってもたらされた効果を「処置効果」や「介入効果」と呼び、英語では「treatment effect」と表されます。これは医療現場における治療や薬の処方などを意味する「treatment」に由来しています4。
代表的な手法(ランダム化比較試験:RCT)
「反実仮想」による因果関係の特定には、重大な問題があります。それは、処置の対象である要因Yについて、要因Xが変化した場合の結果と、要因Xが変化しなかった場合の結果を「同時に」観測することはできないということです。
要因Xが変化する場合・変化しない場合のそれぞれについて2回観測すればよい、と考えたくなりますが、この場合、1回目と2回目の観測では様々な条件が変化している可能性があり、「全く同じ」条件は成立していないと考えることが妥当です。
つまり、1つの個人や個体について、処置があった場合となかった場合を同一条件で両方観測することは不可能であり、これを「因果推論の根本問題」と呼びます5。
この問題に対する最良の解決策が、「ランダム化比較試験(RCT)」と呼ばれる手法です。「因果推論の根本問題」のもとでは、一個人や一個体について処置効果を測定することは不可能ですが、複数の個人や個体から成る「グループ」における「平均的な処置効果(Average Treatment Effect)」を測定することは可能と考えられます。
この場合、処置を受けるグループと受けないグループについて結果を比較し、その差を処置効果としますが、その際に重要なのは、2つのグループが処置の有無以外の要素においては十分に類似していることです。その前提が崩れていると、2つのグループの結果の差が、処置の有無によって生じたものであることを特定できません。
RCTは、2つのグループの対象者を選ぶ際に、その対象をランダム(無作為)に割り振ります。ランダムに割り振ることによって、(一定以上の対象者数があれば)2つのグループが統計的に同質の集団となり、2つのグループの結果の差を、処置の有無によるものと特定することが可能となります。
上記の学習塾の例で言えば、仮に学習塾への入会の有無をランダムに割り振ることができ、(「入会なし」に割り振られた生徒が自主的にそれを補う行動を取らない前提で)入会の有無以外の点において2つのグループが同質の集団となれば、両グループの高校受験の結果の差を、入会の有無によるものと判断することが可能です。
作成:Intelligence In Society
RCTの限界と代替手法
RCTは適切に実施できれば、因果関係の特定において非常に有効な手法です。しかし、特に社会科学領域においては、RCTの実施に必要な労力や費用、対象者をランダムに割り振ることに伴う倫理的な問題などから、実施が難しいケースも多いのが現実です。
また、既に実施中あるいは実施済みの事業や政策の評価においては、事後的にRCTを行うことは当然不可能であり、RCTの適用自体ができないケースも多く存在します。その一方で、RCTが適用できないケースにおいても、因果関係の推定を可能にする様々な手法が近年開発されています。
これらの手法では、RCTを(分析者が観測データの生成過程を完全に掌握する)「実験デザイン」とした場合、それと同等ではないものの、類似した「自然実験」や「疑似実験」と呼ばれる状況を上手く活用することで、RCTが適用できないケースにおいても因果関係の推定が可能な状況をつくり出します。
その中でも代表的な手法としては以下のようなものが挙げられます。なお、各手法のより詳細な解説については、こちらのページをご覧ください。
ある基準値を境に、処置の対象となるか否かが決まる状況において、基準値を僅かに上回った人と僅かに下回った人の結果から、処置効果を測定する方法です。
ある年収を基準値とした政策の効果や、試験点数によって合否が決まる資格の取得などによる処置効果を測定する、といったケースにおいて活用できます。
同じような特性を持つ2つのグループのうち、一方のグループのみに処置が行われ、もう一方のグループには行われない状況において、2つのグループの時系列データを用いた比較に基づいて処置効果を測定する方法です。
特定の個人や組織・地域の集団に対して行った政策や事業の効果を、それが行われなかった集団と比較することで測定する、といった活用の仕方が可能です。
差の差法の特殊なケースとして、処置を受ける対象が単一または少数であり、処置を受けない対象が複数存在する場合に、処置を受けない対象の時系列データをもとに「処置を受ける対象が、仮に処置を受けなかった場合の結果」を予測し、それを実際の結果と比較して処置効果を測定します。
単一または少数の自治体や国などを対象に行われた事業や政策の効果を測定する、といったケースにおいて活用できる手法です。
要因Yに影響を与える要因が要因X以外にも存在し(要因Z)、要因Zによる影響を要因Xによる影響と区別して観測することが難しい場合に、要因Zとは無関係に発生した「外生的なショック」を利用して処置効果を測定します。
偶然発生した出来事が、要因Xを通じて間接的に要因Yの結果に影響を与えているようなケースにおいて有効な推定方法です。
RCTは実施できないものの、結果に影響を与える主な要因があらかじめ分かっている場合に、処置を受けるグループと受けないグループの間でそれらの要因に関してバランスが取れた状態を作り出すことで、処置効果を測定します。
政策や事業などの処置が生み出す効果に影響を与える処置以外の要因として、年齢・学歴・年収・性別といった具体的な要因が特定されているケースにおいて有効な推定方法です。
ここまで統計的因果推論の意味や目的、手法についての概要を解説しました。実際に因果推論を実施するにあたっては、各手法の理論的な背景や適用可能条件について一定の理解を持っていると共に、結果の解釈について十分な検討を行うことが必要です。
因果推論に関する全ての記事は、以下のページからご覧いただけます。
各手法に関するより詳細な内容や、本記事に関連するトピックについては、以下のページをご覧ください。
参考文献・注記:
1. 例えば以下など。
Justin C. Wiltshire (2023) “Walmart Supercenters and Monopsony Power: How A Large, Low-Wage Employer Impacts Local Labor Markets,” Department Discussion Papers 2304, Department of Economics, University of Victoria.
2.例えば以下など。
Takaku, Reo & Yokoyama, Izumi (2021) “What the COVID-19 school closure left in its wake: Evidence from a regression discontinuity analysis in Japan,” Journal of Public Economics, Elsevier, vol. 195(C).
3. Rubin, D. B. (1974) “Estimating causal effects of treatments in randomized and nonrandomized studies,” Journal of Educational Psychology, 66(5), 688–701
4. 西山慶彦・新谷元嗣・川口大司・奥井亮 (2019) 『計量経済学』有斐閣
5. Holland, Paul W.(1986) “Statistics and causal inference,” Journal of the American Statistical Association, Vol. 81, No. 396, pp. 945-960