この記事では、因果推論における「平均処置効果(ATE)」について、その意味や種類、主な推定手法との関係性を具体例をもとに解説します。
<目次>
平均処置効果とは何か
「平均処置効果」の意味
因果推論における「処置効果」とは、事業や政策、治療など何らかの目的を達成するために行った「処置」が持つ、目的の達成に対する「因果効果」を指します。
「因果効果」は、処置と結果の間に因果関係が存在することを必要とするため、単に「処置と結果が同時に生じている」ことを意味する相関関係(共起関係)や、結果が処置以外の要因によって引き起こされた状態である見かけ上の相関(疑似相関)などとは明確に区別される必要があります。
その上で、処置が持つ効果それ自体によってどの程度目的とする状態が達成されたか、を表す概念が「処置効果」であり、「平均処置効果 (Average Treatment Effect: ATE)」は、この処置効果の対象集団全体における平均を取ったもの(=期待値)です。
なぜ「平均」なのか
因果推論では、処置効果の期待値は「ある集団における平均値」として推定されることが一般的ですが1、それは、因果関係を特定する際に「因果推論の根本問題」と呼ばれる課題が生じるためです。
因果推論では、実際に生じた「事実」に対し、「仮に事実とは重要な条件が異なっていた場合に起こったであろうこと」2を意味する「反事実」について考えることで因果関係を定義するアプローチ(「反実仮想」)が広く用いられています。
このアプローチでは、「仮に処置が行われなかった場合」という『反事実』を仮定し、「(他の条件は全て同じ前提で)仮に処置が行われなかった場合、結果がどうなっていたか」という『潜在的結果』を考えることで、因果効果を推測します。
しかしこの際、「事実」と「反事実」を全く同じ条件で両方観測することは実際には不可能であり、これを「因果推論の根本問題」3と呼びます。
「因果推論の根本問題」が存在することによって、(1つの個体に関する)因果関係を把握することは実際には不可能であり、因果関係を特定するには、その前提について何らかの制約を置くことや、条件を緩和することが必要となります。
処置効果の期待値を「集団における平均値」として算出することは、「因果推論の根本問題」が存在する中で因果関係を把握するための最も代表的な戦略であり、因果推論における基本的なアプローチとなっています。
様々な「平均処置効果」
ATE(平均処置効果)
ATEの意味
「Average Treatment Effect: ATE(平均処置効果)」は、先に述べた通り、対象集団全体における平均的な因果効果(の期待値)です。これは、ある集団の中で、その一部が処置を受けるグループ(処置群)、その他が処置を受けないグループ(統制群)の2つに分けられる場合の、集団全体における平均的な因果効果に当たります。
例として、ある自治体Aで新たに導入した中学生向けオンライン学習プログラムの、学力向上に対する因果効果を推定するケースを考えます。
この時、「自治体Aの全ての中学生」を対象集団として因果効果を分析する場合のATEは、「自治体Aの全ての中学生における、オンライン学習プログラムの学力向上に対する平均的な因果効果」となります。
推定手法との関係性
ATEを推定するための分析手法として最も代表的なものは、ランダム化比較試験(RCT)です。RCTでは、対象集団に対して処置を「無作為に割り当てる」ことで、処置群と統制群が統計的に同質の集団となり、2つのグループの結果の差を、処置による因果効果と特定することが可能となります。
ただし、RCTでは常に対象集団全体におけるATEの推定が可能である訳ではない点には注意が必要です。オンライン学習プログラムの例では、自治体Aの中学生全体に対してプログラムの受講有無を無作為に割り当てた場合、推定できるATEは「対象集団全体(=自治体Aの中学生全体)」におけるものとなります。
一方で、例えば仮にRCTが「実験への参加を希望した学校」の中学生に対してプログラムの受講を無作為に割り当てるものであった場合、これにより推定できるATEは「自治体Aの中でRCTに自発的に参加した学校の中学生」におけるものとなります。
処置の割り当てと推定可能な因果効果の関係についての詳細は、以下のページをご覧ください。
ATT(処置群平均処置効果)
ATTの意味
「Average Treatment effect on the Treated: ATT(処置群における平均処置効果)」は、対象集団のうち処置群のみにおける因果効果(の期待値)です。これは、ある集団の中で、その一部が処置を受けるグループ(処置群)、その他が処置を受けないグループ(統制群)の2つに分けられる場合の、処置群に属する対象における平均的な因果効果に当たります。
オンライン学習プログラムの例では、仮に自治体Aにおける予算の制約から学習プログラムの導入が一部エリアの学校に限定されていた場合、自治体Aの中学生全体におけるATEを推定することは困難であり、この場合の推定可能な対象は、「自治体Aのうち学習プログラムが導入された一部エリアの中学生における、オンライン学習プログラムの学力向上に対する平均的な因果効果」を意味するATTとなります。
作成:Intelligence In Society
推定手法との関係性
ATTは、RCTを実施してATEを推定することが困難な場合に、自然実験と呼ばれる状況を利用した推定手法を使用するケースにおいて推定されることが一般的です。
代表的なものには、パネルデータ分析(差の差法)や合成コントロール法などがあります。これらの手法では、同じような特性を持つ2つのグループのうち、一方のグループのみに処置が行われ(処置群)、もう一方のグループには行われない(統制群)状況において、2つのグループの時系列データを用いた比較に基づいて処置効果を測定します。
パネルデータ分析(差の差法)では、自治体Aのうち学習プログラムが導入されたエリアの学校を処置群、導入されなかったエリアの学校を統制群とした上で、両グループの数年前~現在までの学習能力に関する時系列データを用意します。
そして、「もし仮に処置がなかった場合、2つのグループの平均的な結果は平行に推移していた」ということを意味する『平行トレンドの仮定』を置いた上で、「処置開始後の両グループの平均値の差」から「処置開始前の両グループの平均値の差」を差し引くことで、ATTを推定します。
LATE(局所平均処置効果)
LATEの意味
「Local Average Treatment Effect: LATE(局所平均処置効果)」は、対象集団の中のある一部の対象者(=局所)における因果効果(の期待値)です。対象集団全体の因果効果の推定は難しいものの、全体のうちある条件を満たす対象者については処置効果の推定が可能なケースにおいて、ATEの代わりにLATEが推定されます。
オンライン学習プログラムの例では、
- 仮に学習プログラムの導入が一定以上の生徒数(=閾値)を持つ学校のみに対して行われた場合の、閾値周辺の学校の中学生における学習プログラムの学力向上に対する平均的な因果効果(例①)
- 仮に全学校を対象としたRCTにおいて処置の割り当てに従わない学校が存在した場合の、処置の割り当てに従った学校の中学生における学習プログラムの学力向上に対する平均的な因果効果(例②)
などがLATEに当たります。
推定手法との関係性
LATEを推定する手法として代表的なものには、回帰不連続デザインや操作変数法などが挙げられます。
上記の例①は、回帰不連続デザインによりLATEを推定するケースに当たります。回帰不連続デザインでは、処置の有無がある基準値(これを「閾値」と呼びます)に基づいて決定されることが分かっている状況において、「その基準値の近辺」では、処置の有無がランダム(無作為)に割り振られていると見なせることを利用して、閾値周辺における処置効果の推定を行います。
また、上記の例②は、操作変数法によりLATEを推定するケースです。ここでは、「本来は処置対象となる人が、実際には処置を受けない(またはその逆)」ことを意味する『非順守』の問題への対処手段として操作変数法を利用することで、処置の割り当てに従う遵守者(Complier)における処置効果の推定を行います。
CATE(条件付き平均処置効果)
CATEの意味
「Conditional Average Treatment Effect: CATE(条件付き平均処置効果)」は、対象集団全体をある条件に基づいてサブグループに分けた際の、サブグループにおける因果効果(の期待値)です。
対象集団をある特性や属性に基づいてサブグループに分けた場合に、各サブグループによって処置による因果効果が異なることが想定されるケースにおいて、ATEではなくCATEを推定することで、サブグループごとの因果効果をより詳細に把握することを目指します。
オンライン学習プログラムの例では、仮に学習プログラムの因果効果が、各学校の生徒のもともとの平均的な学力レベルによって異なることが想定される場合、各学校の偏差値などで条件付けた(サブグループ化した)上での因果効果を推定することで、限られた予算内でより高い効果の見込める学校に限定して学習プログラムを導入する、といった意思決定が可能となります。
作成:Intelligence In Society
推定手法との関係性
CATEを推定する手法には、対象集団をある特性(共変量)をもとに複数の層に分けた上で、各層の中で無作為に一定数の対象に処置を割り当てる、層化無作為化実験などがあります。これにより、ある特性によって条件付けた平均処置効果(CATE)の推定が可能となります。
また、近年ではCATEの推定に機械学習の手法が用いられるケースも増えています。代表的なものには、複数の基本的な機械学習モデルを組み合わせてCATEを推定するメタラーナーや、アンサンブル学習などの機械学習手法をCATEを直接推定するために変更したCausal Forestなどが挙げられます4。
ここまで、因果推論における「平均処置効果(ATE)」について、その意味や種類、主な推定手法との関係性を解説しました。
当記事に関連するトピックについての詳細は、以下のページをご覧ください。
また、因果推論に関する全ての記事は以下のページからご覧いただけます。
参考文献・注記:
1. 近年では、機械学習の手法などを使い、個体処置効果(Individual Treatment Effect: ITE)を推定する取り組みも行われています。
2. Kosuke Imai, Nora Webb Williams. (2022) “Quantitative Social Science – An Introduction in tidyverse,” Princeton University Press.
3. Holland, Paul W.(1986) “Statistics and causal inference,” Journal of the American Statistical Association, Vol. 81, No. 396, pp. 945-960
4. 金本拓 (2024) 『因果推論ー基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチー』, オーム社