この記事では、因果推論における「合成コントロール法」について、その概要や適用可能なケース、実施におけるポイントを具体例をもとに解説します。
<目次>
合成コントロール法とは
どのような分析手法なのか
「合成コントロール法 (synthetic control: SC)」1は、処置を受ける対象が単一または少数であり、処置を受けない対象が複数存在する場合に、処置を受けない対象の時系列データをもとに「処置を受ける対象が、仮に処置を受けなかった場合の結果」を予測し、それを実際の結果と比較して処置効果を推定する分析手法です。
合成コントロール法と同じ時系列データを使った分析を行う手法に「差の差法 (DID)」がありますが、差の差法では、処置を受ける対象と受けない対象がともに一定数以上存在している場合に、両グループのそれぞれの平均的な値をもとに「平行トレンドの仮定」を置いて処置効果の推定を行います。
一方、「合成コントロール法」では、処置を受ける対象が単一または少数で、「平行トレンドの仮定」を満たすことができない場合においても、処置効果の推定が可能です。
例えば、「日本が独自に導入したビザ発給要件の緩和による観光促進政策」の効果を測定するケースを考えます。この場合、日本と他国の観光需要の時系列の変化を比べる「差の差法」によって、政策の効果を推定することが考えられますが、このケースにおいて「差の差法」は適用できません。
なぜなら、処置を受ける対象が「日本国」のみで単一のため、差の差法による適切な推定に必要な「処置あり/処置なしの各グループにおける平均的な結果」に関する「平行トレンドの仮定」を満たすことが出来ないためです。また、政策導入前後の結果を単純に比較することは、観光需要がマクロな経済環境など他の要因の影響を強く受けるため、適切な処置効果の推定となりません。
合成コントロール法は、日本に類似した複数の諸外国の時系列データをもとに、「仮に日本が独自の観光促進政策を導入しなかった場合」の観光需要の推移を『合成日本』として予測し、それを実際の観光需要の推移と比較することで、処置効果の推定を行います。
作成:Intelligence In Society
どのような場合に適用できるのか
「合成コントロール法」は、単一または少数の対象に対して処置が行われた場合に、処置を受けていない複数の対象(これを「ドナー (donor)」と呼びます)の時系列データをもとに「仮に処置がなかった場合の結果」を予測することで、以下のようなケースにおいて処置効果の推定を可能にします。
- 実施者や対象者の意図などに基づいて、単一または少数の個人や組織・地域等において政策や事業が行われたケース
上記事例の日本における観光促進政策の他、「特定の自治体で導入した子育て支援プログラム」や「特定の企業で導入した離職防止対策」などの効果を推定する場合が挙げられます。
代表的な事例には、カリフォルニア州におけるタバコ規制導入が、同地域におけるタバコの売上に及ぼした影響を分析したものなどがあります2。
- 自然災害の発生や感染症の流行など、突発的なイベントが単一または少数の対象に生じたケース
特定の都道府県に大きな被害を与えた災害が地域人口へ及ぼす影響や、ある有力な地場企業の倒産が地域の雇用へ及ぼす影響を推定する場合などが該当します。
実際の分析事例には、過去に様々な国で発生した大規模な自然災害が、各国のその後の経済成長に与えた影響を分析したものなどがあります3。
合成コントロール法の実施におけるポイント
合成コントロール法に必要な条件
合成コントロール法は、差の差法のように「平行トレンドの仮定」を必要としないことから、より多くのケースに対して柔軟に適用できる可能性がありますが、適切な推定を行うためには、以下の条件が満たされていることが必要です。
①処置群の特性を、統制群の合成によって近似できる
合成コントロール法では、処置群の結果(上記の観光促進政策の例では、日本の観光需要)を、類似するドナーの結果(日本以外の国々の観光需要)の凸平均によって近似し、その近似によって生成された結果(「合成日本」の観光需要)と実際の処置群の結果(実際の日本の観光需要)を比較することで、処置効果を推定します。
(ここでの「凸平均」とは、足し挙げた合計が1となる重みを付けた加重平均を指します。)
そのため、処置群の結果を、ドナーである統制群の個体に重みを付けた合成によって十分に近似できることが、適切な推定結果を得るための条件となります。
例えば、米国・英国・フランスなど日本に類似した先進国の国々のデータから「合成日本」の観光需要を生成するケースにおいて、仮に日本の観光需要がこれらの国々と比べて突出して高い(あるいは低い)場合は、日本以外の国々の凸平均から日本の観光需要を近似することができず、適切な「合成日本」を生成することができません。
したがって、分析対象である処置群の結果が、統制群の個体の凸平均によって十分に近似できることが、合成コントロール法による適切な推定を行う上での条件の一つとなります。
②共変量が処置前後で大きく変化しない
合成コントロール法において、処置群の結果をドナーの個体に重みを付けた合成によって近似する際には、ドナーの「結果」だけでなく、ドナーの「結果」と「共変量」が処置群の結果と共変量を最も良く予測するような「重み」を求め、その重みとドナーの結果を用いて、凸平均により合成された処置群の結果が生成されます4 。
この際、共変量の分布は時間を通じて不変であり、処置の前後で変わらないことが仮定されているため、仮に共変量の分布が処置の前後で大きく変化する場合、ドナーをもとに生成された合成処置群の結果は、処置群の「処置が無かった場合の結果」を適切に近似しない可能性が生じます。
例として、上記の観光促進政策において、処置である「ビザ発給要件の緩和」の他に観光需要に影響を与える共変量として、為替レート、治安の安定度、国際便の本数、世界遺産の登録件数があり、ドナーとなる国々のこれらのデータをもとに、「合成日本」の観光需要を生成したとします。
ここでもし、処置である「ビザ発給要件の緩和」の実施前後で円の為替レートが大きく変化した場合、処置前の期間のデータをもとに生成された「合成日本」の観光需要の予測には為替レートの変化の影響が反映されていないため、この「合成日本」による処置後の期間の観光需要の予測値は、「処置が無かった場合の結果」を適切に近似していない可能性があります。
このように、共変量の分布が処置前後で大きく変化しないことが、合成コントロール法による適切な推定を行う上でのもう一つの条件となります5。
「共変量」についての詳細な解説は、以下のページをご覧ください。
合成コントロール法における仮説検定
合成コントロール法における仮説検定については、まだ広く合意された手法が確立していませんが4、その一つがフィッシャーのp値に基づく手法です。
この検定では、処置群だけでなく、統制群に属する全ての個体(これを「プラセボ個体」と呼びます)についても、その他全ての個体の凸平均により合成した予測値を生成します。そして、処置群の個体と全てのプラセボ個体について、「処置前の期間における実績値と合成値の平均2乗誤差」と「処置後の期間における実績値と合成値の平均2乗誤差」の「比」を算出します。
この「比」の大きさは、「処置開始の前後で合成による予測値と実績値の誤差がどれだけ拡大したか」を表しており、この比が大きいほど、強い処置効果が存在した可能性があることを意味します。処置群の個体と全てのプラセボ個体を「比」の大きさに基づいて順位付けし、「処置による効果が全くない」という帰無仮説のもとで、偶然のみによって処置群の個体の順位が生じる確率をp値として算出します。
例えば、日本による観光促進政策の例において、G20の20か国のうち、日本を除く19か国のデータをもとに「合成日本」の予測値を生成し、それをもとに推定した処置効果を仮説検定する場合を考えます。
この場合、統制群に属する日本以外の19か国についても、プラセボ個体としてその他の国の凸平均による予測値を生成します。そして、日本を含む全20か国について、処置開始前後における実績値と予測値の平均2乗誤差の比を算出し、その大きさに基づいて順位付けします。
その結果、日本の順位が1番(最も誤差が大きい)である場合、p値は「1 / 20 = 0.05」となり、5%の水準で有意であると考えることができます。仮に日本の順位が3番である場合は、p値は「3 / 20 = 0.15」となり、必ずしも処置効果があるとは言えないと考えることができます。
作成:Intelligence In Society
合成コントロール法の強みと弱み
合成コントロール法の強み
合成コントロール法の強みの一つは、「差の差法」(パネルデータ分析)において必要とされた「平行トレンドの仮定」の成立が求められないことから、処置群の数が1つのみまたは少数の場合などにおいても、時系列データを活用することで処置効果の推定が可能になることです。
差の差法における「平行トレンドの仮定」は、それが成立しているケースを見つけ出すことや、その成立を立証することが容易ではないことが、しばしば実施におけるハードルとなりますが、合成コントロール法ではその制約を緩和できることが、大きな強みです。
また、処置群に属する個体の数が大きい場合においても、差の差法と合成コントロール法の手法を併用することで「平行トレンドの仮定」の緩和を可能にする手法(「合成差の差法 (Synthetic DID)」)6なども提案されており、差の差法をそのまま適用することができないケースでも処置効果の推定が可能になる可能性があるという点が、合成コントロール法を活用するメリットです。
加えて、グラフによって実績値と合成値の推移を可視化することで、処置開始前の期間において合成値が実績値を十分に近似しているかや、処置開始後の期間における実績値と合成値の差分をビジュアルに確認することができる点も、合成コントロール法の強みの一つと言えます。
合成コントロール法の弱み
一方、合成コントロール法の弱みの一つは、その適用に必要十分な長さの時系列データ(パネルデータ)が必要となる点です。特に、処置を受けない統制群の数が多く、時系列の長さが短い場合、合成された予測値について十分な精度を確保できないことがあります。
先の「合成コントロール法に必要な条件」で述べたように、「処置群の特性を、統制群の合成によって近似できる」ことが合成コントロール法による適切な処置効果の推定には必要であり、特に処置開始前の期間について十分な長さの時系列データが求められる点が、合成コントロール法の弱みの一つと言えます。
ここまで、因果推論における「合成コントロール法」について、その概要や適用可能なケース、実施におけるポイントを解説しました。
本記事に関連するトピックについては、以下のページをご覧ください。
また、因果推論に関する全ての記事は以下のページからご覧いただけます。
参考文献・注記:
1. Alberto Abadie and Javier Gardeazabal. (2003) “The Economic Costs of Conflict: A Case Study of the Basque Country,” The American Economic Review Vol. 93, No. 1, 113-132
2. Alberto Abadie, Alexis Diamond, Jens Hainmueller. (2010) “Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California’s Tobacco Control Program,” Journal of the American Statistical Association. June 1, 2010, 105(490): 493-505.
3. Eduardo Cavallo, Sebastian Galiani, Ilan Noy and Juan Pantano. (2013) “Catastrophic Natural Disasters and Economic Growth,” The Review of Economics and Statistics Vol. 95, No. 5, 1549-1561
4. 川口康平・澤田真行 (2024)『因果推論の計量経済学』日本評論社
5. 金本拓 (2024) 『因果推論ー基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチー』, オーム社
6. Dmitry Arkhangelsky, Susan Athey, David A. Hirshberg, Guido W. Imbens, Stefan Wager. (2021) “Synthetic Difference-in-Differences,” The American Economic Review Vol. 111, No. 12, 4088-4118