因果推論|差の差法(パネルデータ分析)とは

この記事では、因果推論における「差の差法(パネルデータ分析)」について、その概要や適用可能なケース、実施におけるポイントを具体例をもとに解説します。

差の差法(パネルデータ分析)とは

どのような分析手法なのか

「差の差法 (Difference in Differences: DID)」は、同じような特性を持つ2つのグループのうち、一方のグループのみに処置(介入)が行われ、もう一方のグループには行われない状況において、2つのグループの時系列データを用いた比較に基づいて処置効果を測定する方法です。

時系列データ」とは、ある観測対象についての複数時点(複数月・複数年など)にわたるデータのことを指しますが、複数の観測対象についてこの時系列データが得られるデータのことを、特に「パネルデータ」と呼びます。パネルデータを用いた分析は、実質的に「差の差法」と同じ分析を行っているケースが多いことから、「パネルデータ分析」と「差の差法」が同じ意味で用いられることが多くあります1

「差の差法」は、処置の対象者がランダム(無作為)に選ばれている訳でも、「回帰非連続デザイン (RDD)」の場合のように、ある明確な基準をもとに決定されている訳でもなく、政策決定者や対象者自らの意図によって決まるようなケースにおける処置効果の推定を可能にします。

例えば、ある新型モビリティの地域への導入が、地域経済の活性化に与える影響を推定するケースを考えます。新型モビリティの導入有無は各地域の主体的な判断で行われる場合、新型モビリティを導入した地域と導入しなかった地域を比較して、その差をそのまま「導入の効果」とすることは適切ではありません。

なぜなら、新型モビリティを導入した地域は導入しなかった地域に比べて、もともと地域の活性化に積極的で他にも多様な施策を実施している、あるいは地域経済の低迷により苦しんでいる、などの可能性が考えられ、両地域の結果を単純に比較することは、新型モビリティ導入の効果を過大または過少に評価することになるからです。

「差の差法」では、処置を受けたグループ(処置群)と受けなかったグループ(統制群)に関する複数期間のデータを用い、「もし仮に処置がなかった場合、2つのグループの平均的な結果は平行に推移していた」ということを意味する『平行トレンドの仮定』を置いた上で、「処置開始後の両グループの平均値の差」から「処置開始前の両グループの平均値の差」を差し引くことで、処置効果を推定します。

仮に、新型モビリティを導入した地域と導入しなかった地域の「導入後の経済指標の平均値の差」が『10』、「導入前の経済指標の平均値の差(=2つのグループの元々の違い)」が『3』だった場合、「新型モビリティ導入の効果」は『10-3=7』となります。

差の差法(パネルデータ分析)

作成:Intelligence In Society

このように、「処置後の差」から「処置前の差」を差し引くことで処置効果を推定することから、「差の差法」と呼ばれます。

どのような場合に適用できるのか

「差の差法」は、2つのグループの間で「平行トレンドの仮定」が満たされる状況を利用することで、RCTや回帰非連続デザインなどの手法が行えない場合でも、以下のようなケースにおいて処置効果の推定が可能です。

  • 実施者や対象者の意図などに基づいて、特定の個人や組織・地域等の集団に対して政策や事業が行われるケース
    上記の新型モビリティによる地域活性化への影響の他、一部の学校において行われた教育プログラムの効果や、ある出来事が特定の属性の個人(神奈川県に住む40代男性など)に与えた影響を推定するケースなどが該当します。
    代表的な事例には、米国の一部州における最低賃金の引き上げが、ファーストフードチェーンの雇用に及ぼした影響を分析したもの2などがあります。
  • 上記のうち、政策や事業などの開始タイミングが、対象によって異なるケース
    特定の政策や事業の適用が、対象となる個人や組織・地域に対して一斉に開始されるのではなく、異なるタイミングで開始される場合においても、タイミングの違いに対する調整を行うことで、処置効果の推定が可能です。
    予算の関係から、各学校における教育プログラムが複数年度に渡って順次導入された場合などが該当します。実際の分析事例には、Airbnbなどの住宅シェアリングサービスが地域の住宅供給量に与える影響を、米国の20の都市における規制導入タイミングの違いから推定したもの3などがあります。

差の差法の実施におけるポイント

差の差法に必要な「平行トレンドの仮定」

「差の差法」による因果効果の推定は、パネルデータが入手できるケースにおいて常に可能な訳ではなく、適切な因果効果の推定を行うために必要な前提(識別性の条件)が存在します。それが先に述べた、「平行トレンドの仮定」です。

「平行トレンドの仮定」は、「仮に処置(介入)が起こらなかった場合、処置群(介入グループ)の平均的結果と統制群(比較グループ)の平均的結果は平行に推移する」というものです4

先の新型モビリティ導入の例では、

新型モビリティを導入した地域(処置群)において、仮に新型モビリティを導入していなかった場合、処置群と統制群の経済指標のトレンドが平行に推移する

ということに該当します。

なお、この仮定は、「仮に処置(介入)が起こらなかった場合」という実際の事実とは異なる状況(反事実)に依拠していることから、これが成立しているかどうかを実際のデータから証明することはできません。以下に説明する「事前トレンドの検定」などを通じて、仮定が成立している可能性を間接的に示すことが必要となります。

①事前トレンドの検定 (pre-trends test)

差の差法における「平行トレンドの仮定」が成立している可能性を示すために行われることの一つが、「事前トレンドの検定 (pre-trends test)」です。これは、処置(介入)が行われる前の期間において、処置群と統制群のトレンドが平行に推移していることを実際のデータを用いて示すことに当たります。

なお、「事前トレンド」が平行に推移していることは、実際に平行トレンド仮定の成立が必要な、「処置が行われた後」の期間における平行トレンドの成立を約束するものではないことに注意が必要です。

仮に「事前トレンドの平行」が成立していても、後述する別のイベントの影響などによって、処置後の期間においてはトレンドが平行ではなくなる可能性は残されています。それでも、「事前トレンドの平行」が成立していることは、「平行トレンドの仮定」が成立している可能性を間接的に示すものとなります。

差の差法_事前トレンド検定

作成:Intelligence In Society

②別のイベントによる影響の有無の確認

「平行トレンドの仮定」が成立している可能性を示すために行われるもう一つのことが、「別のイベントによる影響の有無の確認」です。

例えば、先の新型モビリティ導入の例において、新型モビリティ導入後の期間においてマクロな経済不況があり、人口の密集度が比較的高い新型モビリティ導入地域よりも、人口の密集度が比較的低い非導入地域において、経済不況の影響が特に強いとします。

この場合、新型モビリティ導入前後の期間における両地域の経済指標の「差の差」は、新型モビリティ導入の効果と、マクロな経済環境による影響が混在したものとなるため、これをそのまま「新型モビリティ導入による効果」と捉えることは適切ではありません。

このように、処置群と統制群に異なる影響を与える別のイベントが存在しないことを確認することも、「平行トレンドの仮定」が成立している可能性を示す上で重要となります。

③共変量を用いた仮定の正当化

上記の新型モビリティ導入におけるマクロな経済環境による影響のように、処置群と統制群に異なる影響を与える別のイベントによって「平行トレンドの仮定」が成立しない場合でも、共変量 (covariate)に基づいた調整を行うことで、正しい推定が可能となる場合があります。

共変量とは、このケースにおいては、新型モビリティ導入有無とマクロな経済環境による影響度合いの両方に関係する、「人口の密集度」が該当します。

この場合、地域の「人口の密集度」で条件付けることで、マクロな経済環境の両グループにおける影響を均一にし、「平行トレンドの仮定」を成立させることができます。具体的には、両グループの各地域を「人口の密集度」に応じていくつかの標本に分割し(部分標本をつくり)、それぞれの部分標本について推定を行います5

なお、共変量が複数存在する場合など、共変量に応じた部分標本の作成などによる対応が難しい場合は、処置効果を推定するための関数に共変量による影響が適切に反映されている必要があり、これが出来ない場合は推定値の妥当性が確保されません。このような場合の対処法としては、傾向スコアを用いて妥当性を高める方法などが提案されています6

特殊なケースにおける差の差法

複数の処置タイミングを伴う差の差法

ここまでの議論では、処置は処置群の全ての対象に対して同じタイミングで一斉に行われることを前提としていました。しかし、実際の分析の場においては、処置が処置群の対象に対して異なるタイミングで行われることも珍しくありません。

上述の、差の差法が適用できるケースの解説における、「政策や事業などの開始タイミングが、対象者によって異なるケース」がこれに該当しますが、このようなケースにおいても、差の差法による因果効果の推定は可能です。

複数の処置タイミングを伴う差の差法」では、異なるタイミングで処置を受ける対象をそれぞれ異なる集団として扱い、各集団ごとに推定を行うことで、適切な推定を行うことができます7

新型モビリティ導入の例では、仮に地域によって導入のタイミングがN年、N+1年、N+2年の3カ年に分かれている場合、導入タイミングによる3つのグループそれぞれについて、統制群(または統制群+処置群のうちまだ導入していないグループ)との「差の差」を取り、各グループに含まれる地域数に応じた加重平均を算出ことで、新型モビリティ導入の因果効果を推定します。

「ファジー」な差の差法

もう一つの特殊なケースにおける差の差法に、「ファジーな差の差法 (fuzzy DID)」があります。これは、処置の割り付けに従わない「非遵守 (noncompliance)」が存在する回帰非連続デザインのことを指します。

新型モビリティ導入の例では、仮に導入した地域の一部において、資金面や運営面の問題から実際には新型モビリティが機能していなかった場合、それは実態としては新型モビリティを導入しなかったと同等であり、処置の割り付けと実態に乖離が生じている状態となります。このようなケースにおける差の差法が、「ファジーな差の差法」に当たります。

「ファジーな差の差法」においては、「『統制群だが実際には処置を受ける対象』の割合が時間を通じて変化しないこと」などを仮定できる場合7、処置群と統制群の差分を、処置の割り付けに従う「遵守者」の比率で割り戻すことにより、因果効果を算出することが可能です。

差の差法の強みと弱み

差の差法の強み

差の差法の強みの一つは、因果効果の推定対象が「介入を受けた全ての対象」である点です。これは、推定対象が「閾値周辺の対象者における平均的な処置効果」に限られる回帰非連続デザインなどと比べ、より広い対象における因果効果の推定が可能であることを意味します。

ただし、その対象はあくまで「介入を受けた」全ての対象であり、統制群の対象における因果効果は推定対象に含まれないことに注意が必要です。新型モビリティ導入の例では、差の差法で推定できるのは、「新型モビリティを導入した地域」における因果効果であり、これを「分析の対象となった(統制群を含む)全ての地域」に一般化できるわけではありません。

また、「平行トレンド」が成立する限りにおいては、適切に因果効果を推定でき、処置群と統制群における結果変数の事前の水準が異なっていても問題とならない点も、「差の差法」の強みの一つであると言えます。

差の差用の弱み

一方、「差の差法」の弱みは、「平行トレンドの仮定」が満たされるケースを見つけ出すことが容易ではないことと、その仮定が成立していることを直接証明することができない点です。

「平行トレンドの仮定」が成立していることは、先に述べた「事前トレンドの検定」や「別のイベントによる影響の有無の確認」を通じて、定性的な分析を織り交ぜながら間接的に説明するしかないため、「分析の結果が、分析の対象となったサンプル自体において、真の因果関係を表している程度」を表す「内的妥当性」の点では、ランダム化比較試験(RCT)回帰非連続デザイン(RDD)に比べてやや劣るものとなります。

また、「差の差法」の実施には、処置群と統制群それぞれについて、処置前と処置後のデータが必要である点も、「差の差法」の弱みの一つと言えます。このことは、施策や事業などを実施した際に、それらを「実施した対象」の「実施後」に関するデータだけでなく、「実施しなかった対象」も含めた「実施前後」のデータが必要であることを意味します。

逆に、これらのデータが入手できる場合においては、幅広いケースにおいて「差の差法」の適用を検討することが可能です。また、差の差法の類型として、同じパネルデータを使い、「平行トレンドの仮定」を必要としない「合成コントロール法」という分析手法も提案されており、ケースに応じてこれらの手法を使い分けることが有効となります。

ここまで、因果推論における「差の差法(パネルデータ分析)」について、その概要や適用可能なケース、実施におけるポイントを解説しました。

本記事に関連するトピックについては、以下のページをご覧ください。

また、因果推論に関する全ての記事は以下のページからご覧いただけます。

参考文献・注記:
1. 西山慶彦・新谷元嗣・川口大司・奥井亮 (2019) 『計量経済学』有斐閣
2. David Card and Alan B. Krueger. (1994) “Minimum Wages and Employment: A Case Study of the Fast-Food Industry in New Jersey and Pennsylvania,” American Economic Review, American Economic Association, vol. 84(4), 772-793
3. Ron Bekkerman & Maxime C. Cohen & Edward Kung & John Maiden & Davide Proserpio, (2023) “The Effect of Short-Term Rentals on Residential Investment,” Marketing Science, INFORMS, vol. 42(4), 819-834
4. 伊藤公一朗 (2017) 『データ分析の力 因果関係に迫る思考法』光文社新書
5. 共変量が連続変数の場合、より厳密にはカーネル推定量を用いた方法などが推奨されています。
6. Sant’Anna, Pedro H.C. & Zhao, Jun, (2020) “Doubly robust difference-in-differences estimators,” Journal of Econometrics, Elsevier, vol. 219(1), 101-122.
7. 川口康平・澤田真行 (2024)『因果推論の計量経済学』日本評論社

関連記事