因果推論|操作変数法(IV)とは

この記事では、因果推論における「操作変数法」について、その概要や適用可能なケース、実施におけるポイントを具体例をもとに解説します。

操作変数法とは

どのような分析手法なのか

「操作変数」とは、「処置とは関連があるが、結果変数に影響を与えるその他のすべての要因と関連がない変数」のことを指します1

「操作変数法 (Instrumental Variable Methods : IV)」は、この操作変数を使うことで、直接観測することができない「交絡因子」によって処置効果の推定にバイアスが生じてしまう状況においても、適切な因果効果の推定を可能にする方法です。

より具体的には、結果に影響を与える要因が処置以外にも存在し(未観測の交絡因子U)、交絡因子Uによる影響を処置による影響と区別して観測することが難しい場合に、交絡因子Uとは無関係に発生した「外生的なショック(=操作変数)」を利用して、処置効果を測定します

例えば、失業者を対象に就職支援の活動を行うNPOにおいて「就職力UPセミナー」を開催するケースを考えます。この時、セミナーの参加者と不参加者の就職成功率を単純比較することは、セミナー参加の効果を測定する方法として不適切です。なぜなら、セミナーへの参加有無は、対象者の就職に対する意欲や対人能力など、就職成功率に影響する要因と相関している可能性が高いからです。

ここで、受講希望者をランダムに2つの開催日に割り振ったところ、片方の開催日で会場の予定外の設備点検のため、直前になって開催日が変更になったとします。希望者をランダムに割り振っていることから、2つの開催日における参加率と就職成功率の違いは、開催日が変更された影響で生じたと考えられるとします。

するとこの時、開催日を変更したセミナーと予定通り開催されたセミナーにおける、①「参加率の違い(=ショックによる処置の変化)」と②「就職成功率の違い(=ショックによる結果の変化)」を算出し、②を①で割ることで、「セミナーへの参加」が「就職成功率」に与える効果の推定が可能となります。

ここでは、「予定外の設備点検による開催日の変更」という要因が、外生的なショックである『操作変数』となっており、この操作変数を利用することで、対象者の就職に対する意欲や対人能力といった直接観測できない交絡因子が存在する場合においても、「セミナーへの参加」による効果の推定が可能となっています。

どのような場合に適用できるのか

操作変数法の代表的な事例には、冷戦期の東ドイツにおいて、地形によって家庭に届くテレビ電波の強さに違いがある点を「操作変数」として利用し、テレビを通じて発信される西欧(西ドイツ)の文化が、東ドイツ市民の社会主義体制に対する不満と体制崩壊に与えた影響を分析したものなどが挙げられます2

しかし、実際の分析において以下に述べる「操作変数に必要な3つの仮定」を全て満たす適切な操作変数を見つけるのは難しいことが多く、未観測の交絡因子によるバイアスを回避する方法としての操作変数の使用は、一般的に推奨されていません3

その一方で、操作変数法は、ランダム化比較試験(RCT)回帰不連続デザイン(DID)などの他の手法において、「本来は処置対象となる人が、実際には処置を受けない(またはその逆)」ことを意味する『非順守』の問題への対処手段として高い利用価値があります。

RCTなどの手法の実施において、非順守の問題は高い頻度で発生し、処置効果の推定に重大な影響を及ぼします。この問題に操作変数法を適用することで、非順守が発生した場合においても適切な処置効果の推定が可能となります。

非順守への対応としての操作変数法の活用については、以下で具体的な条件や手順を解説します。

操作変数法の実施におけるポイント

「操作変数」に必要な3つの仮定

「操作変数」は、上述のとおり、「処置とは関連があるが、結果変数に影響を与えるその他のすべての要因と関連がない変数」のことを指しますが、より詳細には、以下の3つの仮定を満たすものとされています。

  1. 観測されていない交絡因子と関連がない:外生性(→参考:外生変数)
  2. 観測されている共変量(処置)と関連がある:関連性
  3. 処置のみを通じて結果変数に影響を与える:除外制約

操作変数がどのようなものであるかは、有向非巡回グラフ (DAG: Directed Acyclic Graph)を使い視覚的に確認することでより明確になります。DAGは、方向を持つ(=有向)矢印で構成された、ループしない(=非巡回)ダイアグラムです。操作変数IVは、未観測の交絡因子Uと関連がない一方、処置Tと関連し、処置Tを通じてのみ結果変数Yに影響を与えます。

DAG_操作変数

作成:Intelligence In Society

先ほどの就職支援セミナーの事例では、「予定外の設備点検による開催日の変更」が操作変数でしたが、この操作変数は、対象者の就職に対する意欲や対人能力などとは無関係である一方(=外生性)、セミナーへの参加率とは相関しています(=関連性)。また、「セミナーへの参加率」を通じてのみ結果である「就職成功率」に影響を与えることから(=除外制約)、上記3つの条件を満たすことが分かります。

なお、操作変数に必要な「関連性」の仮定については、たとえ関連性があったとしても、それが「弱い」関連性だった場合、適切な処置効果の推定ができないことが知られています。求められる「関連性」の強さの度合いとしては、「F検定統計量」が10を超えれば操作変数は弱くなく、関連性の仮定は満たされているとする考え方が広く用いられています4

このF検定においては、処置変数(T)を操作変数(IV)およびその他の共変量に回帰した回帰式において、操作変数の係数が全て0である(処置と無関係である)という帰無仮説を設定し、そのF統計量を算出します。

操作変数法による「非順守」への対応

因果効果の推定における「非遵守」の問題

先に述べたように、操作変数法は、ランダム化比較試験(RCT)や回帰不連続デザイン(DID)などの他の手法において、「本来は処置対象となる人が、実際には処置を受けない(またはその逆)」ことを意味する『非順守』の問題への対処手段として高い利用価値があります。

例として、就職支援セミナーを開催するケースにおいて、先ほどのように受講希望者をランダムに2つの開催日に割り振るのではなく、受講希望者に対して「受講の可否をランダムに割り当てる」ことができると仮定します。これは、受講希望者を対象としたランダム化比較試験 (RCT) を実施したと考えることができます。

この時、処置(セミナーの受講)の割り当てが守られ、処置群の全対象者が受講し、統制群の全対象者が受講しなかった場合は、両グループの結果の差を、セミナー受講による処置効果と考えることができます。

しかし、仮に処置群の対象者の一部が何らかの理由で実際には受講しない一方で、統制群の一部が実際には受講する、といった状況が発生した場合、両グループの結果の差から「セミナー受講による処置効果」を適切に推定することはできません。

このケースにおいて両グループの結果の差から推定できるのは、「処置を受けることによる効果」ではなく、「処置を割り当てることによる効果」であり、このような推定量を「ITT (Intention to Treat):処置意図に基づく 推定量」と呼びます5

ITT推定量は、実際に受けた処置に関わらず、処置の割り当てに基づく推定量であり、処置に効果がある場合は、その効果を過小評価したものとなることが知られています。

「単調性の仮定」とCACE

非遵守の問題が存在するケースにおいて、ITT推定量ではなく、「実際に処置を受けることによる効果」を推定するにあたっては、「処置の割り当て」を、処置変数である「処置の受け取り」に対する操作変数として位置づけ、操作変数法の考え方を適用します。

この際、上記の操作変数の3つの仮定(外生性・関連性・除外制約)に加えて、4つ目の仮定として、「単調性の仮定」を置く必要があります。「単調性の仮定」とは、端的には「天邪鬼 (Defier)が存在しない」という仮定ですが、「天邪鬼」とは、「処置を割り当てられた時には処置を受けず、処置を割り当てられなかった時には処置を受ける」対象のことを指します。

実際の分析ケースにおいて、天邪鬼が存在する可能性はゼロではありませんが、存在したとしても極めて少数であると考えられ、多くのケースにおいてこの仮定は妥当と考えることができます。

遵守者(Complier)

作成:Intelligence In Society

「天邪鬼」が存在しない場合、残るのは、「①遵守者 (Complier)」「②常に処置を受ける人 (Always-Taker)」「③常に処置を受けない人 (Never-Taker)」の3種類ですが、②と③は、処置の割り当てによって処置を受けるか否かが変わらないため、「除外制約」により処置効果はゼロとなります。

残った「①遵守者」について、操作変数法により平均処置効果を推定しますが、これは一般的な平均処置効果 (Average Treatment Effect : ATE) に対して、「遵守者における平均処置効果」を意味するCACE (Complier Average Causal Effect)、または「局所的な平均処置効果」を意味するLATE (Local Average Treatment Effect) と呼ばれます。

CACEの算出方法

具体的なCACEの値は、「ITT推定量を遵守者の比率で割る」(CACE=ITT推定量÷遵守者比率)ことで得ることができます。

先ほど、ITT推定量は処置効果を過小評価したものであると述べましたが、CACEの算出においては、ITT推定量を遵守者の比率で割ることにより、この過小評価を是正していると理解することができます5

具体例として、就職支援セミナーにおいて、受講希望者に受講可否をランダムに割り当てるRCTを実施したケースを考えます。実際の処置である「セミナーの受講」に対して、「受講可否の割り当て」を操作変数とした場合、この操作変数は、外生性・関連性・除外制約の3つの仮定を満たす可能性が高いと考えられます。

加えて、天邪鬼が存在しないことを意味する「単調性の仮定」も満たされるとした場合、仮に、

  • 処置群と統制群の就職成功率の差(=処置の割り当てに基づくITT推定量)が15%であり、
  • 割り当てに従ってセミナー受講した対象者の比率 (=遵守者比率)が全体の50%であったとすると、
  • 遵守者における平均処置効果 (CACE) は、15% ÷ 0.5 = 30% 

となり、セミナー受講は遵守者の就職成功率を平均で30%高める効果があったと推定することが可能です。

ここまで、因果推論における「操作変数法」について、その概要や適用可能なケース、実施におけるポイントを解説しました。

本記事に関連するトピックについては、以下のページをご覧ください。

また、因果推論に関する全ての記事は以下のページからご覧いただけます。

参考文献・注記:
1. Joshua D. Angrist, Jörn-Steffen Pischke. (2009) “Mostly Harmless Econometrics: An Empiricist’s Companion,” Princeton University Press.
2. Kern, H. L., and J. Hainmueller. (2009) “Opium for the Masses: How Foreign Media Can Stabilize Authoritarian Regimes,” Political Analysis 17: 377-399.
3. Joshua D. Angrist, Guido W. Imbens and Donald B. Rubin. (1996) “Identification of Causal Effects Using Instrumental Variables,” Journal of the American Statistical Association Vol. 91, No. 434, 444-455
4. 西山慶彦・新谷元嗣・川口大司・奥井亮 (2019) 『計量経済学』有斐閣
5. 高橋将宣(2022) 『統計的因果推論の理論と実装 ― 潜在的結果変数と欠測データ ― 』共立出版

関連記事