この記事では、2つの似た概念である「無作為割当」と「無作為抽出」について、それぞれの意味や、分析結果に関する「内的妥当性」「一般化可能性」との関係性について、具体例をもとに解説します。
<目次>
無作為割当と無作為抽出、それぞれの意味
物事の背景にある因果関係を推定するための理論的な枠組みである「因果推論」において、最も重要なキーワードの一つが「無作為化」です。因果推論の代表的な手法であるRCT(ランダム化比較試験)は、その名前が表す通り、介入(処置)を対象者に対して無作為(ランダム)に割り当てることで、因果関係の特定を可能にする手法です。これを、処置の「無作為割当」と言います。
一方、「無作為割当」と似たもう一つの言葉に「無作為抽出」がありますが、両者は異なる概念です。この2つの違いを理解することは、RCTなどの手法を使って分析を行うことで、「どの集団に関する因果関係が推定できるのか」を正しく判断する上で重要となります。
無作為割当(random assignment):
サンプル(標本)を、処置群と統制群の2つのグループに無作為(ランダム)に分けることで、2つのグループが同質の集団となることを確率的に保証する
無作為抽出(random sampling):
母集団からサンプル(標本)を無作為(ランダム)に選ぶことで、サンプルと母集団が、集団のサイズ以外の全ての要素について同質の集団となることを確率的に保証する
なお、ここでの「確率的に保証する」とは、抽出や割当に伴う誤差が数値評価できるということであり、「必ず同質の集団となることを保証する」ということではありません。
「無作為割当」を行うのは、処置群と統制群の2つのグループが平均的に同質の集団となるようにすることで、両者の比較から「介入による因果効果の把握を可能にするため」です。一方、「無作為抽出」を行うのは、サンプル集団が母集団と平均的に同質の集団となるようにすることで、「サンプル集団が母集団を代表できるようにするため」であると理解できます。
出典:高橋将宣(2022)1をもとに、Intelligence In Society作成
分析結果の「一般化」と無作為抽出
2つの概念に関するこれらの定義から、「無作為割当」と「無作為抽出」はそれぞれ、「内的妥当性」「一般化可能性(外的妥当性)」と密接に関係した概念であることが分かります2。
「内的妥当性」が『分析結果が、分析の対象となったサンプル集団において、真の因果関係を表しているか』を指すのに対して、「一般化可能性」は『サンプル集団に関して推定された因果関係が、母集団においても成立するか』を意味します。
RCTの特徴である「無作為割当」は、サンプル集団に対して処置をランダムに割り当てることで、処置による真の因果効果の推定における「内的妥当性」を高めます。しかし、「無作為割当」が約束するのは、あくまでそのサンプル集団における因果効果の推定に関する妥当性です。
一方、その結果が、本来知りたかった「母集団」における因果効果を適切に捉えているかは、そのサンプルが母集団からどのように抽出された集団であるかに依存します。「無作為抽出」は、サンプル集団が母集団を適切に代表するようにすることで、サンプル集団に関する推定結果を、母集団に対して「一般化」できるようにします。
例として、国による国民の健康増進のための施策として、40歳以上の全国民を対象に健康管理に関するガイドブックを配る事業を検討しており、事前調査を通じてその効果を把握したいという状況を考えます。
40歳以上の全国民を対象としたRCTを行うのは必要な費用や工数が大きすぎるため、東京都に住所のある40歳以上に対してガイドブックの配布有無を無作為に割り当て、健康増進に対する効果を測定するとします。この場合、40歳以上の全国民が「母集団」、40歳以上の東京都在住者が「サンプル集団」となります。
このRCTでは、サンプル集団(40歳以上の東京都在住者)における平均的な因果効果の特定が可能である一方、その結果が母集団(40歳以上の全国民)における因果効果を適切に捉えているとは限りません。40歳以上の東京都在住者に対する「ガイドブック配布」の平均的な効果は、40歳上の全国民に対する平均的な効果と同じではない可能性があるためです。
サンプル集団が母集団から無作為抽出された集団ではない場合、サンプル集団が母集団を代表できている、とは言い切れず、サンプル集団から母集団への分析結果の一般化は担保されません。このような場合、本来の目的集団における因果関係と、分析によって得られた因果関係が一致せず、分析結果の一般化に問題を抱えることになるため注意が必要です。
一般化における「特性の分布」と「因果の構造」
この例のように、「無作為抽出」は分析結果の一般化可能性を考える上で重要な概念です。しかし、一般化が実験対象のサンプルを超えてどの範囲まで確保されるかは、対象における「特性の分布」や「因果の構造」によって様々であり、目的集団からの「無作為抽出」が一般化のために必ず必要な訳ではありません。
先ほどの例では、健康増進のための事業として「健康管理に関するガイドブックの配布」を考えましたが、別の例として、ガイドブック配布ではなく、「生活習慣病のリスク低減に効果のあるとされるサプリメントの配布」を検討しているケースを考えます。
生活習慣病のリスク低減に対するサプリメントの実際の効果を確認するために、「40歳以上の東京都在住者」をサンプル集団として検証した分析結果は、母集団である「40歳以上の全国民」に対して一般化可能でしょうか?この場合、サンプル集団に関する分析結果は、母集団に対して一般化できる可能性が高いと考えられます。
なぜなら、このケースの因果効果の推定に影響すると考えられる「特性の分布」や「因果の構造」は、社会・経済的な存在としての40歳以上の成人に関するものではなく、生理学的な存在としての40歳以上の成人に関するものであり、その点において「東京都在住者」が「全国民」と平均的に大きく異なるとは考えにくいからです。
このように、「無作為抽出」はサンプル集団に関する分析結果の一般化において重要な概念であるものの、必須ではなく、一般化が可能な範囲は、対象領域に関する知見に基づき、特性の分布や因果の構造を詳細に検討することで判断する必要があります。
事業内容 | 健康管理に関するガイドブックの配布 | 生活習慣病リスクを低減するサプリメントの配布 |
サンプル集団 | 40歳以上の東京都在住者 | 40歳以上の東京都在住者 |
一般化のターゲット (母集団) |
社会・経済的存在としての40歳以上の成人(国民) | 生理学的存在としての40歳以上の成人(国民) |
一般化可能性 | ? ※対象領域の知見に基づいた判断が必要 |
○ |
出典:佐藤郁哉(2015)3をもとに、Intelligence In Society作成
ここまで、無作為割当と無作為抽出について、それぞれの意味や、分析結果に関する「内的妥当性」「一般化可能性」との関係性について解説しました。
当記事と関連する内容として、内的妥当性や一般化可能性に関する詳細は以下のページをご覧ください。
また、プログラム評価や因果推論に関する全ての記事は、以下のページからご覧いただけます。
参考文献・注記:
1. 高橋将宣(2022) 『統計的因果推論の理論と実装 ― 潜在的結果変数と欠測データ ― 』共立出版
2. 「一般化可能性」と「外的妥当性」は厳密には異なる意味を持っています。詳細は「外的妥当性と内的妥当性|それぞれの意味と違い」をご覧ください。
3. 佐藤郁哉 (2015) 『社会調査の考え方[下]』東京大学出版会