この記事では、パラメトリック手法とノンパラメトリック手法の2つの統計手法について、それぞれの意味と代表的な手法、ノンパラメトリック手法の使用が効果的なケースを解説します。
<目次>
パラメトリック手法とは
統計分析において広く使用される手法に「パラメトリック手法」がありますが、これは以下のように定義されます。
母集団が特定の確率分布に従っていることが前提となっている統計的手法の総称
ここで「確率分布」とは、ある確率変数について、①それが取る値と、②その値が実現する確率の関係を、横軸に①、縦軸に②を持つ分布として表したものです。よく知られた確率分布には、正規分布、t分布、カイ二乗分布、F分布、一様分布、2項分布、ポアソン分布などがあります。
パラメトリック手法では、分析対象の母集団がこれらの確率分布に従っていることを予め仮定する(前提とする)ことで、統計的な解析による評価を可能としています。
例えば、代表的なパラメトリック手法であるt検定では、母集団が正規分布に従うと予め仮定することで、実験等によって得られた値(①)が帰無仮説の下で生じる確率(②)を、分布の形状をもとに計算することが可能となります。
代表的なパラメトリック手法
代表的なパラメトリック手法には、以下のようなものが挙げられます。なお、計量経済学などの領域では、特定の関数形を仮定したモデルによる分析を指して「パラメトリック推定」と呼ぶケースも存在します。
| t検定 | 平均の差の検定。2つの標本平均の差が、t分布またはz分布に従うと仮定。 |
| F検定 | 2つのグループの分散が等しいか否かの判定。2つの不偏分散の比がF分布に従うと仮定。 |
| 分散分析 | 平均の差の検定を3群以上に拡張。群間変動と郡内変動の不偏分散の比がF分布に従うと仮定。 |
| 比率の差の検定 | 2つのグループの母比率に差があるか否かの判定。2つの標本比率の差が正規分布に従うと仮定。 |
| パラメトリック回帰 | 特定の関数形を仮定した回帰分析。線形モデルによる単・重回帰分析など(計量経済学)。 |
ノンパラメトリック手法とは
一方、パラメトリック手法と対になる概念に「ノンパラメトリック手法」がありますが、これは以下のように定義されます。
母集団について、特定の確率分布に従っていることを前提としない統計的手法の総称
t検定などのパラメトリック手法は、母集団が正規分布などに従っていることを仮定できる場合に実施できる手法ですが、逆の言い方をすれば、母集団が正規分布などに従うと考えることが妥当ではない場合、t検定などのパラメトリック手法は使用することができません。
このようなケースにおいて検定や推定を可能にするのが、ノンパラメトリック手法です。また、後述するように、計量経済学などの領域では、パラメトリック推定に比べてよりバイアスの小さい推定を行う手段として、ノンパラメトリック推定が使用されることもあります。
代表的なノンパラメトリック手法
代表的なパラメトリック手法には、以下のようなものが挙げられます。計量経済学などの領域では、特定の関数形を仮定しないモデルによる分析を指して「ノンパラメトリック推定」と呼ばれます。
| カイ二乗検定 | クロス集計表の表側と表頭の2変数の間の関係の有無を、期待度数をもとに検証。 |
| 正確確率検定 | 小標本のカテゴリーデータについて、度数配置をもとに独立性を検定。 |
| U検定 | ノンパラ手法による平均の差の検定(t検定)。対応のない順位データをもとに検定。 |
| ノンパラメトリック回帰 | 特定の関数形を仮定しない回帰分析。カーネル推定量や局所線形回帰など(計量経済学)。 |
ノンパラ手法の使用が効果的なケース
母集団が特定の確率分布に従うことを前提とするパラメトリック手法と異なり、ノンパラメトリック手法は、基本的にどのようなケースでも使用することができますが、特に以下のようなケースに使用することで、パラメトリック手法に比べてより効果的な分析が可能です。
①分析対象が確率変数ではない場合
対象のデータが確率変数ではない場合は、ノンパラメトリック手法が使用されます。
ここで「確率変数」とは、ある値を取る確率があらかじめ決まっている変数のことですが、例えばサイコロを振った際に出る目は、6つの値がそれぞれ1/6の確率で出る確率変数です。一方、カテゴリデータや順位データといった「質的データ」では、得られる値は確率変数ではないため、特定の確率分布を母集団に仮定することができません。
これらの質的データでは、平均や分散といった集計値を計算することができず、t検定やF検定などを行うことができないため、ノンパラメトリック手法の使用が必要となります。
②外れ値が検出力を低下させる場合
対象のデータが確率変数でも、ある極端な値(外れ値)が検定における検出力を低下させる可能性がある場合、ノンパラメトリック手法の使用が検討されます。
対象データの中に外れ値が含まれている場合、その値を除外して分析を行うことも選択肢の一つです。しかし、それができない場合は外れ値によって分散が大きくなることで、t検定などにおける検出力が低下し、有意な結果を得にくくなるケースがあります。
このようなケースでは、t検定の代わりに、外れ値の影響をより受けにくいノンパラメトリック手法を使用することが対処法の一つとなります。
③関数形の仮定がバイアスを生じさせる場合
因果推論などの文脈において、特定の関数形の仮定が推定結果にバイアスを生じさせる可能性がある場合は、ノンパラメトリック手法が有効な選択肢となります。
例えば、傾向スコア分析においては、推定した傾向スコアをもとに平均処置効果(ATE)を推定するにあたって、処置効果が傾向スコアの値によらず一定であるという「強い仮定」に基づく関数形が仮定されることが一般的です。
しかし、このような強い仮定は推定結果にバイアスを生じさせる可能性があります。そこで、関数形に関する強い仮定を置かずに処置効果を推定する方法がノンパラメトリック回帰です。
代表的なカーネル推定量や局所線形回帰推定量では、傾向スコアの各値における処置効果が、その周辺の傾向スコアにおける処置効果に基づく加重平均などとして推定され、パラメトリック回帰に比べてよりバイアスの小さい処置効果の推定を可能にしています。
ここまで、パラメトリック手法とノンパラメトリック手法の2つの統計手法について、それぞれの意味と代表的な手法、ノンパラメトリック手法の使用が効果的なケースを解説しました。
当記事に関連するトピックについての詳細は、以下のページをご覧ください。
また、データ分析一般・因果推論に関する全ての記事は以下のページからご覧いただけます。
参考文献:
◦栗原伸一・丸山敦史 (2017)『統計学図鑑』オーム社
◦西山慶彦・新谷元嗣・川口大司・奥井亮 (2019) 『計量経済学』有斐閣
◦川口康平・澤田真行 (2024)『因果推論の計量経済学』日本評論社