業績測定とプログラム評価｜それぞれの意味・特徴と相違点の解説

この記事では、事業や政策の評価方法として知られる「業績測定」と「プログラム評価」について、それぞれの意味と特徴、両者の相違点や共通点を解説します。

<目次>

業績測定とは何か

「業績測定 (Performance Measurement）」とは、「施策の実績、特に事前に設定した目標や基準の達成度合いについての体系的で継続的なモニタリング」¹を指します。

業績測定 (Performance Measurement)：
施策の実績、特に事前に設定した目標や基準の達成度合いについての体系的で継続的なモニタリング

ここで「体系的で継続的なモニタリング」とあるように、業績評価の中心は施策の業績（パフォーマンス）に対して「モニタリング」を行うことであり、その情報から事業や政策の見直しや改善に資する情報を得ることを目指します。

日本の政策評価の文脈においては、「業績測定」は「実績評価方式」として整理されていますが、そこでは「あらかじめ政策効果に着目した達成すべき目標を設定し、これに対する実績を定期的・継続的に測定する」（「政策評価に関する基本方針（別紙）」）²と記載されており、政策によるアウトプットやアウトカムなどの実績について、事前の目標に対する達成度を評価するものと定義されています。

プログラム評価とは何か

一方、「プログラム評価 (Program Evaluation)」とは、「施策がどの程度、またどのように効果をあげているかを検証するために、研究的手法を用いてデータを収集・分析する体系的な研究」¹を指します。

プログラム評価 (Program Evaluation)：
施策がどの程度、またどのように効果をあげているかを検証するために、研究的手法を用いてデータを収集・分析する体系的な研究

ここで、「どのように効果をあげているかを検証する」とあるように、プログラム評価においては、施策が「どのように」効果を上げているのか（又はいないのか）という効果発現のロジックやプロセスが重要視されています。

また、「研究的手法を用いて」とあるように、効果の程度やその背景を検証する上では、科学的に厳密な方法が採用されることが一般的です。

日本の政策評価の文脈においては、「プログラム評価」は「総合評価方式」として整理されています。そこでは「政策効果の発現状況を様々な角度から掘り下げて分析し、政策に係る問題点を把握するとともにその原因を分析する」²と記載されており、掘り下げた分析による問題点とその原因の分析に重点が置かれている点が、「モニタリング中心」の業績測定と対比されています。

以下では、業績測定とプログラム評価の主な相違点について、より具体的に解説します。

なお、プログラム評価についての詳細な解説は、以下のページをご覧ください。

関連記事プログラム評価とは｜その意味・目的と実施方法

両者の主な相違点

①評価の対象範囲

両者の主な相違点の一つは、評価の対象とする範囲です。上述の通り、プログラム評価は、「事業や政策のどこに問題があり、それがなぜ発生しているのか」という形で、事業・政策における問題点とその原因の分析を重視します。

そのため、プログラム評価においては、事業や政策の「アウトカム」だけではなく、事業や政策の「デザイン」や、それが実施された「プロセス」といった、事業や政策の「構造」に対しても詳細な分析を行うことで、問題の所在とその原因を明らかにしていきます。このように、「デザイン」「プロセス」「アウトカム」が一体不可分の関係にあると捉え、その検証を行うのがプログラム評価です³。

「デザイン」「プロセス」「アウトカム」を一体的に表現し、可視化するための手段として「ロジックモデル」が作成されることも、プログラム評価の特徴の一つです。ロジックモデルを作成することで、事業や政策の目指す成果・目的と、その達成のために用いられる手段との関係を、体系的かつ論理的なモデルとして表現します。

一方、業績測定では、評価の対象は「アウトカム」に限定され、それが事前に設定した目標や基準に対してどの程度達成されたかが評価されます。それにより、評価に必要とされるリソースが少なくて済む一方、そのアウトカムがなぜ・どのように達成された（されなかった）のかについての情報が得られないため、評価自体がブラックボックス化しやすいという課題もあります。

②アウトカムの捉え方

両者の相違点の2つ目は、アウトカムの捉え方です。

そもそも「アウトカム」とは、「事業実施後に、事業の対象となった個人や集団、社会にあらわれる状態の変化」を意味する概念であり、「活動の結果、または活動実施により生み出される財・サービスや状態など」を意味する「アウトプット」とは明確に区別されるものです³。

アウトカム（成果）：
事業実施後に、事業の対象となった個人や集団、社会にあらわれる状態の変化

アウトプット（産出）：
活動の結果、または活動実施により生み出される財・サービスや状態など

特に、プログラム評価におけるアウトカムは、成果が実現される時間軸やその効果の波及プロセスによって、事業による直接的な成果を表す「直接アウトカム」、最終アウトカムの実現に貢献する成果を表す「中間アウトカム」、最終的に実現を目指す社会の状態を表す「最終アウトカム」などの区別によって綿密に定義され、それらが指標化された上で評価が行われます。

一方、業績測定では、評価対象を指標化する際の「アウトカム志向」は推奨されているものの、多くのケースにおいて実質的に「アウトプット」が評価指標として設定され、プログラム評価のようなアウトカムの綿密な定義が行われることはありません。

これは、行政機関においては「所掌範囲」「単年度予算」といった制約の中でアウトカムレベルの評価を実施することが難しいことから、評価対象を限定することで、現実的により実施可能な評価の形が獲得されていったと捉えることができます。

③評価における科学的な厳密さ

両者の相違点の3つ目は、評価における科学的な厳密さです。

先のプログラム評価の定義で、「施策が効果を上げているかを、研究的手法を用いてデータを収集・分析する」とあったように、プログラム評価では特に、「施策が実際に効果を上げているか」、言い換えると、「施策と成果の間の因果関係（帰属性）」を科学的な手法を用いて厳密に評価します。

施策と評価の間の因果関係を可能な限り厳密に評価するために、「因果推論」の考え方の枠組みが使われ、ランダム化比較試験（RCT）と呼ばれる手法や、自然実験と呼ばれるRCTの代替手法などの採用が検討されます。

一方、業績測定では、あくまで事前の目標値に対する実績の達成状況が評価の対象となります。したがって、その実績が実際に施策の効果によって実現されたのか、あるいは他の要因によって達成されたのかに関する詳細な分析は行われません。

この点についても、業績測定は科学的な厳密さを犠牲にし、その機能を限定する見返りとして、現実的により実施可能な評価の形を獲得したと捉えることが可能です。

両者の共通点

これらの相違点の一方で、業績測定とプログラム評価の共通点の一つは、ともに「事後評価」であるという点です。

両者はともに、事業や政策が開始し一定期間が経過した後、または終了時点で評価が行われる「事後評価」に分類されます。これは、事業や政策の開始前に評価を行うことで（事前評価）、事業・政策の実施有無を判断するための情報を提供する「政策分析」と明確に対比される点です。

事前評価である「政策分析」では、大規模な投資を伴う公共事業やODAなどを対象に、費用便益分析などによって事業の投資対効果を事前に予測することで、投資有無の判断に繋げることなどが目的とされます。

一方、事後評価である「業績測定」や「プログラム評価」では、既に開始されている事業や政策の改善・改良に資する情報の取得や、アカウンタビリティの確保などが主な目的となります。

特に、全ての事業・政策を対象に網羅的に評価を行う場合には「業績測定」、特定の事業・政策について深く詳細に評価する場合には「プログラム評価」という形で使い分けをされるのが一般的であると考えられます。

作成：Intelligence In Society

ここまで、事業や政策の評価方法として知られる「業績測定」と「プログラム評価」について、それぞれの意味と特徴、両者の相違点や共通点を解説しました。

当記事に関連するトピックについての詳細は、以下のページをご覧ください。

関連記事ロジックモデルとは｜その目的と種類、具体例

関連記事アウトカムとは｜アウトプットとの違いと設定方法

関連記事因果推論とは｜その意味、目的と具体的手法

関連記事ランダム化比較試験(RCT)とは｜その意味・目的と実施方法

関連記事因果推論｜自然実験とは、その意味・分析手法と具体例

参考文献・注記：
1. 田辺智子（2014）「業績測定を補完するプログラム評価の役割－米国のGPRAMAの事例をもとに－」『日本評価研究』, 14（2）: 1-16
2. 総務省「政策評価に関する基本方針（別紙）」https://www.soumu.go.jp/main_content/000499512.pdf (2026年3月2日最終閲覧）
3. 源由理子・大島巌（2020）『プログラム評価ハンドブック－社会課題解決に向けた評価方法の基礎・応用－』, 晃洋書房

因果推論 RCT プログラム評価ロジックモデルアウトカム

信頼性と妥当性｜それぞれの意味・違いと改善方法

業績測定とプログラム評価｜それぞれの意味・特徴と相違点

業績測定とは何か

プログラム評価とは何か

両者の主な相違点

①評価の対象範囲

②アウトカムの捉え方

③評価における科学的な厳密さ

両者の共通点

Service
－当法人のサービスについて

ロジックモデルとは｜その目的と種類、具体例

因果推論とは｜その意味、目的と具体的手法

アウトカムとは｜アウトプットとの違いと設定方法

プログラム評価とは｜その意味・目的と実施方法

因果推論｜SUTVA条件とは

関連記事

因果推論｜平均処置効果とは、その種類と推定手法

ランダム化比較試験(RCT)とは｜その意味・目的と実施方法

インパクト評価と社会的インパクト評価｜それぞれの意味と違い

因果推論｜因果関係の成立条件

因果推論｜自然実験とは、その意味・分析手法と具体例

プロセス評価とは｜その意味・目的と実施方法

業績測定とプログラム評価｜それぞれの意味・特徴と相違点

業績測定とは何か

プログラム評価とは何か

両者の主な相違点

①評価の対象範囲

②アウトカムの捉え方

③評価における科学的な厳密さ

両者の共通点

Service － 当法人のサービスについて

ロジックモデルとは｜その目的と種類、具体例

因果推論とは｜その意味、目的と具体的手法

アウトカムとは｜アウトプットとの違いと設定方法

プログラム評価とは｜その意味・目的と実施方法

因果推論｜SUTVA条件とは

関連記事

因果推論｜平均処置効果とは、その種類と推定手法

ランダム化比較試験(RCT)とは｜その意味・目的と実施方法

インパクト評価と社会的インパクト評価｜それぞれの意味と違い

因果推論｜因果関係の成立条件

因果推論｜自然実験とは、その意味・分析手法と具体例

プロセス評価とは｜その意味・目的と実施方法

Service
－当法人のサービスについて