中小企業診断士 過去問
令和6年度(2024年)
問184 (経営情報システム 問23)
問題文
ある二値分類問題に対する2つの予測モデルAとBに対して、1,000件のデータを用いて性能評価を行ったところ、以下の混同行列が得られた。
モデルAとBの性能評価に関する記述の正誤の組み合わせとして、最も適切なものを下記の解答群から選べ。
ただし、正解率、適合率、再現率は、以下のように定義される。
・正解率:全体の件数のうち、陽性と陰性を正しく予測した割合
・適合率:陽性と予測した件数のうち、実際も陽性である割合
・再現率:実際に陽性である件数のうち、陽性と予測した割合
a モデルAの正解率は、モデルBの正解率と等しい。
b モデルAの適合率は、モデルBの適合率よりも大きい。
c モデルAの再現率は、モデルBの再現率よりも大きい。
モデルAとBの性能評価に関する記述の正誤の組み合わせとして、最も適切なものを下記の解答群から選べ。
ただし、正解率、適合率、再現率は、以下のように定義される。
・正解率:全体の件数のうち、陽性と陰性を正しく予測した割合
・適合率:陽性と予測した件数のうち、実際も陽性である割合
・再現率:実際に陽性である件数のうち、陽性と予測した割合
a モデルAの正解率は、モデルBの正解率と等しい。
b モデルAの適合率は、モデルBの適合率よりも大きい。
c モデルAの再現率は、モデルBの再現率よりも大きい。

このページは閲覧用ページです。
履歴を残すには、 「新しく出題する(ここをクリック)」 をご利用ください。
問題
中小企業診断士試験 令和6年度(2024年) 問184(経営情報システム 問23) (訂正依頼・報告はこちら)
ある二値分類問題に対する2つの予測モデルAとBに対して、1,000件のデータを用いて性能評価を行ったところ、以下の混同行列が得られた。
モデルAとBの性能評価に関する記述の正誤の組み合わせとして、最も適切なものを下記の解答群から選べ。
ただし、正解率、適合率、再現率は、以下のように定義される。
・正解率:全体の件数のうち、陽性と陰性を正しく予測した割合
・適合率:陽性と予測した件数のうち、実際も陽性である割合
・再現率:実際に陽性である件数のうち、陽性と予測した割合
a モデルAの正解率は、モデルBの正解率と等しい。
b モデルAの適合率は、モデルBの適合率よりも大きい。
c モデルAの再現率は、モデルBの再現率よりも大きい。
モデルAとBの性能評価に関する記述の正誤の組み合わせとして、最も適切なものを下記の解答群から選べ。
ただし、正解率、適合率、再現率は、以下のように定義される。
・正解率:全体の件数のうち、陽性と陰性を正しく予測した割合
・適合率:陽性と予測した件数のうち、実際も陽性である割合
・再現率:実際に陽性である件数のうち、陽性と予測した割合
a モデルAの正解率は、モデルBの正解率と等しい。
b モデルAの適合率は、モデルBの適合率よりも大きい。
c モデルAの再現率は、モデルBの再現率よりも大きい。

- a:正 b:正 c:正
- a:正 b:正 c:誤
- a:正 b:誤 c:正
- a:誤 b:正 c:正
- a:誤 b:誤 c:誤
正解!素晴らしいです
残念...
この過去問の解説 (2件)
01
二値分類問題の性能評価に関する問題です。以下、誤りの解答群のみ解説します。
b.モデルAの適合率は、モデルBの適合率よりも大きい。
→適合率の定義では、「陽性と予測」した件数のうち「実際も陽性」である割合です。
モデルAでは「陽性と予測」した件数は75件+25件で、「実際も陽性」だった件数は75件であるため、適合率は75%です。
モデルBでは「陽性と予測」した件数は15件+5件で、「実際も陽性」だった件数は15件であるため、適合率は75%です。
したがって、モデルAの適合率はとデルBの適合率は等しいです。
冒頭の解説より、「a:正、b:誤、c:正」の組み合わせであるため不適切な選択肢です。
冒頭の解説より、「a:正、b:誤、c:正」の組み合わせであるため不適切な選択肢です。
冒頭の解説より、「a:正、b:誤、c:正」の組み合わせであるため正解の選択肢となります。
冒頭の解説より、「a:正、b:誤、c:正」の組み合わせであるため不適切な選択肢です。
冒頭の解説より、「a:正、b:誤、c:正」の組み合わせであるため不適切な選択肢です。
【補足】
正解の解答群について、以下に解説します。
a.モデルAの正解率は、モデルBの正解率と等しい。
→正解率の定義では、「全体の件数」のうち、「陽性と陰性を正しく予測」した割合です。
モデルAでは「全体の件数」は1,000件で、「陽性と陰性を正しく予測」したのは950件であるため95%です。
モデルAでは「全体の件数」は1,000件で、「陽性と陰性を正しく予測」したのは950件であるため95%です。
c.モデルAの再現率は、モデルBの再現率よりも大きい。
→再現率の定義では、「実際に陽性である件数」のうち、「陽性と予測」した割合です。
モデルAでは「実際に陽性である件数」は75件+25件で、そのうち「陽性と予測」したのは75件であるため75%です。
モデルBでは「実際に陽性である件数」は15件+45件で、そのうち「陽性と予測」したのは15件であるため25%です。
参考になった数2
この解説の修正を提案する
02
この問題では、2つのモデル(AとB)の予測結果について、正解率・適合率・再現率を計算し、それぞれの記述が正しいかどうかを判断します。
まずは定義に沿って、モデルごとの指標を計算します。
【モデルA】
・実際:陽性75(真陽性)、25(偽陰性) → 合計100件
・実際:陰性25(偽陽性)、875(真陰性) → 合計900件
全体:1,000件
正解率 = (75 + 875) ÷ 1000 = 950 ÷ 1000 = 0.95
適合率 = 75 ÷ (75 + 25) = 75 ÷ 100 = 0.75
再現率 = 75 ÷ (75 + 25) = 75 ÷ 100 = 0.75
【モデルB】
・実際:陽性15(真陽性)、45(偽陰性) → 合計60件
・実際:陰性5(偽陽性)、935(真陰性) → 合計940件
全体:1,000件
正解率 = (15 + 935) ÷ 1000 = 950 ÷ 1000 = 0.95
適合率 = 15 ÷ (15 + 5) = 15 ÷ 20 = 0.75
再現率 = 15 ÷ (15 + 45) = 15 ÷ 60 = 0.25
a:モデルAの正解率は、モデルBの正解率と等しい。
→ 両方とも正解率は 0.95 なので、これは正しい。
b:モデルAの適合率は、モデルBの適合率よりも大きい。
→ 両方とも適合率は 0.75 なので、これは間違い。
c:モデルAの再現率は、モデルBの再現率よりも大きい。
→ Aは 0.75、Bは 0.25。モデルAの方が大きいので、これは正しい。
したがって、正しい選択肢は
「a:正 b:誤 c:正」 です。
誤りです。
誤りです。
正しいです。
誤りです。
誤りです。
モデルAとBは正解率は同じですが、再現率に大きな差があります。
適合率は同じです。
再現率は見逃しをどれだけ防げるかを示しており、モデルAの方が陽性を見逃しにくいことが分かります。
参考になった数1
この解説の修正を提案する
前の問題(問183)へ
令和6年度(2024年) 問題一覧
次の問題(問185)へ