中小企業診断士 過去問
令和6年度(2024年)
問184 (経営情報システム 問23)

このページは閲覧用ページです。
履歴を残すには、 「新しく出題する(ここをクリック)」 をご利用ください。

問題

中小企業診断士試験 令和6年度(2024年) 問184(経営情報システム 問23) (訂正依頼・報告はこちら)

ある二値分類問題に対する2つの予測モデルAとBに対して、1,000件のデータを用いて性能評価を行ったところ、以下の混同行列が得られた。

モデルAとBの性能評価に関する記述の正誤の組み合わせとして、最も適切なものを下記の解答群から選べ。
ただし、正解率、適合率、再現率は、以下のように定義される。
・正解率:全体の件数のうち、陽性と陰性を正しく予測した割合
・適合率:陽性と予測した件数のうち、実際も陽性である割合
・再現率:実際に陽性である件数のうち、陽性と予測した割合

a  モデルAの正解率は、モデルBの正解率と等しい。
b  モデルAの適合率は、モデルBの適合率よりも大きい。
c  モデルAの再現率は、モデルBの再現率よりも大きい。
問題文の画像
  • a:正  b:正  c:正
  • a:正  b:正  c:誤
  • a:正  b:誤  c:正
  • a:誤  b:正  c:正
  • a:誤  b:誤  c:誤

次の問題へ

正解!素晴らしいです

残念...

この過去問の解説 (2件)

01

二値分類問題の性能評価に関する問題です。以下、誤りの解答群のみ解説します。

 

b.モデルAの適合率は、モデルBの適合率よりも大きい。

→適合率の定義では、「陽性と予測」した件数のうち「実際も陽性」である割合です。

 

モデルAでは「陽性と予測」した件数は75件+25件で、「実際も陽性」だった件数は75件であるため、適合率は75%です。

モデルBでは「陽性と予測」した件数は15件+5件で、「実際も陽性」だった件数は15件であるため、適合率は75%です。

 

したがって、モデルAの適合率はとデルBの適合率は等しいです。

選択肢1. a:正  b:正  c:正

冒頭の解説より、「a:正、b:誤、c:正」の組み合わせであるため不適切な選択肢です。

選択肢2. a:正  b:正  c:誤

冒頭の解説より、「a:正、b:誤、c:正」の組み合わせであるため不適切な選択肢です。

選択肢3. a:正  b:誤  c:正

冒頭の解説より、「a:正、b:誤、c:正」の組み合わせであるため正解の選択肢となります。

選択肢4. a:誤  b:正  c:正

冒頭の解説より、「a:正、b:誤、c:正」の組み合わせであるため不適切な選択肢です。

選択肢5. a:誤  b:誤  c:誤

冒頭の解説より、「a:正、b:誤、c:正」の組み合わせであるため不適切な選択肢です。

まとめ

【補足】

 

正解の解答群について、以下に解説します。

 

a.モデルAの正解率は、モデルBの正解率と等しい。
→正解率の定義では、「全体の件数」のうち、「陽性と陰性を正しく予測」した割合です。

 

モデルAでは「全体の件数」は1,000件で、「陽性と陰性を正しく予測」したのは950件であるため95%です。

モデルAでは「全体の件数」は1,000件で、「陽性と陰性を正しく予測」したのは950件であるため95%です。


c.モデルAの再現率は、モデルBの再現率よりも大きい。

→再現率の定義では、「実際に陽性である件数」のうち、「陽性と予測」した割合です。

 

モデルAでは「実際に陽性である件数」は75件+25件で、そのうち「陽性と予測」したのは75件であるため75%です。

モデルBでは「実際に陽性である件数」は15件+45件で、そのうち「陽性と予測」したのは15件であるため25%です。

参考になった数2

02

この問題では、2つのモデル(AとB)の予測結果について、正解率・適合率・再現率を計算し、それぞれの記述が正しいかどうかを判断します。

 

 

 

まずは定義に沿って、モデルごとの指標を計算します。

 

【モデルA】

・実際:陽性75(真陽性)、25(偽陰性) → 合計100件

・実際:陰性25(偽陽性)、875(真陰性) → 合計900件

全体:1,000件

 

正解率 = (75 + 875) ÷ 1000 = 950 ÷ 1000 = 0.95

適合率 = 75 ÷ (75 + 25) = 75 ÷ 100 = 0.75

再現率 = 75 ÷ (75 + 25) = 75 ÷ 100 = 0.75

 

 

 

【モデルB】

・実際:陽性15(真陽性)、45(偽陰性) → 合計60件

・実際:陰性5(偽陽性)、935(真陰性) → 合計940件

全体:1,000件

 

正解率 = (15 + 935) ÷ 1000 = 950 ÷ 1000 = 0.95

適合率 = 15 ÷ (15 + 5) = 15 ÷ 20 = 0.75

再現率 = 15 ÷ (15 + 45) = 15 ÷ 60 = 0.25

 

 

 

a:モデルAの正解率は、モデルBの正解率と等しい。
→ 両方とも正解率は 0.95 なので、これは正しい。

 

b:モデルAの適合率は、モデルBの適合率よりも大きい。
→ 両方とも適合率は 0.75 なので、これは間違い。

 

c:モデルAの再現率は、モデルBの再現率よりも大きい。
→ Aは 0.75、Bは 0.25。モデルAの方が大きいので、これは正しい。

 

したがって、正しい選択肢は

「a:正 b:誤 c:正」 です。

選択肢1. a:正  b:正  c:正

誤りです。

選択肢2. a:正  b:正  c:誤

誤りです。

選択肢3. a:正  b:誤  c:正

正しいです。

選択肢4. a:誤  b:正  c:正

誤りです。

選択肢5. a:誤  b:誤  c:誤

誤りです。

まとめ

モデルAとBは正解率は同じですが、再現率に大きな差があります。

適合率は同じです。

再現率は見逃しをどれだけ防げるかを示しており、モデルAの方が陽性を見逃しにくいことが分かります。

参考になった数1