中小企業診断士の過去問
令和4年度(2022年)
経営情報システム 問4

このページは閲覧用ページです。
履歴を残すには、 「新しく出題する(ここをクリック)」 をご利用ください。

問題

中小企業診断士試験 第1次試験 経営情報システム 令和4年度(2022年) 問4 (訂正依頼・報告はこちら)

データを格納する考え方としてデータレイクが注目されている。データレイクに関する記述として、最も適切なものはどれか。
  • 組織内で運用される複数のリレーショナルデータベースからデータを集めて格納する。
  • 組織内の構造化されたデータや、IoT機器やSNSなどからの構造化されていないデータをそのままの形式で格納する。
  • データウェアハウスから特定の用途に必要なデータを抽出し、キー・バリュー型の形式で格納する。
  • データ利用や分析に適したスキーマをあらかじめ定義して、その形式にしたがってデータを格納する。
  • テキスト形式のデータと画像・音声・動画などのバイナリ形式のデータをそれぞれ加工し、構造化したうえで格納する。

次の問題へ

正解!素晴らしいです

残念...

この過去問の解説 (3件)

01

データレイクとは、構造化データ、半構造化データ、非構造化データなどのすべてのデータを元の形式で保存することができるストレージリポジトリのことです。

選択肢1. 組織内で運用される複数のリレーショナルデータベースからデータを集めて格納する。

これは、データウェアハウスの説明です。

データウェアハウスは、組織内の大量のデータを目的別に蓄積し、その組織の意思決定支援などに利用されるデータベースシステム環境のことです。

選択肢2. 組織内の構造化されたデータや、IoT機器やSNSなどからの構造化されていないデータをそのままの形式で格納する。

正解です。

データレイクは、非構造化データをそのままの形式で保存することができます。

選択肢3. データウェアハウスから特定の用途に必要なデータを抽出し、キー・バリュー型の形式で格納する。

これは、NoSQLデータベースのキー・バリュー型の説明です。

NoSQLデータベースのキー・バリュー型とは、キーとバリューの2つの情報を組み合わせて作られるデータベースです。

選択肢4. データ利用や分析に適したスキーマをあらかじめ定義して、その形式にしたがってデータを格納する。

データレイクは、すべてのデータをもとの形式で保存することが可能ですので、構造化される必要はありません。

そのため、スキーマを格納の前に定義し、構造化する必要はありません。

選択肢5. テキスト形式のデータと画像・音声・動画などのバイナリ形式のデータをそれぞれ加工し、構造化したうえで格納する。

選択肢4と同様で、データレイクは、すべてのデータをもとの形式で保存することが可能ですので、構造化される必要はありません。

そのため、加工し、構造化したうえで格納する必要はありません。

参考になった数21

02

データレイクについてまとめると、「構造化されたデータも、非構造のデータも一元的にまとめたリポジトリ」ということになります。

リポジトリとは、貯蔵庫という意味で様々な情報を1つにまとめたデータベースのことです。

各選択肢をそれぞれ解説します。

選択肢1. 組織内で運用される複数のリレーショナルデータベースからデータを集めて格納する。

選択肢の内容はデータウェアハウスの特徴であるため、本選択肢は不正解です。

選択肢2. 組織内の構造化されたデータや、IoT機器やSNSなどからの構造化されていないデータをそのままの形式で格納する。

データレイクの説明として適切であるため、本選択肢が正解です。

選択肢3. データウェアハウスから特定の用途に必要なデータを抽出し、キー・バリュー型の形式で格納する。

キー・バリュー型の形式という点は、NoSQLについての説明であると見受けられます。

目的に合わせて形式を変換している点も、データレイクに該当しません

本選択肢は不正解です。

選択肢4. データ利用や分析に適したスキーマをあらかじめ定義して、その形式にしたがってデータを格納する。

選択肢の内容はリレーショナルデータベースについての説明であるため、本選択肢は不正解です。

選択肢5. テキスト形式のデータと画像・音声・動画などのバイナリ形式のデータをそれぞれ加工し、構造化したうえで格納する。

データを構造化すると明記されているため、データレイクの説明として不適切です。

選択肢の内容はリレーショナルデータベースについての説明であると考えられます。

本選択肢は不正解です。

まとめ

ビッグデータの活用に注目が集まっているような背景もあるため、データベースの知識を問われることが少なくありません。

本問で出てきている用語は覚えておくように学習をしておきましょう。

参考になった数5

03

データを格納する考え方についての問題です。

選択肢1. 組織内で運用される複数のリレーショナルデータベースからデータを集めて格納する。

この説明だけでは不適切とは判断できませんが、「組織内の構造化されたデータや、IoT機器やSNSなどからの構造化されていないデータをそのままの形式で格納する。」という選択肢の方がより適切です。

選択肢2. 組織内の構造化されたデータや、IoT機器やSNSなどからの構造化されていないデータをそのままの形式で格納する。

正解の選択肢となります。データレイクの特徴として、構造化されていないデータをそのままの形式で格納」できることが挙げられます。

選択肢3. データウェアハウスから特定の用途に必要なデータを抽出し、キー・バリュー型の形式で格納する。

データウェアハウスから特定の用途に必要なデータを抽出」というのは、データマートの説明になります。したがって、不適切です。

選択肢4. データ利用や分析に適したスキーマをあらかじめ定義して、その形式にしたがってデータを格納する。

正解の選択肢(2)にあるように、「構造化されていないデータをそのままの形式で格納」できるため、スキーマを定義する必要がありません。したがって、不適切です。

選択肢5. テキスト形式のデータと画像・音声・動画などのバイナリ形式のデータをそれぞれ加工し、構造化したうえで格納する。

正解の選択肢(2)にあるように、「構造化されていないデータをそのままの形式で格納」できるため、構造化をする必要がありません。したがって、不適切です。

参考になった数4