データの利用について、最近ではデータマイニングなどが浸透してるが、そもそもデータをどのように保管しておくかという問題です。
企業活動において、日々様々な情報・データが発生します。データレイクはまず、発生したデータをそのままの形で保管しておく場所になります。よって構造的に保管されていません。しかし何があるかは見えます。一方データスワンプはデータの沼地と訳され、何のデータがあるかわからないものを指します。データレイクになんでもかんでもデータを保管し、何が何かわからなくなった状態と考えていただければいいかもしれません。
あとデータプールですが、一時的にデータを集めておく保管領域のことです。
データを整理し、分析等に活用できる形に整理しているのがデータウェアハウスになります。データウェアハウスの中で、より特定内容に整理されたものをデータマートと呼び、データマートはデータウェアハウスの一部とも考えられます。
以上はデータの保管に関する語句になります。以下の語句はデータの扱いについての語句になります。
まず、データクレンジングですが、データベースなどに保存されているデータの品質を高めることをいいます。正規化や重複をなくすなどです。データクリーニングともいわれます。
データマイニングとは、大容量のデータを分析して因果関係を明らかにしたり、関係がないと思われるものの間の関係を見つけ出す手法のことです。
データマイグレーションとは、異なる種類の装置やソフトウエア、システム、データ形式の間でデータを移管させることです。
リレーショナルデータベースは、複数のデータベースが主キーをもとに関連付けられたものになります。例えば顧客IDを設定し、購入履歴のデータベース、氏名、年齢など個人属性のデータベースなど複数のデータベースが主キーをもとに関連付けられます。こういったデータベースのことを言います。
以上の知識を踏まえ、選択肢を見ていきます。
Aはデータを置いておく場所ですので、3,4のデータマートではありません。
A,Bの関係はデータウェアハウスとそこから特定のデータを持たせるデータマートの関係になります。
Cはなんでもデータを掘り込む内容ですので、データレイクがあてはまります。
そしてデータをきれいにするデータクレンジングがDとなります。
よって、1.が正解です。