データレイク

 データレイクとは、csvやxmlなどの構造化データ、テキストや音声、動画などの非構造化データを加工することなくそのままの形で一元的に格納するレポジトリ(保管庫)のことです。データレイクの特徴として以下の3点が挙げられます。

 データレイクの特徴

1)大量データの蓄積が可
2)データの形式に依存しない
3)低コスト

 クラウドサービスの機能強化に伴い、大量かつ様々な形式のデータを保存できるという特徴(1と2)を満たしながら、低コスト化(3)を実現したことで、データレイクは近年注目されるようになりました。