The Doppler Quarterly (日本語) 夏 2016

フォーム、および構造化されていないデータをバッチ処理するためのツールが提供されていますが、これらのツールは、データの取り込みと処理に必要なインターフェイスを含む、データレイクを設計するときに検討する必要があります。本書の後半では、 AWS 社と Google 社から提供されているデータアクセスおよびデータ検索用の特定のテクノロジーについて考察します。また、データアクセスを簡素化するために、メタデータ用の一般的なプラットフォームを使用する必要があります。 • セキュリティ制御、ログの収集、および監査 – セキュリティはデータレイクの重要な要素であり、ID 管理、監査、およびアクセス制御は、組織のリスクレベルとコンプライアンスのニーズを満たすように設計する必要があります。また、アクセス制御は複数のアクセス方式の間で一致していなければなりません。 • 展開と自動化 – クラウドでの展開とリカバリを自動化する機能は、運用面に多大な価値をもたらします。変更およびインシデント対応時の IT チームの作業負荷を軽減するために、展開とリカバリに関連するデータレイクのすべての機能を自動化する必要があります。 • 高度な機能 – 高度な機能には、データ分析用の API、または短時間でチームによる新たな分析とレポートのモックアップを可能にする展開ツールキットが含まれます。従来のエンタープライズシステムへの接続を含む、クラウドベースのデータレイクで推奨される設計パターンを図 5 に示します。データレイクデータコンシューマー予測分析機械学習データレイクのデータの処理ダッシュボード ETLエンジンルール/マッチングエンジンストリーミング分析ガバナンスポリシーデータレイクのデータの保存と検索メタデータ e-コマースデータサイエンス BI モバイルアプリケーションデータ統合オブジェクトストア長期アーカイブ図5: データレイクの機能アーキテクチャー 2016年夏号 | THE DOPPLER | 39

The Doppler Quarterly (日本語) 夏 2016 | Page 41