The Doppler Quarterly (日本語) 春 2017 | Page 29
ハイブリッドクラウド
クラウドの採用に心から傾倒している企業であっても、私たちは、まずハイブリッドのアプ
ローチを取ることをお勧めします。最初のステップは、現行システムを特定の構成要素にマッ
ピングし、明確に定義した一連のワークロードにわかりやすく分割することです。現行システ
ムをそのまま移すだけの運用を検討している場合でも、すべてのワークロードを 1 つのフェー
ズでクラウドに移行するのは賢明ではありません。CTP のクラウド採用プログラムでは、規
範的なロードマップを提供し、どうすればワークロードを体系的にクラウドに移行できるか
を解説しています。変更について知識を深め管理に進む中、最初は意図的にハイブリッドで
の運用を続けることをお勧めします。
エンタープライズデータレイク
前述のスキーマオンリード ( データを読み取るときにスキーマ選択を指示する複数の分析エ
ンジンを使用 ) から、当然のように導き出されるのはエンタープライズデータレイク構築の概
念です。これは、エンタープライズデータの収集と保存を、構造化と非構造化の両方について
行う環境で、何らかの形式での構造化を気にする必要はありません。
エンタープライズデータレイクは、一般に Hadoop Distributed File System (HDFS) に構
築されます。HDFS は、大量データセットのパラレルおよび分散型コンピューティングを可能
にし、企業とそのデータ資産の成長とともに拡張できます。
図 4: Microsoft Azure Data Lake
HDInsights
デバイス ソーシャル
LOB
アプリケーション ビデオ
Web センサー
リレーショナル クリック
ストリーム
Microsoft Azure Data Lake
短期のクラスター
大規模な MPP システムを伴うオンプレミスのクラスターから、クラウドベースのインフラスト
ラクチャに移行するときは、どうしても必要な場合を除き、クラスターでの長期の常時稼働を
考えないようにします。エンタープライズデータを高度に利用する多くの場合、とりわけ、デー
タ分析に関するワークロードで必要なのは分析の最終結果だけです。クラウドでは、大規模
なクラスターを自動的に始動し、結果セットのコンピューティングを行い、ジョブの完了後停
止することにより、使いやすさと、関連するコスト節減が可能になります。結果セットは、詳細
な分析や経営報告を行うレポートツールやダッシュボードツールで使用できます。
2017 年春号 | THE DOPPLER | 27