The Doppler Quarterly (FRANÇAIS) Hiver 2017 | Page 58

La grande migration vers les plates-formes Big Data de deuxième génération Joey Jablonski En raison de diffi cultés opérationnelles au sein des centres de donnes, de nombreux clients souhaitent désormais se tourner vers des capacités et services natifs fournis par les plus grands prestataires de cloud public. Les plates-formes Big Data de première génération se caractérisent par leur déploie- ment sur site, à l’aide de serveurs physiques utilisant généralement une pile logicielle de Cloudera, Hortonworks, DataStax ou de prestataires similaires. Ces plates-formes de l’ancien monde ont permis à nombre d’entreprises de commencer à analyser les données de manière nouvelle en fournissant aux analystes un ensemble unique de capacités. C’est aussi grâce à ces plates-formes Big Data révolutionnaires que les compagnies ont pu rivaliser de nouvelle façon sur les marchés. Mais, bien que ces systèmes offrent des capacités innovantes, ils ont souvent un coût élevé. Ces frais incluent à la fois les dépenses d’investissement nécessaires à l’achat de capacités non éprouvées, ainsi que les dépenses opérationnelles couvrant le fonctionne- ment de ces plates-formes complexes. En comparaison avec les exigences opéra- tionnelles des services cloud public, nombre de déploiements sur site sont freinés par la multiplication par trois du nombre de ressources opérationnelles nécessaires au main- tien de la plate-forme, à la gestion de la capacité, la réponse aux incidents, la réalisation des mises à jour et la formation des utilisateurs de la plate-forme. Chaque ressource consacrée à l’entretien de la plate-forme (fi gure 1) est soustraite à celles allouées aux développeurs d’application et aux scientifi ques de données cherchant à extraire de la valeur des données stockées sur ces plates-formes Big Data. En raison de ces diffi cultés opérationnelles, à l’heure actuelle, un certain nombre de cli- ents déplacent activement leurs charges de travail Big Data vers les plates-formes de deuxième génération pour profi ter de capacités et services natifs fournis par les prestataires de cloud public. AWS, Google et Azure disposent tous de services gérés et de capacités PaaS hautement compétitifs et évoluant rapidement. Ces derniers permet- tent aux organisations de concentrer leurs ressources sur les besoins métier essentiels et les capacités avancées comme l’intégration de données, l’analyse de données et la génération de rapports. Même avec les plates-formes Big Data de deuxième génération, les défi s portant sur la qualité des données, la précision du modèle et l’intégration de données continuent à se poser. Cependant, à présent, le personnel pourra se consacrer pleinement à leur résolu- tion et à l’alignement des données avec les besoins métier, plutôt que de devoir se 56 | THE DOPPLER | HIVER 2017