The Doppler Quarterly (FRANÇAIS) Été 2017 | Page 21

Schéma de consommation Apprentissage automatique Analyses ad hoc Tableau de bord de reporting Données spécifiques aux cas d'utilisation, traitées et standardisées Requêtes rapides interactives Recherche d'entreprise Données brutes Lac de données Figure 4|: Couches de lac de données et modèles de consommation peut être utile d’intégrer une partie des données de votre lac dans une plateforme de banque en colonnes. Les outils permettant cette intégration sont, entre autres, Google BigQuery, Amazon Redshift ou encore Azure SQL Data Warehouse. Requêtes interactives et reporting Il existe encore un grand nombre de cas d’utilisation qui nécessitent la prise en charge d’outils de requête SQL classiques pour l’analyse de ces énormes banques de données. Apache Hive, Apache Presto, Amazon Athena et Impala ont tous été développés spécifi quement pour la prise en charge de ces cas d'utilisation en créant ou en utilisant un schéma compatible SQL sur les données brutes. et l’exploitation fl exibles des résultats, à l’échelle de l’en- treprise. Le lac de données est l’un des éléments les plus importants à avoir pour tirer pleinement parti des big data de l'entreprise en tant qu’atout clé, pour extraire des données des informations basées sur les modèles et pour entretenir une culture de prise de décision centrée sur les données. NOTE DE LA REDACTION Cet article est le deuxième d’une série en plusieurs parties étudiant les considérations stratégiques et les détails techniques d’importance auxquels les cadres gestionnaires et les CxO doivent prêter attention Exploration des données et apprentissage automatique dans le cadre d’une stratégie de modernisation de Enfi n, les scientifi ques des données constituent l’une des catégories d’utilisateurs pour qui les lacs de données sont les plus intéressants, puisqu’ils leur permettent d’accéder aux données à l’échelle de l’entreprise sans être gênés par les différents schémas, et donc d’explorer et exploiter les données pour en tirer des informations à haute valeur ajoutée pour l’entreprise. De nombreux outils pour scientifi ques des données s’appuient ou peu- vent travailler conjointement sur des plateformes basées sur Hadoop accédant au lac de données. que nous avons glanées en tant que partenaire de Conclusion Un lac de données conçu et construit correctement per- met la suppression des silos de données et l’exploration l’infrastructure d’analyse à l’échelle de l’entreprise. Nous partageons les observations et les informations nombreux clients pour ces projets de modernisation. Restez au courant des derniers développements cloud. Abon- nez-vous pour recevoir des articles comme celui-ci tous les vendredis. cloudtp.com/doppler ÉTÉ 2017 | THE DOPPLER | 19