The Doppler Quarterly (FRANÇAIS) Été 2017 | Page 21
Schéma de consommation
Apprentissage
automatique
Analyses
ad hoc
Tableau de bord
de reporting
Données spécifiques aux cas
d'utilisation, traitées et standardisées
Requêtes
rapides
interactives
Recherche
d'entreprise
Données brutes
Lac de données
Figure 4|: Couches de lac de données et modèles de
consommation
peut être utile d’intégrer une partie des données de
votre lac dans une plateforme de banque en colonnes.
Les outils permettant cette intégration sont, entre
autres, Google BigQuery, Amazon Redshift ou encore
Azure SQL Data Warehouse.
Requêtes interactives et reporting
Il existe encore un grand nombre de cas d’utilisation qui
nécessitent la prise en charge d’outils de requête SQL
classiques pour l’analyse de ces énormes banques de
données. Apache Hive, Apache Presto, Amazon Athena
et Impala ont tous été développés spécifi quement pour
la prise en charge de ces cas d'utilisation en créant ou en
utilisant un schéma compatible SQL sur les données
brutes.
et l’exploitation fl exibles des résultats, à l’échelle de l’en-
treprise. Le lac de données est l’un des éléments les plus
importants à avoir pour tirer pleinement parti des big
data de l'entreprise en tant qu’atout clé, pour extraire
des données des informations basées sur les modèles et
pour entretenir une culture de prise de décision centrée
sur les données.
NOTE DE LA REDACTION
Cet article est le deuxième d’une série en plusieurs
parties étudiant les considérations stratégiques et les
détails techniques d’importance auxquels les cadres
gestionnaires et les CxO doivent prêter attention
Exploration des données et apprentissage
automatique dans le cadre d’une stratégie de modernisation de
Enfi n, les scientifi ques des données constituent l’une
des catégories d’utilisateurs pour qui les lacs de données
sont les plus intéressants, puisqu’ils leur permettent
d’accéder aux données à l’échelle de l’entreprise sans
être gênés par les différents schémas, et donc d’explorer
et exploiter les données pour en tirer des informations à
haute valeur ajoutée pour l’entreprise. De nombreux
outils pour scientifi ques des données s’appuient ou peu-
vent travailler conjointement sur des plateformes basées
sur Hadoop accédant au lac de données. que nous avons glanées en tant que partenaire de
Conclusion
Un lac de données conçu et construit correctement per-
met la suppression des silos de données et l’exploration
l’infrastructure d’analyse à l’échelle de l’entreprise.
Nous partageons les observations et les informations
nombreux clients pour ces projets de modernisation.
Restez au courant des derniers
développements cloud. Abon-
nez-vous pour recevoir des articles
comme celui-ci tous les vendredis.
cloudtp.com/doppler
ÉTÉ 2017 | THE DOPPLER | 19