The Doppler Quarterly (FRANÇAIS) Printemps 2017 | Page 26
Une liste typique d'activités analytiques dans une grande entreprise peut ressem-
bler à ce qui suit :
• Calcul mensuel d'exploration de données qui implique l'exécution de réseaux
neuronaux à grande échelle sur un cluster de vingt nœuds
• Filtrage, regroupement et synthèse des téraoctets de données pendant le
week-end pour le tableau de bord des dirigeants du lundi.
• Déduplication fl oue de nuit et processus de couplage d'enregistrements à
travers plusieurs fl ux de données, pour la liaison et le regroupement de ces
données.
• Recherches en texte intégral sur des téraoctets de texte nécessitant un
temps de réponse inférieur à la seconde
Il est tout simplement impossible de procéder à une standardisation sur un petit
ensemble d'outils qui est gracieusement au service de tous ces modèles sans se
heurter à des problèmes de performance. Si nous imposons des normes d'entre-
prise aux utilisateurs, ils se mettent à générer des centaines de fl ux en dehors de
l'entrepôt de données pour exécuter des charges de travail spécifi ques, principale-
ment à l'aide d'Excel. Nous avons vu une grande entreprise utiliser Business Objects
principalement comme source de données pour Excel. La dépendance à l'égard des
services informatiques s'accroît, la Business Intelligence en libre-service reste une
aspiration et la prolifération des feuilles de calcul Excel gagne tous les niveaux de
l'entreprise. Pour favoriser l'innovation au sein de l'entreprise, l'infrastructure ana-
lytique doit prendre en charge une multitude de schémas d'analyse et d'outils en
amont.
La persistance
relationnels
polyglotte
plutôt
que
des
modèles
Dans l'un de ses blogs, James Serra défi nit la persistance polyglotte comme suit :
« La « persistance polyglotte » est un terme fantaisiste pour indiquer que lors du
stockage de données, il est préférable d'avoir recours à plusieurs technologies de
stockage de données, choisies en fonction de la façon dont les données sont util-
isées par des applications individuelles ou les composants d'une seule
application. »
Speculative Retailers Web Application
Sessions utilisateurs Données financières Panier Recommandations
Redis SGBDR Riak Neo4J
Catalogue produits Reporting Analyses Journaux d’activités
utilisateurs
MongoDB SGBDR Cassandra Cassandra
Figure|3|: Un exemple d'application de commerce électronique
avec la persistance polyglotte
24 | THE DOPPLER | PRINTEMPS 2017