The Doppler Quarterly (DEUTSCHE) Sommer 2016 | Page 38

Umfang und Plannung
Datenbestand
Anwendungsbestand
Infrastrukturbestand
Big Data- Vision und Business Case
Implementierungsstrategie
• Projektstart und Ressourcenplanung
• Endgültige Fest-- legung von Umfang und Leistungen
• Zeitplan für Mitarbeiter
• Detaillierter Projektplan
• Prüfung der aktuellen Systems of Record
• Prüfung der aktu- -ellen Unternehmensstandards für Data Governance
• Dokumentation unternehmensweiter Qualitätsstandards für eingehende Daten
• Infrastruktur-Technologieportfolio
• SDLC-Umgebungen
• Schatten-IT- Analyse
• Kapazitäts- und Wachstumsanalyse
• Betriebsmodell und -kosten
• Servicestufen
• Änderungsmanagement
• Technologieportfolio
• Betriebliche Organisation
• Kostenmodell
• Cloud-Endpunkte und Servicestufen
• Cloud-Prinzipien
• Referenzarchitektur und Funktionen
• Beschränkungen und Abhängigkeiten
• Geschäftliche Triebfedern und Chancen
• Risiken
• Business Case
• Strategie für Plattformendpunkte
• Strategie für Anwendungsmigration
• Pläne für schnelle Implementierung
• Budget und Ressourcen
• Roadmap für Implementierung
• Betriebsmodell
Abbildung 1 : Strategie für die Bereitstellung von Analysefunktionen
Maschinelles Lernen ist zwar ein aufkommender Trend im Technologiebereich , aber keine neue Technologie . Die Möglichkeiten des maschinellen Lernens werden seit Jahrzehnten erforscht und von etablierten Technologieunternehmen seit vielen Jahren genutzt . Der Unterschied besteht nun darin , dass mehr Unternehmen die Arbeit in der Community für maschinelles Lernen nutzen können , z . B . einfach zu verwendende APIs und vorab geschulte Modelle für bestimmte Domänen . Das maschinelle Lernen ergänzt die immer umfangreicheren Aufgaben im Bereich Vorhersageanalysen , da es sicherstellt , dass die Ergebnisse und Empfehlungen präziser und umfassend auf die Person , das Unternehmen , die Domäne und den Zweck abgestimmt sind .
Die Einrichtung eines Datenlakes in der Cloud erfordert besondere Überlegungen und bietet erweiterte Funktionen , die in lokalen Implementierungen nicht wirtschaftlich vertretbar zur Verfügung stehen . Dazu gehören Flexibilität , automatisierte Wiederherstellung , Verfügbarkeit in mehreren Zonen und PaaSbasierte Analyseservices zur Datennutzung .
Viele Organisationen suchen den besten Standort für die Bereitstellung eines Datenlakes . Aufgrund der Notwendigkeit , Daten aus vielen vorhandenen Systemen zu verarbeiten und zu integrieren , sind die Position und die Verbindungen eines Datenlakes für dessen Effektivität und Nutzbarkeit wichtig . Cloudbasierte Datenlakes bieten einen Vorteil , da sie in der Lage sind , schnell neue Ressourcen hinzuzunehmen und abzubauen , sich mit einer Vielzahl von Netzwerken und Datenquellen zu verbinden und vor allem die leistungsstarken Tools und das Know-how der Anbieter zu nutzen , die sich beim Betrieb ihrer eigenen komplexen , weltweiten Services bewährt haben .
36 | THE DOPPLER | SOMMER 2016