The Doppler Quarterly (DEUTSCHE) Herbst 2017 | Page 23
darauf ab, Vertrauen zwischen den Teams aufzubauen. Wenn diese Teams ihre
Datensätze in einem zentralen Datenkatalog zusammenfassen, haben sie
Zugriff auf aufbereitete Datensätze aus anderen Abteilungen. Dieses Modell
basiert auf der Annahme, dass jede Abteilung Produkte schneller bereitstellen
kann, wenn sie Zugriff auf die Arbeitsergebnisse und Daten anderer Gruppen
hat.
Ein Datenkatalog fungiert hier als Technologietool, das in einer minimalen,
nahezu autonomen Weise eingesetzt werden kann. Er ist jedoch als zentraler
Bestandteil einer größeren Datengovernance-Initiative am wirksamsten.
Abbildung 2 zeigt einen Datenkatalog im Zusammenhang mit anderen nützli-
chen technischen und prozessbezogenen Komponenten, die typischerweise
im Rahmen der Datengovernance-Implementierung zum Einsatz kommen.
Zu den am häufigsten verwendeten umgebenden Funktionalitäten gehören:
Metadaten – Metadaten sind als Aufbereitung von Primärdatensätzen durch
Beschreibungen, gemeinsame Elemente für die Verknüpfung, Qualitätsmetri-
ken und andere datensatzspezifische Details zu verstehen. Diese Metadaten
sind notwendig, damit Datennutzer die Datensätze effektiv einsetzen können.
Dies ist der Kernpunkt dessen, was ein Datenkatalog bietet: ein allgemein
zugänglicher Metastore, über den die verschiedenen Nutzungs- und Abfrage-
tools einen konsistenten Satz von Datendefinitionen verwenden können, um
auf die zugrunde liegenden Unternehmensdaten zuzugreifen.
Datenqualität – Da mithilfe von Daten immer mehr automatisierte Prozesse
und Entscheidungsprozesse vorangetrieben werden, muss die Qualität der
Daten entsprechend dem Risiko kalibriert werden. Einige niedrigere Risikoka-
tegorien, wie z. B. zielgerichtetes Marketing, erfordern keine extrem hohe
Datenqualität, da die Auswirkungen von Ungenauigkeiten vergleichsweise
gering sind. Für andere Bereiche mit höherem Risiko, wie z. B. das Gesund-
heitswesen oder persönliche Finanzdaten, ist die Qualität der Daten jedoch
von größter Bedeutung, da Ungenauigkeiten große Folgen haben können.
Geschäftssprache – Viele Unternehmen haben ihre eigene Sprache und
Akronyme, mit denen sie Organisationen, Beziehungen, Wertschöpfungsket-
ten und unterstützende Geschäftssysteme beschreiben. Der Datenkatalog
dient hier als primäre Methode, um diese organisationsspezifischen Beschrei-
bungen zu erfassen und auf die zugehörigen Datensätze abzubilden.
Stammdaten – Ein wichtiger Grundsatz für eine effektive Zentralisierung von
Unternehmensdaten ist, dass es hochkritische, ausgewählte Datenelemente
gibt, die im Mittelpunkt der Mehrzahl ihrer Geschäftsvorgänge stehen. Die
Sicherstellung, dass diese Elemente konsistent gepflegt, referenziert und ver-
wendet werden, stellt die zentrale Bedeutung des Einsatzes von Stammdaten
dar.
Datenabstammung – Die Wichtigkeit der Verfolgung der Historie, der Ver-
zweigungen und der Änderungen eines Datensatzes kann nicht hoch genug
eingeschätzt werden. Da Datenentwickler Datensätze kombinieren und mani-
pulieren, um die Verwendung für Geschäftsanwender zu vereinfachen, müssen
die Quelldatensätze und nachfolgende Änderungen verfolgt werden. So kön-
nen Benutzer bei Bedarf auf frühere Versionen der Datensätze zurückgreifen.
Klassifizierung – Die Daten müssen so klassifiziert werden, dass die Mitar-
beiter die richtigen Kanäle kennen, über die die Daten gemeinsam genutzt
Herbst 2017 | THE DOPPLER | 21