Business Information Systems · T9

Data Governance, Data Model & Datenqualität

Überblick

Data Governance ist der strategische Ansatz zur Organisation, Steuerung und Kontrolle von Daten als Unternehmensasset. Zentrale Elemente sind das Data Model, Rollen (Data Owner, Data Steward), Prozesse sowie Weisungen & Standards. Datenqualität ist ein zentrales Ziel und Ergebnis guter Data Governance.

Relevanz: Definition und Nutzen von Data Governance erklären; Elemente der Data Governance (Data Model, Rollen, Prozesse, Standards) beschreiben; Datenqualitätsprobleme mit Beispielen benennen; Ursachen mangelnder Datenqualität nennen.

Kernkonzepte
  • Data Governance (Definition): Strategischer Ansatz zur Organisation, Steuerung und Kontrolle der wachsenden Menge und Vielfalt an Daten. Zielt auf effektives Management von Daten als Vermögenswerte ab. Kein primär technisches Projekt, sondern ein Programm zur Transformation in eine datengetriebene Organisation.
  • Nutzen von Data Governance: Umsetzung von Gesetzen und Regulatorien; Basis für gute Datenqualität und Vermeidung von Datensilos; zeitnahe und exakte Aussagen zu Produkten/Kunden → Entscheidungsfindung; Umgang mit exponentiell wachsenden Datenvolumen; Definition von Rollen mit Zuständigkeit.
  • Wichtigste Elemente der Data Governance: Data Model (mit Domäne, Datenobjekt, Data Owner) + Rollen/Responsibles + Prozesse + Weisungen & Standards.
  • Data Model: Struktur zur Beschreibung der Daten eines Unternehmens. Enthält Domänen (Fachbereiche), Datenobjekte (konkrete Datentöpfe wie «Kundendaten», «Produktdaten») und für jedes Datenobjekt einen Data Owner.
  • Domäne: Fachbereich/Themenbereich im Data Model, der zusammengehörige Datenobjekte gruppiert (z.B. Domäne «Kunden», Domäne «Produkte»).
  • Data Owner: Person, die für ein bestimmtes Datenobjekt inhaltlich verantwortlich ist; definiert Qualitätsziele und Zugriffsberechtigung.
  • Data Steward: Operativ für die Datenpflege und Einhaltung der Datenstandards für ein Datenobjekt verantwortlich.
  • Data Literacy: Fähigkeit, Daten zu verstehen, zu interpretieren, kritisch zu hinterfragen und verantwortungsvoll für Entscheidungen zu nutzen.
  • Datenqualitätsprobleme (Typen): Duplikate (doppelt erfasste Datensätze), Unvollständigkeit (fehlende Pflichtfelder), Fehlende Werte (NULL-Werte), Falsche Formatierung, Gültigkeit Wertebereich (Rabatt > 100%), Widerspruch in den Daten (inkonsistente Werte über Systeme hinweg).
  • Ursachen mangelnder Datenqualität: Fehler bei der Erfassung; mangelhafte Datenpflege und -verwaltung; mangelnde Datenstandards; veraltete Daten; Integration ohne Bereinigung/Konsolidierung; Zeitdruck.
  • Datenqualität erkennen und beheben (Zyklus): Definition von Datenqualitätsstandards → Datenbewertung und -audit → Ursachenanalyse → Datenbereinigung (Data Cleaning) → Datenanreicherung und -validierung → Prozessoptimierung und Prävention → Kontinuierliches Monitoring → zurück zu Standards.
Fachwörter & Glossar
  • Data GovernanceStrategischer Ansatz zur Organisation, Steuerung und Kontrolle von Unternehmensdaten als Vermögenswerte; umfasst Rollen, Prozesse, Standards und Datenmodell.
  • Data ModelStrukturierte Beschreibung der Unternehmensdaten mit Domänen, Datenobjekten und zugewiesenen Data Ownern.
  • DomäneFachlicher Zuständigkeitsbereich im Data Model, der zusammengehörige Datenobjekte gruppiert.
  • DatenobjektKonkreter Datentopf innerhalb einer Domäne (z.B. «Kundenstammdaten», «Produktpreise»).
  • Data OwnerPerson mit inhaltlicher Verantwortung für ein Datenobjekt; definiert Qualitätsanforderungen und Zugriffsrechte.
  • Data StewardOperativ für die tägliche Datenpflege und Einhaltung der Data-Governance-Standards verantwortlich.
  • Data LiteracyFähigkeit, Daten zu verstehen, zu interpretieren, kritisch zu hinterfragen und für Entscheidungen zu nutzen.
  • DatensiloZustand, bei dem Daten innerhalb einer Abteilung oder eines Systems isoliert verwaltet werden und für andere Bereiche nicht zugänglich sind.
  • Master Data Management (MDM)Disziplin zur einheitlichen Verwaltung kritischer Stammdaten über alle Systeme hinweg; basiert auf dem Data Model.
  • Data CleaningProzess des Korrigierens, Löschens oder Ersetzens falscher, unvollständiger oder inkonsistenter Daten.
  • DuplikatDatenqualitätsproblem; derselbe Datensatz ist mehrfach (mit unterschiedlichen IDs oder leicht abweichenden Attributen) erfasst.
  • UnvollständigkeitDatenqualitätsproblem; Pflichtfelder sind leer oder Datensätze sind nur teilweise ausgefüllt.
  • Widerspruch in den DatenDatenqualitätsproblem; für denselben Sachverhalt existieren in verschiedenen Systemen unterschiedliche, inkonsistente Werte.
  • IT-GovernanceRahmenwerk für Entscheidungsrechte und Verantwortlichkeiten bezüglich IT-Systeme und -Programme; Abgrenzung zur Data Governance, die sich auf Daten und Informationen fokussiert. ---