Business Intelligence · T4

OLAP, Multidimensionale Analyse & Schemata

Überblick

OLAP ermöglicht komplexe, multidimensionale Analysen grosser Datenmengen. Das Design von Data Warehouses basiert auf einem multidimensionalen Paradigma mit Faktentabellen und Dimensionstabellen, die in verschiedenen Schemata (Star, Snowflake, Galaxy) organisiert sind. OLAP-Operationen erlauben das Navigieren durch Datenwürfel.

Relevanz: Star Schema, Snowflake Schema und Galaxy Schema unterscheiden und zeichnen können; Faktentabelle vs. Dimensionstabelle; OLAP-Operationen (Roll-up, Roll-down/Drill-down, Slice, Dice, Pivot) kennen und anwenden; Konzept Cuboid verstehen.

Kernkonzepte
  • Multidimensionales Datenparadigma: Basis des DWH-Designs; Daten werden als mehrdimensionaler Würfel (Datenwürfel) betrachtet, dessen Achsen die Analysedimensionen (Zeit, Produkt, Region etc.) darstellen; ermöglicht schnelle Antwortzeiten bei komplexen Abfragen.
  • Faktentabelle: Zentrale Tabelle im Star Schema, enthält die messbaren Kennzahlen (Metriken) eines Geschäftsprozesses (z. B. Umsatz, Menge, Rabatt) sowie Fremdschlüssel zu den Dimensionstabellen.
  • Dimensionstabelle: Enthält beschreibende Attribute zur Kontextualisierung der Fakten (z. B. Kundendaten, Produktdaten, Zeitdaten, Standortdaten); leitet sich oft aus Stammtabellen in OLTP-Systemen ab; ist intern hierarchisch strukturiert.
  • Star Schema (Sternschema): DWH-Schematyp mit einer zentralen Faktentabelle, die direkt mit mehreren Dimensionstabellen verbunden ist; einfache Struktur, schnelle Abfragen.
  • Snowflake Schema (Schneeflocken-Schema): Erweiterung des Star Schemas, bei dem Dimensionstabellen wiederum mit anderen Dimensionstabellen verbunden sind (partielle Datenstandardisierung); reduziert Speicherbedarf, erhöht Abfragekomplexität.
  • Galaxy Schema: Schematyp mit mehreren Faktentabellen, die gemeinsame Dimensionstabellen teilen; auch Fact Constellation Schema genannt.
  • OLAP-Operation Roll-up (Konsolidierung): Aggregation von Daten auf einer höheren Hierarchieebene, z. B. von Monat zu Quartal zu Jahr; entspricht einem GROUP BY in SQL.
  • OLAP-Operation Drill-down (Roll-down): Umkehrung des Roll-up; Zerlegung von Daten auf eine tiefere Granularitätsstufe, z. B. von Jahr zu Quartal zu Monat.
  • OLAP-Operation Slice: Auswahl einer Teilmenge des Datenwürfels durch Fixierung einer Dimension auf einen bestimmten Wert (z. B. nur Daten für das Jahr 2024).
  • OLAP-Operation Dice: Auswahl eines Sub-Würfels durch gleichzeitige Einschränkung mehrerer Dimensionen (z. B. Region = Europa AND Jahr = 2024).
  • OLAP-Operation Pivot (Rotate): Rotation des Datenwürfels zur Änderung der Darstellungsperspektive, z. B. Vertauschen von Zeilen und Spalten in einer Kreuztabelle.
  • Cuboid: Ein Konsolidierungsniveau innerhalb des Datenwürfels; Base Cuboid = atomare, nicht aggregierte Daten; Apex Cuboid = vollständig aggregierte Gesamtsumme über alle Dimensionen.
  • Konzept-Hierarchie: Definiert eine Abbildung von niedrigeren zu höheren Konzeptebenen innerhalb einer Dimension, z. B. {Adresse → Gemeinde → Bundesland → Land} für die Standort-Dimension oder {Tag → Woche → Monat → Quartal → Jahr} für die Zeitdimension.
Fachwörter & Glossar
  • OLAP (Online Analytical Processing)Technologie für komplexe analytische Abfragen auf multidimensionalen Datenwürfeln; optimiert für schnelle Lesevorgänge grosser historischer Datenmengen (Gegensatz: OLTP).
  • Datenwürfel (Data Cube)Multidimensionale Datenstruktur, bei der Daten entlang mehrerer Dimensionen (Zeit, Produkt, Region etc.) organisiert sind; Grundlage für OLAP-Analysen.
  • FaktentabelleZentrale Tabelle im DWH-Schema, enthält messbare Kennzahlen (z. B. Umsatz, Menge) und Fremdschlüssel zu Dimensionstabellen.
  • DimensionstabelleTabelle mit beschreibenden Attributen, die den Kontext der Fakten liefern (z. B. Kunden, Produkte, Zeit, Standort); oft hierarchisch strukturiert.
  • Star Schema (Sternschema)DWH-Schematyp: eine Faktentabelle im Zentrum, umgeben von direkt verknüpften Dimensionstabellen; einfach und abfrageoptimiert.
  • Snowflake Schema (Schneeflocken-Schema)Erweitertes Star Schema mit normalisierten, hierarchisch verknüpften Dimensionstabellen; spart Speicherplatz, erhöht Abfragekomplexität.
  • Galaxy Schema (Fact Constellation)DWH-Schema mit mehreren Faktentabellen, die sich gemeinsame Dimensionstabellen teilen.
  • Roll-upOLAP-Operation zur Aggregation von Daten auf eine höhere Hierarchieebene (z. B. Tag → Monat → Jahr); entspricht SQL GROUP BY.
  • Drill-down (Roll-down)OLAP-Operation zur Zerlegung aggregierter Daten auf eine tiefere Granularitätsebene (Umkehrung von Roll-up).
  • SliceOLAP-Operation: Auswahl einer zweidimensionalen Scheibe aus dem Datenwürfel durch Fixierung einer Dimension.
  • DiceOLAP-Operation: Auswahl eines Sub-Würfels durch Einschränkung mehrerer Dimensionen gleichzeitig.
  • Pivot (Rotate)OLAP-Operation: Rotation der Datenwürfel-Perspektive; Vertauschen von Zeilen und Spalten.
  • CuboidEin Konsolidierungsniveau im Datenwürfel; Base Cuboid = keine Aggregation; Apex Cuboid = Aggregation über alle Dimensionen.
  • Konzept-HierarchieAbbildungssequenz von niedrigeren zu höheren Konzeptebenen innerhalb einer OLAP-Dimension (z. B. Standort: Adresse → Gemeinde → Bundesland → Land). ---