Business Intelligence · T2

Datenbanken, SQL & Datenmodellierung

Überblick

Datenbanken und Data Warehouses sind Datenspeichersysteme mit unterschiedlichen Zwecken. Datenbanken speichern operative Daten für einen bestimmten Geschäftsbereich, Data Warehouses integrieren Daten aus dem gesamten Unternehmen für Analysen. SQL ist die zentrale Sprache zur Abfrage und Manipulation von relationalen Datenbanken.

Relevanz: Prüfungshinweis «Datenbank-Wissen ist auch wichtig» – SQL-Grundkenntnisse (SELECT, FROM, WHERE, JOIN, GROUP BY), Tabellenstruktur, Primär- und Fremdschlüssel kennen.

Kernkonzepte
  • Relationale Datenbank: Speichert Daten in Tabellen (Relationen) mit Zeilen (Datensätzen) und Spalten (Attributen). Tabellen werden über Primär- und Fremdschlüssel miteinander verknüpft.
  • Primärschlüssel (Primary Key): Ein eindeutiger Identifikator für jeden Datensatz in einer Tabelle; darf nicht NULL sein und muss einzigartig sein.
  • Fremdschlüssel (Foreign Key): Ein Attribut in einer Tabelle, das auf den Primärschlüssel einer anderen Tabelle verweist und damit eine Beziehung zwischen den Tabellen herstellt.
  • SQL-Grundstruktur: SELECT (Spalten auswählen), FROM (Tabelle angeben), WHERE (Bedingungen filtern), GROUP BY (Aggregation nach Gruppen), ORDER BY (Sortierung), JOIN (Tabellen verknüpfen).
  • JOIN-Typen: INNER JOIN liefert nur Zeilen mit Übereinstimmungen in beiden Tabellen; LEFT JOIN alle Zeilen der linken Tabelle inklusive passende rechte; OUTER JOIN liefert alle Zeilen beider Tabellen.
  • Aggregationsfunktionen: COUNT(), SUM(), AVG(), MIN(), MAX() werden in Kombination mit GROUP BY verwendet, um Kennzahlen über Gruppen von Datensätzen zu berechnen.
  • Datenbank vs. Data Warehouse: Eine Datenbank speichert aktuelle Daten für den operativen Betrieb (OLTP); ein Data Warehouse speichert aktuelle und historische Daten für das gesamte Unternehmen als Basis für BI-Analysen (OLAP).
Fachwörter & Glossar
  • SQL (Structured Query Language)Standardisierte Datenbanksprache für Abfragen (Queries), Dateneingabe, -änderung, -löschung sowie Erstellung und Veränderung von Datenbanken und Tabellen; wird von den meisten Datenbanksystemen unterstützt.
  • Primärschlüssel (Primary Key)Eindeutiges, nicht-NULL-Attribut einer Tabelle, das jeden Datensatz identifiziert.
  • Fremdschlüssel (Foreign Key)Attribut, das auf den Primärschlüssel einer anderen Tabelle verweist; stellt referentielle Integrität sicher.
  • SELECTSQL-Befehl zur Auswahl bestimmter Spalten aus einer oder mehreren Tabellen.
  • JOINSQL-Operation zur Verknüpfung von Zeilen aus zwei oder mehr Tabellen basierend auf einer gemeinsamen Spalte.
  • GROUP BYSQL-Klausel zur Gruppierung von Datensätzen nach einem oder mehreren Attributen, in Kombination mit Aggregationsfunktionen.
  • Relationale DatenbankDatenbank, die Daten in Tabellenform speichert und Beziehungen zwischen Tabellen über Schlüssel definiert; Grundlage für OLTP-Systeme.
  • In-Memory-DatenbankDatenbank, die Daten im Arbeitsspeicher (RAM) statt auf Festplatten hält; ermöglicht deutlich schnellere Abfragen, relevant für Big Data und Echtzeit-BI. ---