Business Information Systems · T8

Datenbank Management System & Datenlebenszyklus

Überblick

Datenbank Management Systeme (DBMS) sind das Fundament der Datenhaltung in jedem BIS. Dieses Thema behandelt die Notwendigkeit von DBMS, die verschiedenen Arten von Daten und Datenbanken, generelle Herausforderungen mit Daten (inkl. Big Data) sowie den Datenlebenszyklus. Die drei Folien zum «Datenverarbeitungsprozess» sind NICHT prüfungsrelevant.

Relevanz: Definition und Zweck eines DBMS erklären; Herausforderungen mit Daten (Big Data, Qualität, Integration, etc.) einordnen; Datenlebenszyklus-Phasen kennen; relationale vs. nicht-relationale Datenbanken unterscheiden.

Kernkonzepte
  • Datenbank Management System (DBMS): System, das verwendet wird, um Daten effektiv zu speichern und zu verwalten – während ihres gesamten Lebenszyklus. Es ist «Datenanbieter für Datenabnehmer» und stellt relevante Daten rechtzeitig und kontextbezogen zur Verfügung. DBMS sind in einer Vielzahl von Systemen integriert: ERP, CRM, Online-Shops, Banksysteme usw.
  • Generelle Herausforderungen mit Daten: Qualität, Privacy & Security, Geschwindigkeit (Real-time), Verfügbarkeit, Klarheit (Purpose), Scaling, Kultur (Silodenken), Integration diverser Quellen, Speicherverwaltung (skalierbar, performant, kosteneffektiv), Datenmenge (Big Data), Konsistenz und Aktualisierungen.
  • Big Data: Begriff für den Umgang mit sehr grossen, schnell wachsenden und vielfältigen Datenmengen, die mit herkömmlichen Datenbankwerkzeugen nicht mehr effizient verarbeitet werden können. Charakterisiert durch die «Vs»: Volume, Velocity, Variety (und weitere).
  • Datenarten: Strukturierte Daten (in tabellarischer Form, z.B. relationale Datenbanken), semi-strukturierte Daten (z.B. JSON, XML), unstrukturierte Daten (z.B. Texte, Bilder, Audiodateien, Kundenfeedback).
  • Relationale Datenbank: Speichert Daten in Tabellen mit definierten Beziehungen; nutzt SQL für Abfragen. Standard-DBMS für strukturierte Daten. Beispiele: MySQL, Oracle, PostgreSQL, MS SQL Server.
  • Nicht-relationale Datenbank (NoSQL): Flexiblere Datenbanktypen für semi- oder unstrukturierte Daten. Typen: Dokumentendatenbanken (MongoDB), Key-Value-Stores, Graph-Datenbanken, Column Stores. Geeignet für Big-Data-Szenarien.
  • Data Warehouse: Zentrale Datenspeicherplattform für analytische Abfragen; optimiert für Lesezugriffe und historische Analysen.
  • Data Lake: Speichert Rohdaten aller Art (strukturiert, semi-, unstrukturiert) in ihrer ursprünglichen Form für spätere Analyse.
  • Daten Lebenszyklus (8 Phasen): 1. Generation (Datenentstehung) → 2. Collection (Sammlung) → 3. Processing (Verarbeitung) → 4. Storage (Speicherung) → 5. Management (Verwaltung) → 6. Analysis (Analyse) → 7. Visualization (Visualisierung) → 8. Interpretation. Phasen 1–5: generelles Datenmanagement. Phasen 6–8: Ergänzung für Datenauswertungen.
Fachwörter & Glossar
  • DBMSDatenbank Management System; System zur effektiven Speicherung, Verwaltung und Bereitstellung von Daten während ihres gesamten Lebenszyklus.
  • Big DataBegriff für sehr grosse, schnell wachsende und vielfältige Datenmengen, die spezielle Technologien zur Verarbeitung erfordern (Volume, Velocity, Variety).
  • Strukturierte DatenDaten in tabellarischer Form mit klar definiertem Schema; in relationalen Datenbanken gespeichert.
  • Semi-strukturierte DatenDaten mit teilweise definierter Struktur, z.B. JSON- oder XML-Dateien.
  • Unstrukturierte DatenDaten ohne festes Schema, z.B. Texte, Bilder, Audio, Video.
  • Relationale DatenbankDBMS, das Daten in Tabellen mit definierten Beziehungen speichert und SQL für Abfragen verwendet.
  • NoSQLNot-Only-SQL; Oberbegriff für nicht-relationale Datenbanken, geeignet für semi- und unstrukturierte Daten und Big-Data-Szenarien.
  • Data WarehouseZentrale Datenspeicherplattform, optimiert für analytische Abfragen und historische Berichte.
  • Data LakeSpeicher für Rohdaten aller Typen und Formate für spätere flexible Analyse.
  • DatenlebenszyklusModell, das die Phasen von der Datenentstehung (Generation) bis zur Interpretation beschreibt (8 Phasen: Generation, Collection, Processing, Storage, Management, Analysis, Visualization, Interpretation).
  • SQLStructured Query Language; Standardabfragesprache für relationale Datenbanken.
  • RedundanzMehrfaches Speichern desselben Datenwerts in einer Datenbank; führt zu Inkonsistenz und ist in ERP-Systemen durch zentrale Datenbankkonzepte zu vermeiden. ---