Business Intelligence · T7

Zeitreihenanalyse, Prognose & Predictive Analytics

Überblick

Predictive Analytics nutzt historische Daten, statistische Modelle und Machine-Learning-Techniken, um zukünftige Ereignisse vorherzusagen. Zeitreihenanalyse ist ein zentrales Werkzeug zur Identifikation von Trend, Saisonalität und Zyklen in zeitlich geordneten Daten. Prescriptive Analytics geht einen Schritt weiter und empfiehlt konkrete Handlungen.

Relevanz: Komponenten einer Zeitreihe (T, C, S, I) kennen; Exponentielle Glättung berechnen können (Formel und Alpha-Wahl); Unterschied Predictive vs. Prescriptive Analytics; Regressionsmodelle und Klassifikation konzeptionell verstehen; MSE als Fehlermasss.

Kernkonzepte
  • Komponenten einer Zeitreihe: Trend (T): langfristige Richtung; Zyklische Schwankungen (C): Konjunkturzyklen; Saisonale Schwankungen (S): regelmässige Muster (z. B. Sommer/Winter); Zufällige Schwankungen (I): irregulare Störungen. Verknüpfung entweder multiplikativ (X = T·C·S·I) oder additiv (X = T+C+S+I).
  • Einfache Exponentielle Glättung: F(t) = α · A(t-1) + (1-α) · F(t-1); Glättet zufällige Schwankungen; Alpha (0 ≤ α ≤ 1) steuert die Gewichtung: hohes Alpha → schnelle Reaktion, niedriges Alpha → glatter Verlauf. Optimalwert: minimiert den MSE (Mittlere Quadratische Abweichung).
  • Exponentielle Glättung mit Trend (Holt): Nutzt zwei Parameter α (Glättung des Schätzwerts) und β (Glättung des Trends); F(t) = α·A(t-1) + (1-α)·(F(t-1)+T(t-1)); T(t) = β·(F(t)-F(t-1)) + (1-β)·T(t-1); Prognose: f(t+k) = F(t) + (k+1)·T(t).
  • Mittlere Quadratische Abweichung (MSE): Durchschnitt der quadrierten Differenzen zwischen beobachteten und prognostizierten Werten; Gütekennzahl für Prognosemodelle.
  • Erklärende Modelle (Regression): Modellieren den Zusammenhang zwischen einer abhängigen Variable und einer oder mehreren unabhängigen Variablen (z. B. Temperatur vs. Eisverkauf).
  • Klassifikationsmodelle: Prognostizieren ein diskretes Ergebnis (z. B. "Kunde kauft: ja/nein"); gehört konzeptionell zur Mustererkennung, wird aber oft mit Prognosen kombiniert.
  • Predictive Analytics: Beantwortet die Frage "Was wird wahrscheinlich passieren?" – basierend auf Daten, Mustern und Modellen.
  • Prescriptive Analytics: Beantwortet die Frage "Was sollten wir konkret tun?" – unter Berücksichtigung von Zielen und Rahmenbedingungen; geht einen Schritt weiter als Predictive Analytics.
Fachwörter & Glossar
  • ZeitreiheZeitlich geordnete Folge von beobachteten Werten einer Variablen; besteht aus den Komponenten Trend (T), Zyklus (C), Saisonalität (S) und Zufall (I).
  • Trend (T)Langfristige Richtungsänderung einer Zeitreihe (z. B. steigender Umsatz über mehrere Jahre).
  • Saisonalität (S)Regelmässig wiederkehrende Schwankungen in einer Zeitreihe innerhalb eines Jahres oder einer anderen Periode (z. B. Weihnachtsgeschäft).
  • Exponentielle GlättungGlättungsverfahren für Zeitreihen, das neueren Beobachtungen exponentiell mehr Gewicht gibt als älteren; Parameter α (0–1) steuert die Reaktionsschnelligkeit.
  • Alpha (α)Glättungsparameter in der exponentiellen Glättung (0 ≤ α ≤ 1); hohes α → starke Gewichtung aktueller Werte; niedriges α → träges, stabiles Modell.
  • MSE (Mean Squared Error)Mittlere quadratische Abweichung; Durchschnitt der quadrierten Prognosefehler; Standard-Gütekennzahl für Prognosemodelle (minimize!).
  • Predictive AnalyticsAnalysemethoden zur Vorhersage zukünftiger Ereignisse basierend auf historischen Daten und statistischen Modellen (Frage: Was wird passieren?).
  • Prescriptive AnalyticsAnalytik, die konkrete Handlungsempfehlungen gibt und optimale Entscheidungen unter gegebenen Zielen und Rahmenbedingungen ableitet (Frage: Was sollen wir tun?).
  • RegressionStatistisches Modell zur Analyse des Zusammenhangs zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen; Ergebnis ist ein kontinuierlicher Wert.
  • KlassifikationMaschinenlernmethode zur Zuordnung von Datenpunkten zu diskreten Klassen (z. B. Spam/Kein Spam, Kauf/Kein Kauf).
  • ZeitreihendekompositionZerlegung einer Zeitreihe in ihre Komponenten Trend, Saisonalität und Zufall; ermöglicht gezielte Analyse jeder Komponente.
  • LSTM (Long Short-Term Memory)Rekurrentes neuronales Netzwerk für Sequenz- und Zeitreihendaten; kann langfristige Abhängigkeiten lernen; genutzt u. a. für Zeitreihen-Imputation.
  • ProphetVon Facebook entwickeltes Zeitreihen-Prognosemodell; berücksichtigt Saisonalität und Trend; genutzt für Lücken-Imputation in Zeitreihen. ---