Beschreibung
Module der Seminarreihe Multivariate Datenanalyse mit R
-
Modul Regressionsanalyse (3 Tage)
- Regressionsanalyse: Regressionsmodelle für kontinuierliche Variablen mit linearen und nicht-linearen Effekten, Moderationseffekten (Wechselwirkungen), Suppressionseffekten (Kontrolle von Störeinflüssen) und Interaktionseffekten zwischen kontinuierlichen und kategorialen Einflussgrößen (Populationsunterschiede); Verfahren zur Auswahl von Prognosevariablen (Betagewichte, Toleranzen) und der Ermittlung des am besten an die Daten angepassten Modells (schrittweise Regression mit AIC/BIC); Residualdiagnostik, Prüfung der Modellprämissen (Angemessenheit des Modells, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Erkennung von einflussreichen Datenpunkten) und Maßnahmen bei Verletzungen (Ausschluss ungeeigneter Fälle, Selektion und Aggregation von Variablen)
- Logistische Regression: Regressionsmodelle für kategoriale Variablen, Interpretation der Koeffizienten der logistischen Regressionsfunktion (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko; Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und Ermittlung des optimalen Trennwerts; Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo R-Quadrat-Statistiken)
-
Modul Varianzanalyse (2 Tage)
- ein-, zwei- und mehrfaktorielle Varianzanalyse (ANOVA)
- Kontrolle von metrischen Störeinflüssen (ANCOVA)
- Messwiederholungsdesigns (mixed ANOVA/ANCOVA)
- robuste Standardfehler bei fehlender Varianzhomogenität
- Effektstärkemaß: generalisiertes Eta-Quadrat
- Post-hoc-Tests: Tukey’s HSD und Games-Howell-Test
- Einzelvergleiche mit Alphafehler-Korrektur: Bonferroni, Holm und Jianjun Li
- Interaktionsanalyse: ordinale, disordinale und hybride Effekte (Wechselwirkungen)
- Prüfung der Wirksamkeit von Maßnahmen und Interventionen: Statistische Auswertung von Pretest-Posttest-Designs
-
Modul Zeitreihenanalyse (3 Tage)
- Zeitregression: Regressionsmodelle mit Trend-, Konjunktur- und Saisonkomponenten, lineare/nichtlineare Trendmodelle mit Berücksichtigung von zyklischen Schwankungen und Strukturbrüchen, Extrapolationsmodelle und Strukturmodelle, Beurteilung der Modellgüte und Prognosegüte, Erstellung von Prognosen mit Prognoseintervallen
- Zustandsraummodelle (State-Space-Modelle): Einfache exponentielle Modelle, Holts exponentielle Glättung, Holt-Winters exponentielle Glättung, Beurteilung der Modellgüte und Prognosegüte, Erstellung von Prognosen mit Prognoseintervallen
- ARIMA-Modelle: Dekomposition von Trend- und Saison-Komponenten, Detektion von Random-Walk-Prozessen, Zeitreihen ohne Saisonalität (ARIMA), Zeitreihen mit Saisonalität (SARIMA), Zeitreihen mit Einflussgrößen (ARIMAX), Zeitreihen mit Saisonalität und Einflussgrößen (SARIMAX), Beurteilung der Modellgüte und Prognosegüte, Erstellung von Prognosen mit Prognoseintervallen
-
Modul Cluster- und Faktorenanalyse (2 Tage)
- Clusteranalyse: hierarchische Clusteranalyse (Distanz- und Ähnlichkeitsmaße, Fusionierungs-Algorithmen: Single-Linkage, Complete-Linkage und Ward-Verfahren); partitionierende Clusteranalyse (k-Means-Clusteranalyse, k-Medoids-Clusteranalyse)
- Dimensionsreduzierende Verfahren: Faktorenanalyse (EFA, Explorative Factor Analysis) und Hauptkomponentenanalyse (PCA, Principal Component Analysis); Variablenauswahl, Extraktion und Rotation der Dimensionen, Berechnung von Faktorwerten
- Reliabilitätsanalyse: Indikatorreliabilität (Faktorladungen, Kommunalitäten, Cronbachs Alpha (ohne Item), Item-To-Skala-Korrelation), Faktorreliabilität (Cronbachs Alpha, Einfachstruktur)
Ausführliche Informationen und Buchungsmöglichkeiten finden Sie auf der → Multivariate Datenanalyse mit R.