Beschreibung
In der fünftägigen Komplett-Schulung Multivariate Datenanalyse mit R werden in den ersten drei Tagen die multiple Regressionsanalyse und die logistische Regressionsanalyse behandelt. In den letzten beiden Tagen werden die strukturentdeckenden Verfahren behandelt. Dazu gehören die Zeitreihenanalyse, die Clusteranalyse und die explorative Faktorenanalyse, dazu ergänzend die Diskriminanzanalyse und die Reliabilitätsanalyse.
Zielgruppe: Anwender, Fachkräfte und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Controlling, Qualitätskontrolle) und der psychologischen, klinischen und pharmazeutischen Forschung
Voraussetzungen: Erfahrungen mit R unter Verwendung von RStudio und die Inhalte des Seminars Grundlagen der Statistik mit R (oder eines vergleichbaren Seminars: Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein). Grundlegende Fertigkeiten im Umgang mit R/RStudio, wie Datenimport, Datenaufbereitung, Grafikerstellung und statistische Standardverfahren, werden vorausgesetzt, ständig angewendet und vertieft. Wenn der Umgang mit R/RStudio nicht vertraut sein sollte, empfiehlt es sich, vorher ein R/RStudio-Training mit den Grundlagen oder ein vergleichbares Seminar zu besuchen.
Lernziele: fortgeschrittene Funktionen von R kennen lernen, Daten mit Hilfe von multivariaten Verfahren auswerten können, Ergebnisse von multivariaten Datenanalysen grafisch darstellen, erläutern und interpretieren können, aufgrund einer Fragestellung das geeignete multivariate Verfahren identifizieren und anwenden können
Übungen: Die Beispiele und Übungsaufgaben erfolgen in der R Schulung mit der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio.
Leistungen: ganztägiger Intensiv-Unterricht in Kleingruppen (8-17 Uhr, max. 10 Personen), gedrucktes Schulungszertifikat; Online-Veranstaltungen: digitale Schulungsunterlagen (gegen Aufpreis: gedruckte Schulungsunterlagen und/oder Fernzugang zu einem Schulungslaptop mit installierter Software); Präsenz-Veranstaltungen: Schulungsräume in zentraler Lage, Getränke in den Pausen, Schulungslaptop mit installierter Software, gedruckte Schulungsunterlagen
Aufbau: Die 5-tägige Komplett-Schulung Multivariate Datenanalyse mit R besteht aus einer 3-tägigen Basis-Schulung und einer anschließenden 2-tägigen Aufbau-Schulung, die auch einzeln gebucht werden können.
Inhalte des 5-tägigen Komplett-Trainings Multivariate Datenanalyse mit Python
-
3-tägiges Basis-Training: Strukturenprüfende Verfahren
- Multiple Regressionsanalyse
Regressionsmodelle für kontinuierliche und kategoriale Variablen mit Suppressionseffekten (Suppressoranalyse), Moderationseffekten (Moderatoranalyse), nicht-linearen Effekten (polynomiale Regression) und Interaktionseffekten zwischen kategorialen und kontinuierlichen Variablen (dummykodierte Regressionsanalyse); Verfahren zur Auswahl von Prognosevariablen (shapley values, relative weights) und der Ermittlung des am besten an die Daten angepassten Modells (schrittweise Regression mit AIC/BIC, best subset regression); Residualdiagnostik und Prüfung der Modellprämissen (Angemessenheit des Modells, Unabhängigkeit der Daten, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Erkennung von einflussreichen Datenpunkten); 2D- und 3D-Grafiken von Regressionsmodellen - Logistische Regression
Schätzung der logistischen Regressionsfunktion, Interpretation der Koeffizienten (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko, Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und automatisierte Verfahren zur Ermittlung des optimalen Trennwerts, automatisierte Auswahl von Prognosevariablen, Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo R-Quadrat-Statistiken)
- Multiple Regressionsanalyse
-
2-tägiges Aufbau-Training: Strukturentdeckende Verfahren
- Zeitreihenanalyse: Glättungsmethoden und LOESS-Dekomposition von Trend- und Saison-Komponenten; exponentielle Prognosemodelle (State-Space-Modelle) und ARIMA-Modelle; Erstellung von Prognosen, Beurteilung der Modellgüte und Prognosegüte, grafische Darstellung von Zeitreihen
- Clusteranalyse: hierarchische Clusteranalyse (Distanz- und Ähnlichkeitsmaße, Fusionierungs-Algorithmen: Single-Linkage, Complete-Linkage, Ward), k-Means-Clusteranalyse
- Diskriminanzanalyse: Schätzung der Diskriminanzfunktion, Prüfung der Modellgüte und der Eignung von Variablen, automatisierte Auswahl von Variablen, Klassifikation von neuen Fällen
- Explorative Faktorenanalyse: Hauptachsenanalyse (EFA), Hauptkomponentenanalyse (PCA), Extraktion und Rotation der Faktoren, Variablenauswahl, Modellgüte, Berechnung von Faktorwerten
- Reliabilitätsanalyse: Prüfung eines Indikatorsets eines Faktors auf Eindimensionalität; Indikatorreliabilität: Faktorladungen, Kommunalitäten, Cronbachs Alpha (ohne Item), Item-To-Skala-Korrelation; Faktorreliabilität: Cronbachs Alpha, Inter-Item-Korrelationen, Einheitsstruktur