Beschreibung
In der fünftägigen Seminar Multivariate Datenanalyse mit Python werden in den ersten drei Tagen die multiple Regressionsanalyse und die logistische Regressionsanalyse behandelt. In den letzten beiden Tagen werden die strukturentdeckenden Verfahren behandelt. Dazu gehören die Zeitreihenanalyse, die Clusteranalyse und die explorative Faktorenanalyse, dazu ergänzend die Reliabilitätsanalyse.
Zielgruppe: Anwender, Fachkräfte und Studierende aus den Bereichen der Sozial- und Marktforschung, den Wirtschaftswissenschaften und der Betriebswirtschaft (Business Intelligence, Marketing, Controlling, Qualitätskontrolle) und der psychologischen, klinischen und pharmazeutischen Forschung
Voraussetzungen: Erfahrungen mit Python und die Inhalte des Seminars Grundlagen der Statistik mit Python (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein). Grundlegende Fertigkeiten im Umgang mit Python – wie Datenimport, Datenaufbereitung, Grafikerstellung und statistische Standardverfahren – werden vorausgesetzt, ständig angewendet und vertieft. Wenn der Umgang mit Python nicht vertraut sein sollte, empfiehlt es sich, vorher einen der beiden genannten Grundlagen-Seminare zu besuchen. Der Unterricht des Aufbaukurses setzt außerdem die Kenntnis der Regressionsanalyse voraus.
Lernziele: fortgeschrittene Funktionen von Python kennen lernen, Daten mit Hilfe von multivariaten Verfahren auswerten können, Ergebnisse von multivariaten Datenanalysen grafisch darstellen, erläutern und interpretieren können, aufgrund einer Fragestellung das geeignete multivariate Verfahren identifizieren und anwenden können
Übungen: Die Beispiele und Übungsaufgaben erfolgen in der Python Schulung mit der Programmiersprache Python und der Entwicklungsumgebung Spyder aus der Python Anaconda Distribution. Falls Sie Spyder nicht kennen sollten, können Sie entweder an dem Kurs mit einer anderen Entwicklungsumgebung teilnehmen oder alternativ sich in die Entwicklungsumgebung Spyder einarbeiten: Dokumentation zu Spyder und Tutorial zu Spyder.
Leistungen: ganztägiger Intensiv-Unterricht in Kleingruppen (9-17 Uhr, max. 10 Personen), gedrucktes Schulungszertifikat; Online-Veranstaltungen: digitale Schulungsunterlagen (gegen Aufpreis: gedruckte Schulungsunterlagen und/oder Fernzugang zu einem Schulungslaptop mit installierter Software); Präsenz-Veranstaltungen: Schulungsräume in zentraler Lage, Getränke in den Pausen, Schulungslaptop mit installierter Software, gedruckte Schulungsunterlagen
Aufbau: Die 5-tägige Komplett-Schulung Multivariate Datenanalyse mit Python besteht aus einer 3-tägigen Basis-Schulung und einer anschließenden 2-tägigen Aufbau-Schulung, die auch einzeln gebucht werden können.
Ausführliche Informationen und Buchungsmöglichkeiten finden Sie auf der → Veranstaltungsseite zum Seminar.
Inhalte des 5-tägigen Komplett-Trainings Multivariate Datenanalyse mit Python
-
3-tägiges Basis-Training: Strukturenprüfende Verfahren
- Multiple Regressionsanalyse
Regressionsmodelle für kontinuierliche und kategoriale Variablen mit Suppressionseffekten (Suppressoranalyse), Moderationseffekten (Moderatoranalyse), nicht-linearen Effekten (polynomiale Regression) und Interaktionseffekten zwischen kategorialen und kontinuierlichen Variablen (dummykodierte Regressionsanalyse); automatisierte Verfahren zur Auswahl von Prognosevariablen und der Ermittlung des am besten an die Daten angepassten Modells; Residualdiagnostik und Prüfung der Modellprämissen (Angemessenheit des Modells, Unabhängigkeit der Daten, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Erkennung von einflussreichen Datenpunkten); 2D- und 3D-Grafiken von Regressionsmodellen - Logistische Regression
Schätzung der logistischen Regressionsfunktion, Interpretation der Koeffizienten (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko, Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und automatisierte Verfahren zur Ermittlung des optimalen Trennwerts, automatisierte Auswahl von Prognosevariablen, Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo Python-Quadrat-Statistiken)
- Multiple Regressionsanalyse
-
2-tägiges Aufbau-Training: Strukturentdeckende Verfahren
- Zeitreihenanalyse
Glättungsmethoden und LOESS-Dekomposition von Trend- und Saison-Komponenten; exponentielle Prognosemodelle (State-Space-Modelle) und ARIMA-Modelle (ARIMA, SARIMA, ARIMAX, SARIMAX und VARMAX-Modelle); Erstellung von Prognosen, Beurteilung der Modellgüte und Prognosegüte, grafische Darstellung von Zeitreihen - Clusteranalyse
hierarchische Clusteranalyse (Distanz- und Ähnlichkeitsmaße, Fusionierungs-Algorithmen: Single-Linkage, Complete-Linkage, Ward), k-Means-Clusteranalyse - Explorative Faktorenanalyse
Hauptachsenanalyse (EFA), Hauptkomponentenanalyse (PCA), Extraktion und Rotation der Faktoren, Variablenauswahl, Modellgüte, Berechnung von Faktorwerten - Reliabilitätsanalyse
Indikatorreliabilität: Faktorladungen, Kommunalitäten, Cronbachs Alpha (ohne Item), Item-To-Skala-Korrelation; Faktorreliabilität: Cronbachs Alpha, Einheitsstruktur
- Zeitreihenanalyse
Ausführliche Informationen und Buchungsmöglichkeiten zu den Teilkursen finden Sie auf der → Veranstaltungsseite zum Seminar.