Angebot!

Seminar Multivariate Datenanalyse mit R

Dozent: Dr. Haug Leuschner

 

 895,00 2.390,00

Zzgl. MwSt.
Auswahl zurücksetzen

Das Seminar Multivariate Datenanalyse mit R behandelt im dreitägigen Basistraining die multiple und die logistische Regressionsanalyse und im direkt anschließenden zweitägigen Aufbautraining strukturentdeckende Verfahren zur Analyse des Zusammenhangs zwischen mehreren Variablen.

Bei Buchung des Aufbautrainings werden die Inhalte des Basistrainings vorausgesetzt. Im fünftägigen Kompletttraining haben Sie das gesamte Programm, wobei im Preis eine Ermäßigung von 100 Euro für die Teilnahme am Basis- und Aufbautraining in derselben Woche enthalten ist.

Unternehmen und Organisationen können bei der Buchung von zwei Seminarplätzen im 5-tägigen Komplett-Training kostenlos eine dritte Person anmelden (bei der Buchung von zwei Plätzen können drei Namen an der Kasse angegeben werden).

Im Preis sind digitale Unterlagen und ein Schulungszertifikat enthalten, optional können gedruckte Unterlagen und ein Fernzugriff auf einen fertig konfigurierten Schulungslaptop dazugebucht werden. Sie können auf Rechnung zahlen (weitere Infos).

Artikelnummer: MDR Kategorien: ,

Beschreibung

In der fünftägigen Komplett-Schulung Multivariate Datenanalyse mit R werden in den ersten drei Tagen die multiple Regressionsanalyse und die logistische Regressionsanalyse behandelt. In den letzten beiden Tagen werden die strukturentdeckenden Verfahren behandelt. Dazu gehören die Zeitreihenanalyse, die Clusteranalyse und die explorative Faktorenanalyse, dazu ergänzend die Diskriminanzanalyse und die Reliabilitätsanalyse.

Zielgruppe: Anwender, Fachkräfte und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Controlling, Qualitätskontrolle) und der psychologischen, klinischen und pharmazeutischen Forschung

Voraussetzungen: Erfahrungen mit R unter Verwendung von RStudio und die Inhalte des Seminars Grundlagen der Statistik mit R (oder eines vergleichbaren Seminars: Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein). Grundlegende Fertigkeiten im Umgang mit R/RStudio, wie Datenimport, Datenaufbereitung, Grafikerstellung und statistische Standardverfahren, werden vorausgesetzt, ständig angewendet und vertieft. Wenn der Umgang mit R/RStudio nicht vertraut sein sollte, empfiehlt es sich, vorher ein R/RStudio-Training mit den Grundlagen oder ein vergleichbares Seminar zu besuchen.

Lernziele: fortgeschrittene Funktionen von R kennen lernen, Daten mit Hilfe von multivariaten Verfahren auswerten können, Ergebnisse von multivariaten Datenanalysen grafisch darstellen, erläutern und interpretieren können, aufgrund einer Fragestellung das geeignete multivariate Verfahren identifizieren und anwenden können

Übungen: Die Beispiele und Übungsaufgaben erfolgen in der R Schulung mit der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio.

Leistungen: ganztägiger Intensiv-Unterricht in Kleingruppen (9-17 Uhr, max. 10 Personen), gedrucktes Schulungszertifikat; Online-Veranstaltungen: digitale Schulungsunterlagen (gegen Aufpreis: gedruckte Schulungsunterlagen und/oder Fernzugang zu einem Schulungslaptop mit installierter Software); Präsenz-Veranstaltungen: Schulungsräume in zentraler Lage, Getränke in den Pausen, Schulungslaptop mit installierter Software, gedruckte Schulungsunterlagen

Aufbau: Die 5-tägige Komplett-Schulung Multivariate Datenanalyse mit R besteht aus einer 3-tägigen Basis-Schulung und einer anschließenden 2-tägigen Aufbau-Schulung, die auch einzeln gebucht werden können.

Inhalte des 5-tägigen Komplett-Trainings Multivariate Datenanalyse mit Python

  • 3-tägiges Basis-Training: Strukturenprüfende Verfahren

    • Multiple Regressionsanalyse
      Regressionsmodelle für kontinuierliche und kategoriale Variablen mit Suppressionseffekten (Suppressoranalyse), Moderationseffekten (Moderatoranalyse), nicht-linearen Effekten (polynomiale Regression) und Interaktionseffekten zwischen kategorialen und kontinuierlichen Variablen (dummykodierte Regressionsanalyse); Verfahren zur Auswahl von Prognosevariablen (shapley values, relative weights) und der Ermittlung des am besten an die Daten angepassten Modells (schrittweise Regression mit AIC/BIC, best subset regression); Residualdiagnostik und Prüfung der Modellprämissen (Angemessenheit des Modells, Unabhängigkeit der Daten, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Erkennung von einflussreichen Datenpunkten); 2D- und 3D-Grafiken von Regressionsmodellen
    • Logistische Regression
      Schätzung der logistischen Regressionsfunktion, Interpretation der Koeffizienten (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko, Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und automatisierte Verfahren zur Ermittlung des optimalen Trennwerts, automatisierte Auswahl von Prognosevariablen, Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo R-Quadrat-Statistiken)
  • 2-tägiges Aufbau-Training: Strukturentdeckende Verfahren

    • Zeitreihenanalyse: Glättungsmethoden und LOESS-Dekomposition von Trend- und Saison-Komponenten; Zeitregressionsmodelle, exponentielle Prognosemodelle (State-Space-Modelle) und ARIMA-Modelle; Erstellung von Prognosen, Beurteilung der Modellgüte und Prognosegüte, grafische Darstellung von Zeitreihen
    • Clusteranalyse: hierarchische Clusteranalyse (Distanz- und Ähnlichkeitsmaße, Fusionierungs-Algorithmen: Single-Linkage, Complete-Linkage, Ward), k-Means-Clusteranalyse
    • Diskriminanzanalyse: Schätzung der Diskriminanzfunktion, Prüfung der Modellgüte und der Eignung von Variablen, automatisierte Auswahl von Variablen, Klassifikation von neuen Fällen
    • Explorative Faktorenanalyse: Hauptachsenanalyse (EFA), Hauptkomponentenanalyse (PCA), Extraktion und Rotation der Faktoren, Variablenauswahl, Modellgüte, Berechnung von Faktorwerten
    • Reliabilitätsanalyse: Prüfung eines Indikatorsets eines Faktors auf Eindimensionalität; Indikatorreliabilität: Faktorladungen, Kommunalitäten, Cronbachs Alpha (ohne Item), Item-To-Skala-Korrelation; Faktorreliabilität: Cronbachs Alpha, Inter-Item-Korrelationen, Einheitsstruktur