Seminar Multivariate Datenanalyse mit R

Dozent: Dr. Haug Leuschner

 

 495,00 4.950,00

Zzgl. MwSt.

Infos zum Kurs finden Sie auf der → Veranstaltungsseite zum Seminar.

Artikelnummer: MDR Kategorien: ,

Beschreibung

In der Seminarreihe Multivariate Datenanalyse mit R werden die Regressionsanalyse, Varianzanalyse, Zeitreihenanalyse, Clusteranalyse, logistische Regression, Faktorenanalyse (EFA) und Hauptkomponentenanalyse (PCA) behandelt.

Zielgruppe: Anwender, Fachkräfte und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Controlling, Qualitätskontrolle) und der psychologischen, klinischen und pharmazeutischen Forschung

Voraussetzungen: Erfahrungen mit R unter Verwendung von RStudio und die Inhalte des Seminars Grundlagen der Statistik mit R (oder eines vergleichbaren Seminars: Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein). Grundlegende Fertigkeiten im Umgang mit R/RStudio, wie Datenimport, Datenaufbereitung, Grafikerstellung und statistische Standardverfahren, werden vorausgesetzt, ständig angewendet und vertieft. Wenn der Umgang mit R/RStudio nicht vertraut sein sollte, empfiehlt es sich, vorher ein R/RStudio-Training mit den Grundlagen oder ein vergleichbares Seminar zu besuchen.

Lernziele: fortgeschrittene Funktionen von R kennen lernen, Daten mit Hilfe von multivariaten Verfahren auswerten können, Ergebnisse von multivariaten Datenanalysen grafisch darstellen, erläutern und interpretieren können, aufgrund einer Fragestellung das geeignete multivariate Verfahren identifizieren und anwenden können

Übungen: Die Beispiele und Übungsaufgaben erfolgen in der R Schulung mit der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio.

Leistungen: ganztägiger Intensiv-Unterricht in Kleingruppen (9-17 Uhr, max. 10 Personen), gedrucktes Schulungszertifikat; Online-Veranstaltungen: digitale Schulungsunterlagen (gegen Aufpreis: gedruckte Schulungsunterlagen und/oder Fernzugang zu einem Schulungslaptop mit installierter Software); Präsenz-Veranstaltungen: Schulungsräume in zentraler Lage, Getränke in den Pausen, Schulungslaptop mit installierter Software, gedruckte Schulungsunterlagen

Aufbau: Die 5-tägige Komplett-Schulung Multivariate Datenanalyse mit R besteht aus einer 3-tägigen Basis-Schulung und einer anschließenden 2-tägigen Aufbau-Schulung, die auch einzeln gebucht werden können.

Ausführliche Informationen und Buchungsmöglichkeiten finden Sie auf der → Veranstaltungsseite zum Seminar.

Module der Seminarreihe Multivariate Datenanalyse mit R

  • Modul Regressionsanalyse (3 Tage)

    • Regressionsmodelle für kontinuierliche und kategoriale Variablen mit linearen und nicht-linearen Effekten (polynomiale Regression), Moderationseffekten (Wechselwirkungen), Suppressionseffekten (Kontrolle von Störeinflüssen) und Interaktionseffekten zwischen kategorialen und kontinuierlichen Variablen (Populationsunterschiede)
    • Verfahren zur Auswahl von Prognosevariablen (Betagewichte, Toleranzen) und der Ermittlung des am besten an die Daten angepassten Modells (schrittweise Regression mit AIC/BIC, best subset regression)
    • Residualdiagnostik, Prüfung der Modellprämissen (Angemessenheit des Modells, Unabhängigkeit der Daten, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Erkennung von einflussreichen Datenpunkten) und Maßnahmen bei Verletzungen (Ausschluss ungeeigneter Fälle, Selektion und Aggregation von Variablen)
  • Modul Varianzanalyse (2 Tage)

    • ein-, zwei- und mehrfaktorielle Varianzanalyse (ANOVA)
    • Kontrolle von metrischen Störeinflüssen (ANCOVA)
    • Messwiederholungsdesigns (mixed ANOVA/ANCOVA)
    • robuste Standardfehler bei fehlender Varianzhomogenität
    • Effektstärkemaß: generalisiertes Eta-Quadrat
    • Post-hoc-Tests: Tukey’s HSD und Games-Howell
    • Einzelvergleiche mit Alphafehler-Korrektur: Bonferroni, Holm und Jianjun Li
    • Interaktionsanalyse: ordinale, disordinale und hybride Effekte (Wechselwirkungen)
    • Prüfung der Wirksamkeit von Maßnahmen und Interventionen: Statistische Auswertung von Pretest-Posttest-Designs (Evaluationsstudien)
  • Modul Zeitreihenanalyse (3 Tage)

    • Zeitreihenanalyse mit Regressionsmodellen: Zeitreihenmodelle mit Trend-, Konjunktur- und Saisonkomponenten, lineare/nichtlineare Trendmodelle mit Berücksichtigung von zyklischen Schwankungen und Strukturbrüchen, Extrapolationsmodelle und Strukturmodelle, Beurteilung der Modellgüte und Prognosegüte
    • Zustandsraummodelle (State-Space-Modelle): Einfache exponentielle Modelle, Holts exponentielle Glättung, Holt-Winters exponentielle Glättung, Beurteilung der Modellgüte und Prognosegüte
    • ARIMA-Modelle: Dekomposition von Trend- und Saison-Komponenten, Detektion von Random-Walk-Prozessen, Zeitreihen ohne Saisonalität (ARIMA), Zeitreihen mit Saisonalität (SARIMA), Zeitreihen mit Einflussgrößen (ARIMAX), Zeitreihen mit Saisonalität und Einflussgrößen (SARIMAX), Beurteilung der Modellgüte und Prognosegüte
  • Modul Clusteranalyse und logistische Regression (2 Tage)

    • Clusteranalyse: hierarchische Clusteranalyse (Distanz- und Ähnlichkeitsmaße, Fusionierungs-Algorithmen: Single-Linkage, Complete-Linkage und Ward-Verfahren), partitionierende Clusteranalysen (k-Means-Clusteranalyse, k-Medoids-Clusteranalyse)
    • Logistische Regression: Schätzung der logistischen Regressionsfunktion, Interpretation der Koeffizienten (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko, Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und automatisierte Verfahren zur Ermittlung des optimalen Trennwerts, automatisierte Auswahl von Prognosevariablen, Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo R-Quadrat-Statistiken)
  • Modul Dimensionsreduktion (1 Tag)

    • Faktorenanalyse (EFA, Explorative Factor Analysis): Variablenauswahl, Extraktion und Rotation der Faktoren, Berechnung von Faktorwerten, bei Interesse auch die Reliabilitätsanalyse zur Auswahl geeigneter Items für einen Fragebogen
    • Hauptkomponentenanalyse (PCA, Principal Component Analysis): Variablenauswahl, Extraktion und Rotation der Komponenten, Berechnung von standardisierten Werte für die Hauptkomponenten

Ausführliche Informationen und Buchungsmöglichkeiten finden Sie auf der → Multivariate Datenanalyse mit R.