Multivariate Datenanalyse mit R

Posted on
Print Friendly, PDF & Email
Der R-Kurs Multivariate Datenanalyse mit R führt als Weiterbildung für fortgeschrittene Anwender in die multivariate Statistik ein. Die Anwendung der multivariaten Verfahren mit der statistischen Programmiersprache R unter der Entwicklungsoberfläche RStudio wird mit vielen Beispielen und Übungsaufgaben trainiert und vertieft. Das Ziel der R-Schulung ist es, multivariate Verfahren mit R unter RStudio anwenden zu können.

Der Nutzen des Seminars besteht darin, dass durch diesen R-Kurs fortgeschrittene Anwender innerhalb von einer Woche in die Lage versetzt werden, multivariate Verfahren anzuwenden und die Ergebnisse korrekt zu interpretieren. Multivariate Verfahren erlauben es, die Variablen in einem Datensatz gemeinsam zu analysieren und sind somit den univariaten Verfahren des Grundlagenkurses Grundlagen der Statistik mit R überlegen. Die Vorteile werden im nächsten Abschnitt erläutert.

Alle Bewertungen stammen ausschließlich von Seminarteilnehmern von Dr. Haug Leuschner.
Die Bewertungen werden von einem unabhängigen Dienstleister gesammelt, geprüft und ausgewertet.

Das Wichtigste auf einen Blick

Details zum Kurs
Ort: Köln / Online
Typ: Intensivkurs
Größe: 4 – 8 Personen
Dauer: 3 / 2 / 5 Tage
Zeiten: 9 – 17 Uhr
Preise*: 895 € – 2.490 €
Intervall: alle 3 Monate
Inhalte des Kurses
  • Multiple Regressionsanalyse
  • Logistische Regression
  • Varianzanalyse
  • Zeitreihenanalyse
  • Clusteranalyse
  • Faktorenanalyse (EFA, Explorative Factor Analysis)
  • Hauptkomponentenanalyse (PCA, Principal Component Analysis)
Weitere Infos…

*Nettopreise ohne MwSt. Endpreis wird im Warenkorb angezeigt.

Was sind multivariate Verfahren?

Die Multivariate Statistik untersucht den Einfluss von mehreren statistischen Variablen zugleich. Zusammenhangsstrukturen zwischen den Variablen können nur mit den multivariaten Verfahren der multivariaten Statistik erkannt werden. Damit sind diese den univariaten Verfahren überlegen, bei denen der Einfluss jeder Variablen auf die Messgröße einzeln analysiert wird. Die univariaten Verfahren werden in dem R-Kurs Grundlagen der Statistik mit R vermittelt.

Multivariate Verfahren wollen im Wesentlichen die in einem Datensatz enthaltene Zahl der Variablen reduzieren, im Ergebnis aber die Gesamtheit der enthaltenen Information berücksichtigen. Dazu wird die Struktur der Daten analysiert. Entweder gibt man im Rahmen der multivariaten Statistik eine Struktur vor und prüft mit Hilfe strukturprüfender Verfahren, ob die Daten mit der vorgegebenen Struktur zusammenpassen, oder man versucht im Rahmen der explorativen Statistik, die Struktur zu entdecken und aus den Daten zu extrahieren.

Beide Verfahrensarten der multivariaten Statistik ergänzen sich häufig. So werden beispielsweise mit Hilfe der Clusteranalyse verschiedene, voneinander abgrenzbare Kundengruppen bestimmt. Mittels einer nachgeschalteten logistischen Regression können dann die Merkmale analysiert werden, mit denen die gefundenen Gruppen sich voneinander unterscheiden lassen. Mit den gewonnenen Erkenntnissen kann bei neuen Fällen die Gruppenzugehörigkeit prognostiziert werden. Oder eine Vielzahl von zu analysierenden Variablen werden zunächst mit Hilfe einer Faktorenanalyse (EFA, Explorative Factor Analysis) oder einer Hauptkomponentenanalyse (PCA, Principal Component Analysis) auf wenige Dimensionen (Faktoren, Hauptkomponenten) reduziert. Anschließend werden die auf diese Weise ermittelten Dimensionen mit Regressions-, Varianz- oder Zeitreihenanalysen untersucht.

Multivariate Verfahren werden erfolgreich in den verschiedensten Feldern eingesetzt wie beispielsweise in den betriebswirtschaftlichen Anwendungsbereichen (Marktforschung und Marketing), in der Technik (Produktentwicklung und Produktion) und in den wissenschaftlichen Anwendungsbereichen (Naturwissenschaften, Biowissenschaften, Sozialwissenschaften, Medienwissenschaften, Medizin, Pharmazie, Psychologie, Pädagogik, Soziologie usw., um nur einige zu nennen).

Aufbau der R-Schulung

Der R-Kurs Multivariate Datenanalyse mit R besteht aus einem dreitägigen Basistraining und einem zweitägigen Aufbautraining, die voneinander unabhängig besucht werden können. Im Basistraining werden die grundlegenden regressionsanalytischen Verfahren vorgestellt. Im Aufbautraining werden an jeweils verschiedenen Terminen die im weitesten Sinne auf der Regressionsanalyse aufbauenden Verfahren vermittelt: die Varianzanalyse, die Zeitreihenanalyse und die strukturentdeckenden Verfahren (Clusteranalyse, Faktorenanalyse und Hauptkomponentenanalyse).

Im dreitägigen Basistraining des R-Seminars Multivariate Datenanalyse mit R werden die regressionsanalytischen Verfahren behandelt. Dazu gehören die multiple Regressionsanalyse, die die linearen und nichtlinearen Zusammenhänge zwischen mehreren Variablen quantitativ beschreibt und erklärt und Prognosen erlaubt, und die logistische Regression, die zur Klassifizierung und Risikoabschätzung von Einzelfällen geeignet ist. Es wird mit vielen Beispielen und Aufgaben gezeigt, wie lineare, nicht-lineare und kategoriale Einflussgrößen und deren Wechselwirkungen modelliert werden. Des Weiteren werden Methoden behandelt, mit denen die für die Zielgröße bedeutsamen Prädiktoren bestimmt (Beta-Gewichte und Toleranzen) und das beste Prognosemodell gefunden und bewertet werden kann (stepwise regression und best subset regression). Mit diesen fortgeschrittenen Kenntnissen können komplexe und realitätsnahe Regressionsmodelle mit hohem Erklärungswert und sehr guten Prognosen entwickelt werden.

Im zweitägigen Aufbautraining des R-Seminars Multivariate Datenanalyse mit R werden weiterführende Verfahren behandelt. Dazu gehören die Varianzanalyse, die die Mittelwerte einer Vielzahl von Gruppen vergleichend analysieren kann, die Zeitreihenanalyse, die Zeitreihen mittels verschiedener Verfahren untersucht und Prognosen für zukünftige Entwicklungen erlaubt und die strukturentdeckenden Verfahren: die Clusteranalyse, die eine Vielzahl von Fällen zu wenigen Gruppen (Cluster) bündelt, und die dimensionsreduzierenden Verfahren. Dazu gehören die Faktorenanalyse und die Hauptkomponentenanalyse, die eine Vielzahl von Variablen zu wenigen Dimensionen (Faktoren oder Hauptkomponenten) reduzieren. An jedem Seminartermin wird eines der drei folgenden Themen im Aufbaukurs behandelt:

  • Die Varianzanalyse erlaubt die simultane Analyse einer Vielzahl von Mittelwerten verschiedener (Teil-) Stichproben. Sie kann überall dort eingesetzt werden, wo Gruppen miteinander verglichen werden sollen, dabei auch die Veränderungen von Gruppen über mehrere Zeitpunkte. Damit ist die Varianzanalyse das Verfahren der ersten Wahl zur Auswertung von Daten aus Experimenten, Quasi-Experimenten, Befragungen, Beobachtungsstudien und randomisierten kontrollierten Studien im Rahmen von Pretest-Posttest-Designs. Die Varianzanalyse ist das grundlegende statistische Verfahren zur Evaluation der Wirksamkeit von Maßnahmen und Interventionen.

  • Die Clusteranalyse, die Faktorenanalyse (EFA, Explorative Factor Analysis) und die Hauptkomponentenanalyse (PCA, Principal Component Analysis) gehören zu den strukturentdeckenden Verfahren. Mit einer Clusteranalyse werden ähnliche Fälle zu Gruppen (Cluster) zusammengefasst. Wir werden die hierarchische Clusteranalyse, die k-Means-Clusteranalyse und die k-Medoids-Clusteranalyse besprechen. Als Ergänzung zur Clusteranalyse wird im Basis-Training die logistische Regression vermittelt, mit der analysiert werden kann, mit welchen Variablen die in der Clusteranalyse gefundenen Gruppen am besten beschrieben werden können. Die Faktorenanalyse und die Hauptkomponentenanalyse dienen dazu, ähnliche Variablen zu Faktoren bzw. Hauptkomponenten zu bündeln. Die beiden Verfahren unterscheiden sich in einem wesentlichen Detail, so dass sich unterschiedliche Einsatzzwecke ergeben. Wir werden beide Varianten und ihre unterschiedlichen Einsatzmöglichkeiten kennenlernen.

  • Die Zeitreihenanalyse gehört zu den anspruchsvolleren Aufgaben in der Statistik. Zeitreihen unterliegen sowohl ihrer Eigendynamik als auch der Saisonalität des jahreszeitlichen Wandels unseres Planeten und darüber hinaus den Einflüssen anderer Zeitreihen. In diesem Kurs erhalten Sie einen zuverlässigen Leitfaden, mit dem Sie das richtige Modell für Ihre Zeitreihen aufstellen, trainieren und testen können. Schon im Basistraining werden wir anstelle der logistischen Regression die Zeitreihenregression kennenlernen. Im Aufbautraining werden für kurzfristige Voraussagen exponentielle Prognosemodelle (State-Space-Modelle) und für langfristige Prognosen die ARIMA-Modelle vermittelt. Dabei werden wir für Zeitreihen mit Saisonalität die SARIMA-Modelle, für Zeitreihen mit Einflussgrößen die ARIMAX-Modelle und für saisonale Zeitreihen mit Einflussgrößen die SARIMAX-Modelle kennenlernen. Eine besondere Herausforderung stellen die VARMAX-Modelle dar, bei denen mehrere unterschiedliche Zeitreihenmodelle und ihre gegenseitige Beeinflussung untersucht werden.

Eine detaillierte Auflistung der Kursinhalte finden Sie → hier.

Nutzen der Weiterbildung

Der Nutzen des Seminars besteht darin, dass Sie durch diesen R-Kurs innerhalb von einer Woche in die Lage versetzt werden, multivariate Verfahren auf einem hohen Niveau anzuwenden und zu interpretieren. Damit dies gelingt, wird nicht nur das theoretische Hintergrundwissen vermittelt, sondern auch die praktische Anwendung und Umsetzung mit der weltweit am meisten eingesetzten und umfangreichsten statistischen Analyse-Umgebung R mit RStudio. Dabei werden die aktuell leistungsfähigsten R-Pakete zur effizienten Auswertung und professionellen Erstellung von publikationsfertigen Grafiken und Tabellen eingesetzt. Damit Sie den vollen Nutzen der Weiterbildung erfahren können, empfiehlt es sich, den kompletten Kurs mit beiden Teilkursen zu belegen.

Zielgruppe der R-Schulung

Der R-Kurs richtet sich an Anwender, Fachkräfte, Doktoranden und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Business Intelligence) und der psychologischen, klinischen, pharmazeutischen und biologischen Forschung, die mit den fortgeschrittenen Verfahren der multivariaten Statistik mehr aus ihren Daten herausholen wollen. Die Verfahren sind dabei in allen empirischen Wissenschaften anwendbar.

Voraussetzungen für den R-Kurs

Die Inhalte des kompletten R-Kurses Grundlagen der Statistik mit R werden vorausgesetzt (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein). Grundlegende Fertigkeiten im Umgang mit R, RStudio und dem Tidyverse – wie Datenimport, Datenaufbereitung, Grafikerstellung und statistische Standardverfahren – werden vorausgesetzt, ständig angewendet und vertieft. Sollten Sie bereits solide statistische Grundkenntnisse haben und kennen sich mit Pearsons r und insbesondere dem t-Test aus, können die Voraussetzungen auch mit der Einführung in die Programmierung mit R geschaffen werden.

Lernziele der R-Schulung

fortgeschrittene Funktionen von R kennen lernen, Daten mit Hilfe der multivariaten Statistik auswerten können, Ergebnisse von multivariaten Verfahren grafisch darstellen, erläutern und interpretieren können, aufgrund einer Fragestellung das geeignete multivariate Verfahren identifizieren und anwenden können

Übungen im R-Kurs

Die Beispiele und Übungsaufgaben stammen aus den Bereichen der Technik, der Medizin, des Marketings, der Marktforschung und den Sozialwissenschaften und lassen sich leicht auf andere Bereiche übertragen. Sie erfolgen in dem R-Kurs mit der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio.

Dauer der R-Schulung

Der R-Kurs Multivariate Datenanalyse mit R besteht aus einem

Die Kursdauer erlaubt es, die Verfahren in der Tiefe kennenzulernen, dass Sie diese professionell anwenden und miteinander kombinieren können. Bei einer geringeren Kursdauer würden die vermittelten Kenntnisse nicht ausreichen, valide Modelle mit hoher Güte und zuverlässigen Prognosen zu entwickeln.

Jede der drei Schulungen kann auch als Inhouse-Schulung in Ihrer Organisation stattfinden.

Alternative und weiterführende Seminare

Diesen R-Kurs gibt es alternativ auch mit der Programmiersprache Python. Nach Abschluss des Kurses Multivariate Datenanalyse mit R können Sie an den folgenden R-Seminaren teilnehmen:

Termine und Preise für Multivariate Datenanalyse mit R

  • Leistungen: Unterricht im zentral gelegenen Seminarraum (bzw. virtuellen Seminarraum bei Zoom), max. 10 Teilnehmer pro Veranstaltung, persönliche Betreuung durch den Dozenten, täglicher Unterricht 9-17 Uhr, umfangreiche Schulungsunterlagen, Schulungszertifikat.
  • Unsere Garantien: Durchführungsgarantie, Best-Price-Garantie, Beste-Technik-Garantie, Gruppengrößengarantie, Zufriedenheitsgarantie, Nutzengarantie, Nachhaltigkeitsgarantie (siehe unten).
  • Buchen ohne Risiko: Keine Vorkasse, Rechnung mit Zahlungsziel 14 Tage nach Seminarende, kostenfreie Stornierung bis 14 Tage vor Seminarbeginn, bei Nichtgefallen Rücktritt bis zum Ende des ersten Seminartags möglich (Rechnung braucht nicht bezahlt zu werden).
  • Preisnachlässe: Organisationen können bei der Buchung von zwei Seminarplätzen im 5-tägigen Komplett-Training kostenlos eine dritte Person anmelden (bei der Buchung von zwei Plätzen können drei Namen an der Kasse angegeben werden). Informationen zu Bildungsurlaub und Ermäßigungen für Arbeitnehmer, Studierende und andere Selbstzahler finden Sie im Kasten auf der rechten Seite (bzw. am Ende der Seite).
  • Hinweise: Sie nehmen mit Ihrem eigenen PC/Laptop teil. Falls auf dem teilnehmenden Computer die Software R mit RStudio nicht installiert werden kann, kann gegen eine geringe Gebühr der Fernzugriff (VNC) auf einen unserer → Schulungslaptops gemietet werden. Präsenzseminare finden zu Ferien- und Messezeiten nicht statt. Bei Teilnahme an einer Präsenzveranstaltung beachten Sie bitte unser Hygienekonzept. Weitere Infos finden Sie → hier.

Sie erhalten eine Rechnung mit tagesaktuellem Datum und Zahlungsziel 14 Tage nach Seminarende.

Seminar Ort Termin Dauer Plätze Preis* +19% MwSt.
Basis-Training Online-SeminarInfos zu unseren Online-Seminaren 12.06. - 14.06.2023 Termin wird garantiert, da bereits gebucht. 3 Tage 0 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  1.345 "> Warteliste
Varianzanalyse Online-SeminarInfos zu unseren Online-Seminaren 15.06. - 16.06.2023 Termin wird garantiert, da bereits gebucht. 2 Tage 0 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  895 "> Warteliste
Komplett-Training Online-SeminarInfos zu unseren Online-Seminaren 12.06. - 16.06.2023 Termin wird garantiert, da bereits gebucht. 5 Tage 0 frei  15% 15 % Online-Rabatt im Preis bereits inkludiert  2.125 "> Warteliste
Basis-Training KölnAdresse und Lage des Veranstaltungsorts 12.06. - 14.06.2023 Termin wird garantiert, da bereits gebucht. 3 Tage 0 frei 1.495 € Warteliste
Varianzanalyse KölnAdresse und Lage des Veranstaltungsorts 15.06. - 16.06.2023 Termin wird garantiert, da bereits gebucht. 2 Tage 0 frei 995 € Warteliste
Komplett-Training KölnAdresse und Lage des Veranstaltungsorts 12.06. - 16.06.2023 Termin wird garantiert, da bereits gebucht. 5 Tage 0 frei 2.490 € Warteliste
Basis-Training Online-SeminarInfos zu unseren Online-Seminaren 18.09. - 20.09.2023 Termin wird garantiert, wenn Sie buchen. 3 Tage > 5 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  1.345 ">
Zeitreihenanalyse Online-SeminarInfos zu unseren Online-Seminaren 21.09. - 22.09.2023 Termin wird garantiert, wenn Sie buchen. 2 Tage > 5 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  895 ">
Komplett-Training Online-SeminarInfos zu unseren Online-Seminaren 18.09. - 22.09.2023 Termin wird garantiert, wenn Sie buchen. 5 Tage > 5 frei  15% 15 % Online-Rabatt im Preis bereits inkludiert  2.125 ">
Basis-Training KölnAdresse und Lage des Veranstaltungsorts 18.09. - 20.09.2023 Termin wird garantiert, wenn Sie buchen. 3 Tage > 5 frei 1.495 €
Zeitreihenanalyse KölnAdresse und Lage des Veranstaltungsorts 21.09. - 22.09.2023 Termin wird garantiert, wenn Sie buchen. 2 Tage > 5 frei 995 €
Komplett-Training KölnAdresse und Lage des Veranstaltungsorts 18.09. - 22.09.2023 Termin wird garantiert, wenn Sie buchen. 5 Tage > 5 frei 2.490 €
Basis-Training Online-SeminarInfos zu unseren Online-Seminaren 18.12. - 20.12.2023 Termin wird garantiert, wenn Sie buchen. 3 Tage > 5 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  1.345 ">
Varianzanalyse Online-SeminarInfos zu unseren Online-Seminaren 21.12. - 22.12.2023 Termin wird garantiert, wenn Sie buchen. 2 Tage > 5 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  895 ">
Komplett-Training Online-SeminarInfos zu unseren Online-Seminaren 18.12. - 22.12.2023 Termin wird garantiert, wenn Sie buchen. 5 Tage > 5 frei  15% 15 % Online-Rabatt im Preis bereits inkludiert  2.125 ">
Basis-Training KölnAdresse und Lage des Veranstaltungsorts 18.12. - 20.12.2023 Termin wird garantiert, wenn Sie buchen. 3 Tage > 5 frei 1.495 €
Varianzanalyse KölnAdresse und Lage des Veranstaltungsorts 21.12. - 22.12.2023 Termin wird garantiert, wenn Sie buchen. 2 Tage > 5 frei 995 €
Komplett-Training KölnAdresse und Lage des Veranstaltungsorts 18.12. - 22.12.2023 Termin wird garantiert, wenn Sie buchen. 5 Tage > 5 frei 2.490 €

*Nettopreise ohne MwSt. Endpreis wird im Warenkorb angezeigt. Angaben wurden am 05.06.2023 um 15:09 Uhr aktualisiert.

Unsere Garantien

Durchführungsgarantie der Weiterbildung Durchführungsgarantie: Wir garantieren Ihnen die Durchführung unserer Seminare ab zwei Anmeldungen. Wird bei einem Präsenzseminar die Mindestteilnehmerzahl nicht erreicht, wird das Präsenzseminar in ein Online-Seminar gewandelt.
Best-Price-Garantie der Seminare Best-Price-Garantie: Bei uns erhalten Sie den besten Preis. Sollten Sie bis zum Seminarbeginn ein von den Inhalten und Leistungen vergleichbares und günstigeres Seminar finden (nicht bei Ihnen selbst), erstatten wir die Differenz.
Beste-Technik-Garantie der Weiterbildung Beste-Technik-Garantie: Wir setzen nur die beste Technik und Software in unseren Online-Seminaren ein. Unsere Seminare zeichen sich von unserer Seite aus durch stabile Verbindungen, hochauflösende Bilder und eine klare und störungsfreie Sprachübertragung aus.
Gruppengrößengarantie der Schulungen Gruppengrößengarantie: Wir garantieren Ihnen, dass unsere Seminare mit nicht mehr als 10 Personen belegt werden. Sie werden von unseren Dozenten in Kleingruppen individuell und persönlich betreut.
Zufriedenheitsgarantie der Weiterbildung Zufriedenheitsgarantie: Sollte ein mehrtägiges Seminar nicht Ihren Erwartungen entsprechen, können Sie Ihre Teilnahme am ersten Tag abbrechen und die Rechnung braucht nicht bezahlt zu werden.
Nutzengarantie der Trainings Nutzengarantie: Sollten Sie nach einem halben Jahr feststellen, dass Sie nichts von dem Gelernten in Ihrem Berufsalltag anwenden konnten, dürfen Sie kostenfrei ein weiteres unserer Seminare besuchen.
Nachhaltigkeitsgarantie der Weiterbildung Nachhaltigkeitsgarantie: Sollte eine Person innerhalb eines halben Jahres nach der Teilnahme an einem unserer Seminare unvorhergesehen für mehr als 6 Monate Ihrer Organisation nicht zur Verfügung stehen (wegen Kündigung, Elternzeit, Erkrankung oder Sonderurlaub), darf eine andere Person Ihres Unternehmens kostenfrei an einem Seminar mit demselben Inhalt teilnehmen.

Offene Schulungen in Multivariate Datenanalyse mit R

Basis-Training Multivariate Datenanalyse mit R
3 Tage Unterricht in Köln oder als Online-Seminar
1.495,00 Euro
1.779,05 Euro inkl. 19% MwSt.
Inhalte beim Aufbauseminar Varianzanalyse oder Cluster-/Faktoranalyse
  • Multiple Regressionsanalyse
    Regressionsmodelle für kontinuierliche und kategoriale Variablen mit Suppressionseffekten (Suppressoranalyse), Moderationseffekten (Moderatoranalyse), nicht-linearen Effekten (polynomiale Regression) und Interaktionseffekten zwischen kategorialen und kontinuierlichen Variablen (dummykodierte Regressionsanalyse); Verfahren zur Auswahl von Prognosevariablen (Betagewichte, Toleranzen) und der Ermittlung des am besten an die Daten angepassten Modells (schrittweise Regression mit AIC/BIC, best subset regression); Residualdiagnostik und Prüfung der Modellprämissen (Angemessenheit des Modells, Unabhängigkeit der Daten, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Erkennung von einflussreichen Datenpunkten); 2D- und 3D-Grafiken von Regressionsmodellen
  • Logistische Regression
    Schätzung der logistischen Regressionsfunktion, Interpretation der Koeffizienten (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko, Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und automatisierte Verfahren zur Ermittlung des optimalen Trennwerts, automatisierte Auswahl von Prognosevariablen, Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo R-Quadrat-Statistiken)
Inhalte beim Aufbauseminar Zeitreihenanalyse
  • Multiple Regressionsanalyse
    Regressionsmodelle für kontinuierliche und kategoriale Variablen mit Suppressionseffekten (Suppressoranalyse), Moderationseffekten (Moderatoranalyse), nicht-linearen Effekten (polynomiale Regression) und Interaktionseffekten zwischen kategorialen und kontinuierlichen Variablen (dummykodierte Regressionsanalyse); Verfahren zur Auswahl von Prognosevariablen (Betagewichte, Toleranzen) und der Ermittlung des am besten an die Daten angepassten Modells (schrittweise Regression mit AIC/BIC, best subset regression); Residualdiagnostik und Prüfung der Modellprämissen (Angemessenheit des Modells, Unabhängigkeit der Daten, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Erkennung von einflussreichen Datenpunkten); 2D- und 3D-Grafiken von Regressionsmodellen
  • Zeitreihenanalyse mit Regressionsmodellen
    Zeitreihenmodelle mit Trend- und Saisonkomponenten, lineare/nichtlineare Trendmodelle mit Berücksichtigung von zyklischen Schwankungen und Strukturbrüchen, Extrapolationsmodelle und Strukturmodelle, Erstellung von Prognosen, Beurteilung der Modellgüte und Prognosegüte
Voraussetzungen
  • Die Inhalte des Seminars Grundlagen der Statistik mit R werden vorausgesetzt (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein).
  • Grundlegende Fertigkeiten im Umgang mit R, RStudio und dem Tidyverse werden vorausgesetzt, ständig angewendet und vertieft. Sollte der Umgang mit R, RStudio und dem Tidyverse nicht vertraut sein (aber es liegen solide Kenntnisse in der Statistik vor), können die Voraussetzungen mit dem Kurs Einführung in die Programmierung mit R geschaffen werden.
Seminartyp und Dauer
  • offene 3-Tages-Schulung mit max. 10 Teilnehmern
  • täglicher Unterricht 9-17 Uhr mit Pausen
Termine und Veranstaltungsorte

Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

Jede gebuchte Schulung wird garantiert durchgeführt!

Aufbau-Training Multivariate Datenanalyse mit R
2 Tage Unterricht in Köln oder als Online-Seminar
995,00 Euro
1.184,05 Euro inkl. 19% MwSt.
Inhalte Varianzanalyse
  • ein-, zwei- und mehrfaktorielle Varianzanalyse (ANOVA)
  • Kontrolle von metrischen Störeinflüssen (ANCOVA)
  • Messwiederholungsdesigns (mixed ANOVA/ANCOVA)
  • robuste Standardfehler bei fehlender Varianzhomogenität
  • Effektstärkemaß: generalisiertes Eta-Quadrat
  • Post-hoc-Tests: Tukey’s HSD und Games-Howell
  • Einzelvergleiche mit Alphafehler-Korrektur: Bonferroni, Holm und Jianjun Li
  • Interaktionsanalyse: ordinale, disordinale und hybride Effekte (Wechselwirkungen)
  • Prüfung der Wirksamkeit von Maßnahmen und Interventionen: Statistische Auswertung von Pretest-Posttest-Designs mit Varianzanalysen
Inhalte Cluster- und Faktorenanalyse
  • Clusteranalyse:
    • hierarchische Clusteranalyse: Distanz- und Ähnlichkeitsmaße, Fusionierungs-Algorithmen (Single-Linkage, Complete-Linkage, Ward-Verfahren)
    • partitionierende Clusteranalysen: k-Means-Clusteranalyse, k-Medoids-Clusteranalyse, CLARA (Clustering Large Applications)
  • Dimensionsreduktion:
    • Faktorenanalyse (EFA, Explorative Factor Analysis): Variablenauswahl, Extraktion und Rotation der Faktoren, Berechnung von Faktorwerten, Hauptachsen- und Reliabilitätsanalyse zur Bewertung der Güte eines Fragebogens
    • Hauptkomponentenanalyse (PCA, Principal Component Analysis): Variablenauswahl, Extraktion und Rotation der Komponenten, Hauptkomponentenanalyse für gemischte Daten (FAMD, Factor Analysis of Mixed Data), multiple Hauptkomponentenanalyse (MFA, Multiple Factor Analysis), hierarchische Clusteranalyse von Hauptkomponenten (HCPC, Hierarchical Clustering on Principal Component)
Inhalte Zeitreihenanalyse mit ARIMA-Modellen
  • Dekomposition von Trend- und Saison-Komponenten
  • Detektion von Random-Walk-Prozessen
  • ARIMA-Modelle: Zeitreihen ohne Saisonalität
  • SARIMA-Modelle: Zeitreihen mit Saisonalität
  • ARIMAX-Modelle: Zeitreihen mit Einflussgrößen
  • SARIMAX-Modelle: Zeitreihen mit Saisonalität und Einflussgrößen
  • VARMAX-Modelle: Multivariate Zeitreihenmodelle
Voraussetzungen
  • Die Inhalte des Basistrainings werden vorausgesetzt. Sollte die Regressionsanlyse nicht mit allen Erweiterungen und Prüfungen der Modellprämissen angewendet werden können, sollte der komplette Kurs gebucht werden.
  • Die Inhalte des Seminars Grundlagen der Statistik mit R werden vorausgesetzt (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein).
  • Grundlegende Fertigkeiten im Umgang mit R, RStudio und dem Tidyverse werden vorausgesetzt, ständig angewendet und vertieft. Sollte der Umgang mit R, RStudio und dem Tidyverse nicht vertraut sein (aber es liegen solide Kenntnisse in der Statistik vor), können die Voraussetzungen mit dem Kurs Einführung in die Programmierung mit R geschaffen werden.
Seminartyp und Dauer
  • offene 2-Tages-Schulung mit max. 10 Teilnehmern
  • täglicher Unterricht 9-17 Uhr mit Pausen
Termine und Veranstaltungsorte

Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

    Jede gebuchte Schulung wird garantiert durchgeführt!

    Komplett-Training Multivariate Datenanalyse mit R
    5 Tage Unterricht in Köln oder als Online-Seminar
    2.490,00 Euro
    2.963,10 Euro inkl. 19% MwSt.
    Inhalte
    • Inhalte der 3-tägigen Basis-Schulung
    • Inhalte der 2-tägigen Aufbau-Schulung
    Voraussetzungen
    • Die Inhalte des Seminars Grundlagen der Statistik mit R werden vorausgesetzt (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein).
    • Grundlegende Fertigkeiten im Umgang mit R, RStudio und dem Tidyverse werden vorausgesetzt, ständig angewendet und vertieft. Sollte der Umgang mit R, RStudio und dem Tidyverse nicht vertraut sein (aber es liegen solide Kenntnisse in der Statistik vor), können die Voraussetzungen mit dem Kurs Einführung in die Programmierung mit R geschaffen werden.
    Seminartyp und Dauer
    • offene 5-Tages-Schulung mit max. 10 Teilnehmer
    • täglicher Unterricht 9-17 Uhr mit Pausen
    Termine und Veranstaltungsorte

    Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

    Jede gebuchte Schulung wird garantiert durchgeführt!

     

    Termine und Preise für den R-Kurs Multivariate Datenanalyse mit R anzeigen