Multivariate Datenanalyse mit R

Posted on
Print Friendly, PDF & Email
Der R-Kurs Multivariate Datenanalyse mit R führt als Weiterbildung für fortgeschrittene Anwender in die multivariate Statistik ein. Die Anwendung der multivariaten Verfahren mit der statistischen Programmiersprache R unter der Entwicklungsoberfläche RStudio wird mit vielen Beispielen und Übungsaufgaben trainiert und vertieft. Das Ziel der R-Schulung ist es, multivariate Verfahren mit R unter RStudio anwenden zu können.

Was sind multivariate Verfahren?

Die Multivariate Statistik untersucht den Einfluss von mehreren statistischen Variablen zugleich. Zusammenhangsstrukturen zwischen den Variablen können nur mit den multivariaten Verfahren der multivariaten Statistik erkannt werden. Damit sind diese den univariaten Verfahren überlegen, bei denen der Einfluss jeder Variablen auf die Messgröße einzeln analysiert wird. Die univariaten Verfahren werden in dem R-Kurs Grundlagen der Statistik mit R für Anfänger und dem R-Kurs Grundlagen der Statistik mit R für Programmierer vermittelt.

Multivariate Verfahren wollen im Wesentlichen die in einem Datensatz enthaltene Zahl der Variablen reduzieren, im Ergebnis aber die Gesamtheit der enthaltenen Information berücksichtigen. Dazu wird die Struktur der Daten analysiert. Entweder gibt man im Rahmen der multivariaten Statistik eine Struktur vor und prüft mit Hilfe strukturprüfender Verfahren, ob die Daten mit der vorgegebenen Struktur zusammenpassen, oder man versucht im Rahmen der explorativen Statistik, die Struktur zu entdecken und aus den Daten zu extrahieren.

Beide Verfahrensarten der multivariaten Statistik ergänzen sich häufig. So werden beispielsweise mit Hilfe der Clusteranalyse verschiedene, voneinander abgrenzbare Kundengruppen bestimmt. Mittels einer nachgeschalteten Diskriminanzanalyse können dann die Merkmale analysiert werden, mit denen die gefundenen Gruppen sich voneinander unterscheiden lassen. Mit den gewonnenen Erkenntnissen kann bei neuen Fällen die Gruppenzugehörigkeit prognostiziert werden. Oder eine Vielzahl von zu analysierenden Variablen werden zunächst mit Hilfe einer Faktorenanalyse auf wenige Faktoren reduziert. Anschließend werden die auf diese Weise ermittelten Faktoren mit Regressions-, Varianz- oder Zeitreihenanalysen untersucht.

Multivariate Verfahren werden erfolgreich in den verschiedensten Feldern eingesetzt wie beispielsweise in den betriebswirtschaftlichen Anwendungsbereichen (Marktforschung und Marketing), in der Technik (Produktentwicklung und Produktion) und in den wissenschaftlichen Anwendungsbereichen (Naturwissenschaften, Biowissenschaften, Sozialwissenschaften, Medienwissenschaften, Medizin, Pharmazie, Psychologie, Pädagogik, Soziologie usw., um nur einige zu nennen).

Alle Bewertungen stammen ausschließlich von Seminarteilnehmern von Dr. Haug Leuschner.
Die Bewertungen werden von einem unabhängigen Dienstleister gesammelt, geprüft und ausgewertet.

Aufbau der R-Schulung

Der R-Kurs Multivariate Datenanalyse mit R besteht aus einem dreitägigen Basistraining und einem zweitägigen Aufbautraining, die voneinander unabhängig besucht werden können. Im Basistraining werden die strukturprüfenden, insbesondere die regressionsanalytischen Verfahren vorgestellt. Im Aufbautraining werden die strukturentdeckenden Verfahren, insbesondere die Zeitreihenanalyse, die Clusteranalyse und die Faktorenanalyse vermittelt.

Im dreitägigen Basistraining des R-Seminars Multivariate Datenanalyse mit R werden die regressionsanalytischen Verfahren behandelt. Dazu gehören die multiple Regressionsanalyse, die die linearen und nichtlinearen Zusammenhänge zwischen mehreren Variablen quantitativ beschreibt und erklärt und Prognosen erlaubt, und die logistische Regression, die zur Klassifizierung und Risikoabschätzung von Einzelfällen geeignet ist. Es wird mit vielen Beispielen und Aufgaben gezeigt, wie lineare, nicht-lineare und kategoriale Einflussgrößen und deren Wechselwirkungen modelliert werden. Des Weiteren werden Methoden behandelt, mit denen die für die Zielgröße bedeutsamen Prädiktoren bestimmt (relative weights und shapley values) und das beste Prognosemodell gefunden und bewertet werden kann (stepwise regression und best subset regression). Mit diesen fortgeschrittenen Kenntnissen können komplexe und realitätsnahe Regressionsmodelle mit hohem Erklärungswert und sehr guten Prognosen entwickelt werden.

Im zweitägigen Aufbautraining des R-Seminars Multivariate Datenanalyse mit R werden strukturentdeckende Verfahren behandelt, die der Entdeckung von Zusammenhängen zwischen Variablen dienen. Dazu gehören die Zeitreihenanalyse, die Zeitreihen mittels verschiedener Verfahren (Zeitregression, exponentielle Prognosemodelle und ARIMA-Modelle in den verschiedensten Varianten) untersucht und Prognosen für zukünftige Entwicklungen erlaubt, die Clusteranalyse, die eine Vielzahl von Fällen zu wenigen Gruppen (Cluster) bündelt, und die explorative Faktorenanalyse (Hauptkomponentenanalyse und Hauptachsenanalyse), die eine Vielzahl von Variablen zu wenigen Dimensionen (Faktoren) reduziert. Als Ergänzung zur Clusteranalyse wird die Diskriminanzanalyse besprochen, mit der analysiert werden kann, mit welchen Variablen die in der Clusteranalyse gefunden Gruppen am besten beschrieben werden können. Als Ergänzung zur Faktorenanalyse wird die Reliabilitätsanalyse behandelt, die die Reliabilität eines Itemsets für einen Faktor prüft. Es wird insbesondere gezeigt, wie mit Hilfe der Faktoren- und Reliabilitätanalyse die Güte eines Fragebogens zur Messung latenter Konstrukte überprüft werden kann.

Die Varianzanalyse ist Schwerpunktthema des Aufbaukurses des R-Seminars Statistik-Grundlagen mit R für Programmierer.

Zielgruppe der R-Schulung

Der R-Kurs richtet sich an Anwender, Fachkräfte, Doktoranden und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Business Intelligence) und der psychologischen, klinischen, pharmazeutischen und biologischen Forschung, die mit den fortgeschrittenen Verfahren der multivariaten Statistik mehr aus ihren Daten herausholen wollen.

Voraussetzungen für den R-Kurs

Die Inhalte eines der beiden R-Kurse Grundlagen der Statistik mit R für Anfänger oder Grundlagen der Statistik mit R für Programmierer werden vorausgesetzt (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein). Grundlegende Fertigkeiten im Umgang mit R und RStudio – wie Datenimport, Datenaufbereitung, Grafikerstellung und statistische Standardverfahren – werden vorausgesetzt, ständig angewendet und vertieft. Wenn der Umgang mit R und RStudio nicht vertraut sein sollte (aber Sie haben solide statistische Grundkenntnisse und kennen sich mit Pearsons r und dem t-Test aus), können die Voraussetzungen mit der Einführung in die Programmierung mit R geschaffen werden.

Der Unterricht des Aufbaukurses setzt außerdem die Kenntnis der Regressionsanalyse voraus. Sonst lassen sich die Verfahren der Zeitreihenanalyse und der Diskriminanzanalyse kaum vermitteln.

Lernziele der R-Schulung

fortgeschrittene Funktionen von R kennen lernen, Daten mit Hilfe der multivariaten Statistik auswerten können, Ergebnisse von multivariaten Verfahren grafisch darstellen, erläutern und interpretieren können, aufgrund einer Fragestellung das geeignete multivariate Verfahren identifizieren und anwenden können

Übungen im R-Kurs

Die Beispiele und Übungsaufgaben stammen aus den Bereichen der Technik, der Medizin, des Marketings, der Marktforschung und den Sozialwissenschaften und lassen sich leicht auf andere Bereiche übertragen. Sie erfolgen in dem R-Kurs mit der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio.

Dauer der R-Schulung

Der R-Kurs Multivariate Datenanalyse mit R besteht aus einem

Die Kursdauer erlaubt es, die Verfahren in der Tiefe kennenzulernen, dass Sie diese professionell anwenden und miteinander kombinieren können. Bei einer geringeren Kursdauer würden die vermittelten Kenntnisse nicht ausreichen, valide Modelle mit hoher Güte und zuverlässigen Prognosen zu entwickeln.

Jede der drei Schulungen kann auch als Inhouse-Schulung in Ihrer Organisation stattfinden.

Alternative und weiterführende Seminare

Diesen R-Kurs gibt es alternativ auch mit der Programmiersprache Python. Nach Abschluss des Kurses Multivariate Datenanalyse mit R können Sie an den folgenden R-Seminaren teilnehmen:

Termine und Preise für Multivariate Datenanalyse mit R

  • Leistungen: Unterricht im zentral gelegenen Seminarraum (bzw. virtuellen Seminarraum bei Zoom), max. 10 Teilnehmer pro Veranstaltung, persönliche Betreuung durch den Dozenten, täglicher Unterricht 9-17 Uhr, umfangreiche Schulungsunterlagen, Schulungszertifikat.
  • Unsere Garantien: Durchführungsgarantie, Best-Price-Garantie, Beste-Technik-Garantie, Gruppengrößengarantie, Zufriedenheitsgarantie, Nutzengarantie, Nachhaltigkeitsgarantie (siehe unten).
  • Buchen ohne Risiko: Keine Vorkasse, Rechnung mit Zahlungsziel 14 Tage nach Seminarende, kostenfreie Stornierung bis 14 Tage vor Seminarbeginn, bei Nichtgefallen Rücktritt bis zum Ende des ersten Seminartags möglich (Rechnung braucht nicht bezahlt zu werden).
  • Preisnachlässe: Online-Seminare sind 10 % preisgünstiger als Präsenzseminare. Wenn Sie die komplette Weiterbildung in derselben Woche buchen, sparen Sie 100 Euro. Organisationen können bei der Buchung von zwei Seminarplätzen im 5-tägigen Komplett-Training kostenlos eine dritte Person anmelden (bei der Buchung von zwei Plätzen können drei Namen an der Kasse angegeben werden). Informationen zu Bildungsurlaub und Ermäßigungen für Arbeitnehmer, Studierende und andere Selbstzahler finden Sie im Kasten auf der rechten Seite (bzw. am Ende der Seite).
  • Hinweise: Sie nehmen mit Ihrem eigenen PC/Laptop teil. Falls auf dem teilnehmenden Computer die Software R mit RStudio nicht installiert werden kann, kann gegen eine geringe Gebühr der Fernzugriff (VNC) auf einen unserer → Schulungslaptops gemietet werden. Bei Teilnahme an einer Präsenzveranstaltung beachten Sie bitte unser Hygienekonzept. Weitere Infos finden Sie → hier.
Seminar Ort Termin Dauer Plätze Preis +19% MwSt.
Basis-Training Online-SeminarInfos zu unseren Online-Seminaren 06.12. - 08.12.2021 3 Tage > 5 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  1.345
Aufbau-Training Online-SeminarInfos zu unseren Online-Seminaren 09.12. - 10.12.2021 2 Tage > 5 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  895
Komplett-Training Online-SeminarInfos zu unseren Online-Seminaren 06.12. - 10.12.2021 5 Tage > 5 frei  20% 20 % Online-Rabatt im Preis bereits inkludiert  1.995
Basis-Training KölnAdresse und Lage des Veranstaltungsorts 06.12. - 08.12.2021 3 Tage > 5 frei 1.495 €
Aufbau-Training KölnAdresse und Lage des Veranstaltungsorts 09.12. - 10.12.2021 2 Tage > 5 frei 995 €
Komplett-Training KölnAdresse und Lage des Veranstaltungsorts 06.12. - 10.12.2021 5 Tage > 5 frei 2.390 €

Die Angaben wurden am 04.08.2021 um 03:06 Uhr aktualisiert.

Unsere Garantien

Durchführungsgarantie der Weiterbildung Durchführungsgarantie: Wir garantieren Ihnen die Durchführung unserer Seminare. Ohne Anmeldung kann jedoch ein Termin innerhalb von sechs Wochen vor Beginn jederzeit ersatzlos gestrichen werden.
Best-Price-Garantie der Seminare Best-Price-Garantie: Bei uns erhalten Sie den besten Preis. Sollten Sie bis zum Seminarbeginn ein von den Inhalten und Leistungen vergleichbares und günstigeres Seminar finden (nicht bei Ihnen selbst), erstatten wir die Differenz.
Beste-Technik-Garantie der Weiterbildung Beste-Technik-Garantie: Wir setzen nur die beste Technik und Software in unseren Online-Seminaren ein. Unsere Seminare zeichen sich von unserer Seite aus durch stabile Verbindungen, hochauflösende Bilder und eine klare und störungsfreie Sprachübertragung aus.
Gruppengrößengarantie der Schulungen Gruppengrößengarantie: Wir garantieren Ihnen, dass unsere Seminare mit nicht mehr als 10 Personen belegt werden. Sie werden von unseren Dozenten in Kleingruppen individuell und persönlich betreut.
Zufriedenheitsgarantie der Weiterbildung Zufriedenheitsgarantie: Sollte ein mehrtägiges Seminar nicht Ihren Erwartungen entsprechen, können Sie Ihre Teilnahme am ersten Tag abbrechen und Sie erhalten Ihr Geld wieder zurück.
Nutzengarantie der Trainings Nutzengarantie: Sollten Sie nach einem halben Jahr feststellen, dass Sie nichts von dem Gelernten in Ihrem Berufsalltag anwenden konnten, dürfen Sie kostenfrei ein weiteres unserer Seminare besuchen.
Nachhaltigkeitsgarantie der Weiterbildung Nachhaltigkeitsgarantie: Sollte eine Person innerhalb eines halben Jahres nach der Teilnahme an einem unserer Seminare unvorhergesehen für mehr als 6 Monate Ihrer Organisation nicht zur Verfügung stehen (wegen Kündigung, Elternzeit, Erkrankung oder Sonderurlaub), darf eine andere Person Ihres Unternehmens kostenfrei an einem Seminar mit demselben Inhalt teilnehmen.

Offene Schulungen in Multivariate Datenanalyse mit R

Basis-Training Multivariate Datenanalyse mit R
in Köln, Berlin, Frankfurt, Hamburg, München oder als Online-Seminar
1.495,00 Euro
(1.779,05 Euro inkl. 19% MwSt.)
Inhalte
  • Multiple Regressionsanalyse
    Regressionsmodelle für kontinuierliche und kategoriale Variablen mit Suppressionseffekten (Suppressoranalyse), Moderationseffekten (Moderatoranalyse), nicht-linearen Effekten (polynomiale Regression) und Interaktionseffekten zwischen kategorialen und kontinuierlichen Variablen (dummykodierte Regressionsanalyse); Verfahren zur Auswahl von Prognosevariablen (shapley values, relative weights) und der Ermittlung des am besten an die Daten angepassten Modells (schrittweise Regression mit AIC/BIC, best subset regression); Residualdiagnostik und Prüfung der Modellprämissen (Angemessenheit des Modells, Unabhängigkeit der Daten, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Erkennung von einflussreichen Datenpunkten); 2D- und 3D-Grafiken von Regressionsmodellen
  • Logistische Regression
    Schätzung der logistischen Regressionsfunktion, Interpretation der Koeffizienten (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko, Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und automatisierte Verfahren zur Ermittlung des optimalen Trennwerts, automatisierte Auswahl von Prognosevariablen, Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo R-Quadrat-Statistiken)
Voraussetzungen
Seminartyp und Dauer
  • offene 3-Tages-Schulung mit max. 10 Teilnehmern
  • täglicher Unterricht 9-17 Uhr mit Pausen
Termine und Veranstaltungsorte

Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

Jede gebuchte Schulung wird garantiert durchgeführt!

Aufbau-Training Multivariate Datenanalyse mit R
in Köln, Berlin, Frankfurt, Hamburg, München oder als Online-Seminar
995,00 Euro
(1.184,05 Euro inkl. 19% MwSt.)
Inhalte
  • Zeitreihenanalyse
    Glättungsmethoden und LOESS-Dekomposition von Trend- und Saison-Komponenten; Zeitregressionsmodelle, exponentielle Prognosemodelle (State-Space-Modelle) und ARIMA-Modelle; Erstellung von Prognosen, Beurteilung der Modellgüte und Prognosegüte, grafische Darstellung von Zeitreihen
  • Clusteranalyse
    hierarchische Clusteranalyse (Distanz- und Ähnlichkeitsmaße, Fusionierungs-Algorithmen: Single-Linkage, Complete-Linkage, Ward), k-Means-Clusteranalyse
  • Diskriminanzanalyse
    Schätzung der Diskriminanzfunktion, Prüfung der Modellgüte und der Eignung von Variablen, automatisierte Auswahl von Variablen, Klassifikation von neuen Fällen
  • Explorative Faktorenanalyse
    Hauptachsenanalyse (EFA), Hauptkomponentenanalyse (PCA), Extraktion und Rotation der Faktoren, Variablenauswahl, Modellgüte, Berechnung von Faktorwerten
  • Reliabilitätsanalyse
    Indikatorreliabilität: Faktorladungen, Kommunalitäten, Cronbachs Alpha (ohne Item), Item-To-Skala-Korrelation; Faktorreliabilität: Cronbachs Alpha, Einheitsstruktur
Voraussetzungen
  • Die Inhalte des Basistrainings werden vorausgesetzt. Sollte die Regressionsanlyse nicht mit allen Erweiterungen und Prüfungen der Modellprämissen angewendet werden können, sollte der komplette Kurs gebucht werden.
  • Die Inhalte eines der beiden Seminare Grundlagen der Statistik mit R für Anfänger oder Grundlagen der Statistik mit R für Programmierer werden vorausgesetzt (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein).
  • Grundlegende Fertigkeiten im Umgang mit R und RStudio werden vorausgesetzt, ständig angewendet und vertieft. Sollte nur der Umgang mit R und RStudio nicht vertraut sein (aber die anderen Voraussetzungen sind erfüllt), können die Voraussetzungen mit dem Kurs Einführung in die Programmierung mit R geschaffen werden.
Seminartyp und Dauer
  • offene 2-Tages-Schulung mit max. 10 Teilnehmern
  • täglicher Unterricht 9-17 Uhr mit Pausen
Termine und Veranstaltungsorte

Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

Jede gebuchte Schulung wird garantiert durchgeführt!

Komplett-Training Multivariate Datenanalyse mit R
in Köln, Berlin, Frankfurt, Hamburg, München oder als Online-Seminar
2.490,00 Euro
(2.963,10 Euro inkl. 19% MwSt.)
Inhalte
  • Inhalte der 3-tägigen Basis-Schulung
  • Inhalte der 2-tägigen Aufbau-Schulung
  • Als Komplett-Schulung buchen und 100 Euro sparen!
Voraussetzungen
Seminartyp und Dauer
  • offene 5-Tages-Schulung mit max. 10 Teilnehmer
  • täglicher Unterricht 9-17 Uhr mit Pausen
Termine und Veranstaltungsorte

Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

Jede gebuchte Schulung wird garantiert durchgeführt!

 

Termine und Preise für den R-Kurs Multivariate Datenanalyse mit R anzeigen