Multivariate Datenanalyse mit Python

Posted on
Der Python-Kurs Multivariate Datenanalyse mit Python führt als Weiterbildung für fortgeschrittene Anwender in die multivariate Statistik ein. Die Anwendung der multivariaten Verfahren mit der Programmiersprache Python wird mit vielen Beispielen und Übungsaufgaben trainiert und vertieft. Das Ziel der Python-Schulung ist es, multivariate Verfahren mit Python anwenden zu können.

Der Nutzen des Seminars besteht darin, dass durch diesen Python-Kurs fortgeschrittene Anwender innerhalb von einer Woche in die Lage versetzt werden, multivariate Verfahren anzuwenden und die Ergebnisse korrekt zu interpretieren. Multivariate Verfahren erlauben es, die Variablen in einem Datensatz gemeinsam zu analysieren und sind somit den univariaten Verfahren des Grundlagenkurses Grundlagen der Statistik mit Python überlegen. Die Vorteile werden im nächsten Abschnitt erläutert.

Alle Bewertungen stammen ausschließlich von Seminarteilnehmern
von Dr. Haug Leuschner. Die Bewertungen werden von einem unab-
hängigen Dienstleister gesammelt, geprüft und ausgewertet.

Das Wichtigste auf einen Blick

Details zum Kurs
Ort: Köln / Online
Typ: Intensivkurs
Größe: 4 – 8 Personen
Dauer: 3 / 2 / 5 Tage
Zeiten: 9 – 17 Uhr
Preise*: 895 € – 2.490 €
Intervall: halbjährlich
Inhalte des Kurses
  • Regressionsanalyse
  • Logistische Regression
  • Zeitreihenanalyse (ARIMA)
  • Clusteranalyse
  • Faktorenanalyse (EFA)
  • Hauptkomponentenanalyse (PCA)
Weitere Infos…

*Nettopreise ohne MwSt. Endpreis wird im Warenkorb angezeigt.

Was sind multivariate Verfahren?

Die Multivariate Statistik untersucht den Einfluss von mehreren statistischen Variablen zugleich. Zusammenhangsstrukturen zwischen den Variablen können nur mit den multivariaten Verfahren der multivariaten Statistik erkannt werden. Damit sind diese den univariaten Verfahren überlegen, bei denen der Einfluss jeder Variablen auf die Messgröße einzeln analysiert wird. Die univariaten Verfahren werden in dem Python-Kurs Grundlagen der Statistik mit Python vermittelt.

mehr...

Zum einen gibt es die strukturentdeckenden Verfahren, mit denen explorativ die Zusammenhänge zwischen Variablen oder Ähnlichkeiten zwischen Beobachungsfällen analysiert werden. So kann im Rahmen eines dimensionsreduzierenden Verfahrens eine hinter vielen Variablen stehende Struktur von wenigen Dimensionen ermittelt werden. Oder es werden mit Hilfe einer Clusteranalyse die beobachteten Fälle einer Stichprobe zu Gruppen ähnlicher Fälle gebündelt. Zum anderen gibt es die strukturprüfenden Verfahren, mit denen geprüft werden kann, welches Erklärungsmuster bzw. welche Struktur von Einflussgrößen die Daten am besten erklärt.

Beide Verfahrensarten der multivariaten Statistik ergänzen sich. So werden beispielsweise mit einer Clusteranalyse beobachtete Fälle mit Hilfe von Merkmalsvariablen in Gruppen ähnlicher Fälle aufgeteilt. Mittels einer nachgeschalteten logistischen Regression können die Merkmale analysiert werden, mit denen die gefundenen Gruppen sich voneinander unterscheiden lassen. Mit den gewonnenen Erkenntnissen können neue Fälle klassifiziert, d. h. deren Gruppenzugehörigkeiten ermittelt werden.

Oder eine Vielzahl von zu analysierenden Variablen werden mit Hilfe einer Faktorenanalyse (EFA, Explorative Factor Analysis) oder einer Hauptkomponentenanalyse (PCA, Principal Component Analysis) auf wenige Dimensionen (Faktoren, Hauptkomponenten) reduziert. Anschließend werden die auf diese Weise ermittelten Dimensionen mit Regressions-, Varianz- oder Zeitreihenanalysen untersucht.

Multivariate Verfahren werden erfolgreich in den verschiedensten Feldern eingesetzt wie beispielsweise in den betriebswirtschaftlichen Anwendungsbereichen (Marktforschung und Marketing), in der Technik (Produktentwicklung und Produktion) und in den wissenschaftlichen Anwendungsbereichen (Naturwissenschaften, Biowissenschaften, Sozialwissenschaften, Medienwissenschaften, Medizin, Pharmazie, Psychologie, Pädagogik, Soziologie usw., um nur einige zu nennen).

Aufbau des Python-Kurses

Der Python-Kurs Multivariate Datenanalyse mit Python besteht aus einem dreitägigen Basistraining und einem zweitägigen Aufbautraining, die voneinander unabhängig besucht werden können. Im Basistraining werden die strukturprüfenden, insbesondere die regressionsanalytischen Verfahren vorgestellt. Im Aufbautraining werden die strukturentdeckenden Verfahren, insbesondere die Zeitreihenanalyse, die Clusteranalyse und die Faktorenanalyse vermittelt. Die Varianzanalyse ist Schwerpunktthema des Aufbaukurses des Python-Seminars Grundlagen der Statistik mit Python.

Beschreibung des dreitägigen Basistrainings

Im dreitägigen Basistraining vom Python-Kurs Multivariate Datenanalyse mit Python werden die regressionsanalytischen Verfahren behandelt. Dazu gehören die multiple Regressionsanalyse, die die linearen und nichtlinearen Zusammenhänge zwischen mehreren Variablen quantitativ beschreibt und erklärt und Prognosen erlaubt, und die logistische Regression, die zur Klassifizierung und Risikoabschätzung von Einzelfällen geeignet ist. Im dreitägigen Basistraining wird bei beiden Verfahren gezeigt, wie lineare, nicht-lineare und kategoriale Einflussgrößen und deren Wechselwirkungen modelliert werden. Mit diesen fortgeschrittenen Kenntnissen können komplexe und realitätsnahe Regressionsmodelle mit hohem Erklärungswert und sehr guten Prognosen entwickelt werden.

Beschreibung des zweitägigen Aufbautrainings

Im zweitägigen Aufbautraining vom Python-Kurs Multivariate Datenanalyse mit Python werden strukturentdeckende Verfahren behandelt, die der Entdeckung von Zusammenhängen zwischen Variablen dienen. Dazu gehören die Zeitreihenanalyse, die Zeitreihen mittels verschiedener Verfahren (exponentielle Prognosemodelle und ARIMA-Modelle in den verschiedensten Varianten) untersucht und Prognosen für zukünftige Entwicklungen erlaubt, die Clusteranalyse, die eine Vielzahl von Fällen zu wenigen Gruppen (Cluster) bündelt, und die explorative Faktorenanalyse (Hauptkomponentenanalyse und Hauptachsenanalyse), die eine Vielzahl von Variablen zu wenigen Dimensionen (Faktoren) reduziert. Mit der logistischen Regression des Basiskurses kann ermittelt werden, mit welchen Variablen die in der Clusteranalyse gefunden Gruppen am besten beschrieben werden können. Als Ergänzung zur Faktorenanalyse wird die Reliabilitätsanalyse behandelt, die die Reliabilität eines Itemsets für einen Faktor prüft. Es wird insbesondere gezeigt, wie mit Hilfe der Faktoren- und Reliabilitätanalyse die Güte eines Fragebogens zur Messung latenter Konstrukte überprüft werden kann.

In den Schulungsunterlagen finden Sie das gesamte Unterrichtsprogramm mit Schritt-für-Schritt-Anleitungen und umfangreichen Musterlösungen zu allen Fallbeispielen und Übungsaufgaben (ca. 500 DIN A5 PDF-Seiten).

Eine Auflistung der Kursinhalte finden Sie → hier.

Nutzen der Weiterbildung

Der Nutzen des Seminars besteht darin, dass Sie durch diesen Python-Kurs innerhalb von einer Woche in die Lage versetzt werden, multivariate Verfahren auf einem hohen Niveau anzuwenden und zu interpretieren. Damit dies gelingt, wird nicht nur das theoretische Hintergrundwissen vermittelt, sondern auch die praktische Anwendung und Umsetzung mit der von Experten im Bereich von Data Science und der künstlichen Intelligenz bevorzugt eingesetzten statistischen Analyse-Umgebung Python mit Spyder. Dabei werden die aktuell leistungsfähigsten Python-Pakete zur effizienten Auswertung und professionellen Erstellung von publikationsfertigen Grafiken und Tabellen eingesetzt. Damit Sie den vollen Nutzen der Weiterbildung erfahren können, empfiehlt es sich, den kompletten Kurs mit beiden Teilkursen zu belegen.

Zielgruppe der Python-Schulung

Der Python-Kurs richtet sich an Anwender, Fachkräfte, Doktoranden und Studierende aus den Bereichen der Sozial- und Marktforschung, der Betriebswirtschaft (Marketing, Business Intelligence) und der psychologischen, klinischen, pharmazeutischen und biologischen Forschung, die mit den fortgeschrittenen Verfahren der multivariaten Statistik mehr aus ihren Daten herausholen wollen.

Voraussetzungen für den Python-Kurs

Die Inhalte des Python-Kurses Grundlagen der Statistik mit Python werden vorausgesetzt (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein). Grundlegende Fertigkeiten im Umgang mit Python und Spyder – wie Datenimport, Datenaufbereitung, Grafikerstellung und statistische Standardverfahren – werden vorausgesetzt, ständig angewendet und vertieft. Wenn der Umgang mit Python und Spyder nicht vertraut sein sollte (aber Sie haben solide statistische Grundkenntnisse und kennen sich mit Pearsons r und dem t-Test aus), können die Voraussetzungen mit der Einführung in die Programmierung mit Python geschaffen werden. Falls Sie einfach nur die Entwicklungsumgebung Spyder nicht kennen sollten (aber die anderen Voraussetzungen sind erfüllt), können Sie entweder an dem Kurs mit einer anderen Entwicklungsumgebung teilnehmen oder alternativ sich in die Entwicklungsumgebung Spyder einarbeiten: Dokumentation zu Spyder und Tutorial zu Spyder.

Der Unterricht des Aufbaukurses setzt außerdem die Kenntnis der Regressionsanalyse voraus. Sonst lassen sich einige Verfahren des Aufbaukurses kaum vermitteln.

Lernziele der Python-Schulung

fortgeschrittene Funktionen von Python kennen lernen, Daten mit Hilfe der multivariaten Statistik auswerten können, Ergebnisse von multivariaten Verfahren grafisch darstellen, erläutern und interpretieren können, aufgrund einer Fragestellung das geeignete multivariate Verfahren identifizieren und anwenden können

Übungen im Python-Kurs

Die Beispiele und Übungsaufgaben stammen aus den Bereichen der Technik, der Medizin, des Marketings, der Marktforschung und den Sozialwissenschaften und lassen sich leicht auf andere Bereiche übertragen. Sie erfolgen in dem Python-Kurs mit der Programmiersprache Python und der Entwicklungsumgebung Spyder aus der Python Anaconda Distribution. Falls Sie Spyder nicht kennen sollten, können Sie entweder an dem Kurs mit einer anderen Entwicklungsumgebung teilnehmen oder alternativ sich in die Entwicklungsumgebung Spyder einarbeiten: Dokumentation zu Spyder und Tutorial zu Spyder.

Dauer der Python-Schulung

Der Python-Kurs Multivariate Datenanalyse mit Python besteht aus einem

Die Kursdauer erlaubt es, die Verfahren in der Tiefe kennenzulernen, dass Sie diese professionell anwenden und miteinander kombinieren können. Bei einer geringeren Kursdauer würden die vermittelten Kenntnisse nicht ausreichen, valide Modelle mit hoher Güte und zuverlässigen Prognosen zu entwickeln.

Jede der drei Schulungen kann auch als Inhouse-Schulung in Ihrer Organisation stattfinden.

Alternative und weiterführende Seminare

Diesen Python-Kurs gibt es alternativ auch mit der statistischen Programmiersprache R. Nach Abschluss des Kurses Multivariate Datenanalyse mit Python können Sie an den folgenden Python-Seminaren teilnehmen:

Termine und Preise für Multivariate Datenanalyse mit Python

  • Leistungen: Unterricht im zentral gelegenen Seminarraum (bzw. virtuellen Seminarraum bei Zoom), max. 10 Teilnehmer pro Veranstaltung, persönliche Betreuung durch den Dozenten, täglicher Unterricht 9-17 Uhr, umfangreiche Schulungsunterlagen, Schulungszertifikat.
  • Unsere Garantien: Durchführungsgarantie, Best-Price-Garantie, Beste-Technik-Garantie, Gruppengrößengarantie, Zufriedenheitsgarantie, Nutzengarantie, Nachhaltigkeitsgarantie (siehe unten).
  • Buchen ohne Risiko: Keine Vorkasse, Rechnung mit Zahlungsziel 14 Tage nach Seminarende, kostenfreie Stornierung bis 14 Tage vor Seminarbeginn, bei Nichtgefallen Rücktritt bis zum Ende des ersten Seminartags möglich (Rechnung braucht nicht bezahlt zu werden).
  • Preisnachlässe: Organisationen können bei der Buchung von zwei Seminarplätzen im 5-tägigen Komplett-Training kostenlos eine dritte Person anmelden (bei der Buchung von zwei Plätzen können drei Namen an der Kasse angegeben werden). Informationen zu Bildungsurlaub und Ermäßigungen für Arbeitnehmer, Studierende und andere Selbstzahler finden Sie im Kasten auf der rechten Seite (bzw. am Ende der Seite).
  • Hinweise: Sie nehmen mit Ihrem eigenen PC/Laptop teil. Falls auf dem teilnehmenden Computer die Python Anaconda Distribution nicht installiert werden kann, kann gegen eine geringe Gebühr der Fernzugriff (VNC) auf einen unserer → Schulungslaptops gemietet werden. Präsenzseminare finden zu Ferien- und Messezeiten nicht statt. Weitere Infos finden Sie → hier.

Sie erhalten eine Rechnung mit tagesaktuellem Datum und Zahlungsziel 14 Tage nach Seminarende.

Seminar Ort Termin Dauer Plätze Preis* +19% MwSt.
Basis-Training Online-SeminarInfos zu unseren Online-Seminaren 02.06. - 04.06.2025 Termin wird garantiert, wenn Sie buchen. 3 Tage > 5 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  1.590 ">
Aufbau-Training Online-SeminarInfos zu unseren Online-Seminaren 05.06. - 06.06.2025 Termin wird garantiert, wenn Sie buchen. 2 Tage > 5 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  1.060 ">
Komplett-Training Online-SeminarInfos zu unseren Online-Seminaren 02.06. - 06.06.2025 Termin wird garantiert, wenn Sie buchen. 5 Tage > 5 frei  15% 15 % Online-Rabatt im Preis bereits inkludiert  2.495 ">

*Nettopreise ohne MwSt. Endpreis wird im Warenkorb angezeigt. Angaben wurden am 15.10.2024 um 05:48 Uhr aktualisiert.

Unsere Garantien

Durchführungsgarantie der Weiterbildung Durchführungsgarantie: Wir garantieren Ihnen die Durchführung unserer Seminare ab zwei Anmeldungen. Wird bei einem Präsenzseminar die Mindestteilnehmerzahl nicht erreicht, wird das Präsenzseminar in ein Online-Seminar gewandelt.
Best-Price-Garantie der Seminare Best-Price-Garantie: Bei uns erhalten Sie den besten Preis. Sollten Sie bis zum Seminarbeginn ein von den Inhalten und Leistungen vergleichbares und günstigeres Seminar finden (nicht bei Ihnen selbst), erstatten wir die Differenz.
Beste-Technik-Garantie der Weiterbildung Beste-Technik-Garantie: Wir setzen nur die beste Technik und Software in unseren Online-Seminaren ein. Unsere Seminare zeichen sich von unserer Seite aus durch stabile Verbindungen, hochauflösende Bilder und eine klare und störungsfreie Sprachübertragung aus.
Gruppengrößengarantie der Schulungen Gruppengrößengarantie: Wir garantieren Ihnen, dass unsere Seminare mit nicht mehr als 10 Personen belegt werden. Sie werden von unseren Dozenten in Kleingruppen individuell und persönlich betreut.
Zufriedenheitsgarantie der Weiterbildung Zufriedenheitsgarantie: Sollte ein mehrtägiges Seminar nicht Ihren Erwartungen entsprechen, können Sie Ihre Teilnahme am ersten Tag abbrechen und die Rechnung braucht nicht bezahlt zu werden.
Nutzengarantie der Trainings Nutzengarantie: Sollten Sie nach einem halben Jahr feststellen, dass Sie nichts von dem Gelernten in Ihrem Berufsalltag anwenden konnten, dürfen Sie kostenfrei ein weiteres unserer Seminare besuchen.
Nachhaltigkeitsgarantie der Weiterbildung Nachhaltigkeitsgarantie: Sollte eine Person innerhalb eines halben Jahres nach der Teilnahme an einem unserer Seminare unvorhergesehen für mehr als 6 Monate Ihrer Organisation nicht zur Verfügung stehen (wegen Kündigung, Elternzeit, Erkrankung oder Sonderurlaub), darf eine andere Person Ihres Unternehmens kostenfrei an einem Seminar mit demselben Inhalt teilnehmen.

Offene Schulungen in Multivariate Datenanalyse mit Python

Basis-Training Multivariate Datenanalyse mit Python
3 Tage Unterricht als Online-Seminar
1.770,00 Euro
2.106,30 Euro inkl. 19% MwSt.
Inhalte
  • Regressionsanalyse: Regressionsmodelle für kontinuierliche Variablen mit linearen und nicht-linearen Effekten, Moderationseffekten (Wechselwirkungen), Suppressionseffekten (Kontrolle von Störeinflüssen) und Interaktionseffekten zwischen kontinuierlichen und kategorialen Einflussgrößen (Populationsunterschiede); Verfahren zur Auswahl von Prognosevariablen (Betagewichte, Toleranzen) und der Ermittlung des am besten an die Daten angepassten Modells (schrittweise Regression mit AIC/BIC); Residualdiagnostik, Prüfung der Modellprämissen (Angemessenheit des Modells, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Erkennung von einflussreichen Datenpunkten) und Maßnahmen bei Verletzungen (Ausschluss ungeeigneter Fälle, Selektion und Aggregation von Variablen)
  • Logistische Regression: Regressionsmodelle für kategoriale Variablen, Interpretation der Koeffizienten der logistischen Regressionsfunktion (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko; Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und Ermittlung des optimalen Trennwerts; Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo R-Quadrat-Statistiken)
Voraussetzungen
  • Die Inhalte des Seminars Grundlagen der Statistik mit Python werden vorausgesetzt (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein).
  • Grundlegende Fertigkeiten im Umgang mit Python und Spyder werden vorausgesetzt, ständig angewendet und vertieft. Sollte nur der Umgang mit Python und Spyder nicht vertraut sein (aber die anderen Voraussetzungen sind erfüllt), können die Voraussetzungen mit der Einführung in die Programmierung mit Python geschaffen werden.
  • Falls Sie Spyder nicht kennen sollten (aber die anderen Voraussetzungen sind erfüllt), können Sie entweder an dem Kurs mit einer anderen Entwicklungsumgebung teilnehmen oder alternativ sich in die Entwicklungsumgebung Spyder einarbeiten: Dokumentation zu Spyder und Tutorial zu Spyder.
Seminartyp und Dauer
  • offene 3-Tages-Schulung mit max. 10 Teilnehmern
  • täglicher Unterricht 9-17 Uhr mit Pausen
Termine und Veranstaltungsorte

Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

Aufbau-Training Multivariate Datenanalyse mit Python
2 Tage Unterricht als Online-Seminar
1.180,00 Euro
1.404,20 Euro inkl. 19% MwSt.
Inhalte
  • Zeitreihenanalyse: Glättungsmethoden und LOESS-Dekomposition von Trend- und Saison-Komponenten, ARIMA-Modelle, Erstellung von Prognosen, Beurteilung der Modellgüte und Prognosegüte, grafische Darstellung von Zeitreihen
  • Clusteranalyse: hierarchische Clusteranalyse (Distanz- und Ähnlichkeitsmaße, Fusionierungs-Algorithmen: Single-Linkage, Complete-Linkage und Ward-Verfahren), partitionierende Clusteranalyse (k-Means-Clusteranalyse)
  • Dimensionsreduzierende Verfahren: Faktorenanalyse (EFA, Explorative Factor Analysis) und Hauptkomponentenanalyse (PCA, Principal Component Analysis), Variablenauswahl, Extraktion und Rotation der Dimensionen, Berechnung von Faktorwerten
Voraussetzungen
  • Die Inhalte des Basistrainings werden vorausgesetzt. Sollte die Regressionsanlyse nicht mit allen Erweiterungen und Prüfungen der Modellprämissen angewendet werden können, sollte der komplette Kurs gebucht werden.
  • Die Inhalte des Seminars Grundlagen der Statistik mit Python werden vorausgesetzt (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein).
  • Grundlegende Fertigkeiten im Umgang mit Python und Spyder werden vorausgesetzt, ständig angewendet und vertieft. Sollte nur der Umgang mit Python und Spyder nicht vertraut sein (aber die anderen Voraussetzungen sind erfüllt), können die Voraussetzungen mit der Einführung in die Programmierung mit Python geschaffen werden.
  • Falls Sie Spyder nicht kennen sollten (aber die anderen Voraussetzungen sind erfüllt), können Sie entweder an dem Kurs mit einer anderen Entwicklungsumgebung teilnehmen oder alternativ sich in die Entwicklungsumgebung Spyder einarbeiten: Dokumentation zu Spyder und Tutorial zu Spyder.
Seminartyp und Dauer
  • offene 2-Tages-Schulung mit max. 10 Teilnehmern
  • täglicher Unterricht 9-17 Uhr mit Pausen
Termine und Veranstaltungsorte

Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

Komplett-Training Multivariate Datenanalyse mit Python
5 Tage Unterricht als Online-Seminar
2.950,00 Euro
3.510,50 Euro inkl. 19% MwSt.
Inhalte
  • Inhalte der 3-tägigen Basis-Schulung
  • Inhalte der 2-tägigen Aufbau-Schulung
Voraussetzungen
  • Die Inhalte des Seminars Grundlagen der Statistik mit Python werden vorausgesetzt (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein).
  • Grundlegende Fertigkeiten im Umgang mit Python und Spyder werden vorausgesetzt, ständig angewendet und vertieft. Sollte nur der Umgang mit Python und Spyder nicht vertraut sein (aber die anderen Voraussetzungen sind erfüllt), können die Voraussetzungen mit der Einführung in die Programmierung mit Python geschaffen werden.
  • Falls Sie Spyder nicht kennen sollten (aber die anderen Voraussetzungen sind erfüllt), können Sie entweder an dem Kurs mit einer anderen Entwicklungsumgebung teilnehmen oder alternativ sich in die Entwicklungsumgebung Spyder einarbeiten: Dokumentation zu Spyder und Tutorial zu Spyder.
Seminartyp und Dauer
  • offene 5-Tages-Schulung mit max. 10 Teilnehmer
  • täglicher Unterricht 9-17 Uhr mit Pausen
Termine und Veranstaltungsorte

Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

 

Termine und Preise für den Python-Kurs Multivariate Datenanalyse mit Python anzeigen