Multivariate Datenanalyse mit Python

Posted on
Print Friendly, PDF & Email
Der Python Kurs Multivariate Datenanalyse mit Python führt in die multivariate Statistik ein. Die Anwendung der multivariaten Verfahren mit der statistischen Programmiersprache Python unter der Entwicklungsumgebung JupyterLab aus der Anaconda-Distribution wird auf unseren Schulungslaptops mit vielen Beispielen und Übungsaufgaben trainiert und vertieft. Das Ziel der Python Schulung ist es, multivariate Verfahren mit Python anwenden zu können.

Was sind multivariate Verfahren?

Die Multivariate Datenanalyse untersucht den Einfluss von mehreren statistischen Variablen zugleich. Zusammenhangsstrukturen zwischen den Variablen können nur mit den multivariaten Verfahren der multivariaten Statistik erkannt werden. Damit sind diese den univariaten Verfahren überlegen, bei denen der Einfluss jeder Variablen auf die Messgröße einzeln analysiert wird. Die univariaten Verfahren werden in dem Python-Kurs Grundlagen der Statistik mit Python vermittelt.

Multivariate Verfahren wollen im Wesentlichen die in einem Datensatz enthaltene Zahl der Variablen reduzieren, im Ergebnis aber die Gesamtheit der enthaltenen Information berücksichtigen. Dazu wird die Struktur der Daten analysiert. Entweder gibt man im Rahmen der induktiven Statistik eine Struktur vor und prüft mit Hilfe strukturprüfender Verfahren, ob die Daten mit der vorgegebenen Struktur zusammenpassen, oder man versucht im Rahmen der explorativen Statistik, die Struktur zu entdecken und aus den Daten zu extrahieren.

Beide Verfahrensarten der multivariaten Statistik ergänzen sich häufig. So werden beispielsweise mit Hilfe der Clusteranalyse verschiedene, voneinander abgrenzbare Kundengruppen bestimmt. Mittels einer nachgeschalteten Diskriminanzanalyse können dann die Merkmale analysiert werden, mit denen die gefundenen Gruppen sich voneinander unterscheiden lassen. Mit den gewonnenen Erkenntnissen kann bei neuen Fällen die Gruppenzugehörigkeit prognostiziert werden. Oder eine Vielzahl von zu analysierenden Variablen werden zunächst mit Hilfe einer Faktorenanalyse auf wenige Faktoren reduziert. Anschließend werden die auf diese Weise ermittelten Faktoren mit Regressions-, Varianz- oder Zeitreihenanalysen untersucht.

Multivariate Verfahren werden erfolgreich in den verschiedensten Feldern eingesetzt wie beispielsweise in den betriebswirtschaftlichen Anwendungsbereichen (Business Intelligence, Marktforschung und Marketing), in der Technik (Produktentwicklung und Produktion) und in den wissenschaftlichen Anwendungsbereichen (z. B. Medizin, Pharmazie, Biowissenschaften, Psychologie, Pädagogik, Soziologie).

Inhalte der Python Schulung

In den ersten drei Tagen (Basiskurs) vom Python Kurs Multivariate Datenanalyse mit Python werden die regressionsanalytischen Verfahren behandelt, die aufeinander aufbauen. Dazu gehören die multiple Regressionsanalyse, die die linearen und nichtlinearen Zusammenhänge zwischen mehreren Variablen quantitativ beschreibt und erklärt und Prognosen erlaubt, die logistische Regression, die zur Klassifizierung und Risikoabschätzung von Einzelfällen geeignet ist und die Zeitregression, die Zeitreihen mittels der multiplen Regression in mehrere Komponenten zerlegt und Prognosen für zukünftige Entwicklungen erlaubt. Im dreitägigen Basistraining wird gezeigt, wie lineare, nicht-lineare und kategoriale Einflussgrößen und deren Wechselwirkungen modelliert werden. Mit diesen fortgeschrittenen Kenntnissen können komplexe und realitätsnahe Regressionsmodelle mit hohem Erklärungswert und sehr guten Prognosen entwickelt werden.

In den letzten beiden Tagen (Aufbaukurs) vom Python Kurs Multivariate Datenanalyse mit Python werden strukturentdeckende Verfahren behandelt, die der Entdeckung von Zusammenhängen zwischen Variablen dienen. Dazu gehören die Zeitreihenanalyse, die Zeitreihen mittels verschiedener Verfahren (exponentielle Prognosemodelle und ARIMA-Modelle) untersucht und Prognosen für zukünftige Entwicklungen erlaubt, die Clusteranalyse, die eine Vielzahl von Fällen zu wenigen Gruppen (Cluster) bündelt, und die explorative Faktorenanalyse, die eine Vielzahl von Variablen zu wenigen Dimensionen (Faktoren) reduziert. Als Ergänzung zur Clusteranalyse wird die Diskriminanzanalyse besprochen, mit der analysiert werden kann, mit welchen Variablen die in der Clusteranalyse gefunden Gruppen am besten beschrieben werden können. Als Ergänzung zur Faktorenanalyse wird die Reliabilitätsanalyse behandelt, die die Eignung und Reliabilität eines Itemsets für einen Faktor prüft. Es wird insbesondere gezeigt, wie mit Hilfe der Faktoren- und Reliabilitätanalyse die Güte eines Fragebogens zur Messung latenter Dimensionen überprüft werden kann.

Die Varianzanalyse ist Schwerpunktthema im Aufbaukurs des Grundlagenseminars.

 

Alle Bewertungen stammen ausschließlich von Seminarteilnehmern von Dr. Haug Leuschner.
Die Bewertungen werden von einem unabhängigen Dienstleister gesammelt, geprüft und ausgewertet.

Zielgruppe der Python Schulung

Der Python Kurs richtet sich an Anwender, Fachkräfte, Doktoranden und Studierende aus den Bereichen der Sozial- und Marktforschung, den Wirtschaftswissenschaften und der Betriebswirtschaft (Marketing, Business Intelligence) und der psychologischen, klinischen, pharmazeutischen und biologischen Forschung, die mit den fortgeschrittenen Verfahren der multivariaten Statistik mehr aus ihren Daten herausholen wollen.

Voraussetzungen für den Python Kurs

Erfahrungen mit Python unter Verwendung von JupyterLab und die Inhalte des Seminars Grundlagen der Statistik mit Python (Interpretation von Korrelationskoeffizienten wie Pearsons r und Signifikanztests wie dem t-Test sollten bekannt sein). Grundlegende Fertigkeiten im Umgang mit Python/JupyterLab – wie Datenimport, Datenaufbereitung, Grafikerstellung und statistische Standardverfahren – werden vorausgesetzt, ständig angewendet und vertieft. Wenn der Umgang mit Python/JupyterLab nicht vertraut sein sollte, empfiehlt es sich, vorher ein Python/JupyterLab-Training mit den Grundlagen oder ein vergleichbares Seminar zu besuchen, um Python und JupyterLab zu lernen.

Lernziele der Python Schulung

fortgeschrittene Funktionen von Python kennen lernen, Daten mit Hilfe der multivariaten Statistik auswerten können, Ergebnisse von multivariaten Verfahren grafisch darstellen, erläutern und interpretieren können, aufgrund einer Fragestellung das geeignete multivariate Verfahren identifizieren und anwenden können

Übungen im Python Kurs

Es wird Wert auf den Anwendungsbezug gelegt, die Praxisbeispiele und Übungsaufgaben erfolgen in der Python Schulung auf unseren Schulungslaptops mit der statistischen Programmiersprache Python und der Entwicklungsumgebung JupyterLab aus der Anaconda Distribution.

Dauer der Python Schulung

Der Python Kurs Multivariate Datenanalyse mit Python besteht aus einem

Die Kursdauer erlaubt es, die Verfahren in der Tiefe kennenzulernen, dass Sie diese professionell anwenden und miteinander kombinieren können. Bei einer geringeren Kursdauer würden die vermittelten Kenntnisse nicht ausreichen, valide Modelle mit hoher Güte und zuverlässigen Prognosen zu entwickeln. Jede der drei Schulungen kann auch als Inhouse-Schulung in Ihrer Organisation stattfinden.

Termine und Preise

Leistungen: Unterricht im virtuellen Klassenraum, max. 10 Teilnehmer pro Veranstaltung, persönliche Betreuung durch den Dozenten, täglicher Unterricht 8-17 Uhr, digitale Schulungsunterlagen, Schulungszertifikat. Falls auf dem teilnehmenden Computer die Python Anaconda Distribution nicht installiert werden kann, kann gegen eine geringe Gebühr ab 5 Euro pro Tag der Fernzugriff auf einen Schulungslaptop gemietet werden (Windows Remote Desktop).

Informationen zur Durchführung von Präsenz- und Online-Seminaren finden Sie → hier. Unternehmen und Organisationen können bei der Buchung von zwei Seminarplätzen im 5-tägigen Komplett-Training zudem kostenlos eine dritte Person anmelden (Anmeldung zum selben Termin + genügend freie Plätze, sonst bitte anderen Termin wählen). Sie können auf Rechnung zahlen (weitere Infos).

Seminar Ort Termin Dauer Plätze Preis +16% MwSt.

Die Angaben wurden am 26.10.2020 um 02:28 Uhr aktualisiert.

Unsere Garantien

Best-Price-Garantie Best-Price-Garantie: Bei uns erhalten Sie den besten Preis. Sollten Sie ein von den Inhalten und Leistungen vergleichbares Seminar bei einem anderen Anbieter finden (nicht bei Ihnen selbst), erhalten Sie bei uns denselben Preis.
Durchführungsgarantie Durchführungsgarantie: Wir garantieren Ihnen die Durchführung unserer Seminare. Ohne Anmeldung kann jedoch ein Termin innerhalb von sechs Wochen vor Beginn jederzeit ersatzlos gestrichen werden.
Gruppengrößengarantie Gruppengrößengarantie: Wir garantieren Ihnen, dass unsere Seminare mit nicht mehr als 10 Personen belegt werden. Sie werden von unseren Dozenten in Kleingruppen individuell und persönlich betreut.
Technikgarantie Technikgarantie: Wir setzen nur die beste Technik und Software in unseren Online-Seminaren ein. Unsere Seminare zeichen sich von unserer Seite aus durch stabile Verbindungen, hochauflösende Bilder und eine klare und störungsfreie Sprachübertragung aus.
Zufriedenheitsgarantie Zufriedenheitsgarantie: Sollte ein mehrtägiges Seminar nicht Ihren Erwartungen entsprechen, können Sie Ihre Teilnahme am ersten Tag abbrechen und Sie erhalten Ihr Geld wieder zurück.
Nutzengarantie Nutzengarantie: Sollten Sie nach einem halben Jahr feststellen, dass Sie nichts von dem Gelernten in Ihrem Berufsalltag anwenden konnten, dürfen Sie kostenfrei ein weiteres unserer Seminare besuchen.
Nachhaltigkeitsgarantie Nachhaltigkeitsgarantie: Sollte eine Person innerhalb eines halben Jahres nach der Teilnahme an einem unserer Seminare unvorhergesehen für mehr als 6 Monate Ihrer Organisation nicht zur Verfügung stehen (wegen Kündigung, Elternzeit, Erkrankung oder Sonderurlaub), darf eine andere Person Ihres Unternehmens kostenfrei an einem Seminar mit demselben Inhalt teilnehmen.

Alternative und weiterführende Seminare

Diesen Python Kurs gibt es alternativ auch mit der statistischen Programmiersprache R und der Statistik-Software SPSS, wird aber nicht für Excel, SAS, Stata, Statistica oder Matlab angeboten. Nach erfolgreichem Abschluss des Seminars Multivariate Datenanalyse mit Python haben Sie die Möglichkeit, an dem weiterführendem Seminar Data Mining mit Python oder unserem 5-tägigem Data Science Crash Course teilzunehmen. Unsere neuen Data Science Python-Kurse und Data Science R-Kurse bieten fortgeschrittene statistische Verfahren zu Data Mining, Machine Learning, Deep Learning, künstliche Intelligenz und Big Data für fortgeschrittene Anwender und Profis an. Bei uns können Sie viel Python lernen!

Offene Schulungen Multivariate Datenanalyse mit Python

Basis-Training Multivariate Datenanalyse mit Python
in Köln, Berlin, Frankfurt, Hamburg, München oder als Online-Seminar
1.485 Euro
(1.722,60 Euro inkl. 16% MwSt.)
Inhalte
  • Multiple Regressionsanalyse
    Regressionsmodelle für kontinuierliche und kategoriale Variablen mit Suppressionseffekten (Suppressoranalyse), Moderationseffekten (Moderatoranalyse), nicht-linearen Effekten (polynomiale Regression) und Interaktionseffekten zwischen kategorialen und kontinuierlichen Variablen (dummykodierte Regressionsanalyse); automatisierte Verfahren zur Auswahl von Prognosevariablen und der Ermittlung des am besten an die Daten angepassten Modells; Residualdiagnostik und Prüfung der Modellprämissen (Angemessenheit des Modells, Unabhängigkeit der Daten, Multikollinearität, Homoskedastizität und Normalverteilung der Residuen, Erkennung von einflussreichen Datenpunkten); 2D- und 3D-Grafiken von Regressionsmodellen
  • Logistische Regression
    Schätzung der logistischen Regressionsfunktion, Interpretation der Koeffizienten (Logits, Odds und Wahrscheinlichkeiten), Berechnung von Odds Ratio und relatives Risiko, Konfusionstabellen mit Trefferquote, Spezifität und Sensitivität, ROC-Kurven und automatisierte Verfahren zur Ermittlung des optimalen Trennwerts, automatisierte Auswahl von Prognosevariablen, Prüfung des Gesamtmodells und der Merkmalsvariablen (AUC, Likelihood-Ratio-Test und Pseudo R-Quadrat-Statistiken)
  • Zeitregression
    Zeitreihenmodelle mit Trend- und Saisonkomponenten, lineare/nichtlineare Trendmodelle mit Berücksichtigung von zyklischen Schwankungen und Strukturbrüchen, Extrapolationsmodelle und Strukturmodelle, Erstellung von Prognosen mit Prognoseintervallen, Beurteilung der Modellgüte und Prognosegüte, grafische Darstellung von Zeitreihen
Voraussetzungen
  • die Inhalte des Python Schulung Grundlagen der Statistik mit Python (Interpretation von Korrelationskoeffizienten wie Pearsons python und Signifikanztests wie dem t-Test sollten bekannt sein)
  • Grundlegende Fertigkeiten im Umgang mit Python und JupyterLab werden vorausgesetzt, ständig angewendet und vertieft.
  • Wenn der Umgang mit Python/JupyterLab nicht vertraut sein sollte, empfiehlt es sich, vorher ein Python/JupyterLab-Training mit den Grundlagen oder ein vergleichbares Seminar zu besuchen.
Seminartyp und Dauer
  • offene 3-Tages-Schulung mit 2-10 Teilnehmern
  • täglicher Unterricht 8-17 Uhr mit drei Pausen

Aufbau-Training Multivariate Datenanalyse mit Python
in Köln, Berlin, Frankfurt, Hamburg, München oder als Online-Seminar
990 Euro
(1.148,40 Euro inkl. 16% MwSt.)
Inhalte
  • Zeitreihenanalyse
    Glättungsmethoden und LOESS-Dekomposition von Trend- und Saison-Komponenten, exponentielle Prognosemodelle (State-Space-Modelle) und ARIMA-Modelle, Erstellung von Prognosen, Beurteilung der Modellgüte und Prognosegüte, grafische Darstellung von Zeitreihen
  • Clusteranalyse
    hierarchische Clusteranalyse (Distanz- und Ähnlichkeitsmaße, Fusionierungs-Algorithmen: Single-Linkage, Complete-Linkage, Ward), k-Means-Clusteranalyse
  • Diskriminanzanalyse
    Schätzung der Diskriminanzfunktion, Prüfung der Modellgüte und der Eignung von Variablen, automatisierte Auswahl von Variablen, Klassifikation von neuen Fällen
  • Explorative Faktorenanalyse
    Hauptachsenanalyse, Hauptkomponentenanalyse, Extraktion und Rotation der Faktoren, Variablenauswahl, Modellgüte, Berechnung von Faktorwerten
  • Reliabilitätsanalyse
    Prüfung des Indikatorsets eines Faktors auf Eindimensionalität; Reliabilitätsprüfung auf Indikatorebene (Indikatorreliabilität): Faktorladungen, Kommunalitäten, Cronbachs Alpha (ohne Item), Item-To-Skala-Korrelation; Prüfung auf Konstruktebene (Faktorreliabilität): Cronbachs Alpha, Inter-Item-Korrelationen, Einheitsstruktur
Voraussetzungen
  • die Inhalte des Seminars Grundlagen der Statistik mit Python (Interpretation von Korrelationskoeffizienten wie Pearsons python und Signifikanztests wie dem t-Test sollten bekannt sein)
  • Grundlegende Fertigkeiten im Umgang mit Python und JupyterLab werden vorausgesetzt, ständig angewendet und vertieft.
  • Wenn der Umgang mit Python/JupyterLab nicht vertraut sein sollte, empfiehlt es sich, vorher ein Python/JupyterLab-Training mit den Grundlagen oder ein vergleichbares Seminar zu besuchen.
Seminartyp und Dauer
  • offene 2-Tages-Schulung mit 2-10 Teilnehmern
  • täglicher Unterricht 8-17 Uhr mit drei Pausen

Komplett-Training Multivariate Datenanalyse mit Python
in Köln, Berlin, Frankfurt, Hamburg, München oder als Online-Seminar
2.375 Euro
(2.755 Euro inkl. 16% MwSt.)
Inhalte
  • Inhalte der 3tägigen Basis-Schulung
  • Inhalte der 2tägigen Aufbau-Schulung
  • Als Komplett-Schulung buchen und 100 Euro sparen!
Voraussetzungen
  • die Inhalte des Seminars Grundlagen der Statistik mit Python (Interpretation von Korrelationskoeffizienten wie Pearsons python und Signifikanztests wie dem t-Test sollten bekannt sein)
  • Grundlegende Fertigkeiten im Umgang mit Python und JupyterLab werden vorausgesetzt, ständig angewendet und vertieft.
  • Wenn der Umgang mit Python/JupyterLab nicht vertraut sein sollte, empfiehlt es sich, vorher ein Python/JupyterLab-Training mit den Grundlagen oder ein vergleichbares Seminar zu besuchen.
Seminartyp und Dauer
  • offene 5-Tages-Schulung mit 2-10 Teilnehmer
  • täglicher Unterricht 8-17 Uhr mit drei Pausen
Termine und Veranstaltungsorte

Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

    Jede gebuchte Schulung wird garantiert durchgeführt!

     

    Termine und Preise anzeigen