Seminar Data Mining mit Python

 2.250,00

Zzgl. 19% MwSt.
Lieferzeit: Sofort lieferbar

Das Seminar Data Mining mit Python führt in die Grundlagen und die Verwendung von Python zum Data Mining ein. Das Training vermittelt das theoretische Verständnis und die praktische Anwendung für wichtige der im Data Mining eingesetzten Verfahren. Sie lernen grundlegende Schritte mit Python im Bereich Data Mining, um selbständig erste Data Mining Analysen durchzuführen. Sie arbeiten überwiegend selbständig mit Unterstützung des Trainers, um das Erlernte in den Übungen direkt umzusetzen und anzuwenden. Sie können mit PayPal, Kreditkarte, Vorkasse und auf Rechnung zahlen (weitere Infos).

Auswahl zurücksetzen
Artikelnummer: DMP Kategorien: ,

Beschreibung

Die dreitägige Schulung Data Mining mit Python führt in die Grundlagen und die Verwendung von Python zum Data Mining ein. Das Training vermittelt nicht nur das theoretische Verständnis, sondern auch die praktische Anwendung für wichtige der im Data Mining eingesetzten Verfahren. Sie lernen grundlegende Schritte mit Python im Bereich Data Mining, um selbständig erste Data Mining Analysen durchzuführen. Sie arbeiten überwiegend selbständig mit Unterstützung des Trainers, um das Erlernte in den Übungen direkt umzusetzen und anzuwenden.

Zielgruppe: Die Schulung richtet sich an Fach- und Führungskräfte, die einen Einstieg in die Python-Programmierung des Data-Minings wünschen, um eigenständig an data science Projekten mitarbeiten zu können oder einen besseren Überblick über die Tätigkeit eines data scientist zu erhalten.

Voraussetzungen: Es wird keine Erfahrung mit Python vorausgesetzt. Grundlegende Erfahrung mit einer Programmiersprache erleichtert den Einstieg. Ein Basiswissen von einfachen statistischen Begriffen wie Mittelwert, Median, Perzentil, lineare Regression ist hilfreich (beispielsweise durch ein Besuch des Basis-Seminars Grundlagen der Statistik mit R).

Lernziele: Die Teilnehmer erhalten einen Überblick über Python und die Entwicklungsumgebung Spyder aus der Anaconda distribution und können erste Analysen mit Python im Data Mining umsetzen. Die Schulung zielt darauf, die Einstiegshürde für die Anwendung von Python im Data Science zu nehmen, so dass die Teilnehmer überwiegend mit den eigenen Laptops und der Unterstützung des Trainers in Python arbeiten, um das Erlernte direkt umzusetzen und anzuwenden. Ein selbstständiges Arbeiten als data scientist wird ermöglicht, indem die Konzepte von Python vermittelt werden. Möglichkeiten weitergehende Algorithmen und Methoden zu finden werden aufgezeigt, um das Erlernte nach dem Seminar durch stetige Anwendung zu erweitern. Ein Überblick über bekannte Algorithmen im Machine Learning wird gegeben und die Teilnehmer können die verschiedenen Algorithmen voneinander differenzieren und in Python benutzen.

Übungen: In den konkreten Beispielen und praktischen Übungen, welche selbstständig mit Unterstützung des Trainers bearbeitet werden, werden die vorhandenen Kenntnisse über die Programmiersprache Python dahingehend ausgebaut, dass eine praktische Umsetzung und ein selbständiges Arbeiten im Bereich data science ermöglicht wird. Ein durchgehendes Datenbeispiel wird verwendet, um die wichtigsten Bibliotheken zu behandeln, welche in umfangreichen Übungen trainiert werden. Die Praxisbeispiele und Übungsaufgaben erfolgen mit der Programmiersprache Python und der Entwicklungsumgebung Spyder. Hierfür sollte die Python Distribution Anaconda auf dem eigenen Laptop installiert sein.

Dauer: Die Schulung Data Mining mit Python besteht aus einem 3-tägigen Training mit insgesamt 24 Unterrichtsstunden á 45 Minuten.

Leistungen: Schulungsräume in zentraler Lage, 2-8 Teilnehmer pro Veranstaltung, täglich 8 Unterrichtsstunden 9-17 Uhr (vier Doppelstunden á 90 Minuten mit drei Pausen von ca. 15, 60 und 15 Minuten), Getränke in den Pausen, gedruckte Schulungsunterlagen und ein Zertifikat mit den Schulungsinhalten (Laptop mit installierter Software hat der Teilnehmer selbst mitzubringen)

Inhalte des 3-tägigen Trainings Data Mining mit Python:

  • Grundkenntnisse für Data Mining mit Python
    • Pakete installieren und laden
    • Hilfe und weiterführende Informationen finden
  • Einführung
    • Datenstrukturen in Python (tuples, list, dictionaries, strings)
    • Installieren von neuen Paketen
    • Klassen, Funktionen
    • Entwicklungsumgebungen (Spyder)
  • Datenverarbeitung
    • Einführung in das Data Science Paket pandas
    • Indexierung und Slicing eines DataFrames
    • Erzeugen und Ändern von DataFrames
    • Statistische Informationen über die Daten ableiten
    • Umgang mit fehlenden Werten
    • Datentypen konvertieren
  • Daten einlesen und grundlegende Statistiken
    • Grundlegende, deskriptive Statistiken
    • Kontingenztafeln erstellen
    • Daten aus verschiedenen Formaten (csv, xlsx, txt) einlesen und schreiben
    • Daten in das binäre Python Format pickle schreiben und lesen
  • Visualisierung
    • Grundlegende Visualisierungen (Scatterplot, Linienplot, Barplot, Histogram) mit dem Paket matplotlib
    • Anpassung und Individualisierung von Grafiken
    • Grafiken mit dem Paket pandas erzeugen
    • Speichern von Grafiken
  • Algorithmen im Data Science
    • Überblick über die Einteilung von Algorithmen im Machine Learning (Supervised Learning – unsupervised learning – reinforcement learning)
    • Theoretischer Überblick über Machine Learning und wichtiger Algorithmen
    • Lineare Regression
    • Logistische Regression
    • Entscheidungsbäume
    • Random Forest
    • Support Vector Machine (SVM)
    • K-means
    • Kerndichteschätzer
    • Praktische Umsetzung von Machine Learning Algorithmen mit dem Paket scikit-learn
    • Kreuzvalidierung, confusion matrix, ROC curve
    • Trainieren und Validieren von Modellen
  • Fallbeispiel zur Wiederholung des Gelernten: Abgeschlossenes Projekt, indem die wichtigsten Schritte wiederholt werden können vom Daten Einlesen, Erarbeiten bis zur Modellierung und Visualisierung.