Data Mining mit Python

Posted on
Print Friendly, PDF & Email
Der dreitägige Python Kurs Data Mining mit Python führt in die Grundlagen und die Verwendung von Python im Data Mining ein. Die Python Schulung Data Mining mit Python vermittelt nicht nur das theoretische Verständnis, sondern auch die praktische Anwendung für wichtige der im Data Mining eingesetzten Verfahren. Sie lernen grundlegende Schritte mit Python im Bereich Data Science, um selbständig erste Data Mining Analysen durchzuführen. Ein Schwerpunkt des Python Kurses ist das für Data Science entwickelte Python Paket pandas. Die mit diesem Paket erzeugten data frames entsprechen den in der statistischen Programmiersprache R üblichen data.frames und ermöglichen einen wesentlich höheren Datendurchsatz. Für die Visualisierung der Ergebnisse wird das Paket matplotlib eingesetzt. Sie werden auch erfahren, wie weitergehende Algorithmen und Methoden in Python zu finden sind, um das Wissen nach dem Seminar fortlaufend erweitern zu können. Sie erhalten einen Überblick über verwendete Algorithmen aus dem Machine Learning, welche in Python umgesetzt werden. Sie arbeiten überwiegend selbständig mit Unterstützung des Trainers, um das Erlernte in den Übungen direkt umzusetzen und anzuwenden.

 

Alle Bewertungen stammen ausschließlich von Seminarteilnehmern von Herrn Jan Köhler.
Die Bewertungen werden von einem unabhängigen Dienstleister gesammelt, geprüft und ausgewertet.

Zielgruppe der Python Schulung

Der Python Kurs richtet sich an Datenanalysten und zukünftige Data Scientists, welche eine Vertiefung in wichtige Machine Learning Algorithmen erhalten wollen oder die die Syntax der Programmiersprache Python kennenlernen wollen, um Python-Skripte für Data-Mining-Analysen schreiben zu können.

Voraussetzungen der Python Schulung

In dem Python Kurs werden grundlegende Kenntnisse in Python nicht vorausgesetzt, sie wären jedoch hilfreich. Alternativ wäre auch die Erfahrung in einer anderen Programmiersprache sehr förderlich, um Konzepte wie Variable, Variablenzuweisung, Funktionsaufruf und den Unterschied zwischen Ganzzahl und Dezimalzahl bereits zu kennen. Ein Basiswissen von grundlegenden statistischen Begriffen wie Mittelwert, Median, Perzentil, Normalverteilung, lineare Regression ist sehr empfehlenswert, um den Inhalten besser folgen zu können.

Lernziele der Python Schulung

Die Teilnehmer erhalten mit dem Python Kurs einen Überblick über Python und die Entwicklungsumgebung Spyder aus der Anaconda Distribution und können erste Analysen mit Python im Data Mining umsetzen. Die Python Schulung zielt darauf, die Einstiegshürde für die Anwendung von Python im Data Science zu nehmen, so dass die Teilnehmer überwiegend mit den eigenen Laptops und der Unterstützung des Trainers in Python arbeiten, um das Erlernte direkt umzusetzen und anzuwenden. Ein selbstständiges Arbeiten als data scientist wird ermöglicht, indem mit dem Python Kurs die Konzepte von Python vermittelt werden. Möglichkeiten weitergehende Algorithmen und Methoden zu finden werden aufgezeigt, um das Erlernte nach dem Seminar durch stetige Anwendung zu erweitern. Ein Überblick über bekannte Algorithmen im Machine Learning wird gegeben und die Teilnehmer des Python Kurses können die verschiedenen Algorithmen voneinander differenzieren und in Python benutzen.

Übungen im Python Kurs

In den konkreten Beispielen und praktischen Übungen, welche selbstständig mit Unterstützung des Trainers bearbeitet werden, werden die vorhandenen Kenntnisse über die Programmiersprache Python dahingehend ausgebaut, dass eine praktische Umsetzung und ein selbständiges Arbeiten im Bereich data science ermöglicht wird. Ein durchgehendes Datenbeispiel wird verwendet, um die wichtigsten Bibliotheken zu behandeln, welche in umfangreichen Übungen trainiert werden. Die Praxisbeispiele und Übungsaufgaben erfolgen mit der Programmiersprache Python und der Entwicklungsumgebung Spyder. Bitte bringen Sie einen eigenen Laptop mit, auf dem die Python Distribution Anaconda installiert ist.

Dauer der Python Schulung

Der Python Kurs Data Mining mit Python besteht aus einem 3-tägigen Training (mit 24 Unterrichtsstunden á 45 Minuten), das auch als Inhouse-Schulung in Ihrer Organisation stattfinden kann.

Ähnliche und weiterführende Seminare

Der Python Kurs Data Mining mit R deckt weitgehend dasselbe Themengebiet ab, verwendet jedoch die statistische Programmiersprache R für die praktische Umsetzung und den Übungseinheiten. Alternativ können Sie auch an unserem 5-tägigem Data Science Crash Course und danach an unseren Kursen für weit fortgeschrittene Anwender teilnehmen. Unsere neuen Data Science R-Kurse und Data Science Python-Kurse bieten fortgeschrittene statistische Verfahren zu Data Mining, Machine Learning, Deep Learning, künstliche Intelligenz und Big Data an. Bei uns können Sie viel R lernen!

Data Mining mit Python

Training Data Mining mit Python
pro Person in Stuttgart oder München
1.595 Euro
(‭1.898,05‬ Euro inkl. 19% MwSt.)
Inhalte
  • Grundkenntnisse für Data Mining mit Python
    • Pakete installieren und laden
    • Hilfe und weiterführende Informationen finden
  • Einführung
    • Datenstrukturen in Python (tuples, list, dictionaries, strings)
    • Installieren von neuen Paketen
    • Klassen, Funktionen
    • Entwicklungsumgebungen (Spyder)
  • Datenverarbeitung
    • Einführung in das Data Science Paket pandas
    • Indexierung und Slicing eines DataFrames
    • Erzeugen und Ändern von DataFrames
    • Statistische Informationen über die Daten ableiten
    • Umgang mit fehlenden Werten
    • Datentypen konvertieren
  • Daten einlesen und grundlegende Statistiken
    • Grundlegende, deskriptive Statistiken
    • Kontingenztafeln erstellen
    • Daten aus verschiedenen Formaten (csv, xlsx, txt) einlesen und schreiben
    • Daten in das binäre Python Format pickle schreiben und lesen
  • Visualisierung
    • Grundlegende Visualisierungen (Scatterplot, Linienplot, Barplot, Histogram) mit dem Paket matplotlib
    • Anpassung und Individualisierung von Grafiken
    • Grafiken mit dem Paket pandas erzeugen
    • Speichern von Grafiken
  • Überblick über Machine Learning
    • Einführung in Machine Learning (Supervised – Unsupervised Learning. Overfitting, cross-validation)
    • Grundlegendes Konzept von den Algorithmen Support Vector Machine (SVM), Random Forest und K-means
    • Modelle der Algorithmen in Python erstellen
    • Ergebnisse validieren
  • Detaillierte Umsetzung der Algorithmen Entscheidungsbaum und Logistische Regression
    • Grundlagen des Algorithmus
    • Train-Test Split der Daten
    • Ein Model in Python erstellen
    • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
    • Hyperparameter im Training
    • cross-validation
Voraussetzungen
  • keine Kenntnisse in Python notwendig
  • Grundlegende Programmierkenntnisse in einer anderen Sprache wäre von Vorteil
  • Grundkenntnisse der Statistik (beispielsweise durch ein Besuch des Basis-Seminars von Grundlagen der Statistik mit Python)
Seminartyp und Dauer
  • offene 3-Tages-Schulung mit 2-10 Teilnehmer
  • täglicher Unterricht 9-17 Uhr mit drei Pausen
Termine und Veranstaltungsorte

Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

    Jede gebuchte Schulung wird garantiert durchgeführt!