Seminar Data Mining mit R

 2.250,00

Zzgl. 19% MwSt.
Lieferzeit: Sofort lieferbar

Mit 5.00 von 5 bewertet, basierend auf 1 Kundenbewertung

Das Seminar Data Mining mit R führt in die Grundlagen und die Verwendung von R zum Data Mining ein. Das Training vermittelt das theoretische Verständnis und die praktische Anwendung für wichtige der im Data Mining eingesetzten Verfahren. Sie lernen grundlegende Schritte mit R im Bereich Data Mining, um selbständig erste Data Mining Analysen durchzuführen. Sie arbeiten überwiegend selbständig mit Unterstützung des Trainers, um das Erlernte in den Übungen direkt umzusetzen und anzuwenden. Sie können mit PayPal, Kreditkarte, Vorkasse und auf Rechnung zahlen (weitere Infos).

Auswahl zurücksetzen
Artikelnummer: DMR Kategorien: ,

Beschreibung

Die dreitägige Schulung Data Mining mit R führt in die Grundlagen und die Verwendung von R zum Data Mining ein. Das Training Data Mining mit R vermittelt nicht nur das theoretische Verständnis, sondern auch die praktische Anwendung für wichtige der im Data Mining eingesetzten Verfahren. Sie lernen grundlegende Schritte mit R im Bereich Data Mining, um selbständig erste Data Mining Analysen durchzuführen. Sie arbeiten überwiegend selbständig mit Unterstützung des Trainers, um das Erlernte in den Übungen direkt umzusetzen und anzuwenden.

Zielgruppe: Die Schulung richtet sich an Fachkräfte bzw. Projektleiter, zukünftige data scientists und Datenanalysten, die einen Einstieg in die R-Programmierung für Datenanalyse und Data-Mining wünschen, um eigenständig an data science Projekten mitarbeiten zu können oder ein Verständnis für R Code erhalten möchten.

Voraussetzungen: Es wird keine Erfahrung mit R vorausgesetzt. Grundlegende Erfahrung mit einer Programmiersprache erleichtert den Einstieg. Ein Basiswissen von einfachen statistischen Begriffen wie Mittelwert, Median, Perzentil, lineare Regression ist hilfreich (beispielsweise durch ein Besuch der Basis-Seminare von Grundlagen der Statistik mit R und Multivariate Datenanalyse mit R).

Lernziele: Die Teilnehmer erhalten einen Überblick über R und die Entwicklungsumgebung RStudio und können erste Analysen mit R im Data Mining umsetzen. Die Schulung zielt darauf, die Einstiegshürde für die Anwendung von R im Data Science zu nehmen, indem die Teilnehmer überwiegend mit den eigenen Laptops und der Unterstützung des Trainers in R arbeiten, um das Erlernte direkt umzusetzen und anzuwenden. Ein selbstständiges Arbeiten als data scientist wird ermöglicht, indem die wesentlichen Konzepte von R vermittelt werden. Möglichkeiten weitergehende Algorithmen und Methoden zu finden werden aufgezeigt, um das Erlernte nach dem Seminar durch stetige Anwendung zu erweitern. Ein Überblick über bekannte Algorithmen im Machine Learning wird gegeben und die Teilnehmer können die verschiedenen Algorithmen voneinander differenzieren und in R benutzen.

Übungen: In den konkreten Beispielen und praktischen Übungen, welche selbstständig mit Unterstützung des Trainers bearbeitet werden, werden die vorhandenen Kenntnisse über die Programmiersprache R dahingehend ausgebaut, dass eine praktische Umsetzung und ein selbständiges Arbeiten im Bereich data science ermöglicht wird. Ein durchgehendes Datenbeispiel wird verwendet, um die wichtigsten Bibliotheken zu behandeln, welche in umfangreichen Übungen trainiert werden. Die Praxisbeispiele und Übungsaufgaben erfolgen mit der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio, die auf dem eigenen Laptop installiert sein sollten.

Dauer: Die Schulung Data Mining mit R besteht aus einem 3-tägigen Training mit insgesamt 24 Unterrichtsstunden á 45 Minuten.

Leistungen: Schulungsräume in zentraler Lage, 2-8 Teilnehmer pro Veranstaltung, täglich 8 Unterrichtsstunden 9-17 Uhr (vier Doppelstunden á 90 Minuten mit drei Pausen von ca. 15, 60 und 15 Minuten), Getränke in den Pausen, gedruckte Schulungsunterlagen und ein Zertifikat mit den Schulungsinhalten (Laptop mit installierter Software hat der Teilnehmer selbst mitzubringen)

Inhalte des 3-tägigen Trainings Data Mining mit R:

  • Grundkenntnisse für Data Mining mit R
    • Hintergrund zu R und RStudio
    • Pakete installieren und laden
    • Datenstrukturen in R
    • Hilfe und weiterführende Informationen finden
    • Wie unterscheidet sich R von anderen Programmiersprachen
  • Das data mining Paket data.table
    • Struktur und Besonderheiten von data.table im Vergleich zum data.frame
    • Ähnlichkeit eines data.tables zu SQL Abfragen
    • Daten nach Zeilen und Spaltennamen abfragen
    • Berechnungen direkt auf Spalten durchführen
    • Abfragen gruppieren
  • Daten einlesen und konvertieren
    • Das Arbeitsverzeichnis zum Einlesen von Daten setzen
    • Daten aus verschiedenen Quellen einlesen (Websiten, txt, csv)
    • Daten aus fremden Quellen einlesen (SPSS)
    • fread(), um effizient große Datenmengen einzulesen
    • Daten als .RData speichern und laden
    • Abfragen aus einer Datenbank (SQLite)
  • Data handling (data.table)
    • Eine Spalte erzeugen, löschen, ändern
    • Zwischen Datentypen konvertieren
    • lapply() und die Anwendung in einem data.table (mit .SD und .SDcols)
  • Visualisierung von Daten mit dem Paket ggplot2
    • Grammar of Graphics und die grundlegende Idee dahinter
    • Scatterplot, Linienplot
    • Histogramm
    • Kerndichteschätzer
    • Barplot
    • Speichern von Grafiken
    • Darstellung (Größe der Datenpunkte, Farbe, Gruppierung) variable oder fest ändern
    • Subplots erzeugen (Facetting)
  • Grundlegende Statistiken
    • Deskriptive Statistiken
    • Korrelationen (Spearman, Pearson)
    • Zufallszahlen aus verschiedenen Verteilungen erzeugen
  • Fortgeschrittene Wege, ein data.table zu benutzen
    • Der := Operator in data.table zum Umformen von Daten
    • Eine Funktion auf eine Gruppe von Daten anwenden
    • Daten aggregieren
    • Filtern von Datensätzen anhand selbst gewählter Attribute
    • Ersetzen von fehlenden Werten
    • Umformung von data.table (pivotieren, reshape)
  • Control Flows
    • Schreiben einer eigenen Funktion
    • If und if-else
    • For Schleifen
    • While Schleife
  • Theoretischer Einblick in Algorithmen im Data Mining
    • Überblick über die Einteilung von Algorithmen im Data Mining (supervised Learning – unsupervised learning – reinforcement learning)
    • Erklärung von Machine Learning, Big Data, vier Vs im Big Data
    • Erläuterung von wichtigen Algorithmen: Lineare Regression, Logistische Regression, Entscheidungsbäume, Random Forest, Support Vector Machine (SVM), K-means, Kerndichteschätzer
    • Overfitten des Modells und Vermeidungsstrategien
    • Validierung des Modells: Kreuzvalidierung, confusion matrix, ROC Kurve
  • Praktische Umsetzung der Algorithmen im Data Mining
    • Einzelne Schritte beim Modellieren der Daten (Aufteilung in Test- und Train-Daten, Model erstellen, Model validieren)
    • Praktische Umsetzung der behandelten Algorithmen in R
    • Trainieren und Validieren von verschiedenen Algorithmen (Lineare Regression, Logistische Regression, Entscheidungsbäume, Random Forest, Support Vector Machine (SVM), K-means, Kerndichteschätzer)
    • Auswertung der Modellgüte und plotten einer ROC Kurve
  • Abgeschlossenes Fallbeispiel zur Wiederholung des Erlernten
    • Daten einlesen und vorverarbeiten
    • Modellierung mit Machine Learning Algorithmen
    • Visualisierung der Ergebnisse