Data Mining mit R

Posted on
Print Friendly, PDF & Email
Der dreitägige R-Kurs Data Mining mit R führt in die Grundlagen und die Verwendung von R im Data Mining ein. Die R Schulung Data Mining mit R vermittelt nicht nur das theoretische Verständnis, sondern auch die praktische Anwendung für wichtige der im Data Mining eingesetzten Verfahren. Sie lernen grundlegende Schritte mit R im Bereich Data Science, um selbständig erste Data Mining Analysen durchzuführen. Ein Schwerpunkt des R Kurses ist das für Data Science entwickelte R-Paket data.tables. Die mit diesem Paket erzeugten data frames entsprechen den in der statistischen Programmiersprache R üblichen data.frames und ermöglichen einen wesentlich höheren Datendurchsatz. Für die Visualisierung der Ergebnisse wird das R-Paket ggplot2 eingesetzt. Sie werden auch erfahren, wie weitergehende Data Mining Algorithmen und Data Science Methoden in R zu finden sind, um das Wissen nach dem Seminar fortlaufend erweitern zu können. Sie erhalten einen Überblick über verwendete Algorithmen aus dem Machine Learning, welche in R umgesetzt werden. Sie arbeiten überwiegend selbständig mit Unterstützung des Trainers, um das Erlernte in den Übungen direkt umzusetzen und anzuwenden.

Alle Bewertungen stammen ausschließlich von Seminarteilnehmern von Herrn Jan Köhler.
Die Bewertungen werden von einem unabhängigen Dienstleister gesammelt, geprüft und ausgewertet.

Das Wichtigste auf einen Blick

Details zum Kurs
Ort: Online
Typ: Intensivkurs
Größe: 4 – 8 Personen
Dauer: 3 Tage
Zeiten: 9 – 17 Uhr
Preis*: 1.650 €
Intervall: alle 3 – 6 Monate
Inhalte des Kurses
  • Einführung in das Data Mining
  • R-Paket data.table im Data-Mining
    • Daten importieren
    • Daten transformieren
  • Daten visualisieren mit ggplot2
  • Deskriptive Statistiken und Korrelationsanalysen
  • Einführung ins Machine Learning
  • Anwendung der Algorithmen
    • Entscheidungsbaum
    • logistische Regression
Weitere Infos…

*Nettopreise ohne MwSt. Endpreis wird im Warenkorb angezeigt.

Zielgruppe der Weiterbildung

Diese Weiterbildung richtet sich an Datenanalysten und zukünftige Data Scientists, welche eine Vertiefung in wichtige Data Mining und Machine Learning Algorithmen erhalten wollen oder die die Syntax der Programmiersprache R kennenlernen wollen, um R-Skripte für Data-Mining-Analysen schreiben zu können.

Voraussetzungen der Schulung

In dem R-Kurs werden grundlegende Kenntnisse in R nicht vorausgesetzt, sie wären jedoch hilfreich. Alternativ wäre auch die Erfahrung in einer anderen Programmiersprache sehr förderlich, um Konzepte wie Variable, Variablenzuweisung, Funktionsaufruf und den Unterschied zwischen Ganzzahl und Dezimalzahl bereits zu kennen. Sie können dazu den Vorbereitungskurs Einführung in die Programmierung mit R besuchen. Ein Basiswissen von grundlegenden statistischen Begriffen wie Mittelwert, Median, Perzentil, Normalverteilung, lineare Regression ist sehr empfehlenswert, um den Inhalten besser folgen zu können.

Lernziele des Seminars

Die Teilnehmer erhalten mit dem R-Kurs einen Überblick über die statistische Programmiersprache R und die Entwicklungsumgebung RStudio und können erste Analysen mit R im Data Mining umsetzen. Die R Schulung zielt darauf, die Einstiegshürde für die Anwendung von R im Data Science zu nehmen, indem die Teilnehmer überwiegend mit den eigenen Laptops und der Unterstützung des Trainers in R arbeiten, um das Erlernte direkt umzusetzen und anzuwenden. Ein selbstständiges Arbeiten als data scientist wird ermöglicht, indem mit dem R-Kurs die wesentlichen Konzepte von R vermittelt werden. Möglichkeiten, weitergehende Algorithmen und Methoden zu finden, werden aufgezeigt, um das Erlernte nach dem Seminar durch stetige Anwendung zu erweitern. Ein Überblick über bekannte Algorithmen im Machine Learning wird gegeben und die Teilnehmer des R Kurses können die verschiedenen Algorithmen voneinander differenzieren und in R benutzen.

Übungen im Kurs

Ziel der R Schulung ist der erfolgreiche Umgang mit der Syntax in R für die Datenanalyse. Das Seminar hat daher zahlreiche praktische Übungen, welche selbstständig mit Unterstützung des Trainers bearbeitet werden, um die Kenntnisse in R dahingehend zu schulen, dass eine praktische Umsetzung und ein selbständiges Arbeiten im Bereich Data Science ermöglicht wird. Ein durchgehendes Datenbeispiel wird verwendet, um die wichtigsten Bibliotheken zu behandeln, welche in umfangreichen Übungen trainiert werden. Die Praxisbeispiele und Übungsaufgaben erfolgen mit der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio.

Dauer der Weiterbildung Data Mining mit R

Die Weiterbildung Data Mining mit R besteht aus einem 3-tägigen Training (mit 24 Unterrichtsstunden á 45 Minuten), das auch als Inhouse-Schulung in Ihrer Organisation stattfinden kann.

Alternative und weiterführende Seminare

Der Kurs Data Mining mit Python deckt dieselben Inhalte ab, verwendet jedoch die Programmiersprache Python für die praktische Umsetzung und Übungseinheiten. Alternativ können Sie auch an unserem Data Science Crash Course mit R mit etwas anderen Schwerpunkten, aber mehr Inhalten teilnehmen.

Termine und Preise für die Weiterbildung Data Mining mit R

  • Leistungen: Unterricht im zentral gelegenen Seminarraum (bzw. virtuellen Seminarraum bei Zoom), max. 10 Teilnehmer pro Veranstaltung, persönliche Betreuung durch den Dozenten, täglicher Unterricht 9-17 Uhr, umfangreiche Schulungsunterlagen, Schulungszertifikat.
  • Unsere Garantien: Best-Price-Garantie, Beste-Technik-Garantie, Gruppengrößengarantie, Zufriedenheitsgarantie, Nutzengarantie, Nachhaltigkeitsgarantie (siehe unten).
  • Buchen ohne Risiko: Keine Vorkasse, Rechnung mit Zahlungsziel 14 Tage nach Seminarende, kostenfreie Stornierung bis 14 Tage vor Seminarbeginn, bei Nichtgefallen Rücktritt bis zum Ende des ersten Seminartags möglich (Rechnung braucht nicht bezahlt zu werden).
  • Preisnachlässe: Online-Seminare sind 10 % preisgünstiger als Präsenzseminare. Informationen zu Bildungsurlaub und Ermäßigungen für Arbeitnehmer, Studierende und andere Selbstzahler finden Sie im Kasten auf der rechten Seite (bzw. am Ende der Seite).
  • Hinweise: Sie nehmen mit Ihrem eigenen PC/Laptop teil. Falls auf dem teilnehmenden Computer die Software R mit RStudio nicht installiert werden kann, kann gegen eine geringe Gebühr der Fernzugriff (VNC) auf einen unserer → Schulungslaptops gemietet werden. Weitere Infos finden Sie → hier.

Sie erhalten eine Rechnung mit tagesaktuellem Datum und Zahlungsziel 14 Tage nach Seminarende.

Seminar Ort Termin Dauer Plätze Preis* +19% MwSt.
Data Mining Kurs Online-SeminarInfos zu unseren Online-Seminaren 15.07. - 17.07.2024 Termin wird garantiert, wenn Sie buchen. 3 Tage > 5 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  1.750 ">
Data Mining Kurs Online-SeminarInfos zu unseren Online-Seminaren 28.10. - 30.10.2024 Termin wird garantiert, wenn Sie buchen. 3 Tage > 5 frei  10% 10 % Online-Rabatt im Preis bereits inkludiert  1.750 ">

*Nettopreise ohne MwSt. Endpreis wird im Warenkorb angezeigt. Angaben wurden am 19.03.2024 um 06:32 Uhr aktualisiert.

Unsere Garantien

Beste-Technik-Garantie der Weiterbildung Beste-Technik-Garantie: Wir setzen nur die beste Technik und Software in unseren Online-Seminaren ein. Unsere Seminare zeichen sich von unserer Seite aus durch stabile Verbindungen, hochauflösende Bilder und eine klare und störungsfreie Sprachübertragung aus.
Gruppengrößengarantie der Schulungen Gruppengrößengarantie: Wir garantieren Ihnen, dass unsere Seminare mit nicht mehr als 10 Personen belegt werden. Sie werden von unseren Dozenten in Kleingruppen individuell und persönlich betreut.
Zufriedenheitsgarantie der Weiterbildung Zufriedenheitsgarantie: Sollte ein mehrtägiges Seminar nicht Ihren Erwartungen entsprechen, können Sie Ihre Teilnahme am ersten Tag abbrechen und die Rechnung braucht nicht bezahlt zu werden.
Nutzengarantie der Trainings Nutzengarantie: Sollten Sie nach einem halben Jahr feststellen, dass Sie nichts von dem Gelernten in Ihrem Berufsalltag anwenden konnten, dürfen Sie kostenfrei ein weiteres unserer Seminare besuchen.
Nachhaltigkeitsgarantie der Weiterbildung Nachhaltigkeitsgarantie: Sollte eine Person innerhalb eines halben Jahres nach der Teilnahme an einem unserer Seminare unvorhergesehen für mehr als 6 Monate Ihrer Organisation nicht zur Verfügung stehen (wegen Kündigung, Elternzeit, Erkrankung oder Sonderurlaub), darf eine andere Person Ihres Unternehmens kostenfrei an einem Seminar mit demselben Inhalt teilnehmen.

 

Offene Schulungen in Data Mining mit R

Training Data Mining mit R
3 Tage Unterricht als Online-Seminar
1.945 Euro
2.314,55 Euro inkl. 19% MwSt.
Inhalte
  • Grundkenntnisse für Data Mining mit R
    • Hintergrund zu R und RStudio
    • Pakete installieren und laden
    • Datenstrukturen in R
    • Hilfe und weiterführende Informationen finden
    • Wie unterscheidet sich R von anderen Programmiersprachen
  • Das Data Mining Paket data.table
    • Struktur und Besonderheiten von data.table im Vergleich zum data.frame
    • Ähnlichkeit eines data.tables zu SQL Abfragen
    • Daten nach Zeilen und Spaltennamen abfragen
    • Berechnungen direkt auf Spalten durchführen
    • Abfragen gruppieren
  • Daten einlesen und konvertieren
    • Das Arbeitsverzeichnis zum Einlesen von Daten setzen
    • Daten aus verschiedenen Quellen einlesen (Websiten, txt, csv)
    • Daten aus fremden Quellen einlesen (SPSS)
    • fread(), um effizient große Datenmengen einzulesen
    • Daten als .RData speichern und laden
    • Abfragen aus einer Datenbank (SQLite)
  • Data handling (data.table)
    • Eine Spalte erzeugen, löschen, ändern
    • Zwischen Datentypen konvertieren
    • lapply() und die Anwendung in einem data.table (mit .SD und .SDcols)
  • Visualisierung von Daten mit dem Paket ggplot2
    • Grammar of Graphics und die grundlegende Idee dahinter
    • Scatterplot, Linienplot
    • Histogramm
    • Kerndichteschätzer
    • Barplot
    • Speichern von Grafiken
    • Darstellung (Größe der Datenpunkte, Farbe, Gruppierung) variable oder fest ändern
    • Subplots erzeugen (Facetting)
  • Grundlegende Statistiken
    • Deskriptive Statistiken
    • Korrelationen (Spearman, Pearson)
    • Zufallszahlen aus verschiedenen Verteilungen erzeugen
  • Fortgeschrittene Wege, ein data.table zu benutzen
    • Der := Operator in data.table zum Umformen von Daten
    • Eine Funktion auf eine Gruppe von Daten anwenden
    • Daten aggregieren
    • Filtern von Datensätzen anhand selbst gewählter Attribute
    • Ersetzen von fehlenden Werten
  • Control Flows
    • Schreiben einer eigenen Funktion
    • If und if-else
    • For Schleifen
    • While Schleife
  • Überblick über Machine Learning
    • Einführung in Machine Learning (Supervised – Unsupervised Learning. Overfitting, cross-validation)
    • Grundlegendes Konzept von den Algorithmen Support Vector Machine (SVM), Random Forest und K-means
    • Modelle der Algorithmen in R erstellen
    • Ergebnisse validieren
  • Detaillierte Umsetzung der Algorithmen Entscheidungsbaum und Logistische Regression
    • Grundlagen des Algorithmus
    • Train-Test Split der Daten
    • Ein Model in R erstellen
    • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
    • Hyperparameter im Training
    • cross-validation
Voraussetzungen
Seminartyp und Dauer
  • offene 3-Tages-Schulung mit max. 10 Teilnehmer
  • täglicher Unterricht 9-17 Uhr mit drei Pausen
Termine und Veranstaltungsorte

Zur Anzeige der Adresse eines Veranstaltungsorts klicken Sie bitte auf den Ortsnamen:

 

Termine und Preise für den R-Kurs Data Mining mit R anzeigen