Data Mining mit R

Posted on

Unter Data Mining wird die spezialisierte Anwendung bekannter statistischer Verfahren auf große Datenbestände (data warehouse) zur automatischen Generierung von Erkenntnissen über bestehende Datenbestände verstanden. Die im Data Mining eingesetzten multivariate Verfahren werden in Ihrer Analyse-Geschwindigkeit zu Ungunsten der Analyse-Genauigkeit angepasst, damit größere Datenmengen (big data) analysiert werden können. Die hierbei verwendeten Mining Verfahren und Mining Techniken (Ausreißererkennung, Clusteranalyse, Klassifikation, Assoziationsanalyse, Regressionsanalyse) finden vielfach auch Anwendung im Bereich des Machine Learning. In Abgrenzung zum Machine Learning geht es beim Data Mining jedoch um das Auffinden neuer Muster in bestehenden Datenbeständen, während es beim Machine Learning eher darum geht, bekannte Muster in neuen Datenbeständen zu finden. Die Inhalte dieses Seminars werden mit der statistischen Programmiersprache R vermittelt, die als eine der de-facto data science Programmiersprachen bereits mehr als zwei Millionen Nutzer mit wachsender Tendenz hat. Aus diesem Grund bieten die meisten Anbieter von Software für data science bzw. predictive analytics Schnittstellen zu R an.

Das eintägige Vorbereitungs-Training Data Mining mit R wiederholt Grundlagen und führt in die Verwendung des R-Pakets data.table ein. Die mit diesem R-Paket erzeugten data.table entsprechen weitestgehend dem in R üblichen data.frame, können jedoch größere Datenmengen aufnehmen, sind wesentlich performanter, verkürzen die Rechenzeiten und lassen sich schneller programmieren. Das zweitägige Haupttraining Data Mining mit R vermittelt das theoretische Verständnis und die praktische Anwendung für wichtige der im Data Mining eingesetzten Verfahren. Für die Visualisierung der Ergebnisse werden die Grundlagen des graphischen R-Pakets ggplot2 vermittelt.

Zielgruppe

Die Schulung richtet sich an Fach- und Führungskräfte mit ersten R-Kenntnissen, die einen Einstieg in die R-Programmierung des Data-Minings wünschen, um eigenständig an data science Projekten mitarbeiten zu können oder einen besseren Überblick über die Tätigkeit eines data scientist zu erhalten.

Voraussetzungen

Erste Erfahrungen mit R und RStudio, Grundkenntnisse der Statistik und Erfahrungen mit der Regressionsanalyse sind von Vorteil (beispielsweise durch ein Besuch der Basis-Seminare von Grundlagen der Statistik mit R und Multivariate Datenanalyse mit R)

Lernziele

Die Teilnehmer erhalten einen Überblick über einen typischen Data Mining Projektverlauf und die hauptsächlich eingesetzten statistischen Verfahren und ihre Algorithmen, um die Ergebnisse von Data Mining besser verstehen zu können. In den konkreten Beispielen und praktischen Übungen werden die vorhandenen Kenntnisse über die Programmiersprache R dahingehend ausgebaut, dass eine praktische Umsetzung und ein selbständiges Arbeiten im Bereich data science ermöglicht wird.

Übungen

Die Schulung zielt darauf, die Einstiegshürde für die Anwendung von R im Data Science zu nehmen, so dass die Teilnehmer überwiegend mit den eigenen Laptops und der Unterstützung des Trainers in R arbeiten, um das Erlernte direkt umzusetzen und anzuwenden. Die Praxisbeispiele und Übungsaufgaben erfolgen mit der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio, die auf dem eigenen Laptop installiert sein sollten.

Dauer

Die Schulung Data Mining mit R besteht aus einem

Jede der drei Schulungen kann auch als Inhouse-Schulung in Ihrer Organisation stattfinden.

Ähnliche Seminare

Das Seminar Data Mining mit Python deckt weitgehend dasselbe Themengebiet ab, verwendet jedoch die Programmiersprache Python für die praktische Umsetzung und den Übungseinheiten.

Offene Schulungen Data Mining mit R

Vor-Training Data Mining mit R
pro Person in Stuttgart, Ulm, München, Köln, Frankfurt
ab 800 Euro
(952 Euro inkl. 19% MwSt.)
Inhalte
Voraussetzungen
Seminartyp und Dauer
Termine

Haupt-Training Data Mining mit R
pro Person in Stuttgart, Ulm, München, Köln, Frankfurt
ab 1.500 Euro
(1.785 Euro inkl. 19% MwSt.)
Inhalte
Voraussetzungen
Seminartyp und Dauer
Termine

Voll-Training Data Mining mit R
pro Person in Stuttgart, Ulm, München, Köln, Frankfurt
ab 2.100 Euro
(2.499 € Euro inkl. 19% MwSt.)
Inhalte
Voraussetzungen
Seminartyp und Dauer
Termine

Inhouse-Seminare

Diese Schulung kann auch als individuelles Seminar in Ihrem Unternehmen stattfinden. Individuelle Seminare können mit einer der beiden Data Science Programmiersprachen R oder Python unterrichtet werden. Lassen Sie sich ein auf Ihre Bedürfnisse zugeschnittenes und passgenaues Angebot zukommen!