Data Science Crash Course mit R

Posted on
Print Friendly, PDF & Email
In dem R-Kurs Data Science Crash Course mit R erhalten Sie eine fundierte und modular aufgebaute Einführung in die Themen Data Science, Künstliche Intelligenz und Machine Learning (Maschinelles Lernen) sowohl für numerische Daten als auch für Textdaten. Ziel dieser Methoden ist es, aus den vorhandenen Daten einen Mehrwert zu schaffen. Und genau das lernen Sie in unserem Data Science Crash Course in drei aufeinander aufbauenden Modulen. Bei entsprechenden Vorkenntnissen können Sie die Module auch einzeln besuchen.

Module des Data Science Crash Course mit R

Data Science Crash Course mit R (5 Tage)
Modul „Data Science und Künstliche Intelligenz mit R“ (2 Tage) Modul „Machine Learning mit R“ (2 Tage) Modul „Natural Language Processing (NLP) mit R“ (1 Tag)

Im einführenden Modul → „Data Science und Künstliche Intelligenz mit R“ erhalten Sie einen Überblick über das spannende Thema Künstliche Intelligenz mit vielen Praxisbeispielen. Zudem werden Sie in der Programmiersprache R so weit fit gemacht, dass Sie Ihr erstes Data-Science-Projekt vom Einlesen der Daten bis hin zur Speicherung der Modelle zur weiteren Verwendung eigenhändig umsetzen können.

Das weiterführende Modul → „Machine Learning mit R“ geht nun einen Schritt weiter. Hier erhalten Sie einen Einblick in die unterschiedlichen Algorithmen des Maschinellen Lernens. Die Theorie dahinter wird dabei anhand von Praxisübungen aus den Bereichen Clustering, Virtuelle Sensoren und Zeitreihenvorhersage vermittelt. In diesem Modul werden Sie sich hauptsächlich mit der Anwendung des Machine Learning auf numerischen Daten beschäftigen.

Abgerundet wird der Data Science Crash Course durch das abschließende Modul → „Natural Language Processing (NLP) mit R“, bei dem Sie sich mit der Anwendung des Maschinellen Lernens im Kontext der natürlichen Sprachverarbeitung auseinandersetzen. Im Gegensatz zum Modul Machine Learning mit R werden jetzt Wörter und Textdaten und nicht mehr numerische Daten verarbeitet. Zusätzlich behandeln wir in diesem Modul das wichtige Thema der Datenbeschaffung – und eine mögliche Option bietet hier das Web Scraping bzw. Crawling, das Sie anhand einer Praxisübung selbst umsetzen.

Diesen R-Kurs gibt es auch mit der Skriptsprache Python: → Data Science Crash Course mit Python.

 

Alle Bewertungen stammen ausschließlich von Kunden und Seminarteilnehmern von Dr. Christoph Oestreicher.
Die Bewertungen werden von einem unabhängigen Dienstleister gesammelt, geprüft und ausgewertet.

Zielgruppe des Seminars Data Science Crash Course mit R

Unser Data Science Crash Course mit R ist für Beschäftigte aus operativen Bereichen, R&D und IT mit grundlegenden Programmierkenntnissen geeignet, welche die Potenziale von Data Science, Künstlicher Intelligenz und Maschinellem Lernen für ihren Bereich kennenlernen und hautnah erfahren möchten. Anwender, Studenten, Doktoranden und Forscher aus den mathematischen, statistischen, naturwissenschaftlichen, ingenieurwissenschaftlichen, informationstechnologischen, betriebs-, wirtschafts-, markt- und sozialwissenschaftlichen Bereichen sind ebenfalls willkommen.

Voraussetzungen für das Seminar

Für den Data Science Crash Course mit R sind Grundverständnisse der Linearen Algebra (Vektoren, Matrizen) und ein Basiswissen in der Statistik (wie Korrelationen, Signifikanztests, lineare Regression) sehr empfehlenswert. Sie sollten Grundkenntnisse in einer Programmiersprache besitzen, am besten wäre eine Skriptsprache wie R, Python oder Matlab. Liegen keine Programmierkenntnisse vor, können Sie den dafür entwickelten Vorbereitungskurs Einführung in die Programmierung mit R besuchen.

Lernziele des Seminars

Am Ende des Data Science Crash Course mit R werden Sie:

  • die aktuelle Berichterstattung zu Künstliche Intelligenz, Maschinellem Lernen, Reinforcement Learning und Data Science sowie deren Anwendungspotential in verschiedenen Bereichen wie Logistik, Predictive Maintenance oder Chatbots inhaltlich einordnen und bewerten können,
  • vorhandene Daten mit R und Methoden des Maschinellen Lernens für Ihren Bereich nutzbar machen können (unter Einsatz der R-Pakete Tidyverse, Caret und Keras/Tensorflow),
  • die Programmiersprache R und den wissenschaftlichen Rechenstapel von R zur Implementierung von Maschinellen Lernalgorithmen kennengelernt haben, um zu wissen, welche Daten für die erfolgreiche Umsetzung einer Fragestellung aus Ihrem Bereich (noch) notwendig sind,
  • ein vollständigen Data-Science-Zyklus umgesetzt haben und damit wissen, was hierfür notwendig ist und welche Herausforderungen auf Sie zukommen werden,
  • eine Kategorien-Einteilung/Clustering mit Unüberwachtem Lernen/Unsupervised Learning (PCA, k-Means, DBSCAN) durchführen können,
  • eine Trendvorhersage mit Überwachtem Lernen/Supervised Learning (Neuronale Netze, XGBoost, LSTM) durchführen können,
  • einen Virtuellen Sensor mit Überwachtem Lernen/Supervised Learning (Decision Tree, Random Forest, XGBoost) entwickeln können,
  • wissen, was Sie beachten müssen, wenn Sie Daten aus dem Internet ziehen (Web Scraping und Web Crawling) – und wie Sie Daten von einer Seite “scrapen“ und vorverarbeiten können,
  • wie Sie Texte mittels Tokenizer, Stopwords, Stemming und n-grams vor-verarbeiten bzw. parsen können und
  • einen praktischen Einblick erhalten, wie Sie Topic Clustering, eine Sentiment Analyse und Satz-Vervollständigung mittels Unsupervised und Supervised Learning durchführen können.

Dauer des Seminars

  • Rahmen: 5 Tage mit 40 Unterrichtsstunden (täglich 8 Stunden, 9-17 Uhr)
  • Aufteilung Theorie/Praxis: 40% Theorie + 60 % Praxis, Übungen und Demos

Termine und Preise für den Data Science Crash Course mit R

Informationen zur Durchführung von Präsenz- und Online-Seminaren finden Sie → hier. Präsenzseminare finden aufgrund der erhöhten Infektionsgefahr in geschlossenen Räumen bis auf Weiteres nicht statt. Der Preis für das Online-Seminar des kompletten Lehrgangs ist um 15 % reduziert (Unterricht im virtuellen Klassenraum, max. 10 Teilnehmer pro Veranstaltung, persönliche Betreuung durch den Dozenten, täglicher Unterricht 9-17 Uhr, digitale Schulungsunterlagen, Zertifikat wird danach zugeschickt). Unternehmen und Organisationen können bei der Buchung von zwei Seminarplätzen kostenlos eine dritte Person anmelden (bei der Buchung von zwei Plätzen können drei Namen an der Kasse angegeben werden). Falls auf dem teilnehmenden Computer die Software R und RStudio nicht installiert werden können, kann gegen eine geringe Gebühr der Fernzugriff auf einen Schulungslaptop gemietet werden (Virtual Network Computing). Sie können auf Rechnung zahlen (weitere Infos).

Seminar Ort Termin Dauer Plätze Preis +19% MwSt.
Data Science Onlinekurs Online-SeminarInfos zu unseren Online-Seminaren 15.03. - 19.03.2021  5 Tage > 5 frei  20% 20 % Online-Rabatt im Preis bereits inkludiert  1.995
Data Science Onlinekurs Online-SeminarInfos zu unseren Online-Seminaren 17.05. - 21.05.2021  5 Tage > 5 frei  15% 15 % Online-Rabatt im Preis bereits inkludiert  2.125
Data Science Onlinekurs Online-SeminarInfos zu unseren Online-Seminaren 12.07. - 16.07.2021  5 Tage > 5 frei  15% 15 % Online-Rabatt im Preis bereits inkludiert  2.125
Data Science Onlinekurs Online-SeminarInfos zu unseren Online-Seminaren 27.09. - 01.10.2021  5 Tage > 5 frei  15% 15 % Online-Rabatt im Preis bereits inkludiert  2.125
Data Science Onlinekurs Online-SeminarInfos zu unseren Online-Seminaren 22.11. - 26.11.2021  5 Tage > 5 frei  15% 15 % Online-Rabatt im Preis bereits inkludiert  2.125

Die Angaben wurden am 20.01.2021 um 11:45 Uhr aktualisiert.

Unsere Garantien

Durchführungsgarantie Durchführungsgarantie: Wir garantieren Ihnen die Durchführung unserer Seminare. Ohne Anmeldung kann jedoch ein Termin innerhalb von sechs Wochen vor Beginn jederzeit ersatzlos gestrichen werden.
Best-Price-Garantie Best-Price-Garantie: Bei uns erhalten Sie den besten Preis. Sollten Sie bis zum Seminarbeginn ein von den Inhalten und Leistungen vergleichbares und günstigeres Seminar finden (nicht bei Ihnen selbst), erstatten wir die Differenz.
Beste-Technik-Garantie Beste-Technik-Garantie: Wir setzen nur die beste Technik und Software in unseren Online-Seminaren ein. Unsere Seminare zeichen sich von unserer Seite aus durch stabile Verbindungen, hochauflösende Bilder und eine klare und störungsfreie Sprachübertragung aus.
Gruppengrößengarantie Gruppengrößengarantie: Wir garantieren Ihnen, dass unsere Seminare mit nicht mehr als 10 Personen belegt werden. Sie werden von unseren Dozenten in Kleingruppen individuell und persönlich betreut.
Zufriedenheitsgarantie Zufriedenheitsgarantie: Sollte ein mehrtägiges Seminar nicht Ihren Erwartungen entsprechen, können Sie Ihre Teilnahme am ersten Tag abbrechen und Sie erhalten Ihr Geld wieder zurück.
Nutzengarantie Nutzengarantie: Sollten Sie nach einem halben Jahr feststellen, dass Sie nichts von dem Gelernten in Ihrem Berufsalltag anwenden konnten, dürfen Sie kostenfrei ein weiteres unserer Seminare besuchen.
Nachhaltigkeitsgarantie Nachhaltigkeitsgarantie: Sollte eine Person innerhalb eines halben Jahres nach der Teilnahme an einem unserer Seminare unvorhergesehen für mehr als 6 Monate Ihrer Organisation nicht zur Verfügung stehen (wegen Kündigung, Elternzeit, Erkrankung oder Sonderurlaub), darf eine andere Person Ihres Unternehmens kostenfrei an einem Seminar mit demselben Inhalt teilnehmen.

Inhalte des Seminars Data Science Crash Course mit R

Data Science Crash Course mit R
pro Person in Stuttgart oder als Online-Seminar
2.495 Euro
(2.969,05 Euro inkl. 19% MwSt.)
Inhalte

Modul → „Data Science und Künstliche Intelligenz mit R“ (2 Tage)

  • Überblick, Grundlagen und Praxisbeispiele
    • Künstliche Intelligenz
    • Data Science
    • Maschinelles Lernen
    • Herausforderungen bei der Umsetzung eines Data Science/KI Projekts
    • Praxisbeispiele u.a. zu den Themen:
      • Natural Language Processing (NLP)
      • Bilderkennung
      • Predictive Maintenance
      • Prozessindustrie
      • Logistik
  • Intensivkurs R
    • Einführung in R: Datenstrukturen (Listen, Vektoren und Data Frames), Kontrollstrukturen (Fallunterscheidungen, Schleifen und benutzerdefinierte Funktionen) und Erstellung von Diagrammen (ggplot2, plotly)
    • Relevante R-Pakete: Tidyverse, Caret und Keras/Tensorflow
    • Data Science mit R: Statistiken, Korrelationen, Vorverarbeitung
    • Praxis-Übung: Datenzugriff, Datenexplorierung und Visualisierung
  • Methoden des Maschinelles Lernen
    • Überwachtes Lernen/Supervised Learning
    • Unüberwachtes Lernen/Unsupervised Learning
    • Reinforcement Learning
    • Praxis-Übung: Selektion der richtigen Features
  • Data-Science-Zyklus
    • Datenverständnis und Vorbereitung
    • Aufsetzen des Data-Science-Zyklus: Train-Test-Split, Pipelines, Kreuzvalidierung/Crossvalidaton, Hyperparameter-Optimierung
    • Implementierung eines Machine Learning Algorithmus (Learning Vector Quantization)
    • Evaluation des Algorithmus
    • Praxis-Übung: Clustering und Klassifikation

Modul → „Machine Learning mit R“ (2 Tage)

  • Praxis-Beispiel I (Clustering)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung I: Dimensionalitätsreduzierung mit einer Principal Components Analysis (PCA)
    • Praxis-Übung II: Kategorie-Einteilung von Service-Einsätzen mittels KMeans und Density-Based Spatial Clustering of Applications with Noise (DBSCAN)
  • Praxis-Beispiel II (Virtueller Sensor)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung: Vorhersage eines (meistens nicht direkt messbaren) Wertes anhand vorhandener Variablen/Merkmale mittels Decision Trees, Random Forest und XGBoost und Evaluation mittels Feature Importance
  • Praxis-Beispiel III (Trendvorhersage)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung I: Zeitreihenvorhersage mittels Random Forest, XGBoost und Neuronalen Netzen
    • Praxis-Übung II: Multivariate Zeitreihenvorhersage mittels Long-Short-Term-Memory (LSTM) inkl. weiterführende R-Bibliotheken: keras, tensorflow

Modul → „Natural Language Processing (NLP) mit R“ (1 Tag)

  • Web Scraping und Crawling
    • Kommerzielle und ethische Gesichtspunkte
    • Scrapen einer Webseite: requests, robots.txt, html, regex
    • Praxis-Übung: Scrapen einer Webseite
  • Vorverarbeitung von Text
    • Parsing: Tokenizer, Stopwords, Stemming, n-grams
    • Praxis-Übung: Parsen von Data-Science-Texten
  • Praxis-Beispiel I (Topic Clustering)
    • Kurze Einführung in den Kontext und die Zielsetzung
    • Praxis-Übung: Unüberwachtes Lernen/Unsupervised Learning (DBSCAN)
  • Praxis-Beispiel II (Sentiment Analysis)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Praxis-Übung: Überwachtes Lernen/Supervised Learning (Neuronale Netze)
  • Praxis-Beispiel III (Sentence Completion)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Praxis-Übung: Symbolische Zeitreihenvorhersage (Long-Short-Term-Memory/LSTM und Embedding)
Voraussetzungen
  • Grundkenntnisse in der linearen Linearen Algebra (Vektoren, Matrizen)
  • Grundkenntnisse in der Statistik (Korrelation, Signifikanztest, lineare Regression)
  • Grundkenntnisse einer Skriptsprache wie R, Python oder Matlab

Grundkenntnisse in R können Sie in unserem Vorbereitungskurs → Einführung in die Programmierung mit R erwerben. Vorhandene Grundkenntnisse in R und Statistik können Sie in unseren Kursen Grundlagen der Statistik mit R für Anfänger und → Statistik-Grundlagen mit R für Programmierer auffrischen und vertiefen.

Seminartyp und Dauer
  • offene 5-Tages-Schulung mit max. 10 Teilnehmer
  • Unterricht 9-17 Uhr mit angemessenen Pausen
  • 40 Unterrichtsstunden, d.h. 8 Stunden täglich
  • 40% Theorie + 60 % Praxis, Übungen und Demos
Termine und Veranstaltungsorte

 

Termine und Preise für den R-Kurs Data Science Crash Course mit R anzeigen