Seminar Data Science Crash Course

Dozent: Dr. Franz-Josef Toelle

 2.800,00

Zzgl. 19% MwSt.
Auswahl zurücksetzen

Das Seminar Data Science Crash Course ermöglicht es den Teilnehmern, die grundlegenden Fähigkeiten zu erwerben, die zur Realisierung datengetriebener Geschäftsmodelle in zukunftsorientierten Unternehmen erforderlich sind. Dies wird durch den Einsatz der relevantesten Tools, wie Azure ML, TensorFlow, Amazon Machine Learning AWS, Apache Spark etc. sowie Techniken mit R und Python zur Lösung komplexer Geschäftsprobleme erreicht. Die Teilnehmer werden in die Lage versetzt, Data Science Techniken auf die Herausforderungen des Datenmanagements in ihren Unternehmen anzuwenden, häufige Fallstricke in der Big Data Analytik zu identifizieren und zu vermeiden sowie Maschinelle Lernalgorithmen einzusetzen, um ihre Daten zu analysieren. Die Kursgebühr beinhaltet die Kursmaterialien, ein Mittagessen, Erfrischungssnacks und Getränke. Ein Laptop mit einer aktuellen Installation von R oder Python ist selbst mitzubringen. Sie können per Überweisung oder auf Rechnung zahlen (weitere Infos).

Artikelnummer: DSC Kategorien: , , ,

Beschreibung

Viele Unternehmen sind auf der Suche nach Data Scientists, um sich die Potenziale datengetriebener Vorgehensweisen und Geschäftsmodelle zu erschließen oder sie auszubauen. Was bei der Fülle von Anforderungen in diesem Arbeitsbereich und der dafür notwendigen Kompetenzen schnell klar wird: Den universellen Data Scientist gibt es nicht.

Welche Kompetenzen für Unternehmen im Vordergrund stehen, hängt von ihrem jeweiligen Anwendungsbereich ab, jedoch beinhaltet das Anforderungsprofil grundlegende Fähigkeiten, die jeder Data Scientist erfüllen muss. Unser „Data Science Crash Kurs“ ermöglicht es den Teilnehmern, diese Fähigkeiten zu erwerben, während sie mit realen Datensätzen arbeiten. Dies wird durch den Einsatz der relevantesten Tools, wie Azure ML, TensorFlow, Amazon Machine Learning AWS, Apache Spark etc. sowie Techniken mit R und Python zur Lösung komplexer Geschäftsprobleme erreicht. Unsere Teilnehmer lernen Theorie und Praxis hinter Begriffen wie Empfehlungsmaschinen, Regressionen, Netzwerk- und grafischer Modellierung, Anomalie-Erkennung, Hypothesentests, Maschinellem Lernen und Big Data Analytics. Sie werden in die Lage versetzt, Data Science Techniken auf die Herausforderungen des Datenmanagements in ihren Unternehmen anzuwenden, häufige Fallstricke in der Big Data Analytik zu identifizieren und zu vermeiden sowie Maschinelle Lernalgorithmen einzusetzen, um ihre Daten zu analysieren.

Voraussetzungen: Sie sollten Interesse an Datentechnik und Kenntnisse der Programmiersprachen R oder Python haben und mit den grundlegenden Konzepten der Mathematik wie Statistik, Linearer Algebra und Wahrscheinlichkeitsrechnung vertraut sein.

Lernziele: Nach Abschluss des Kurses sind die Teilnehmer in der Lage analytische Modelle zu interpretieren, um bessere Geschäftsentscheidungen zu treffen. Sie verstehen die Herausforderungen, die mit der Skalierung großer Datenalgorithmen verbunden sind. Wir legen den Schwerpunkt auf die Grundlagen der Datenexploration, Visualisierung, Feature Engineering, Qualität, Erfassung und Probennahme, um Ihnen eine solide Grundlage für die prädiktive Analytik zu bieten. Der Lehrplan umfasst ein breites Spektrum an Klassifikation, Regressionanalyse, Empfehlung und unüberwachte Lerntechniken. Wir legen Wert auf ein solides Verständnis der Algorithmen und deren korrekte Anwendung. Die richtige Wahl der Metriken und die Abstimmung der Parameter sind entscheidend für den Aufbau robuster prädiktiver Modelle. Eine Kombination aus Vorlesung, Diskussion und praktischen Übungen stellt sicher, dass Sie die Möglichkeit haben, die richtigen Metriken für Ihr Modell auszuwählen, und Sie können Ihr Maschinelles Lernmodell so einstellen, dass es verallgemeinerbar wird. Da der Data Scientist Kenntnisse im Bereich des Data Engineering benötigt, werden Sie Hive-Abfragen ausführen. Sie werden auch lernen, Nachrichten-warteschlangen aufzubauen und Daten in Echtzeit zu verarbeiten.

Dauer: Die Seminardauer beträgt fünf Tage. Format:

  • 50% Vorlesung + 50 % Praxis, Übungen und Demos
  • 50 Stunden Präsenzschulung, d.h. 10 Stunden täglich

Leistungen: Schulungsräume in zentraler Lage, 2-10 Teilnehmer pro Veranstaltung, Unterricht 9-18 Uhr, gedruckte Schulungsunterlagen, ein Zertifikat mit den Schulungsinhalten und Mittagessen, Erfrischungssnacks und Getränke in den Pausen (ein Laptop mit R Project und RStudio oder mit der Python Ananconda Distribution ist selbst mitzubringen)

Agenda des Seminars Data Science Crash Course

  • Einführungen in
    • Data Science, Big Data und Künstliche Intelligenz
    • Praxisbeispiele aus Unternehmen
      • Kundenabwanderung
      • Umsatzsteigerung
      • Kreditrisiko-Bewertung
      • Produktentwicklung
      • Kreditkartenbetrug
  • Grundlagen des Data Science
    • Data Exploration, Visualization, and Feature Engineering
    • Praxis-Übung: Data Exploration, Visualisierung, and Feature Engineering
    • Machine Learning Grundlagen
  • Klassifikations-Algorithmen
    • Einführung in Predictive Modeling
    • Entscheidungsbaum-Lernen
    • Logistische Regression
    • Naïve Bayes
    • Praxis-Übung: Erstellen eines Klassifikators
  • Regressions-Algorithmen
    • Lineare Regression
    • Regularized Regression Models
    • Praxis-Übung: Erstellen eines Regression-Modells
    • Neuronale Netze
    • Praxis-Übung: Erstellen eines Regression-und Klassifikations-Modells
  • Unsupervised Learning
    • K-Means Clustering
    • Praxis-Übung: Beispiel für K-Means Clustering
  • Empfehlungssysteme
    • Text Analytics
    • Content-Based and Collaborative Filtering
    • Bewertung von Empfehlungssystemen. DCG, nDCG
    • Praxis-Übung
  • Ensemble Methods
    • Bootstrapping, Bagging, and Boosting
    • AdaBoost
    • Random Forests
    • Praxis-Übung: Erstellen eines Random Forest Klassifikators
  • Operationalisierung von Modellen des maschinellen Lernens
    • Metriken und Methoden für die Evaluierung von Klassifikations- und Regressionsmodellen
    • Tuning von Parametern maschineller Lernalgorithmen
  • Feature Engineering
  • Feature Auswahl
  • Einsatz von Modellen des maschinellen Lernens
    • Erstellen und Testen von APIs
    • Kontinuierliche Integration
    • PaaS und IaaS
    • Docker
  • Übungen: Erstellen eines Modells in Azure ML Studio oder KNIME oder Amazon SageMaker
    • Praxis-Übung: Laden und Visualisierung von Daten
    • Praxis-Übung: Aufbau und Bewertung eines Modells