Angebot!

Seminar Data Science Crash Course mit Python

Dozent: Dr. Christoph Oestreicher

 

 2.495,00  1.995,00

Zzgl. 16% MwSt.
Auswahl zurücksetzen

Mit dem Seminar Data Science Crash Course mit Python erhalten Sie eine fundierte und modular aufgebaute Einführung in die Themen Data Science, Künstliche Intelligenz und Machine Learning (Maschinelles Lernen) sowohl für numerische Daten als auch für Textdaten. Informationen zur Durchführung von Online-Seminaren finden Sie hier. Unternehmen und Organisationen können bei der Buchung von zwei Seminarplätzen im 5-tägigen Komplett-Training kostenlos eine dritte Person anmelden (Anmeldung zum selben Termin + genügend freie Plätze, sonst bitte anderen Termin wählen). Sie können auf Rechnung zahlen (weitere Infos).

Beschreibung

In dem Kurs Data Science Crash Course mit Python erhalten Sie eine fundierte und modular aufgebaute Einführung in die Themen Data Science, Künstliche Intelligenz und Machine Learning (Maschinelles Lernen) sowohl für numerische Daten als auch für Textdaten. Ziel dieser Methoden ist es, aus den vorhandenen Daten einen Mehrwert zu schaffen. Und genau das lernen Sie in unserem Data Science Crash Course in drei aufeinander aufbauenden Modulen.

Zielgruppe: Beschäftigte aus operativen Bereichen, R&D und IT mit grundlegenden Programmierkenntnissen, welche die Potenziale von Data Science, Künstlicher Intelligenz und Maschinellem Lernen für ihren Bereich kennenlernen und hautnah erfahren möchten; außerdem Anwender, Studenten, Doktoranden und Forscher aus den mathematischen, statistischen, naturwissenschaftlichen, ingenieurwissenschaftlichen, informationstechnologischen, betriebs-, wirtschafts-, markt- und sozialwissenschaftlichen Bereichen.

Voraussetzungen: Für den Data Science Crash Course mit Python sind Grundverständnisse der Linearen Algebra (Vektoren, Matrizen) und ein Basiswissen in der Statistik (wie Korrelationen, Signifikanztests, lineare Regression) sehr empfehlenswert. Sie sollten Grundkenntnisse in einer Programmiersprache besitzen, am besten wäre eine Skriptsprache wie Python, Matlab oder R.

Lernziele:

  • die aktuelle Berichterstattung zu Künstliche Intelligenz, Maschinellem Lernen, Reinforcement Learning und Data Science sowie deren Anwendungspotential in verschiedenen Bereichen wie Logistik, Predictive Maintenance oder Chatbots inhaltlich einordnen und bewerten können,
  • vorhandene Daten mit Python und Methoden des Maschinellen Lernens für Ihren Bereich nutzbar machen können (unter Einsatz der Python-Pakete Scikit-Learn und Keras/Tensorflow),
  • die Programmiersprache Python und den wissenschaftlichen Rechenstapel von Python zur Implementierung von Maschinellen Lernalgorithmen kennengelernt haben, um zu wissen, welche Daten für die erfolgreiche Umsetzung einer Fragestellung aus Ihrem Bereich (noch) notwendig sind,
  • ein vollständigen Data Science-Zyklus umgesetzt haben und damit wissen, was hierfür notwendig ist und welche Herausforderungen auf Sie zukommen werden,
  • ein Kategorien-Einteilung/Clustering aus dem Bereich NLP/Text-Mining mit Unüberwachtem Lernen/Unsupervised Learning (PCA, k-Means, DBSCAN) durchführen können,
  • eine Trendvorhersage mit Überwachtem Lernen/Supervised Learning (Neuronale Netze, XGBoost, LSTM) durchführen können,
  • wissen, was Sie beachten müssen, wenn Sie Daten aus dem Internet ziehen (Web Scraping und Web Crawling) – und wie Sie Daten von einer Seite “scrapen“ und vor-verarbeiten können,
  • wie Sie Texte mittels Tokenizer, Stopwords, Stemming und n-grams vor-verarbeiten bzw. parsen können und
  • einen praktischen Einblick erhalten, wie Sie Topic Clustering, eine Sentiment Analyse und Satz-Vervollständigung mittels Unsupervised und Supervised Learning durchführen können.

Dauer: Die Seminardauer beträgt fünf Tage. Format:

  • Rahmen: 5 Tage mit 40 Unterrichtsstunden (täglich 8 Stunden, 9-17 Uhr)
  • Aufteilung Theorie/Praxis: 40% Theorie + 60 % Praxis, Übungen und Demos

Leistungen: Unterricht im virtuellen Klassenraum, max. 10 Teilnehmer pro Veranstaltung, persönliche Betreuung durch den Dozenten, täglicher Unterricht 9-17 Uhr, digitale Schulungsunterlagen, Zertifikat wird danach zugeschickt, Zahlung auf Rechnung

Agenda des Seminars Data Science Crash Course mit Python

Modul Data Science und Künstliche Intelligenz mit Python (2 Tage)

  • Überblick, Grundlagen und Praxisbeispiele
    • Künstliche Intelligenz
    • Data Science
    • Maschinelles Lernen
    • Herausforderungen bei der Umsetzung eines Data Science/KI Projekts
    • Praxisbeispiele u.a. zu den Themen:
      • Natural Language Processing (NLP)
      • Bilderkennung
      • Predictive Maintenance
      • Prozessindustrie
      • Logistik
  • Intensivkurs Python
    • Einführung in Python: list, array, loops, functions, classes, plotting
    • Relevante Python-Bibliotheken: numpy, scikit-learn, pandas
    • Data Science mit Python: Statistiken, Korrelationen, Vorverarbeitung
    • Praxis-Übung: Datenzugriff, Datenexplorierung und Visualisierung
  • Methoden des Maschinelles Lernen
    • Überwachtes Lernen/Supervised Learning
    • Unüberwachtes Lernen/Unsupervised Learning
    • Reinforcement Learning
    • Praxis-Übung: Selektion der richtigen Features
  • Data-Science-Zyklus
    • Datenverständnis und Vorbereitung
    • Aufsetzen des Data Science Zyklus: Train-Test-Split, Pipelines, Kreuzvalidierung/Crossvalidaton, Hyperparameter-Optimierung
    • Implementierung eines Machine Learning Algorithmus (Learning Vector Quantization)
    • Evaluation des Algorithmus
    • Praxis-Übung: Clustering und Klassifikation

Modul Machine Learning mit Python (2 Tage)

  • Praxis-Beispiel I (Clustering)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung I: Dimensionalitätsreduzierung mit einer Principal Components Analysis (PCA)
    • Praxis-Übung II: Kategorie-Einteilung von Service-Einsätzen mittels KMeans und Density-Based Spatial Clustering of Applications with Noise (DBSCAN)
  • Praxis-Beispiel II (Virtueller Sensor)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung: Vorhersage eines (meistens nicht direkt messbaren) Wertes anhand vorhandener Variablen/Merkmale mittels Decision Trees, Random Forest und XGBoost und Evaluation mittels Feature Importance
  • Praxis-Beispiel III (Trendvorhersage)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung I: Zeitreihenvorhersage mittels Random Forest, XGBoost und Neuronalen Netzen
    • Praxis-Übung II: Mulitvariate Zeitreihenvorhersage mittels Long-Short-Term-Memory (LSTM) inkl. eiterführende Python-Bibliotheken: keras, tensorflow

Modul Natural Language Processing (NLP) mit Python (1 Tag)

  • Web Scraping und Crawling
    • Kommerzielle und ethische Gesichtspunkte
    • Scrapen einer Webseite: requests, robots.txt, html, regex
    • Praxis-Übung: Scrapen einer Webseite
  • Vorverarbeitung von Text
    • Parsing: Tokenizer, Stopwords, Stemming, n-grams
    • Praxis-Übung: Parsen von Data Science Texten
  • Praxis-Beispiel I (Topic Clustering)
    • Kurze Einführung in den Kontext und die Zielsetzung
    • Praxis-Übung: Unüberwachtes Lernen/Unsupervised Learning (DBSCAN)
  • Praxis-Beispiel II (Sentiment Analysis)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Praxis-Übung: Überwachtes Lernen/Supervised Learning (Neuronale Netze)
  • Praxis-Beispiel III (Sentence Completion)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Praxis-Übung: Symbolische Zeitreihenvorhersage (Long-Short-Term-Memory/LSTM und Embedding)