Seminar Natural Language Processing (NLP) mit R

Dozent: Dr. Christoph Oestreicher

 

Bisher bei uns  625,00

Zzgl. 19% MwSt.

Das eintägige Seminar Natural Language Processing (NLP) mit R ist das dritte Modul des Lehrgangs Data Science Crash Course mit R und gibt einen Einblick, wie Sprachdaten verarbeitet werden können.

Eine kurze Beschreibung des Kurses finden Sie unten. Ausführliche Informationen finden Sie auf der → Veranstaltungsseite zum Seminar.

Artikelnummer: NLR Kategorien: , ,

Beschreibung

Der Kurs Natural Language Processing (NLP) mit R ist das dritte Modul des Lehrgangs Data Science Crash Course mit R und gibt einen Einblick, wie Sie symbolische Daten (wie Wörter) verarbeiten können und dadurch ein Verständnis von Text und Sätzen erhalten (auch mit Nutzung von ChatGPT). Diese Fertigkeit können Sie dann anwenden, um z. B. einen eigenen Chatbot oder einen Chatbot auf Basis von ChatGPT zu entwickeln oder andere symbolische oder ereignis-basierte Daten (wie z. B. Seitenaufrufe) zu modellieren und vorherzusagen. Gerne können Sie Ihre eigene Fragestellung inkl. der notwendigen Daten mitbringen.

Zielgruppe: Beschäftigte aus operativen Bereichen, R&D und IT mit grundlegenden Programmierkenntnissen geeignet, welche die Potenziale von Data Science, Künstlicher Intelligenz und Maschinellem Lernen für ihren Bereich kennenlernen und hautnah erfahren möchten. Außerdem Anwender, Studenten, Doktoranden und Forscher aus den mathematischen, statistischen, naturwissenschaftlichen, ingenieurwissenschaftlichen, informationstechnologischen, betriebs-, wirtschafts-, markt- und sozialwissenschaftlichen Bereichen.

Voraussetzungen: Die Inhalte des Seminars Data Science und Künstliche Intelligenz mit R werden vorausgesetzt. Grundsätzliches Verständnis der Modellierung und dem zugehörigen Prozess im Data Science sowie entsprechende Programmierkenntnisse in der Skriptsprache R sollten vorhanden sein. Das Modul Machine Learning mit R ist nicht zwingend notwendig, dennoch sollte eine grundlegende Kenntnis über die unterschiedlichen Machine Learning Algorithmen vorhanden sein. Falls auf dem teilnehmenden Computer die neuesten Versionen von R und RStudio nicht installiert werden können, kann gegen eine geringe Gebühr der Fernzugriff (Virtual Network Computing) auf einen Schulungslaptop gemietet werden.

Lernziele: Am Ende dieses Intensivkurses Natural Language Processing (NLP) mit R werden Sie

  • wissen, was Sie beachten müssen, wenn Sie Daten aus dem Internet ziehen (Web Scraping und Web Crawling) – und wie Sie Daten von einer Seite “scrapen“ und vorverarbeiten können,
  • wie Sie Texte mittels Tokenizer, Stopwords, Stemming und n-grams vor-verarbeiten bzw. parsen können und
  • einen praktischen Einblick erhalten, wie Sie Topic Clustering, eine Sentiment Analyse und Satz-Vervollständigung mittels Unsupervised und Supervised Learning durchführen können.

Dauer: Die Seminardauer beträgt ein Tag. Format:

  • Rahmen: 1 Tag mit 8 Unterrichtsstunden (9-17 Uhr)
  • Aufteilung Theorie/Praxis: 40% Vorlesung + 60 % Praxis, Übungen und Demos

Leistungen: Unterricht im virtuellen Klassenraum, max. 10 Teilnehmer pro Veranstaltung, persönliche Betreuung durch den Dozenten, täglicher Unterricht 9-17 Uhr, digitale Schulungsunterlagen, Zertifikat wird danach zugeschickt, Zahlung auf Rechnung

Ausführliche Informationen und Buchungsmöglichkeiten finden Sie auf der → Veranstaltungsseite zum Seminar.

Inhalte des 1-tägigen Trainings Natural Language Processing (NLP) mit R

  • Web Scraping und Crawling
    • Kommerzielle und ethische Gesichtspunkte, auch im Kontext von ChatGPT
    • Scrapen einer Webseite: requests, robots.txt, html, regex
    • Praxis-Übung: Scrapen einer Webseite
  • Vorverarbeitung von Text
    • Parsing: Tokenizer, Stopwords, Stemming, n-grams
    • Praxis-Übung: Parsen von Data-Science-Texten
  • Praxis-Beispiel I (Topic Clustering)
    • Kurze Einführung in den Kontext und die Zielsetzung
    • Praxis-Übung: Unüberwachtes Lernen/Unsupervised Learning (DBSCAN)
  • Praxis-Beispiel II (Sentiment Analysis)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Praxis-Übung: Überwachtes Lernen/Supervised Learning (Neuronale Netze)
  • Praxis-Beispiel III (Sentence Completion)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Ausblick auf die Technologie der Transformer (Architektur von ChatGPT)
    • Praxis-Übung: Symbolische Zeitreihenvorhersage (Long-Short-Term-Memory/LSTM und Embedding)

Ausführliche Informationen und Buchungsmöglichkeiten finden Sie auf der → Veranstaltungsseite zum Seminar.