Natural Language Processing Schulung für Einsteiger, Alexander Thamm GmbH, Mittwoch, 01. April 2020



Die Schulung gibt eine Einführung in das Thema Natural Language Processing. Zunächst wird das Feld durch die Vorstellung verschiedener Use Cases motiviert. Es folgt eine Abgrenzung zu anderen Data Science / Machine Learning Projekten: Was unterscheidet textbasierte Daten von Zahlen oder Bildern? Was sind typische Ziele von NLP Projekten vs. anderen Data Science Projekten? Mit dem erworbenen grundlegenden Verständnis für das Feld widmet sich die Schulung der konkreten Umsetzung von NLP-Projekten. Behandelt werden verschiedene Cleaning- und Preprocessing-Methoden (Tokenization, Stopwords Removal, Stemming, Lemmatization), sowie Transformations-Methoden, um textbasierte Daten numerisch zu repräsentieren (Count Vectorization, TF-IDF Weighting). Der Fokus liegt dabei auf traditionelleren Repräsentationen (z.B. Bag of Words). Der praktische Teil besteht aus einer Mischung aus theoretischer Vorstellung der Methoden und praktischen Übungen zur Anwendung der Inhalte. Moderne Ansätze und Entwicklungen im Feld und deren Anwendbarkeit in der Praxis werden in einem abschließenden Block vorgestellt.
Schulungsinhalte

Vorstellung der NLP Use Cases
Was unterscheidet NLP Probleme von anderen Problemen?
Einführung Bag of Words-Repräsentation
Data Pre-processing
Tokenization (words, n-grams, characters)
Stopwords/ Punctuation
Stemming 
Lemmatizing + Part of Speech Tagging
Upper/lower casing
Named Entitiy Recognition
Data Transformation
Count Vectorizer
Occurance matrix (binary)
Frequency matrix (word count)
Weighting Techniques (TF-IDF, PMI) 
Cleaning
Encoding
Excluding words/text parts in different language
Anwendung der erlernten Techniken an konkreten Beispielen
Vergleich der Performanz verschiedener Classifier (z.B. Naive Bayes, Support Vector Machine)
Ableitung komplexerer Repräsentationen vom Bag-of-Words Modell
Andere Zählmethoden  
Kontext-sensitive Ansätze
Verständnis für die Anwendbarkeit verschiedener Ansätze auf unterschiedliche Problemstellungen, Daten-Grundlagen und Projektziele

 
Key Take Aways

NLP Use Cases
Nötige und hiflreiche Verarbeitungsschritte beim Umgang mit Text
Auswahl der passenden Methoden für NLP-Probleme

 
Zielgruppe & Voraussetzungen
 
Zielgruppe
Personen, die bereits erste Kenntnisse / Erfahrungen in Data Science und Machine Learning haben und Einblicke in das Fachgebiet Natural Language Processing erlangen wollen
Personen, die verstehen wollen, wie man mit textbasierten Daten arbeiten kann
 
Voraussetzungen
allgemeines Verständnis für Data Science Use Cases und Methoden 
 
 
Dozenten
Nico Becker Nico Becker ist Data Scientist bei der Alexander Thamm GmbH. Er ist als Trainee gestartet und hat Einblicke in viele verschiedene Bracnchen und Problemstellungen erhalten. Sein Fachgebiet ist die der Entwicklung von Machine Learning Algorithmen sowie der benötigten Schritte zur Daten-Aufbereitung und -Transformation. Der Fokus lag dabei zuletzt vor allem auf der Klassifizierung von Text basierten Daten. Neben der Projektarbeit gehören die Moderation von Workshops und Schulungen zu seinen Tätigkeiten.
 


Natural Language Processing Schulung für Einsteiger

Salesforce Admin Training München

Salesforce Admin Training München

Montag 12. Oktober 2020
Docker Foundation Training
Montag 20. April 2020
Docker Foundation Training
Montag 22. Juni 2020
Einführung Business Analytics
Donnerstag 23. April 2020
Data Management / ETL
Montag 27. April 2020
Einführung Business Analytics
Donnerstag 25. Juni 2020
Data Management / ETL
Montag 29. Juni 2020
Weitere interessante Veranstaltungen
Holen Event Empfehlungen basierend auf Ihre Facebook-Geschmack. Hol es dir jetzt!Zeigen Sie mir die passenden Veranstaltungen für michNicht jetzt