Mastering Natural Language Processing with Python
Kursziel
Natural Language Processing (NLP) ist ein rasant wachsendes Feld, das es Computern ermöglicht, menschliche Sprache zu verstehen, zu interpretieren und zu generieren. Es wird in der akademischen Forschung fachübergreifend eingesetzt – von den digitalen Geisteswissenschaften über die Sozialwissenschaften bis hin zur biomedizinischen Textanalyse. Dieser Kurs konzentriert sich auf fortgeschrittene NLP-Techniken mit der Programmiersprache Python und stattet Forschende mit den Werkzeugen aus, um Textdaten mit Klarheit und Präzision zu analysieren, zu modellieren und Erkenntnisse daraus zu gewinnen.
Durch praktische Programmierübungen und reale Datensätze entwickeln Sie praktische Fähigkeiten zur Verarbeitung und Analyse natürlicher Sprache. Sie werden grundlegende und fortgeschrittene Methoden erforschen, von der Vorverarbeitung und Vektorisierung bis hin zu Machine-Learning-Modellen für die Textklassifizierung und -generierung.
Bitte beachten Sie, dass die Kurse in englischer Sprache abgehalten werden.
Kursbeschreibung
Dieser Kurs richtet sich an Forschende und Anwender mit Vorkenntnissen in der Python-Programmierung. Er vertieft Kern- und Fortgeschrittenentechniken des NLP, die häufig in akademischen und Forschungskontexten angewendet werden.
Nach dem erfolgreichen Abschluss dieses Kurses werden Sie in der Lage sein:
- Verarbeitung und Bereinigung von Textrohdaten für die Analyse
- Transformation von Text in numerische Repräsentationen mittels Techniken wie TF-IDF und Word Embeddings
- Erstellung und Evaluierung von Modellen für Aufgaben wie Sentiment-Analyse, Topic Modeling und Named Entity Recognition
- Anwendung von Best Practices für Interpretierbarkeit, Reproduzierbarkeit und den verantwortungsvollen Einsatz von NLP in der Forschung
Das bloße Verfolgen von Folien wird die Fähigkeit des Programmierens nicht automatisch auf Sie übertragen. Erst durch die aktive Auseinandersetzung mit den Kursinhalten in Ihrer Entwicklungsumgebung wird dies gelingen.
Deshalb ist eine entsprechende Vorbereitung notwendig: Bitte stellen Sie sicher, dass Sie vor Kursbeginn Zugang zu Google Colab haben. Wir werden Google Colab für die Programmieranteile nutzen, damit wir Python ohne (oft zeitaufwändige) Vorkonfiguration oder Installation auf Ihrem Rechner verwenden können. Um Google Colab zu nutzen, benötigen Sie ein Google-Konto (dasselbe Konto, das für Gmail, YouTube usw. verwendet wird).
Kursmaterial
Sie finden die Vorlesungsfolien hier.
Falls Sie während der praktischen Übungen etwas nachschlagen möchten, finden Sie das Vorlesungs-Notebook hier. Bitte beachten Sie, dass dies nur ein kurzer Überblick ist und ich Ihnen während der Vorlesung weitere Beispiele geben werde.
Das Google Colab Notebook mit den Übungen finden Sie hier. Die Lösungen finden Sie hier.
Happy coding!

