Course in Natural Language Processing

Description

Natürliche Sprachen sind von Menschen gesprochene Sprachen, die sich dynamisch und weitgehend unkontrolliert entwickelt haben. Die Verarbeitung natürlicher Sprache (engl. "Natural Language Processing", NLP) ist eine der zentralen Herausforderungen der Informatik im Bereich der angewandten künstlichen Intelligenz. Zu den Zielen gehören die u.a. computergestützte Unterstützung von Menschen beim Schreiben, das Identifizieren oder Generieren von Texten, die eine Frage beantworten, das automatische Kategorisieren von Texten, das Extrahieren bestimmter Informationen aus ihnen und das Zusammenfassen oder Übersetzen von Texten. Um sicherzustellen, dass sich Maschinen nahtlos in eine Umgebung einfügen, die von und für Menschen geschaffen wurde, werden natürliche Sprachen als Benutzerschnittstelle dienen. Die daraus resultierenden Technologien werden Sprachtechnologien genannt. In dem Modul werden grundlegende und fortgeschrittene Konzepte und Methoden der Sprachverarbeitung sowie der entsprechende mathematische Hintergrund vermittelt und in der Praxis erprobt. Typische Schwerpunkte sind verschiedene Bereiche der Linguistik, Korpuslinguistik, Textmodelle, Wörter, Syntax, Semantik, Diskurs und Anwendungen sowie KI- und ML-Technologien und insbesondere Transformer-Architekturen.

General Information

Lecturer Prof. Dr. Martin Potthast
Lab Advisors Tim Hagen
Workload 2 SWS Lecture, 2 SWS Lab
Lecture Wednesday, 12:00 s.t. - 13:30, Hörsaal 2104 (Wilhelmshöher Allee 71), starting 23.04.2025
Lab Tuesday, 14:15 - 15:45, Raum -1605 (Neubau Wilhelmshöher Allee), starting 29.04.2025
Exam Written exam at the end of the semester: 05.08.2025 at 10:15 in Room 0425 (Wilhelmshöher Allee)

Lecturenotes

Lab Sessions

Lab project material will be published here over the course of the semester.

Date Title Materials Deliverables
29.04.2025
  • Lab Overview
06.05.2025
  • NLTK & spaCy
  • IMDB Movie Reviews
13.05.2025
  • Exercise 1 due
20.05.2025
27.05.2025
  • Exercise 2 due
03.06.2025
10.06.2025
  • Exercise 3 due
17.06.2025
24.06.2025
  • Exercise 4 due
01.07.2025
08.07.2025
  • Exercise 5 due
15.07.2025
22.07.2025
  • Exercise 6 due

Literature

  • J. Eisenstein. Natural Language Processing. MIT Press 2019. [view]
  • D. Jurafsky, J. H. Martin. Speech and Language Processing. Prentice Hall 2000, 2009, 2025. [view]
  • C. D. Manning, H. Schütze. Foundations of Statistical Natural Language Processing. MIT Press 1999. [view]

Further Resources