Course in Natural Language Processing
Description
Natürliche Sprachen sind von Menschen gesprochene Sprachen, die sich dynamisch und weitgehend unkontrolliert entwickelt haben. Die Verarbeitung natürlicher Sprache (engl. "Natural Language Processing", NLP) ist eine der zentralen Herausforderungen der Informatik im Bereich der angewandten künstlichen Intelligenz. Zu den Zielen gehören die u.a. computergestützte Unterstützung von Menschen beim Schreiben, das Identifizieren oder Generieren von Texten, die eine Frage beantworten, das automatische Kategorisieren von Texten, das Extrahieren bestimmter Informationen aus ihnen und das Zusammenfassen oder Übersetzen von Texten. Um sicherzustellen, dass sich Maschinen nahtlos in eine Umgebung einfügen, die von und für Menschen geschaffen wurde, werden natürliche Sprachen als Benutzerschnittstelle dienen. Die daraus resultierenden Technologien werden Sprachtechnologien genannt. In dem Modul werden grundlegende und fortgeschrittene Konzepte und Methoden der Sprachverarbeitung sowie der entsprechende mathematische Hintergrund vermittelt und in der Praxis erprobt. Typische Schwerpunkte sind verschiedene Bereiche der Linguistik, Korpuslinguistik, Textmodelle, Wörter, Syntax, Semantik, Diskurs und Anwendungen sowie KI- und ML-Technologien und insbesondere Transformer-Architekturen.General Information
| Lecturer | Prof. Dr. Martin Potthast |
| Lab Advisors | Klara Gutekunst |
| Workload | 2 SWS Lecture, 2 SWS Lab |
| Lecture | Wednesday, 12:00 s.t. - 13:30, Hörsaal 2104 (Wilhelmshöher Allee 71), starting 15.04.2026 |
| Lab | Tuesday, 14:15 - 15:45, Raum -1605 (Neubau Wilhelmshöher Allee), starting 21.04.2026 |
| Exam | Thursday, 16 July 2026 10:00 – 11:45, Hörsaal 0446. |
| Permitted resources for the exam |
- a non-programmable calculator - a one-sided, handwritten (pen and paper; not digitally handwritten) DIN A4 sheet of paper with notes (with name + matriculation number, has to be handed in) |
Organization
- Lectures will take place in person, but have additionally been prerecorded. The videos can be accessed by following the lecturenotes below, or on the Webis YouTube channel. [playlist]
- Exercises will take place regularly from April 21 onwards.
- Examination will take place as a written exam (90 min). The exam is written in English. Your answers can be written in English or German.
-
Communication
- Discord — direct communication with teaching staff and announcements will be posted here. Please email the teaching staff for a link to join.
- Lecture website — materials and organization annoucements will be uploaded on this website.
Lecturenotes
-
Natural Language Processing »
Introduction »
Organization, Literature
[video 1] -
Natural Language Processing »
Introduction »
NLP Problems
IR Excursion: [IR In a Nutshell] [Indexing] [Search Engine Architecture]
[video 2] [video 3] [video 4] -
Natural Language Processing »
Corpus Linguistics »
Empirical Research in NLP
[video 5] [video 6] [video 7 (2025)] -
Natural Language Processing »
Corpus Linguistics »
Corpora
[video 8 (2025)] -
Natural Language Processing »
Corpus Linguistics »
Annotation
[video 9 (2025)] [video 10 (2025)] -
Natural Language Processing »
Text Models »
Text Preprocessing
[video 11 (2025)] [video 12 (2025)] [exkurs: string processing] [video 13 (2025)] [video 14 (2025)] -
Natural Language Processing »
Words »
Morphology
[video 15 (2025)] -
Natural Language Processing »
Text Models »
Text Representation
[video 16 (2025)] [video 17 (2025)] [video 18 (2025)] [slides logistic regression] [video 19 (2025)] -
Natural Language Processing »
Semantics »
Semantic Structures
[video 20 (2025)] -
Natural Language Processing »
Text Models »
Text Similarity
[video 21 (2025)] -
Natural Language Processing »
Language Models »
Language Modeling
[video 22 (2025)] -
Natural Language Processing »
Language Models »
Introduction to LLMs
[video 23 (2025)] [video 24 (2025)]
Lab Sessions
Lab project material will be published here over the course of the semester.
| Date | Title | Materials | Deliverables |
|---|---|---|---|
| 21.04.2026 |
|
|
|
| 28.04.2026 |
|
||
| 05.05.2026 |
|
||
| 12.05.2026 |
|
|
|
| 19.05.2026 |
|
|
Literature
- J. Eisenstein. Natural Language Processing. MIT Press 2019. [view]
- D. Jurafsky, J. H. Martin. Speech and Language Processing. Prentice Hall 2000, 2009, 2025. [view]
- C. D. Manning, H. Schütze. Foundations of Statistical Natural Language Processing. MIT Press 1999. [view]
Further Resources
- 01 — Introduction to Python [view] [download]
- 02 — Introduction to Jupyter [view] [download]
- 03 — How to commandline [MIT's missing-semester]