Scalable Language Technologies Lab

Description

Sprachtechnologien sind Methoden und Werkzeuge zur Analyse, Modifizierung und Erzeugung menschlicher Sprache. Sie sollen zwischenmenschliche Interaktionen und Interaktionen zwischen Menschen und Maschinen in natürlicher Sprache unterstützen. Sprachtechnologien bilden die Grundlage zahlreicher intelligenter Informationssysteme, wie Suchmaschinen, Übersetzungssysteme, Dialog- und Konversationssysteme, Argumentationssysteme und viele mehr. Sie werden in den Bereichen Natural Language Processing (NLP) und Information Retrieval (IR) erforscht. Künstliche Intelligenz (KI), maschinelles Lernen (ML) und insbesondere Deep Learning (DL) bilden eine wichtige Grundlage für Sprachtechnologien. Der Einsatz der letzteren erfordert skalierbare verteilte Architekturen und große Mengen an Sprachdaten, die als Trainingsbeispiele für die Modellierung ausgewertet werden. Eine der primären Datenquellen hierfür ist das Web. Die Webis-Forschungsgruppe betreibt einen modernen Hochleistungsrechner mit umfangreicher Speicher- und Rechenkapazität sowie aktueller Middleware (https://webis.de/facilities.html). Zu Forschungszwecken wird dort ein Webausschnitt im Umfang von Petabytes gespeichert, der die Gegenwart und Vergangenheit des Webs widerspiegelt – ein einzigartiger Forschungsgegenstand. Im Modul lernen die Studierenden maschinelle Lernverfahren für NLP, IR, Big Data und DL zu analysieren und skalierbar umzusetzen.

General Information

Lecturers Prof. Dr. Martin Potthast, Lukas Gienapp
Workload 4 SWS
Lab Monday, 10:15-13:45, Raum -1605 (Neubau Wilhelmshöher Allee), starting 28.04.2025.
Contact via email or office hours

Resources

Date Title Description Materials Deliverables Stream
28.04.2025 Introduction (Session 1)
  • General Information
  • Project Overview
  • Group finding
05.05.2025 AQL & ElasticSearch(Session 2)
  • Cluster onboarding
  • Hands-on programming exercise
  • Group finding