
Datum: 19.03.2026 bis 20.03.2026
Uhrzeit: 10:00 bis 16:00 Uhr
Ort: Leibniz-Institut für Europäische Geschichte (IEG) | Alte Universitätsstraße 19 | D - 55116 Mainz
Diese Veranstaltung wird organisiert durch das
Format:
Bring-your-own-data-Lab
LLMs für die Geisteswissenschaften
Vom General-Purpose-Modell zum Spezialwerkzeug im Bring-Your-Own-Data-Lab
Leitung des Workshops:
Sarah Oberbichler, Johanna Mauermann, Lauren Coetzee
Ziele und Inhalt:
In dem Workshop geht es um spezialisierte Large Language Models und spezialisiertes Prompting für die Geisteswissenschaften. In verschiedenen Impulsvorträgen und Hands-on-Sessions lernen Teilnehmende, wie sie offene, auf die geisteswissenschaftliche Forschung spezialisierte und lokale Modelle mit ihren eigenen Daten verwenden können und wie sie Prompts an geisteswissenschaftliche Fragen anpassen können. Ebenfalls reflektieren wir, wie Daten für ein Fine-Tuning oder Post-Training eines kleinen Sprachmodells aufbereitet werden können.
Voraussetzungen:
Der Workshop richtet sich an Forschende der Geisteswissenschaften, die mit Textdaten arbeiten. Vorausgesetzt werden grundlegende Kenntnisse im Bereich generativer KI. Die mitgebrachten Daten sollten maschinenlesbar vorliegen.
Wir werden in manchen Hands-on-Sessions mit Jupyter Notebooks und Python sowie mit Hugging Face arbeiten. Die Teilnahme ist auch ohne vertiefte Kenntnisse in diesen Bereich möglich.
Selbstlernmaterialien zur Vorbereitung des Workshops (Einführung in Jupyter Notebooks und das Verarbeiten von Datensätzen mit Python) finden sich im folgenden GitHub-Repository: https://github.com/soberbichler/Bring-your-own-data-Lab_LLMs.
Bitte geben Sie bei der Anmeldung folgende Informationen an:
- Ihr Fachgebiet
- Welche Erfahrung haben Sie mit generativer KI?
- Welche Art von Daten bringen Sie mit?
Hinweis: Die Teilnehmerzahl ist auf maximal 15 Personen begrenzt.
Der Workshop findet überwiegend auf Deutsch statt, einzelne Impulse werden auf Englisch sein.
Anmeldungsfrist: 9. März 2026
Programm
Tag 1
10:00 Uhr Anmeldung
10:30 Uhr Willkommen / Einführung / Kennenlernen
11:15 Uhr Impuls 1: Offene und spezialisierte Modelle für die Geistewissenschaften | Sarah Oberbichler
12:15 Uhr Mittagspause
13:15 Uhr Hands-on: Lokal gehostete und forschungsnahe LLMs am eigenen Rechner | Sarah Oberbichler
14:45 Uhr Kaffeepause
15:00 Uhr Hands-on: Lokal gehostete LLMs mit eigenen Daten verwenden | Sarah Oberbichler
15:30 Uhr Impuls 2: Einführung in HuggingFace | Johanna Mauermann
15:45 Uhr Hands-on: Forschungsnahe Modelle mit HuggingFace Inference | Johanna Mauermann
16:45 Uhr Diskussion
17:15 Uhr Abschluss
18:00 Uhr Workshop-Abendessen (auf eigene Kosten) | alle Teilnehmenden
Tag 2
09:30 Uhr Willkommen
09:45 Uhr Impuls 1: Prompting und Benchmarking für die Geisteswissenschaften | Lauren Coetzee
10:45 Uhr Kaffeepause
11:00 Uhr Hands-On: Prompts an geisteswissenschaftliche Forschungsfrage anpassen und Benchmarking Strategien überlegen | Lauren Coetzee
12:00 Uhr Mittagspause
13:00 Uhr Impuls 2: Einführung in Fine-Tuning und Post-Training | Sarah Oberbichler
13:30 Uhr Hands-on: (Eigene) Daten für Fine-Tuning aufarbeiten | Sarah Oberbichler
14:45 Uhr Kaffeepause
15:00 Uhr Diskussion und Mentoring | Sarah Oberbichler/Lauren Coetzee/Johanna Mauermann
15:45 Uhr Schlusswort
Kontakt und Anmeldung
Hinweis zur Anmeldung
Der Workshop ist bereits ausgebucht, Interessierte können sich jedoch gerne auf die Warteliste setzen lassen.
Bei Fragen wenden Sie sich an:
Johanna Mauermann