Edition-Lab

Leitung: Prof. Dr. Jörg Wesche

Das Edition Lab beschäftigt sich mit Methoden zur Erschließung von Textsammlungen und digitalen historischen Editionen aus literaturwissenschaftlicher Perspektive. Es ist aus verschiedenen Campuslab-Projekten hervorgegangen und arbeitet eng mit dem Göttinger Digitalisierungszentrum und der Abteilung "Forschung und Entwicklung" der SUB zusammen.

Die digitale Edition, insbesondere die Erstellung und Nutzung der digitalen Editionen, dient als Bindeglied zwischen der Literaturwissenschaft und den eher formalisierten Wissenschaften der Korpuslinguistik sowie der Informatik.

Das Editionslabor beschäftigt sich in erster Linie mit der Generierung von Daten, also philologisch korrekt edierten Texten. Eine Edition kann eine Vielzahl von unterschiedlichen Ansätzen verfolgen. Sie können eine dokumentarische oder diplomatische Funktion haben und auf ihren Entstehungsprozess oder eine historisch-kritische Kontextualisierung ausgerichtet sein. In jedem Fall muss sie aus drei Teilen bestehen, die alle auf einer soliden Methodik beruhen: Bewahrung, Präsentation und Annotation, jeweils bezogen auf die unterschiedlichsten Texte in verschiedenen Sprachen und Schriftsystemen. Dabei haben wir es weniger mit Big Data zu tun, sondern eher mit der Erstellung, Verarbeitung und teilweise Analyse von dichten, komplexen Daten.

Der erste Schritt ist die OCR (optische Zeichenerkennung) der handschriftlichen oder gedruckten Texte. Da wir für wissenschaftliche Editionen einen exakt transkribierten Text benötigen, ist in der Regel ein hoher Korrekturaufwand notwendig. Um diesen Arbeitsaufwand zu verringern, ist eine Weiterentwicklung der Technologien erforderlich. Zu diesem Zweck stehen wir in Kontakt mit dem Team von OCR-D, der von der DFG geförderten Initiative zur Entwicklung von Optical Character Recognition.

Im zweiten Schritt müssen die transkribierten Texte markiert werden. Dies geschieht zum einen automatisch, wie bei der Part-of-Speech-Annotation, die den Token Wortarten zuordnet. Auf der anderen Seite müssen verschiedene formale und inhaltliche Aspekte manuell annotiert werden.

Im Beispielbild sehen Sie einen Screenshot aus der Datenbank "Interaktionelle Rede in den Stücken von Andreas Gryphius". Diese ist aus dem bereits abgeschlossenen gleichnamigen DFG-geförderten Projekt hervorgegangen. In diesem Projekt wurde eine annotierte Datenbank (basierend auf der Datenbankarchitektur ANNIS3) verwendet, die das gesamte dramatische Werk von Andreas Gryphius enthält, mit dem Ziel, korpusbasierte Fragestellungen aus einer literatur- und sprachübergreifenden Perspektive zu untersuchen.

Insgesamt ist die digitale Edition ein sich entwickelndes Feld. Seit dem 19. Jahrhundert haben sich in den Philologien Standards historisch-kritischer Editionen entwickelt, die nun in den digitalen Raum übertragen werden müssen. Die Herausforderung besteht darin, traditionelle Kriterien und Methoden mit den Möglichkeiten der Digital Humanities zu verbinden. Bereits eingeführte Standards (z. B. TEI) müssen teilweise angepasst und erweitert werden. Auch die Verpflichtung auf die FAIR-Prinzipien stellt die Forscher vor verschiedene Herausforderungen. Weitere Informationen zur Debatte um digitale Editionen finden Sie im "Manifest für digitale Editionen", das auf der diesjährigen DHd-Konferenz entstanden ist.

Wir planen - vorbehaltlich der Genehmigung - ein Projekt zu den Werken von Gotthold Ephraim Lessing. Ziel ist es, nicht nur eine Edition eines der einflussreichsten deutschsprachigen Schriftsteller zu erstellen, sondern gleichzeitig einen Beitrag zur Theorie und Methodik der digitalen Edition zu leisten.