Dr. Marco Büchler (Göttingen)


Historische Text Re­-use Erkennung


Respondentin: Dr. Ute Pietruschka (Göttingen/Halle)


Zeit: 10. Juli 2014, 18h c.t.
Ort: Raum VG 1.104 (Verfügungsgebäude, Platz der Göttinger Sieben 7, 37073 Göttingen).


Abstract

Die Erkennung von Text Re-use spiegelt das Wiederverwenden von Textinhalten wider. Beispiele hierfür sind Zitate, Paraphrasen, Allusionen und auf modernen Texten auch Plagiarismus. Bei historischen Texten wird diese Erkennung zusätzlich durch die sprachliche Varianz wie Sprachevolution, verschiedene Dialekte oder auch unvollständig erhaltene Wörter erschwert. Geisteswissenschaftliche Anwendungen des Historischen Text Re-use sind beispielsweise das Aufzeigen von Überlieferungslinien, das Erkennen von Abschreibverhältnissen oder die Textkritik.
Mit dem Aufkommen von Big Data in den Geisteswissenschaften steht eine große Menge an verteilten Textdaten zur Verfügung, die nur sehr schwer mit traditionellen Methoden erschlossen werden kann. Ausgehend von einer ?Anforderungsanalyse? zu den Re-use Types (Was wird zitiert?) und den Re-use Styles (Wie wird etwas wiedergegeben?) wird das TRACER-Framework vorgestellt. Anhand eines Fallbeispieles wird weiterhin gezeigt, wie sehr der Re-use Style durch die Intention des Wiederverwendens beeinflusst wird und somit andere Verfahren mit abweichenden Parametern notwendig sind. Auf Basis dieser Prämisse wird ein Weg aufgezeigt, wie eine Text Re-use Analyse nahezu vollautomatisch evaluiert werden kann, wodurch die Möglichkeit geschaffen wird, das Verfahren und die Parameter automatisch bestmöglich vorzubestimmen. Abschließend folgt eine kurze Betrachtung zur damit geschaffenen Komplexität einer Text Re-use Analyse im Kontext der Big Data.