Auffinden und Analysieren komplexer Textvarianten in Hannah Arendts Denk- und Schreibwerkstatt mit LERA

Etling, Fabian; Pöckelmann, Marcus; Grote, Brigitte
https://zenodo.org/records/10698469
Zum TEI/XML Dokument

Das Editionsvorhaben Hannah Arendt. Kritische Gesamtausgabe1  macht sämtliche Schriften der Autorin mit Ausnahme der Briefe zugänglich. Dafür werden von einem internationalen Herausgeber:innenteam ca. 21.000 Seiten der von Hannah Arendt zu Lebzeiten veröffentlichten Werke (Monographien, Essaysammlungen, Artikel, Interviews etc.) sowie unveröffentlichter Dokumente aus ihrem Nachlass (Typoskripte, Notizen etc.) bearbeitet und mit einem detaillierten Stellenkommentar versehen. Die Website2  der Edition komplementiert die in den Druckbänden veröffentlichten konstituierten Texte3 , indem sie die zahlreichen Vorfassungen und Umarbeitungen der Autorin integriert. Die Website versteht sich nicht nur als Publikationsort der digitalen Edition, sondern darüber hinaus als erweiterte Forschungsplattform4 : Die Entstehungsstadien ihrer Schriften sollen, soweit Zeugnisse vorliegen, nachvollzogen werden können. Der Editionsvorgang soll dabei bis hin zu einzelnen Entzifferungs- und Deutungsentscheidungen nachprüfbar bleiben (Etling und Kieslich, 2024). Eine Herausforderung stellen dementsprechend die Kollationierung und textkritische Auseinandersetzung mit den großen Textmengen dar – eine editorische Arbeit, die manuell nur mit erheblichem Aufwand leistbar ist. Den Leser:innen der Edition sollen durch die Wiedergabe eines vollständigen Textvergleichs die textkritischen Entscheidungen transparent gemacht sowie die Identifikation und Beurteilung varianter Stellen sowohl auf einer Makroebene (Textsegmente) als auch auf einer Mikroebene (Zeichenmengen innerhalb der Segmente) ermöglicht werden.5 

Mit LERA6  existiert ein frei verfügbares digitales Kollationierungswerkzeug, welches die Berechnung und Präsentation von Textvarianten zwischen Textfassungen sowie deren Analyse mittels interaktiver Visualisierungen ermöglicht (Pöckelmann et al., 2023). Der Textvergleich erfolgt in zwei Stufen: Auf eine automatische Alignierung von größeren Textsegmenten wie Absätzen folgt ein Detailvergleich auf Tokenebene, sodass auch große Textmengen von der Software verarbeitet und dargestellt werden können. LERA ist für den Vergleich mehrerer Textfassungen ausgelegt, wobei im Gegensatz zum Leitquellenprinzip ein gleichrangiger Vergleich verfolgt wird.7  Spezifische Textvarianten können durch das integrierte Filtersystem dynamisch vom Textvergleich ausgenommen werden. Neben der Volltextpräsentation via synoptischer Gegenüberstellung und Variantenapparat zur Analyse von Einzelstellen (Close Reading) bietet LERA auch verschiedene, kombinierte Distant-Reading-Visualisierungen an, welche die Textvarianten aggregieren und so eine explorative Analyse ermöglichen (Schütz und Pöckelmann, 2016).

Placeholder
Abb.1: Die Einzeltextansicht der Arendt-Edition verweist für einen textkritischen Fassungsvergleich auf LERA

Die Bedarfe der Arendt-Edition legen den Einsatz von LERA als Forschungswerkzeug und Visualisierungsinstrument nahe. Zunächst wurde exemplarisch die Anbindung für drei Gruppen von Textfassungen umgesetzt, um projektspezifische Anforderungen an LERA zu bestimmen. In einem ersten Schritt wird LERA durch die Editor:innen bei der Erforschung der Unterschiede und Gemeinsamkeiten zwischen Textfassungen genutzt und kann so z. B. Erkenntnisse zur Textgenese liefern und die Kollationierungsarbeit unterstützen. Als ‚semi-automatisches‘ Werkzeug liefert LERA Vorschläge für Textalignierung und variante Segmente, die in der Bedienoberfläche weiterbearbeitet und so in einem iterativen Prozess vervollständigt und präzisiert werden können. Vor allem bei großen Textmengen lassen sich Abweichungen zwischen Einzeltexten gegenüber einem manuellen Abgleich mit wesentlich geringerem Aufwand identifizieren. Die synoptische Vergleichsansicht ermöglicht hierbei durch die farbcodierte Hervorhebung der varianten Textstellen zudem das Aufdecken von Transkriptionsfehlern. Die semi-automatisch erzeugten Analysedaten werden in einem zweiten Schritt genutzt, um im Webportal die Varianten für die forschenden Leser:innen der Edition zu visualisieren. Ausgehend von der Einzelansicht eines Textes kann die Vergleichsansicht von LERA für abweichende Textfassungen aufgerufen werden (vgl. Abb. 1). Die Vergleichsansicht bietet durch die Alignierung der Segmente einen Überblick über die in Arendts Fall oft großen Textmengen sowie über theoretisch beliebig viele Fassungen und erlaubt damit, Abweichungen auf einer Makro- und Mikroebene schnell zu identifizieren und zu untersuchen (vgl. Abb. 2). Durch die Kooperation mit LERA gelingt der Edition ein erster Schritt hin zu einer virtuellen Forschungsumgebung, die vertiefte Einblicke in Arendts Denk- und Schreibprozesse erlaubt.

Placeholder
Abb. 2: Synoptische Gegenüberstellung von Textfassungen unter Hervorhebung der Textvarianten mit LERA

Der Einsatz im Kontext der Arendt-Edition zeigt zugleich auch neue Bedarfe und Verbesserungspotenziale für LERA auf. So wurden die Mechanismen für die Verarbeitung von XML-Strukturen verfeinert, z. B. als Ausgangspunkt für eine Segmentierung beim Datenimport oder als Kriterien für eine jeweils spezifische Behandlung verschiedener XML-Markupkonstrukte im Textvergleich. Damit einhergehend wurden die Konfigurationsmöglichkeiten von LERA erweitert, insbesondere die Steuerung der Tokenisierung (z. B. bei Worttrennungen oder Inline-Markup) sowie die Filtereinstellungen für Textvergleich und -wiedergabe, und das User Interface hinsichtlich der Zugänglichkeit und Bedienbarkeit optimiert.

Die Anforderung der Arendt-Edition, den XML-Datenexport aus LERA in den Datenbestand der Edition zurückspielen und z. B. für die Anzeige von textkritischen Apparaten einsetzen zu können, motiviert die derzeitige Weiterentwicklung des LERA-Exportformats gemäß der TEI-Richtlinien mit dem Ziel, auch für Dritte eine vielfältige Nachnutzung durch einen interoperablen Datenstandard zu gewährleisten. Dieses und die Erweiterung von LERA für den strukturierten Vergleich mehrsprachiger Textfassungen, die nicht strikt parallele Texte sind, sind Gegenstand eines aktuellen DFG-Projekts10 . Die Synergien, die sich aus der Kooperation herausgebildet haben, bieten über die beteiligten Projekte hinaus einen Mehrwert für die Forschungslandschaft im Bereich der digitalen Editionen.


Fußnoten

1 Siehe https://www.arendteditionprojekt.de. Seit 2020 wird das Editionsprojekt als Langfristvorhaben durch die DFG gefördert: https://gepris.dfg.de/gepris/projekt/421689821.
2 Siehe https://hannah-arendt-edition.net .
3 Siehe https://www.wallstein-verlag.de/reihen/hannah-arendt-kritische-gesamtausgabe.html.
4 Vgl. auch aktuelle Editionsvorhaben wie Arthur Schnitzler digital ( https://www.schnitzler-edition.net ), die Historisch-kritische Edition von Goethes Faust ( https://faustedition.net ) oder auch die Uwe Johnson Werkausgabe ( http://www.uwe-johnson-werkausgabe.de ), die allesamt Werkzeuge zur Analyse und Exploration der publizierten Texte anbieten.
5 Ein Textvergleich auf der Makroebene soll den Text in seiner Gesamtheit betrachten und sich auf anhand bestimmter Vorgaben ermittelte Segmente beziehen, z. B. Absatzstrukturen. Ein Vergleich auf der Mikroebene soll innerhalb der Segmente, die sich gemäß Makrovergleich entsprechen, bestimmte Token betrachten, z. B. Wörter, Zahlen und Satzzeichen.
6 LERA (Locate, Explore, Retrace and Apprehend complex text variants) wird seit 2013 im Rahmen interdisziplinärer Forschungsprojekte an der Martin-Luther-Universität Halle-Wittenberg entwickelt. Ein Demonstrator der Software mit verschiedenen Textbeispielen ist unter https://lera.uzi.uni-halle.de verfügbar.
7 Im Gegensatz zu LERA oder auch CollateX (Dekker und Middell, 2011) arbeiten viele Kollationierungswerkzeuge, welche für mehr als zwei zu vergleichende Textfassungen gleichzeitig ausgelegt sind, nach dem klassischen Leitquellenprinzip, bei dem eine Textfassung als Basistext für den Vergleich ausgewählt werden muss. So zum Beispiel eComparatio (Bräckel et al., 2019), Juxta (Wheeles und Jensen, 2013) oder TUSTEP (Ott, 2000).
8 Siehe https://hannah-arendt-edition.net/v1/ae1254820.
9 Siehe https://hakg.uzi.uni-halle.de/editions/3.
10 Siehe https://www.cedis.fu-berlin.de/services/projektentwicklung/aktuell/semi-automatische-kollationierung/index.html.

Bibliographie

  • Bräckel, O., H. Kahl, F. Meins und C. Schubert. 2019. “eComparatio - A Software Tool for Automatic Text Comparison.” In Digital Classical Philology: Ancient Greek and Latin in the Digital Revolution. De Gruyter Saur, 221–238. https://doi.org/10.1515/9783110599572-013 .
  • Dekker, R. H. und G. Middell. 2011. “Computer-supported collation with CollateX: managing textual variance in an environment with varying requirements. ” Supporting Digital Humanities 2011, Kopenhagen, 17.–18.11.2011.
  • Etling, F. und I. Kieslich. 2024. “Transformation als inhärentes Textphänomen . ” Angenommen als Beitrag zur 20. internationalen Tagung der Arbeitsgemeinschaft für germanistische Edition zum Thema Edition als Transformation. Bedingungen, Formen, Interessen und Ziele editorischer Präsentationen, Wuppertal, 21.–24. Februar 2024.
  • Ott, W. 2000. “Strategies and tools for textual scholarship: the Tübingen system of text processing programs (TUSTEP).” In Literary and Linguistic Computing, Volume 15, Issue 1, 93–108. https://doi.org/10.1093/llc/15.1.93.
  • Pöckelmann, M., A. Medek, J. Ritter und P. Molitor. 2023. “LERA - An interactive platform for synoptical representations of multiple text witnesses.” In Digital Scholarship in the Humanities, Volume 38, Issue 1, 330–346. https://doi.org/10.1093/llc/fqac021.
  • Schütz, S. und M. Pöckelmann. 2016. “LERA - Explorative Analyse komplexer Textvarianten in Editionsphilologie und Diskursanalyse.” DHd2016, 3. Jahrestagung der Digital Humanities im deutschsprachigen Raum, Leipzig, 07.–12.03.2016. https://doi.org/10.5281/zenodo.4645364 .
  • Wheeles, D. und K. Jensen. 2013. “Juxta Commons.” DH2013, Proceedings of the 24. international annual conference of Digital Humanities, Lincoln, 16. – 19.07.2013. 545–546.