CANSpiN: Zur computergestützten Analyse narrativen Raums im Roman des 19. und 20. Jahrhunderts
https://zenodo.org/records/10698289
Mit unserer Einreichung stellen wir den aktuellen Arbeitsstand des Projekts „Computational Approaches to Narrative Space in 19th and 20th Century Novels“ (CANSpiN) vor, das im Rahmen des DFG-Schwerpunktprogramms „Computational Literary Studies“ (SPP 2207) von April 2023 bis März 2026 gefördert wird. Ziel des Vorhabens ist es, computergestützte Methoden zur Erkennung und Analyse narrativen Raums in literarischen Texten zu entwickeln und diese Methoden für die Untersuchung literaturhistorischer Fragen zum Verhältnis von Raum und nationaler Identität in deutsch- und spanischsprachigen Romanen des 19. und 20. Jahrhunderts zur Anwendung zu bringen. Dieser Zielstellung entspricht die Zusammensetzung der Projektgruppe, die aus Wissenschaftler:innen der Germanistik, Romanistik, den Digital Humanities und der Mathematik besteht.
Ausgangspunkt der Überlegungen ist die Definition des narrativen Raums: Darunter verstehen wir im weiteren Sinne die Räumlichkeit eines narrativen Textes nach Schumacher (2022b), die durch raumreferentielle sprachliche Ausdrücke bestimmt ist. In einem engeren narratologischen Sinne begreifen wir narrativen Raum als den Raum der erzählten Welt, wie er durch die Erzählung konstituiert ist (Genette, 2010). Wie dieser Raum strukturell und funktional zu beschreiben ist, dazu existieren bereits zahlreiche literaturwissenschaftliche Vorschläge (Dennerlein, 2009; Piatti, 2008; Ryan, 2014; Lotman, 1977; Renner, 2004). Wie raumanalytische Zugänge formalisiert und auf konkrete Textmerkmale abgebildet werden können, dazu bieten Arbeiten der Computational Literary Studies schon erste Antworten (Viehhauser und Barth, 2017; Barth, 2021, 2022; Viehhauser, 2020; Schumacher, 2022a, 2022b).
Auf diesem Forschungsstand setzen wir auf: In einem offenen explorativen Verfahren erproben wir verschiedene raumanalytische Kategorien-Sets hinsichtlich ihrer literaturwissenschaftlichen Aussagekraft und ihrer computergestützten Operationalisierbarkeit (Arbeitspaket 1). Für jedes dieser Sets entwickeln wir Annotationsrichtlinien, um die verwendeten Korpora computergestützt zu annotieren und mit quantitativen Methoden vergleichend zu untersuchen. So haben wir ein erstes Kategoriensystem CANSpiN.CS1 für die Annotation von Raumreferenzen in Erzähltexten definiert und mit Hilfe des Tools CATMA (Gius et al., 2023) erprobt. Es ist geplant, auf diesem Wege eine Ground Truth aufzubauen, mit der im Tool NTEE (Lemke et al., 2023) Modelle für die Erkennung von Raumentitäten trainiert werden können, welche die semi-automatisierte, vollständige Annotation der Textkorpora im Projekt erlauben.
Das Interesse des Projekts richtet sich dabei insbesondere auch auf die Möglichkeiten und Grenzen des Deep Learnings mit Sprachmodellen der BERT-Architektur (Devlin et al., 2019) für die computergestützte Annotation literaturwissenschaftlich definierter Textphänomene: Um diese auszuloten, werden die im Arbeitspaket 1 erzeugten Modelle mit Methoden eines Explainable AI-Ansatzes (XAI) untersucht (Arbeitspaket 2), was konkrete Maßnahmen und Vorschläge zur Optimierung der Annotationsprozesse erwarten lässt, aber auch Erkenntnisse über die technischen Grenzen dieses Vorgehens (Rogers et al., 2021).
Die Korpora werden derzeit ausgehend von verschiedenen Vorarbeiten zusammengestellt, aus deutschsprachigen Romanen des 19. Jahrhunderts (Zeit: 1790-1910, Ziel: etwa 200 Romane, Quellen: ELTeC-deu (Konle et al., 2021), DTA (Berlin-Brandenburgischen Akademie der Wissenschaften, 2023), TextGrid Repository (TextGrid Konsortium, 2014)), spanischsprachigen Romanen des 19. Jahrhunderts (Zeit: 1790-1870, Ziel: etwa 100 Romane, Quellen: ELTeC-spa (Navarro-Colorado et al., 2021), Biblioteca Virtual Miguel de Cervantes (Centro de Humanidades Digitales en la Universidad de Alicante, 2021)), spanischsprachigen Romanen aus Lateinamerika des 19. Jahrhunderts (Zeit: 1830-1910, Ziel: etwa 200 Romane, Quellen: Corpus de novelas hispanoamericanas del siglo XIX (Conha19) (Henny-Krahmer, 2021)) und deutschsprachigen Romanen des 20. Jahrhunderts (Zeit: 1950-2000, Ziel: etwa 100 Romane, Quellen: TEI-Dateien der Uwe Johnson-Werkausgabe, E-Books (u.a. zu den Autor:innen Heinrich Böll, Christine Brückner, Uwe Johnson, Walter Kempowski, Christa Wolf)). Für ein einheitliches Format der Texte haben wir uns für das Schema ELTeC Level 0 (Burnard, 2012) entschieden, das wir für unsere Zwecke im CANSpiN-Projekt anpassen.
Die Auswahl der Korpora gründet auf unserer Arbeitshypothese, dass narrativer Raum in Romanen sprach- und zeitübergreifend ein für die Analyse zugängliches Phänomen ist, das unterschiedlich ausgeformt, also dargestellt und funktionalisiert sein kann. Durch die quantitativen Analysen aus Arbeitspaket 1 erwarten wir in dieser Hinsicht neue Erkenntnisse zu literaturhistorischen Fragestellungen (Arbeitspaket 3), etwa zur Darstellung und Semantik von Raum in Romanen im Kontext der Nationenbildung im 19. Jahrhundert in Deutschland und Lateinamerika (Sommer, 1993; Peñaranda Medina, 1994; Hanway, 2003; Viel, 2009; Ferrer, 2018) und der Herausbildung zweier deutscher Identitäten in der Nachkriegsliteratur des 20. Jahrhunderts (Bond, 1996; Erll et al., 2003; Helbig et al., 2007; Westphal, 2007; Nies, 2018).
Bibliographie
- Barth, Florian. 2021. “Konzept und Klassifikation literarischer Raumentitäten.” In INFORMATIK 2020, hg. von Ralf Heinrich Reussner, Anne Koziolek und Robert Heinrich, 1281–1293. Bonn: Gesellschaft für Informatik. .
- Barth, Florian. 2022. “Von der literaturwissenschaftlichen Theorie zu maschinellen Erkennung: Operationalisierung von Raumentitäten und Settings.” In Digitale Verfahren in der Literaturwissenschaft, hg. von Jan Horstmann und Frank Fischer. Sonderausgabe #6 von Textpraxis. Digitales Journal für Philologie. .
- Berlin-Brandenburgischen Akademie der Wissenschaften (Hg.). 2023. Deutsches Textarchiv. Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache. Berlin. https://www.deutschestextarchiv.de.
- Bond, Greg. 1996. “'weil es ein Haus ist, das fährt.' Rauminszenierungen in Uwe Johnsons Werk.” In Johnson-Jahrbuch 3, 72–96. Göttingen: Vandenhoeck & Ruprecht.
- Burnard, Lou. 2012. COST-ELTeC/Schemas. Version 0.8.1. .
- Centro de Humanidades Digitales en la Universidad de Alicante (Hg.). 2021. Biblioteca Virtual Miguel de Cervantes. Alicante. https://www.cervantesvirtual.com.
- Dennerlein, Katrin. 2009. Narratologie des Raumes. Berlin und New York: De Gruyter.
- Devlin, Jacob, Ming-Wei Chang, Kenton Lee und Kristina Toutanova. 2019. “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding.” In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers), 4171–4186. Minneapolis, Minnesota: Association for Computational Linguistics. .
- Erll, Astrid, Marion Gymnich und Ansgar Nünning (Hg.). 2003. Literatur – Erinnerung – Identität: Theoriekonzeptionen und Fallstudien. Trier: VWT.
- Ferrer, José Luis. 2018. La invención de Cuba: Novela y nación (1837-1846). Madrid: Editorial Verbum.
- Genette, Gérard. 2010. Die Erzählung. 3., durchges. und korrigierte Aufl. Paderborn: Fink.
- Gius, Evelyn, Jan Christoph Meister, Malte Meister, Marco Petris, Mareike Schumacher und Dominik Gerstorfer. 2023. CATMA. Version 7.0.0. .
- Hanway, Nancy. 2003. Embodying Argentina: Body, Space and Nation in 19th Century Narrative. Jefferson, NC: McFarland.
- Helbig, Holger, Kristin Felsner, Sebastian Horn und Therese Manz (Hg.). 2007. Weiterschreiben: zur DDR-Literatur nach dem Ende der DDR. Berlin: Akademie Verlag.
- Henny-Krahmer, Ulrike (Hg.). 2021. Corpus de novelas hispanoamericanas del siglo XIX (conha19). Version 1.0.1. .
- Konle, Leonard, Fotis Jannidis, Carolin Odebrecht und Lou Burnard. 2021. German Novel Corpus (ELTeC-deu). Version 1.0.0. .
- Lemke, Marc, Konrad Sperfeld und Jochen Zöllner. 2023. NEISS TEI Entity Enricher. Version 1.1.1. .
- Lotman, Jurij Michailowitsch. 1977. Die Struktur literarischer Texte. München: Fink.
- Navarro-Colorado, Borja, Lou Burnard und Carolin Odebrecht. 2021. Spanish Novel Corpus (ELTeC-spa). Version 0.9.1. .
- Nies, Martin (Hg.). 2018. Raumsemiotik. Räume – Grenzen – Identitäten. .
- Peñaranda Medina, Rosario. 1994. La novela modernista hispanoamericana: estrategias narrativas. Valencia: Universitat de Valencia.
- Piatti, Barbara. 2008. Die Geographie d er Literatur. Schauplätze, Handlungsräume, Raumphantasien. Göttingen: Wallstein.
- Renner, Karl Nikolaus. 2004. “Grenze und Ereignis. Weiterführende Überlegungen zum Ereigniskonzept von Jurij M. Lotman.” In Norm – Grenze – Abweichung: Kultursemiotische Studien zu Literatur, Medien und Wirtschaft, 357–81. Passau: Verlag Karl Stutz. .
- Rogers, Anna, Olga Kovaleva und Anna Rumshisky. 2021. “A Primer in BERTology: What We Know About How BERT Works.” In Transactions of the Association for Computational Linguistics 8, 842–866. .
- Ryan, Marie-Laure. 2014. “Space.” In The Living Handbook of Narratology, hg. von Peter Hühn, Jan Christoph Meister, John Pier und Wolf Schmid. Hamburg: Hamburg University. .
- Schumacher, Mareike. 2022a. “‘Wie Wölkchen Im Morgenlicht’ – Zur automatisierten Metaphern-Erkennung und der Datenbank literarischer Raummetaphern LaRa.” In DHd2022: Kulturen des digitalen Gedächtnisses. Konferenzabstracts, 232–236. .
- Schumacher, Mareike. 2022b. Orte und Räume im Roman. Ein Beitrag zur digitalen Literaturwissenschaft. Berlin und Heidelberg: Metzler. .
- Sommer, Doris. 1993. Foundational Fictions. The National Romances of Latin America. Berkeley, LA: University of California Press.
- TextGrid Konsortium. 2014. TextGrid: Virtuelle Forschungsumgebung für die Geisteswissenschaften. Göttingen: TextGrid Konsortium. https://www.textgrid.de.
- Viehhauser, Gabriel. 2020. “Zur Erkennung von Raum in narrativen Texten. Spatial Frames und Raumsemantik als Modelle für eine digitale Narratologie des Raums.” In Reflektierte Algorithmische Textanalyse, 373–388. Berlin und Boston: De Gruyter. .
- Viehhauser, Gabriel und Florian Barth. 2017. “Towards a Digital Narratology of Space.” In Digital Humanities 2017. Conference Abstracts, 643–646. Montréal. .
- Viel, Bernhard. 2009. Utopie der Nation: Ursprünge des Nationalismus im Roman der Gründerzeit. Berlin: Matthes & Seitz.
- Westphal, Nicola. 2007. Literarische Kartografie. Erzählter Raum in den Romanen Uwe Johnsons. Göttingen: Vandenhoeck & Ruprecht.