Lieblingsgegenden, Fenster und Mauern Zur emotionalen Enkodierung von Raum in Deutschschweizer Prosa zwischen 1850 und 1930
Einleitung
Raum ist eine wichtige Dimension von ‘Kultur’, nicht zuletzt in literarischen Artefakten. Definiert als “area, as perceived by people, whose character is the result of the action and interaction of natural and/or human factors’ (Council of Europe, 2000, S. 2) impliziert besonders die Landschaft, das ‘Gebiet, wie wahrgenommen’, einen oftmals vergleichenden En- und Dekodierungsakt.
Wer die Natur aufrichtig schätzt, hat seine Lieblingsgegenden, in welche er immer wieder zurückkehrt, selbst wenn er inzwischen überlegenere landschaftliche Bilder kennengelernt haben sollte. (Carl Spitteler, Xaver Z'Gilgen, 1891)
Die Räume der deutschschweizer Literatur sind wie bei Spitteler offenbar regelmäßig solche “Lieblingsgegenden”, die dann doch Untiefen offenbaren, wie die Dörfer Gotthelfs, die Kleinstädte Kellers (Seldwyla) und Frischs (Güllen). Aber da ist auch der alpine Naturraum (Meyers Jürg Jenatsch, Heers An heiligen Wassern), sowie urbane und auch nichtschweizer Räume, wie etwa in Spyris Frankfurt am Main.
Es lief von einem Fenster zum anderen und dann wieder zum ersten zurück; aber immer war dasselbe vor seinen Augen, Mauern und Fenster und wieder Mauern und dann wieder Fenster. Es wurde Heidi ganz bange. (Johanna Spyri, Heidis Lehr- und Wanderjahre, 1880)
Spittelers scheinbar zahme Alpen, Spyris urbanes Gefängnis und schließlich Hölderlins erhabener “furchtbarherrlicher Haken” des Hochgebirgsaufstiegs (Kanton Schweiz, 1792) sind dabei ‘Kultur’ in doppeltem Sinne. Sie sind zum einen archivierte Beschreibungen von (fiktionalem) Raum, die zum kulturellen Gedächtnis gehören. Doch sind sie auch ‘Kultur’ im Luhmannschen Sinne (vgl. Schaffrick, 2017) - eine Beobachtungsoperation, mit der die beschriebenen Räume in Relation zu anderen (fiktional) enkodierten Räumen gesetzt werden.1
Forschungsfrage und Vorgehen
Unser Beitrag möchte die beiden beschriebenen Ebenen von Kultur mit der des ‘digitalen Gedächtnisses’ zusammenbringen, indem wir computationelle Verfahren auf literarische Texte (als ‘Schweizer digitales Kulturerbe’) anwenden, um die affektive Enkodierung dargestellter Raumtypen (als ‘Reflektion der Reflektion’) zu untersuchen.
Ausgehend vom übergreifenden Forschungsinteresse einer Komparatistik der deutschsprachigen Länder möchte unser Beitrag erste Ergebnisse berichten über die emotionale Enkodierung von fiktionalem Raum. Anhand des DCHLi (Deutschschweizer Literaturkorpus), zurzeit als Pilotkorpus mit 76 Texten, und ausgehend von einem semiotischen Zugang zu textuell enkodierten Emotionen (z.B. Schiewer, 2007; vgl. Anz, 2007; Winko, 2022) und Raumanalyse (Balshaw, & Kennedy, 2000; Bologna, 2020)
legen wir die in gängigen Sentiment-Diktionären vorgehaltenen Affekt-Kategorien zwischen dimensionalen (Valenz, Arousal) und diskreten Emotionen (“Angst”, “Freude”, “Wut”, “Trauer”, “Ekel”) an. Wir fragen:
Welche unterschiedlichen Typen von Landschaft und Raum gibt es in der fiktionalen deutschschweizer Prosa zwischen 1854 und 1930, und wie sind diese jeweils emotional enkodiert?
Unsere quantitativen Befunde sollen Bezüge herstellen zu ikonischen Kultur/Natur-Dichotomien im Erbe der Romantik, zu historischen Stadt/Land-Konstellationen, aber auch zu einem nationalliterarischen Rahmen mit vielbeklagtem Schweizer “Mythos” (Böhler, 2010) einerseits und identifikatorischen (oftmals Alpen-orientierten) Angeboten (Zimmer, 1998) für die “imagined community” (Anderson) der sogenannten Willensnation andererseits.
Daten und Methode
Unser DCHLi Pilotkorpus umfasst derzeit 76 fiktionale Prosatexte von AutorInnen, die der deutschschweizer “Nationalliteratur” zugeordnet werden und die zwischen 1854 und 1930 zuerst publiziert wurden (N= 2,025,529 Wörter). DCHLi enthält das wachsende Deutschschweizer ELTeC-gsw (Grisot & Herrmann, 2021) das wiederum Teil der European Literary Text Collection (ELTeC, Odebrecht et al., 2021) ist.
Ausgehend vom derzeit de facto Standard der diktionärbasierten Sentimentanalyse innerhalb der DH (vgl. Kim & Klinger, 2019) nutzten wir zur Co-Identifizierung von räumlichen Entitäten und Affekt acht für das Deutsche gängige frei verfügbare Sentiment-/Emotions-Diktionäre, sowie Ressourcen mit geopolitischen und räumlichen Informationen. Ähnlich wie Heuser et al. (2016) identifizieren wir zunächst regelbasiert lexikalisch ‘räumliche Entitäten’ als “Seedwords”, und analysieren daraufhin innerhalb einer Spanne von + - 50 Wörtern um das seedword den enkodierten Affekt.
Spatial entities
Im ersten Schritt erstellten wir ein möglichst umfassendes und feingranuliertes Diktionär “räumlicher Entitäten”, das auf höchster Taxonomie-Ebene die Kategorien RURAL und URBAN zusammenfasst, die sich wiederum in fünf Subkategorien ‘natural entity’, ‘rural entity,’ und ‘geographic entity’, sowie ‘urban entity’ und ‘geopolitical entity’ auffächern (vgl. Wartmann et al. 2018, p. 1580; siehe Abb. 1).
Hier wurden unter Rückgriff auf Ressourcen wie Openthesaurus und das Schweizer Idiotikon historisch wie sprachlich relevante Elemente berücksichtigt (i.e. Weiher, Weg, Hütte, Berg, See, Straße, Gebäude, Dom; Wiler, Bergli). Für die geopolitischen (i.e. Basel, Zürich, Berlin, Rom) and geographischen Elemente (i.e. Matterhorn, Rigi, Rhein) nutzen wir als digitale Ressourcen unter anderem Wikidata, Ortsnamen und Swisstopo. Die resultierenden Listen wurden händisch nachkorrigiert und werden auf GitHub (wie auch der gemeinfreie Teil des Korpus sowie der Code) frei zugänglich publiziert werden.
Sentiment und Emotion
Im zweiten Schritt erstellten wir für einen systematischen Vergleich ein Repositorium mit acht der frei verfügbaren Sentiment-Diktionäre (ADU, BAWL, Germanlex, LANG, Klinger, Plutchik, SentiWS, SentiArt, siehe Tabelle 2).
| BAWL-R (Võ et al. 2009) |
| LANG (Kanske & Kotz, 2010) |
| Plutchik (Stamm, 2014) |
| Klinger (Klinger et al., 2016) |
| Adu (Hölzer et al., 1992) |
| Germanlex (Clematide et al., 2010) |
| SentiWS (Remus et. al., 2010) |
| SentiArt (Jacobs, 2019) |
Deren unterschiedlichen Formate wurden für die automatische Sentiment-Annotation in einer processing pipeline vereinheitlicht. Abbildung 2 zeigt die lexikalische Abdeckung der acht Diktionäre auf dem DCHLi, die angibt, wie viele der Wörter von der jeweiligen Ressource erkannt wurden (geordnet in abfallender Reihenfolge).
Im dritten Schritt errechneten wir das semiotische Emotionspotenzial innerhalb der räumlichen Seedword-Spannen. Abbildung 3 zeigt den Abbildungsprozess der räumlichen Entitäten auf das Korpus beispielhaft für das BAWL-R-Diktionär: Sobald eine Entität identifiziert ist, werden innerhalb einer Gesamtspanne von 101 Wörtern je 50 Wörter vor und nach der Entität für die Berechnung von Emotions- und Sentimentwerten einbezogen (ohne Stoppwörter).
Mittels dieses Verfahrens kann die Repräsentation von Emotionen (Valenz, Diskrete Emotionen) und ihre Ausprägung (Arousal) bezüglich des fiktionalen Raums näherungsweise untersucht werden, wobei uns zunächst die potenzielle Differenz in der Emotionsrepräsentation zwischen ländlichen und städtischen Räumen interessierte.
Ergebnisse und Diskussion
Wir verwendeten R (Version R 4.1.0, R Core Team, 2021) um mittels mixed linear models den Effekt des Entitätstyps (rural, urban) auf die jeweiligen Sentiment-Werte zu beobachten, mit AutorIn und Titel als randomisierte Faktoren. Verwendete Pakte waren v.a. tidyverse (Wickham et al., 2019); LmerTest (Kuznetsova et al., 2017), und tm (Feinerer, 2020).
Wir konnten statistisch signifikante Effekte des Entitätstyps u.a. auf die Valenz/Polarität in verschiedenen Diktionären beobachten, wobei LANG und BAWL “positives Sentiment” häufiger für “rural” Passagen aufwiesen, Germanlex jedoch den entgegengesetzten Befund (Tabelle 3).
Für die diskreten Emotionen berücksichtigte das mixed model jede einzelne Emotion als zusätzlichen “fixed factor” (Tabelle 4). Abweichungen zwischen den Diktionären konnten wieder beobachtet werden, wobei SentiArt signifikante Differenzen für fünf Basisemotionen (ausser Angst) detektiert. Freude, Trauer, Ekel und Wut sind dabei häufiger in “rural” Passagen zu finden, während Überraschung häufiger in “urban” Passagen auftritt.
Obwohl die Sentimentdetektion, das räumliche Matching der Emotionen und die Korpusgröße weiter verbessert werden sollen, interpretieren wir die vorliegenden Daten vorsichtig dahingehend, dass Textpassagen mit ländlichen und Natur-Referenzen in unserem Korpus häufiger positiv enkodiert sind. Es scheint, dass diese «ruralen» und «Natur-» Räume im Vergleich insgesamt mehr unterschiedliche und möglicherweise reichhaltigere Emotionen repräsentieren.
Angesichts der Zusammensetzung des vorliegenden Korpus kann dies nicht nur auf eine topische Assoziation von positiv enkodierter Natur vs. negativ enkodierter Stadt/industrialisierter Zivilisation bezogen werden, sondern scheint auch Landschaft und Natur als vornehmlichen Schauplatz der Diegese abzubilden. Schlägt man den Bogen weiter, und projiziert noch hypothetisch auf die Grundgesamtheit der Deutschschweizer Prosa (Herrmann et al., 2021), könnte der Vorschlag, dass Deutschschweizer Literatur in dieser Zeit vornehmlich auf dem Lande und in der Natur stattfindet, im Luhmannschen Sinne als ‘kultureller’ Differenzvorschlag verstanden werden: ein Identifikationsangebot, das ‘Schweiz’ ebendort, und nicht anderswo, verortet. Wohlgemerkt wäre gerade unter solchen Bedingungen die evidente Rolle von Technik, Infrastruktur, Handel und Industrialisierung mitzumodellieren.
Wir schließen mit einer unabdingbaren methodologischen Notiz. In der vorliegenden Studie war es unsere Absicht, diktionärbasierte Sentimentanalyse als im Feld der DH gegenwärtig noch kanonischen Ressourcentyp in Anschlag zu bringen (Kim & Klinger, 2019). Die niedrige lexikalische Abdeckung für die meisten Diktionäre, die im Umlauf sind (Abb. 2), zeigt auf, dass hier neue Ressourcen und ein erweitertes Methodenbewusstsein nötig sind. Untersucht man die Reliabilität und Domänenspezifik der einzelnen Diktionäre genauer, wie wir es getan haben, wird schnell deutlich, dass es sich für die DH lohnt, den Anschluss an den State of the Art des Affective Computing aktiv zu verfolgen.
Die Verwendung von vektorraumbasierten Diktionären wie SentiArt, aber besonders die Domänenadaption des avancierten maschinellen Lernens, auch auf feinjustierten Annotationen (Kim & Klinger, 2018; Hoang et al., 2019), sind notwendig, um Nuancen, Objekte und Bedingungen von fiktional enkodiertem Affekt sicher zu detektieren. So bereiten wir derzeit manuelle Annotationen zur Implementierung in einer deep learning Architektur vor und rechnen mit aussagekräftigen Ergebnissen zum Zeitpunkt des Vortrages. Zudem erweitern wir derzeit die Raumentitätszuordnung bezüglich von Elementen des Interiors, da wir davon ausgehen, dass diese im Allgemeinen und Spezifischen in urbanen Settings häufiger auftreten. Diese Annahme prüfen wir in explorativen Studien.
Fußnoten
Bibliographie
- Anz, T. (2007). Kulturtechniken der Emotionalisierung: Beobachtungen, Reflexionen und Vorschläge zur literaturwissenschaftlichen Gefühlsforschung. In Im Rücken der Kulturen. - Paderborn: Mentis-Verlag, pp. 207–39.
- Balshaw, M., & Kennedy, L. (2000). Urban space and representation. Pluto.
- Bologna, F. (2020). A Computational Approach to Urban Space in Science Fiction. Journal of Cultural Analytics. https://doi.org/10.22148/001c.18120
- Böhler, M. (2010). Gefängnis Schweiz oder Bergnebel Seldwyla? Max Niemeyer Verlag. https://www.degruyter.com/document/doi/10.1515/9783484970526.1.45/html (accessed 13 July 2021).
- Clematide, S. & Klenner, M. (2010). Evaluation and extension of a polarity lexicon for German. doi:10.5167/UZH-45506. https://www.zora.uzh.ch/id/eprint/45506 (accessed 12 July 2021).
- Council of Europe. (2009). European Landscape Convention. Report and Convention Florence. ETS, 17(8).
- Feinerer, I. & Hornik, K. (2020). tm: Text Mining Package. R package version 0.7-8. https://CRAN.R-project.org/package=tm
- Grisot, G., & Herrmann, J.B. (Eds.) (2021). Swiss German Novel Collection (ELTeC-gsw), Version v1.0.0, July 2021. In: European Literary Text Collection (ELTeC). COST Action Distant Reading for European Literary History. https://github.com/COST-ELTeC/ELTeC-gsw/blob/master/README.md
- Herrmann, J. B., Grisot, G., Gubser, S., & Kreyenbühl, E. (2021). Ein großer Berg Daten? Zur bibliothekswissenschaftlichen Dimension des korpusliteraturwissenschaftlichen DH-Projekts "High Mountains – Deutschschweizer Erzählliteratur 1880-1930". 027.7 Journal for Library Culture.
- Heuser, R., Moretti, F. & Steiner, E. (2016). The Emotions of London. Literary LabPamphlet, 13. https://litlab.stanford.edu/LiteraryLabPamphlet13.pdf (accessed 15 December 2020).
- Hoang, M., Bihorac, O. A., & Rouces, J. (2019). Aspect-based sentiment analysis using BERT. Proceedings of the 22nd Nordic Conference on Computational Linguistics, 187–196.
- Hölzer, M., Scheytt, N. and Kächele, H. (1992). Das „Affektive Diktionär Ulm“ als eine Methode der quantitativen Vokabularbestimmung. In Züll, C. and Mohler, P. Ph. (eds), Textanalyse: Anwendungen der computerunterstützten Inhaltsanalyse. Beiträge zur 1. TEXTPACK-Anwenderkonferenz. (ZUMA-Publikationen). Wiesbaden: VS Verlag für Sozialwissenschaften, pp. 131–54 doi:10.1007/978-3-322-94229-6_7. https://doi.org/10.1007/978-3-322-94229-6_7 (accessed 12 July 2021).
- Jacobs, A. M. (2019). Sentiment Analysis for Words and Fiction Characters From the Perspective of Computational (Neuro-)Poetics. Frontiers in Robotics and AI, 6 doi:10.3389/frobt.2019.00053. https://www.frontiersin.org/article/10.3389/frobt.2019.00053/full (accessed 8 September 2019).
- Kanske, P., & Kotz, S. A. (2010). Leipzig Affective Norms for German: A reliability study. Behavior Research Methods, 42(4), 987–991. https://doi.org/10.3758/BRM.42.4.987
- Kim, E. & Klinger, R. (2018). Who feels what and why? annotation of a literature corpus with semantic roles of emotions. Proceedings of the 27th International Conference on Computational Linguistics, 1345–1359.
- Kim, E. & Klinger, R. (2019). A Survey on Sentiment and Emotion Analysis for Computational Literary Studies. Zeitschrift Für Digitale Geisteswissenschaften. 10.17175/2019_008.
- Kuznetsova, A., Brockhoff, P. B., & Christensen, R. H. B. (2017). LmerTest package: tests in linear mixed effects models. JOSS, 82(13), 1–26. https://doi.org/10.18637/jss.v082.i13
- Luhmann, N. (1997). Die Gesellschaft Der Gesellschaft. Suhrkamp.
- Odebrecht, C., Burnard L., & Schöch, C. (Eds.) (2021). European Literary Text Collection (ELTeC), version 1.1.0, April 2021. COST Action Distant Reading for European Literary History (CA16204). DOI: doi.org/10.5281/zenodo.4662444.
- R Core Team (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.
- Schaffrick, M. (2016). Niklas Luhmann (1927–1998), Kultur Als Historischer Begriff (1995). KulturPoetik, 16(2), pp. 272–80.
- Schiewer, G. L. (2007). Bausteine zu einer Emotionssemiotik: Zur Sprache des Gefühlsausdrucks in Kommunikation und affective computing. Kodikas/Code. Ars Semeiotica: An International Journal of Semiotics, 30(3–4), 235–257.
- Stamm, N. (2014). Klassifikation und Analyse von Emotionswörtern in Tweets für die Sentimentanalyse.
- Võ, M. L. H., Jacobs, A. M., & Conrad, M. (2006). Cross-validating the Berlin affective word list. Behavior Research Methods, 38(4), 606–609.
- Wartmann, F. M., Acheson, E., & Purves, R. S. (2018). Describing and comparing landscapes using tags, texts, and free lists: an interdisciplinary approach. International Journal of Geographical Information Science, 32(8), 1572–1592. https://doi.org/10.1080/13658816.2018.1445257
- Wickham et al. (2019). Welcome to the tidyverse. Journal of Open Source Software, 4(43), 1686, https://doi.org/10.21105/joss.01686
- Winko, S. (2022). Literature and Emotion. In Schiewer, G.L., Altarriba, J., & Ng, B.C. (Hgg.), Handbook on Language and Emotion. Handbooks of Linguistics and Communication Science, HSK. Berlin; Boston: De Gruyter.
- Zimmer, O. (1998). In search of natural identity: Alpine landscape and the reconstruction of the Swiss nation. Comparative Studies in Society and History, 40(4), 637–665.