Alternative Gattungstheorien: Das Prototypenmodell am Beispiel hispanoamerikanischer Romane
https://zenodo.org/records/4622413
Einleitung
Die Definition von Gattungen sowohl im Sinne allgemeiner Gattungskonzepte als auch konkreter einzelner Gattungen ist ein altes und nach wie vor zentrales Problem der Literaturwissenschaft und wird immer noch debattiert (Kayser 1956: 330-387, Zymner 2003). Allgemein können Gattungsbegriffe als Sammelbegriffe verstanden werden, deren Aufgabe es ist, zu beschreiben, in welcher Hinsicht Texte zu Textgruppen zusammengefasst werden können. Oft ist dabei auf das Konzept von Gattungen als logischen Klassen zurückgegriffen worden, auch in vielen Untersuchungen zu literarischen Gattungen im Bereich der Digital Humanities, obwohl in der literaturwissenschaftlichen Gattungstheorie bereits seit den 60er-Jahren andere Vorschläge für das Verständnis von Gattungskategorien gemacht worden sind.
Im Sinne der “Kritik der digitalen Vernunft” ist das Ziel dieses Beitrags, die Problematik der Gattungsbeschreibung auf der theoretischen Basis alternativer Gattungstheorien und mit Hilfe informatischer Mittel aus einer neuen Perspektive zu betrachten. Dazu wird exemplarisch die Anwendbarkeit des Prototypenmodells als Gattungskonzept für digitale gattungsstilistische Studien überprüft. Als Testkorpus dient eine Sammlung von Texten aus der hispanoamerikanischen Romanliteratur des 19. Jahrhunderts.
Forschungsstand und Ziele
Viele Gattungstheorien beruhen auf der Grundannahme, dass sich konkrete Texte anhand von hinreichenden und notwendigen Attributen eindeutig disjunkten Klassen zuordnen lassen und oft auch, dass sich für Gattungen eine Taxonomie entwickeln lässt (vgl. Zymner 2003: 102-104). Allerdings weisen nicht alle Texte einer bestimmten Gattung gemeinsame Merkmale auf, noch sind die Beziehungen zwischen den einzelnen Gattungen und Texten statisch. Zudem gibt es die Vorstellung von Werken, die initiale, prägende Wirkung haben (z. B. Waverley von Walter Scott für den historischen Roman) oder besonders gute Vertreter einer Gattung sind (z. B. Goethes Wilhelm Meisters Lehrjahre). Es kann dann andere Vertreter geben, bei denen die für die Gattung als prototypisch angesehenen Merkmale nicht so stark ausgeprägt sind, die aber trotzdem der entsprechenden Textgruppe zuzuordnen sind. Kritik am Klassenkonzept äußert schon Vivas (1968), später u. a. Hempfer (2010). Neuere Gattungstheorien haben daher u. a. Wittgensteins Konzept der Familienähnlichkeit (Weitz 1956, Fowler 1982, Fishelov 1991) und die in der Kognitionspsychologie entwickelte Prototypentheorie (Rosch 1973) als alternative Modelle der Kategorisierung aufgegriffen.
In den Digital Humanities gibt es bereits einige Untersuchungen zu literarischen Gattungen, bei denen jedoch üblicherweise die Annahme zugrunde liegt, dass Gattungen als Klassen im logischen Sinn zu verstehen sind (Calvo Tello et al. 2017, Hettinger el al. 2016a, Hettinger et al. 2016b, Schöch et al. 2016, Schöch 2015, Schöch 2013).1
Im vorliegenden Beitrag wird exemplarisch dargestellt, inwiefern es möglich ist, das Prototypenmodell zu verwenden, um Einsichten in die Anordnung maschinell gruppierter Texte zu gewinnen, die über den klassischen Ansatz der Klassifikation nicht möglich wären. Der Beitrag leistet damit zum einen, einen konkreten Vorschlag für die Formalisierung des Prototypen-Ansatzes für gattungsstilistische Untersuchungen zu machen. Zum anderen zielt er darauf, durch die Berücksichtigung der internen Strukturierung von Gattungskategorien eine bessere Anbindung der computergestützten Verfahren an literaturgeschichtliche Forschungsergebnisse zu ermöglichen.
Fallbeispiel: Untergattungen des hispanoamerikanischen Romans im 19. Jahrhundert
Korpus. Die Analyse wurde an 80 hispanoamerikanischen Romanen von 51 AutorInnen getestet, welche fünf verschiedenen Untergattungen zugeordnet sind: dem historischen Roman, dem Liebesroman, dem kostumbristischen Roman, dem Gaucho-Roman und dem Antisklaverei-Roman. Der historische Roman, der Liebesroman und der kostumbristische Roman sind im Hispanoamerika des 19. Jahrhunderts verbreitete Untergattungen (Janik 2008: 60-77) mit europäischen Vorläufern und Vorbildern. Der Gaucho-Roman und der Antisklaverei-Roman sind Romantypen, die in Hispanoamerika entstanden sind und nur in bestimmten Regionen vorkommen. Für alle fünf Untergattungen wird angenommen, dass sie vor allem auf einer inhaltlichen Ebene definiert sind (Álamo Felices 2011, Lichtblau 1959: 121-135, Rivas 1990).
Für die Zuordnung der Romane zu den verschiedenen Untergattungen wurde einschlägige Sekundärliteratur ausgewertet. Abb. 1 und 2 zeigen die Verteilung der Romane über die Zeit nach Untergattungen sowie nach Ländern. Bestandteil des Korpus sind neben hispanoamerikanischen Romanen auch fünf Texte aus Spanien sowie je ein Text aus England und Frankreich (in spanischer Übersetzung), welche aufgrund ihres Prototypen-Status einbezogen wurden. Das Korpus umfasst insgesamt 2,3 Mio. Token.2
| Untergattung | Prototyp(en) | Art |
| Historischer Roman |
|
Vorbild |
| Liebesroman |
|
Vorbild |
| Kostumbristischer Roman |
|
Vorbilder |
| Gaucho-Roman |
|
Höhepunkt |
| Antisklaverei-Roman |
|
Höhepunkt |
Beim historischen Roman und beim Liebesroman handelt es sich bei den Prototyp-Texten um Übersetzungen der ursprünglich auf englisch und französisch verfassten Romane, die auch in Hispanoamerika als Vorbilder für diese Romantypen eingeschätzt werden. Kontroverser wird diskutiert, welche Texte Einfluss auf die kostumbristischen Romane ausgeübt haben. Auf der einen Seite wird der mexikanische Autor Lizardi als Pionier genannt, auf der anderen Seite werden Romane spanischer Autoren (Caballero, Alarcón, Valera, Pereda) angeführt (Calderón 2005). Eine Prototypenanalyse könnte hier Argumente für eine der beiden Thesen liefern. Im Falle des Gaucho-Romans und des Antisklaverei-Romans sind die gesetzten Prototypen als Höhepunkte der jeweiligen Gattung zu verstehen, da die weiteren diesen Untergattungen zugeordneten Romane im Korpus entweder als Vorstufen oder Nachfolger der besonders repräsentativen Gattungsvertreter beschrieben worden sind (Lichtblau 1959: 121-135, Rivas 1990).
Methoden. Um die für die Untergattungen relevanten Strukturen auf unterschiedlichen textlichen Ebenen zu analysieren und zu modellieren, wurden Topic Modelling und eine Analyse der häufigsten Wörter (MFW) angewandt.
Das Topic Modeling (vgl. Blei 2012) wurde mit MALLET6 mit für das Korpus geeigneten Vorverarbeitungsschritten und Parametern durchgeführt (Lemmatisierung, Beschränkung auf Substantive, Segmentlänge von 1000 Wörtern, 30 Topics, 5000 Iterationen, Optimierung alle 10 Iterationen) und die Ergebnisse anschließend für die einzelnen Romane wieder aggregiert. Abb. 3 zeigt ein Beispiel-Topic aus dem entstandenen Modell:
Die zweite Dokument-Repräsentation wurde auf Basis der 10.000 häufigsten Wörter (MFW) in den Roman-Volltexten erstellt (nicht lemmatisiert, gewichtet mit TF-IDF, maximale Dokument-Frequenz von 90 %). Anhand dieser beiden Repräsentationen kann überprüft werden, welche Merkmale zentral für die Abbildung von Gattungsunterschieden zwischen den Texten sind.
Ergebnisse und Diskussion. Die auf der Grundlage der Topics und MFW ermittelten Ähnlichkeiten zwischen den Texten wurden hinsichtlich der Beziehungen der Romane zu ihren jeweiligen Prototypen ausgewertet. Abb. 4 zeigt beispielsweise die Abstände der einzelnen Gaucho-Romane zum Prototypen “Juan Moreira” von Eduardo Gutiérrez, auf der linken Seite die Topic-Ähnlichkeiten und auf der rechten Seite die MFW-Ähnlichkeiten. Insgesamt fällt auf, dass die Vorläufer und Nachfolger dem Prototypen hinsichtlich der Topics ähnlicher sind als in Bezug auf die MFW, der Gaucho-Roman also mehr durch gemeinsame Themen als (im weitesten Sinne) stilistische Eigenschaften zusammengehalten wird. In beiden Fällen sind die Abstände zum Prototypen jedoch relativ groß. Wir führen das darauf zurück, dass die Beschreibung der Gattung durch Lichtblau vor allem eine seiner Entwicklung ist: in den Vorläufern (“La familia de Sconner”, “Amalia”) kommt der Gaucho als Typ nur beiläufig bzw. nur in kurzen Passagen überhaupt vor. Bei den Topic-Ähnlichkeiten ist der späteste Gaucho-Roman im Korpus, “Arturo Sierra” von Julio Llanos, dem Prototypen am nächsten. Laut Lichtblau ist dies ein sentimentaler Sensations-Roman, in dem der Gaucho nur noch eine oberflächliche Rolle spielt (Lichtblau 1959: 134f). Dies zeigt, dass Oberflächenphänomene mit unserem Verfahren gut erfasst werden, die Texteigenschaften aber nicht in allen Fällen hinreichend sind, um die Gattungszugehörigkeit zu klären.
Fazit und Ausblick
Die exemplarische Anwendung des Prototypenmodells auf die hispanoamerikanischen Romane verschiedener Untergattungen hat gezeigt, dass Ansätze zur Modellierung literarischer Gattungen, die über das Prinzip logischer Klassen hinausgehen, informatisch umgesetzt werden können. Fragen wie diejenige nach der Prototypizität einzelner Texte, Gattungsmischungen und nach differenzierten Nähe- und Distanzverhältnissen lassen sich erst auf dieser Grundlage angehen. Literaturgeschichtliche Aussagen zu Gattungszugehörigkeiten und Gattungsentwicklungen mit prototypensemantischem Bezug (wie hier die Entwicklung des Gaucho-Romans oder die Frage nach den die hispanoamerikanische Tradition prägenden kostumbristischen Romanen) können so hinsichtlich relevanter Textmerkmale genauer untersucht werden.
Künftig sollen weitere theoretische Gattungsmodelle, insbesondere das Prinzip der Familienähnlichkeit, auf ihre Anwendbarkeit für gattungstilitische Untersuchungen hin getestet werden. Außerdem soll geprüft werden, welche Ergebnisse andere Textrepräsentationen als Topic-Modelle und MFW liefern, z.B. Word Embeddings. Zu diskutieren bleibt, wie offene Kategorisierungsmodelle evaluiert werden können.
Fußnoten
Bibliographie
- Álamo Felices, Francisco (2011): Los subgéneros novelescos. Teoría y modalidades narrativas. Almería: Universidad Almería.
- Blei, David M. (2012): “Probabilistic Topic Models”, in: Communications of the ACM 55 (4): 77-84. DOI: 10.1145/2133806.2133826
- Calderón, Mario (2005): “La novela costumbrista mexicana”, in: Clark de Lara, Belem / Speckman Guerra, Elisa (eds.): La república de las letras. Vol. 1: Ambientes, asociaciones y grupos. Movimientos, temas y géneros literarios. México: UNAM 315-324.
- Calvo Tello, José / Schlör, Daniel / Henny, Ulrike / Schöch, Christof (2017): “Neutralising the Authorial Signal in Delta by Penalization: Stylometric Clustering of Genre in Spanish Novels” in: DH2017: Annual Conference of the Alliance of Digital Humanities Organizations. Montreal: McGill University & Université de Montréal 181-184 [letzter Zugriff 13. Januar 2018].
- Fishelov, David (1991): “Genre theory and family resemblance”, in: Poetics 20: 123-138.
- Fowler, Alastair (1982): Kinds of Literature. An Introduction to the Theory of Genres and Modes. Oxford: Clarendon Press.
- Hagen, Thora / Huber, Michael / Tepavac, Daniel (2017): “Workshop on Distant Reading in Literary Texts”, in: DHdBlog [letzter Zugriff 13. Januar 2018].
- Hempfer, Klaus W. (2010): “Zum begrifflichen Status der Gattungsbegriffe: Von ‘Klassen’ zu ‘Familienähnlichkeiten’ und ‘Prototypen’”, in: Zeitschrift für französische Sprache und Literatur 120 (1): 14-32.
- Hettinger, Lena / Jannidis, Fotis / Reger, Isabella / Hotho, Andreas (2016a): “Classification of Literary Subgenres”, in: DHD 2016. Leipzig: Universität Leipzig 154-58 [letzter Zugriff 13. Januar 2018].
- Hettinger, Lena / Jannidis, Fotis / Reger, Isabella / Hotho, Andreas (2016b): “Significance Testing for the Classification of Literary Subgenres”, in: DH2016: Annual Conference of the Alliance of Digital Humanities Organizations. Kraków: Jagiellonian University & Pedagogical University 218-220 [letzter Zugriff 13. Januar 2018].
- Janik, Dieter (2008): Hispanoamerikanische Literaturen. Von der Unabhängigkeit bis zu den Avantgarden (1810-1930). Tübingen: Narr.
- Kayser, Wolfgang (1956 4): Das sprachliche Kunstwerk. Eine Einführung in die Literaturwissenschaft. Bern: Francke Verlag. Erste Auflage 1948.
- Lichtblau, Myron I. (1959): The Argentine Novel in the Nineteenth Century. New York: Hispanic Institute in the United States.
- Rivas, Mercedes (1990): Literatura y esclavitud en la novela cubana del siglo XIX. Sevilla: Escuela de Estudios Hispano-Americanos.
- Rosch, Eleanor (1973): “On the internal structure of perceptual and semantic categories”, in: E. T. Moore (ed.): Cognitive development and the acquisition of language. New York: Academic Press: 111-144.
- Schöch, Christof, / Henny, Ulrike / Calvo Tello, José / Schlör, Daniel / Popp, Stefanie (2016): “Topic, Genre, Text. Topics im Textverlauf von Untergattungen des spanischen und hispanoamerikanischen Romans (1880-1930)”, in: DHD 2016. Leipzig: Universität Leipzig, 235-239 [letzter Zugriff 13. Januar 2018].
- Schöch, Christof (2015): “Topic Modeling French Crime Fiction”, in: DH2015: Annual Conference of the Alliance of Digital Humanities Organizations. Sydney: The University of Western Sydney [letzter Zugriff 13. Januar 2018].
- Schöch, Christof (2013): “Fine-tuning Our Stylometric Tools: Investigating Authorship and Genre in French Classical Theater”, in: DH2013: Annual Conference of the Alliance of Digital Humanities Organizations. Lincoln: UNL [letzter Zugriff 13. Januar 2018].
- Vivas, Eliseo (1968): “Literary Classes: Some Problems”, in: Genre 1: 97-105.
- Weitz, Morris (1956): “The Role of Theory in Aesthetics”, in: The Journal of Aesthetics and Art Criticism 15 (1): 27-35.
- Zymner, Rüdiger (2003): Gattungstheorie. Probleme und Positionen der Literaturwissenschaft. Paderborn: mentis Verlag.