Status Quo der Entwicklungen von Ontologien Rhetorischer Figuren in Englisch, Deutsch und Serbisch

Kühn, Ramona; Mitrović, Jelena
https://zenodo.org/records/10698380
Zum TEI/XML Dokument

Einleitung und Motivation

Rhetorische Figuren sind seit Jahrhunderten Gegenstand der Untersuchung in den Bereichen der Linguistik und der Rhetorik. Diese Figuren, wie zum Beispiel Metapher, Ironie, Alliteration und viele weitere, können als Abweichung vom normalen Sprachgebrauch verstanden werden (Fahnestock, 1999). Die daraus resultierende Wirkung ist, dass Texte oder Worte, die rhetorische Figuren enthalten, einprägsamer, überzeugender oder auch beeinflussender sein können. Wir möchten dabei Figuren unterscheiden, die sprachunabhängig funktionieren, wie zum Beispiel die Wiederholung eines Wortes, oder die Verwendung des gleichen Anfangslauts (z. B. bei der Figur Alliteration) und Figuren, die auf einem gemeinsamen kulturellen Verständnis und Hintergrundwissen basieren (z. B. Metaphern wie „jemandem das Herz brechen”) und oft nicht wörtlich, sondern nur im übertragenen Sinne verstanden werden können. Besonders bei Übersetzungen zwischen zwei Sprachen ist es immens wichtig, die Nuancen zu erkennen und richtig zu interpretieren.

Bei der Analyse dieser übertragenen Figuren können kultur- und sprachübergreifende Vergleiche angestellt werden, um Gemeinsamkeiten und Unterschiede in ihrer Verwendung und Wirkung über verschiedene kulturelle Kontexte hinweg zu untersuchen. Auch können neue Einblicke in menschliches Verhalten oder die soziale Dynamik innerhalb bestimmter Gemeinschaften gewonnen werden. Um dies zu ermöglichen, benötigt man große Datenmengen, die von Expert:innen annotiert werden. Diese manuelle Arbeit ist jedoch sehr zeit- und kostenintensiv. Darüber hinaus sind versierte Fachkräfte auf diesem Forschungsgebiet vergleichsweise selten anzutreffen. Daher ist es wichtig, dass rhetorische Figuren maschinell annotiert werden können. Eine maschinenlesbare Darstellung und Beschreibung rhetorischer Figuren ist daher notwendig. Häufig werden dafür formale, domänenspezifische Ontologien verwendet.

In diesem Artikel gehen wir der Frage nach, wie der aktuelle Status Quo der Ontologie-Entwicklung rhetorischer Figuren ist. Unser Fokus liegt dabei vor allem auf englisch-, serbisch- und deutschsprachigen Modellen. Wir geben zuerst einen Überblick über die Entwicklung und Kategorisierung von rhetorischen Figuren, um die Notwendigkeit für Ontologien hervorzuheben. Anschließend präsentieren wir aktuelle Ontologien in Serbisch, Deutsch und Englisch, sowie eine mehrsprachige Ontologie, die eine Vereinigung der vorigen Ontologien darstellt. Am Ende des Artikels geben wir einen Ausblick, wie die Zukunft bezüglich automatisierter Erkennung rhetorischer Figuren im Kontext großer Sprachmodelle („Large Language Models“) aussehen könnte.

Einblicke in die Beschreibungen Rhetorischer Figuren und ihrer Kategorisierung

Bereits Aristoteles, Sokrates und Plato beschäftigten sich mit den Grundlagen der Rhetorik und ihrer Überzeugungsfähigkeit in Argumentationen. Die erste konkrete Beschreibung rhetorischer Figuren findet sich im Buch IV der Schrift „Rhetorica ad Herennium“, dessen unbekannter Autor das Werk ca. 80 v. Chr. verfasst hat. Die Figuren werden dort in die zwei Gruppen „Figuren der Diktion“ (zum Beispiel Epanaphora, Antithesis, Klimax, Metapher) und „Gedankenfiguren“ (zum Beispiel Vergleich, Personifikation, Untertreibung, oder lebendige Beschreibung) eingeteilt (Caplan und Winterbottom, 2016). Man kann jedoch in dieser Einteilung kein einheitliches Schema erkennen. Fahnestock (1999) kritisiert, dass zusätzlich indirekt eine dritte Gruppe mit Ausnahmen eingeführt wird, sodass diese Einteilung in Gruppen inkonsistent und sogar verwirrend erscheint.

Etwa zur gleichen Zeit entstand Ciceros Werk „De inventione“, welches sich zum einen mit Grundbegriffen der Rhetorik und zum anderen mit Argumentationstechniken befasst. Es ähnelt in vielen Bereichen der Schrift Rhetorica ad Herennium. Quintilian wagt in seiner Schrift „Institutio Oratoria” (Quintilian, ca. 92 n. Chr. / 1996) einen neuen Versuch, rhetorische Figuren zu kategorisieren. Er verwendet dabei die Kategorien aus dem Werk Rhetorica ad Herennium, führt aber eine Unterscheidung zwischen „Figuren“ und „Tropen“ ein. Bereits in dieser Schrift fällt auf, dass es verschiedene Kategorisierungen und Meinungen gibt, die sich nur schwer in ein einheitliches Format bringen lassen. Dieses Dilemma zieht sich durch die Jahrhunderte hinweg, von Richard Whatelys „Elements of Rhetoric“ im Jahre 1828 über Kenneth Burkes rhetorische Theorien (1945-1966), bis Heinrich Lausberg 1960 mit seinem „Handbuch der literarischen Rhetorik“ einen neuen Versuch wagt. Das Buch ist eine enorme Sammlung von Erkenntnissen der vorigen Jahrhunderte und versucht, eine Systematik zu etablieren. Mit Hilfe mehrsprachiger Beispiele sollen den Leser:innen rhetorische Figuren und ihre Eigenheiten verdeutlicht werden. Jedoch merkt man in diesem Werk, dass es schwierig ist, allgemeingültige Standards in einem Gebiet zu etablieren, das es seit nahezu 2000 Jahren nicht geschafft hat, Kategorien ohne Widersprüche zu formulieren. Möchte man dies modellieren, wäre es notwendig, die verschiedenen Datenquellen und Definitionen zu integrieren. Außerdem müsste eine Modellierung gerade abstrakt genug sein, um auch konkurrierende Kategorien abbilden zu können, aber dennoch spezifisch genug, um die Eigenheiten der verschiedenen Figuren reflektieren zu können.

Ontologien zur Standardisierung und ihre Relevanz für die Digital Humanities

Wie soll man es nun schaffen, aus diesem Wirrwarr der Kategorien einen einheitlichen Standard zu entwickeln, der zugleich maschinenlesbar ist? Warum sollte dies überhaupt nötig sein? Rhetorische Figuren spielen auch in unserer heutigen Zeit eine große Rolle, sei es bei politischen Reden, in der Werbung oder in sozialen Medien. Denn auch heute haben sie die gleiche Wirkung wie vor tausenden Jahren: Sie können die Leserschaft überzeugen, Argumente plausibler erscheinen lassen, oder eine Botschaft einprägsamer machen. Da eine manuelle Analyse zu zeit- und kostenintensiv ist, wird eine computergestützte Erkennung immer wichtiger. Dafür sind allerdings eine einheitliche Benennung, ein gemeinsames Verständnis, sowie ein Set an Regeln erforderlich.

Ontologien sind hierfür das geeignete Mittel, da sie eine formale, einheitliche Struktur darstellen, die sowohl von Menschen als auch Maschinen lesbar und verarbeitbar ist. Sie können Daten aus heterogenen Quellen integrieren (Rehbein, 2017) und bestehende Wissensbestände vereinen (Mladenović et al., 2014). Sie dienen der Wissensrepräsentation und -organisation. Eine semantische Verarbeitung wird dadurch ermöglicht (Kaiya und Saeki, 2006). Zudem helfen sie, ein gemeinsames Verständnis der vorhandenen domänenspezifischen Informationen zu vermitteln (Noy und McGuiness, 2001). Zusammenhänge können durch die graphische Darstellung der Relationen in Form eines Netzwerkes noch leichter erkannt werden.

Konsistenz, Validität und das Einhalten logischer Regeln lassen sich mit Ontologien ebenfalls überprüfen. Ontologien haben bereits in vielen Bereichen bewiesen, dass sie unterschiedliche Definitionen und Beschreibungen vereinheitlichen und Sachverhalte konsistent modellieren können, zum Beispiel in der Medizin (Hu, 2006) oder im Katastrophenschutz (Bu Daher, 2022). Die wohl bekannteste Ontologie im Bereich der Digital Humanities ist das CIDOC Conceptual Reference Model (Bruseker et al., 2017), welches Objekte im Bereich des kulturellen Erbes beschreibt. Ein anderes Projekt in diesem Gebiet ist beispielsweise „GOLEM“ (Pianzola et al., 2023), welches mit Hilfe von Ontologien kulturelle Merkmale der Online-Fiktion in verschiedenen Sprachen miteinander vergleicht. Langmead et al. (2016) untersuchen die Relevanz von Ontologien in den Digital Humanities mit einem Fokus auf historische Netzwerke der Frühen Neuzeit.

Im Bereich rhetorischer Figuren sind Ontologien wichtige Werkzeuge für Linguist:innen und Informatiker:innen, die ein tieferes Verständnis dafür entwickeln wollen, wie Sprache in bestimmten Kontexten oder Genres verwendet wird. Rhetorische Figuren sind komplexe sprachliche Phänomene, die in verschiedenen Texten und Sprachen auftreten. Die Ontologien vereinen dabei die Vielzahl an heterogenen Datenquellen, die es im Bereich der rhetorischen Figuren gibt. Eine Ontologie rhetorischer Figuren ermöglicht die systematische Erfassung und Strukturierung des Wissens über diese Figuren. Sie hilft dabei, die verschiedenen Figuren, ihre Definitionen, Eigenschaften und Beziehungen zueinander in einer formalen und einheitlichen Weise darzustellen. Ontologien, in denen verwandte rhetorische Figuren nach ihren Konstruktionsregeln oder Eigenschaften gruppiert sind, dienen dabei unter anderem als Nachschlagewerk und Sammlung des Wissens über rhetorische Figuren. Darüber hinaus können sie in der Erkennung rhetorischer Figuren in Texten unterstützen und dabei helfen, Annotationsrichtlinien zu erstellen (Reiter, 2020). Diese Annotationen können dann für das Training von großen Sprachmodellen verwendet werden, um eine automatische Identifizierung in Texten zu ermöglichen.

Die Bedeutung von Ontologien für rhetorische Figuren in den Digital Humanities liegt in ihrer Fähigkeit, semantische Strukturen und Beziehungen zwischen den Figuren zu erfassen und zu organisieren. Zudem können solche Ontologien dazu beitragen, das Textverständnis zu steigern, da die darin erkannten Figuren direkt mit ihrer Wirkung verknüpft werden können, die sie auf die Zielgruppe haben. Zudem können kultur- und sprachübergreifende Analysen durchgeführt werden, da bestimmte Figuren in manchen Sprachen eventuell häufiger verwendet werden als in anderen. Hinzu kommt, dass Definitionen mancher Figuren oder sogar Figuren selbst sprachabhängig existieren und dadurch Gemeinsamkeiten und Unterschiede in den Sprachen und über verschiedene kulturelle Kontexte hinweg untersucht werden können.

Status Quo der Entwicklungen von Ontologien Rhetorischer Figuren und ihre Anwendungen

Im Folgenden stellen wir verschiedene Ontologien rhetorischer Figuren und ihre Entwicklung vor. Dabei gehen wir nur auf Ontologien ein, die mehrere verschiedene rhetorische Figuren abbilden und sich nicht auf eine einzelne Figur fokussieren. Den Beginn der Entwicklung solcher Ontologien markiert das sogenannte RhetFig Projekt (Kelly et al., 2010), dessen Ziel es war, ein theoretisches Konzept für eine mögliche Modellierung von Ontologien rhetorischer Figuren zu erstellen. Dabei werden rhetorische Figuren in drei Gruppen kategorisiert, nämlich Tropen, Schema und Chroma. Zudem werden linguistische Domänen (z. B. morphologisch, phonologisch) eingeführt, die jeder Figur zugeordnet werden. Dieses Konzept diente als Basis für die serbische RetFig (ohne „h“) Ontology (Mladenović und Mitrović, 2013). In dieser wird die Einteilung in linguistische Domänen und Gruppen fortgeführt. 98 serbische Figuren wurden dabei formal in der W3C Web Ontology Language (OWL) modelliert und beschrieben. Wang et al. (2021) entwickelten dann die Ploke Ontologie, die Figuren der perfekten lexikalen Wiederholung modelliert. Diese Ontologie basiert ebenfalls auf der Grundstruktur des RhetFig Projekts. In dieser Ontologie werden zusätzlich neurokognitive Eigenschaften eingeführt, die von einer Wiederholungsfigur ausgelöst werden (z. B. „Attention Effect“). Eine deutsche Ontologie für rhetorische Figuren stellt die GRhOOT Ontologie (Kühn et al., 2022) dar, die wiederum auf der serbischen RetFig Ontologie basiert, aber insgesamt 110 verschiedene Figuren modelliert. Dafür wurde für jede Figur einzeln untersucht, ob sie im Deutschen ebenfalls existiert und ob die Definitionen gleich sind. Dabei wurde festgestellt, dass 12 serbische Figuren so nicht im Deutschen existieren (z. B. die serbische rhetorische Figur „Wunsch“ hat kein Pendant im Deutschen). Circa 60 Figuren konnten gleich modelliert werden. Allerdings gab es auch Fälle wie die Figur „Syllepsis“, deren deutsche Definition besagt, dass ein Wortelement weggelassen wird, während bei der serbischen Figur „Silepsa“ ein Wortelement hinzugefügt wird. Inspiriert durch diese sprachlichen Unterschiede wurde die „Multilingual Ontology” (Wang et al., 2022) modelliert, die versucht, Ploke Figuren – also Figuren mit perfekter lexikaler Wiederholung – der serbischen, deutschen und englischen Ontologie zu vereinen. Wie wir bereits anfangs festgestellt haben, sollten diese Figuren sprachlich unabhängig sein. Jedoch wurden dabei ebenfalls Unterschiede festgestellt. Beispielsweise lautet die Definition der Figur Epizeuxis im Deutschen, dass ein Wort oder Wortgruppe mindestens drei Mal wiederholt wird. Die englische Definition spezifiziert jedoch nicht näher, wie oft ein Wort wiederholt werden muss, wodurch bereits eine zweimalige Wiederholung auf die Figur Epizeuxis hindeuten kann.

Diese Beispiele zeigen deutlich, dass existierende Ontologien rhetorischer Figuren nicht einfach in andere Sprachen übersetzt werden können. Für jede einzelne Figur muss verglichen werden, ob sie so in der Zielsprache existiert und die Definition gleich ist. Zudem müssen die Figuren gefunden werden, die es in der Sprache der existierenden Ontologie nicht gibt, allerdings in der Zielsprache als rhetorische Figur angesehen wird. Genau so wurde verfahren, um eine englische Ontologie zu modellieren, die mehrere verschiedene Figuren abbildet. Mit dieser sogenannten ESTHER Ontologie (Kühn et al. 2023) wurde das englische Äquivalent zur deutschen und serbischen Ontologie geschaffen. Sie ist eine Weiterentwicklung der deutschen GRhOOT Ontologie und beinhaltet zusätzlich Wissen aus weiteren englischen Quellen. Auch wurden hierarchische Abhängigkeiten und Co-Lokationen zwischen verschiedenen Figuren modelliert, zum Beispiel, dass die Figur Symploke stets auch eine Anapher und Epipher ist, oder dass eine Klimax aus der Kombination von Gradatio und Inkrementum gebildet wird (O’Reilly et al. 2018). Eine zeitliche Übersicht der hier genannten Ontologien findet sich in Abbildung 1.

Placeholder
Abbildung Zeitliche Übersicht der Ontologie-Entwicklungen.

Doch wie sollen diese Ontologien nun dazu beitragen, große Datenmengen zu analysieren und rhetorische Figuren darin automatisch zu identifizieren? Kühn und Mitrović (2023) zeigen dafür einige Anwendungsbeispiele auf. Sie nennen als größtes Problem für die automatisierte Erkennung das Fehlen annotierter Datensätze. Die Ontologien sollen dabei unterstützen, diese Hürde zu überwinden, um dann mit annotierten Daten große Sprachmodelle für diese spezielle Aufgabe zu trainieren. Konkret können die Ontologien dazu genutzt werden, Personen in der manuellen Annotation zu schulen, um die wenigen Expert:innen darin zu unterstützen. Da die Ontologien in OWL geschrieben sind, können die Daten mit der Anfragesprache SPARQL angefragt werden. Zudem beschreiben Kühn und Mitrović (2023) das theoretische Konzept einer grafische Benutzeroberfläche, die ein niedrigeschwelliges Angebot zur Annotation rhetorischer Figuren für viele Nutzer:innen darstellt. Dabei handelt es sich um eine Website mit Auswahlmöglichkeiten, die die Nutzer:innen aktiv dabei unterstützt, Figuren in einem Text bestimmen zu können. Die Anfragen im Hintergrund basieren dabei auf SPARQL-Anfragen an die jeweilige Ontologie. Diese Oberfläche befindet sich allerdings noch in der Entwicklung. Da die serbische RetFig, die deutsche GRhOOT und die englische ESTHER Ontologie auf der gleichen Architektur basieren, kann dieses Tool jedoch dann sprachübergreifend eingesetzt werden. Zusätzlich können Gamification Elemente das Angebot noch attraktiver für eine größere Nutzerschaft machen.

 

Zusammenfassung und Ausblick

Wir haben gezeigt, wie aktuelle Entwicklungen bezüglich maschinenlesbarer und formaler Ontologien im Bereich rhetorischer Figuren voranschreiten. Dadurch, dass die Ontologien alle aufeinander aufbauen aber dennoch unterschiedliche Sprachen betrachten, ist eine strukturelle Kompatibilität gegeben.

Die in den Ontologien spezifizierten Konstruktionsregeln rhetorischer Figuren können Sprachmodelle trainiert werden. Diese können dabei auch dazu dienen, Sätze oder ganze Texte mit gewünschten rhetorischen Figuren zu generieren. Somit könnte der Mangel an Daten von gewissen Figuren in diesem Bereich überwunden werden. Außerdem muss erforscht werden, inwiefern Sprachmodelle bereits jetzt rhetorische Figuren in Texten oder Sätzen erkennen und korrekt annotieren können. Sie würden damit auch eine kostengünstige Alternative zur manuellen Annotation schaffen. Bis dies jedoch möglich ist, brauchen wir unsere Ontologien und manuelle Bemühungen, denn die Sprachmodelle sind nur so gut wie die verfügbaren Trainingsdaten. Dazu gehören ethische Überlegungen wie die Vermeidung von Bias und die Gewährleistung der Transparenz bei der Generierung von Texten. Außerdem können Sprachmodelle nicht ohne menschliche Überprüfung als alleinige Quelle der Wahrheit betrachtet werden, da sie auf vorherigen Textdaten trainiert werden und daher deren Vorurteile und Einschränkungen reflektieren können.

Wenn wir jedoch in der Lage sind, rhetorische Figuren automatisiert zu erkennen und zu identifizieren, bekommen wir einen besseren Einblick in die Art und Weise, wie wir sowohl in schriftlicher als auch in mündlicher Form effektiv kommunizieren - etwas, das zweifellos im Laufe der Zeit relevant bleiben wird, unabhängig von den technologischen Fortschritten, die in den kommenden Jahren gemacht werden.

Acknowledgment

Placeholder

The project on which this report is based was funded by the German Federal Ministry of Education and Research (BMBF) under the funding code 01|S20049. The author is responsible for the content of this publication.


Bibliographie

  • Bruseker, George, Nicola Carboni and Anais Guillem. 2017. “Cultural heritage data management: The role of formal ontology and CIDOC CRM.” Heritage and archaeology in the digital age: acquisition, curation, and dissemination of spatial cultural heritage data: 93-131.
  • Bu Daher, Julie, Tom Huygue, Patricia Stolf and Nathalie Hernandez. 2023. “An Ontology and a reasoning approach for Evacuation in Flood Disaster Response.” Journal of Information & Knowledge Management, 2350042.
  • Caplan, Harry and Mark Winterbottom. 2016. Rhetorica ad herennium. Oxford Research Encyclopedia of Classics.
  • Fahnestock, Jeanne. 1999. Rhetorical figures in science. Oxford University Press, USA.
  • Hu, Xiaohua. 2006. “Natural language processing and ontology-enhanced biomedical literature mining for systems biology.” In Computational systems biology: 39–56. Elsevier.
  • Kaiya, Haruhiko and Motoshi Saeki. 2006. “Using domain ontology as domain knowledge for requirements elicitation.” In 14th IEEE International Requirements Engineering Conference (RE'06): 189-198. IEEE.
  • Kelly, Ashley R., Nike A. Abbott, Randy Allen Harris, Chrysanne DiMarco and David R Cheriton. 2010. “Toward an ontology of rhetorical figures.” Proceedings of the 28th ACM International Conference on Design of Communication.
  • Kühn, Ramona and Jelena Mitrovic. 2023. “Multilingual Domain Ontologies of Rhetorical Figures and Their Applications.” UniDive General Meeting, Paris.
  • Kühn, Ramona, Jelena Mitrović and Michael Granitzer. 2022. “GRhOOT: Ontology of Rhetorical Figures in German.” Proceedings of the Thirteenth Language Resources and Evaluation Conference.
  • Kühn, Ramona, Jelena Mitrović and Michael Granitzer. 2023. “ESTHER: Ontology of Rhetorical Figures in English.” Proceedings of the Joint Ontology Workshops. To be published.
  • Langmead, Alison, Jessica M. Otis, Christopher N. Warren, Scott B. Weingart and Lisa D. Zilinksi. 2016. “Towards interoperable network ontologies for the digital humanities.” International Journal of Humanities and Arts Computing, 10 (1): 22-35.
  • Lausberg, Heinrich. 1960. Handbuch der literarischen Rhetorik. Vol. 2. München. Hueber.
  • Mladenović, Miljana and Jelena Mitrović. 2013. “Ontology of Rhetorical Figures for Serbian.” Text, Speech, and Dialogue: 16th International Conference, TSD 2013, Pilsen, Czech Republic, September 1-5. Proceedings 16. Springer Berlin Heidelberg.
  • Mladenović, Miljana, Jelena Mitrović and Cvetana Krstev. 2014. “Developing and maintaining a wordnet: Procedures and tools.” In Proceedings of the Seventh Global Wordnet Conference: 55-62.
  • Noy, Natalya F. und Deborah L. McGuinness. 2001. Ontology development 101: A guide to creating your first ontology.
  • O’Reilly, Cliff, Yetian Wang, Katherine Tu, Sarah Bott, Paulo Pacheco, Tyler William Black and Randy Allen Harris. 2018. “Arguments in gradatio, incrementum and climax; a climax ontology.” In Proceedings of the 18th workshop on Computational Models of Natural Argument. Academic Press.
  • Pianzola, Federico, Xiaoyan Yang, Noa Visser, Michiel van der Ree and Andreas van Cranenburgh. 2023. “Constructing the GOLEM: Graphs and Ontologies for Literary Evolution Models.” Digital Humanities 2023. Collaboration as Opportunity (DH2023), Graz, Austria. https://doi.org/10.5281/zenodo.8107749
  • Quintilian, Marcus Fabius. Ca. 92 n. Chr. Institutio oratoria. Übersetzt von HE Butler. 1996.
  • Rehbein, Malte. 2017. “Ontologien”. Digital Humanities: Eine Einführung: 162-176.
  • Reiter, Nils. 2020. “Anleitung zur Erstellung von Annotationsrichtlinien.“ In Nils Reiter/Axel Pichler/Jonas Kuhn (Hg.), Reflektierte algorithmische Textanalyse: Interdisziplinäre(s) Arbeiten in der CRETA-Werkstatt: 193-202. Berlin, Boston: De Gruyter. https://doi.org/10.1515/9783110693973-009
  • Wang, Yetian, Ramona Kühn, Randy Allen Harris, Jelena Mitrović and Michael Granitzer. 2022. “Towards a Unified Multilingual Ontology for Rhetorical Figures.” Proceedings of the 14th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management. Valletta, Malta: SCITEPRESS-Science and Technology Publications.
  • Wang, Yetian, Randy Allen Harris and Daniel M. Berry. 2021. “An Ontology for Ploke: Rhetorical Figures of Lexical Repetitions.” JOWO.