Erkennen historischer Datierungen in den Reichstagsakten

Reinert, Matthias
https://zenodo.org/records/10698327
Zum TEI/XML Dokument

Historische Datierungen anhand der Heiligentage

Die im Heiligen Römischen Reich bis zum Beginn des 16. Jahrhundert vorherrschende Datierungspraxis orientierte sich am christlichen „Kirchenjahr“, an den Sonntagen, den Heiligentagen und Festen. In den digital verfügbaren Bänden der Reichstagsakten finden sie sich - anhand der unten beschriebenen Erkennungsverfahren - vor allem bis 1541, weniger in 1543 und selten in 1556/57 und 1575. Nach der Gregorianischen Kalenderreform 1582 bildeten sich je nach konfessioneller Ausrichtung der Territorien und deren individueller Übernahme der Reform parallele Datierungen alten und neuen Stils.

Reichstagsakten

Die Reichstagsakten sind ein Editionsvorhaben der Historischen Kommission bei der Bayerischen Akademie der Wissenschaften, das seit ihrer Gründung 1858 in mittlerweile 4 Reihen vorangetrieben wurde (vgl. Annas 2021, Wolgast 2008).

Seit 2012 werden die Bände der Reihen durch ein Hybrides Editionsverfahren sowohl für den PDF-Satz als auch für eine XML-basierte Online-Fassung vorbereitet (RTA digital).

Der Arbeitskorpus besteht aus den XML-Fassungen von

  • Heil, Dietmar (Bearb.) 2014. Der Reichstag zu Konstanz 1507 (Reichstagsakten Mittlere Reihe. Reichstagsakten unter Maximilian I. Band 9), München.
  • Heil, Dietmar (Bearb.) 2017. Der Reichstag zu Worms 1509 (Reichstagsakten Mittlere Reihe. Reichstagsakten unter Maximilian I. Band 10), München.
  • Seyboth, Reinhard (Bearb.) 2017. Die Reichstage zu Augsburg 1510 und Trier/Köln 1512 (Reichstagsakten Mittlere Reihe. Reichstagsakten unter Maximilian I. Band 11), München.
  • Seyboth, Reinhard (Bearb.) 2022. Die Reichstage zu Worms 1513 und Mainz 1517 (Reichstagsakten Mittlere Reihe. Reichstagsakten unter Maximilian I. Band 12), München.
  • Luttenberger, Albrecht P. (Bearb.) und Christiane Neerfeld (Druckvorbereitung) 2018. Der Reichstag zu Regensburg 1541 (Deutsche Reichstagsakten, Jüngere Reihe. Reichstagsakten unter Kaiser Karl V., XI. Band.), München.
  • Schweinzer-Burian, Silvia (Bearb.) und Friedrich Edelmayer (Vorarbeiten) 2021. Der Reichstag zu Nürnberg 1543 (Deutsche Reichstagsakten, Jüngere Reihe. Reichstagsakten unter Kaiser Karl V., XIV. Band.), München.
  • Leeb, Josef (Bearb.) 2013. Der Reichstag zu Regensburg 1556/57 (Deutsche Reichstagsakten. Reichsversammlungen 1556-1662), München.
  • Neerfeld, Christiane (Bearb.) 2016. Der Kurfürstentag zu Regensburg 1575 (Deutsche Reichstagsakten. Reichsversammlungen 1556-1662), München.

Lokale Grammatiken

Der Korpusprozessor Unitex (Paumier 2021) erlaubt die Anwendung von speziellen Wörterbüchern in linguistische Strukturen beschreibenden Graphen. Diese können zudem in Reihe geschaltet werden (vgl. Kap. 12 CasSys in Paumier 2021, Maurel/Friburger 2011), wodurch eine Verarbeitung bestehender XML-Strukturen, dynamische Erkennung von Wörterbuch-Einträgen (Transducer) also auch serielle Anwendungen von Graphen auf einen Korpustext (Kaskaden) möglich sind.

Bereits auf der DHd 2014 wurde ein ähnlicher Ansatz (Stotz 2014) für die Erkennung von Entitäten rund um das Verb „emigrieren“ vorgestellt.

Vorgehen

  • Bootstrapping der Entitäten (Tage, Heilige) = typische Struktur der Ausdrücke
  • Aufbau der Wörterbücher, u.a. Extraktion Grotefend.digital
  • Realtagging der Konstrukte
  • Auswertung bezogen auf das Korpus
  • Rewrite als Cascade: – internes Kodieren der Strukturleerstellen (mind. 2 Fassungen der Bootstrap-Graphen) – Ausgabegraph bezieht intern kodierte und extern hinterlegte Entitäten mit ein
  • Entity Linking to Grotefend.digital

1. Bootstrapping Heiligentage & Bezeichner

Relevante Entitäten der Datierungen sind offenbar der Wochentag bzw. die Anzahl der Tage (N) vor oder nach („post“/„ante“[pa]) einem Fixtag. Für die Fixtage kommen Heiligen(namens)tage (SAINT) oder Feiertage (FERIA) in Frage. Diese alle können in verschiedenen Schreibweisen und Sprachen (Latein, Deutsch) vorkommen.

Placeholder
Abbildung 1: Graph zur Bestimmung von Wochentagen. Ein sog. Bootstrapping versucht zunächst eine grobe Struktur der Art „N pa SAINT“ bzw. „N pa FERIA“ abzubilden und der Graph wird auf die Ausgabe der auf die Leerstellen passenden Ausdrücke ausgelegt.

Placeholder
Abbildung 2: Graph zur Bestimmung von Heiligentagen. Die geschweiften Klammern kodieren die gefundenen Matches wiederum als Wörterbucheinträge für die folgenden Transducer-Schritte.

2. Aufbau der Wörterbücher

Für die im Bootstrap-Graphen gefunden Entitäten-Bezeichner ist ein manueller Kontrollgang nötig um ggf. Fehlerkennungen aus dem Wörterbuch zu entfernen. U.U. wird der Strukturgraph erweitert.

Eine weitere Gruppe Wörterbücher für Entitäten läßt sich aus dem Angebot Grotefend.digital (Raunig 2021) sowie (Grotefend 2004) extrahieren: die Bezeichner der Heiligen(-Tage) und Festtage. Diese können ebenso in einem Graph eingebunden werden, um passende Bezeichner an den strukturell vorgegebenen Stellen zu erlauben.

Anhand des Korpus der digialisierten RTA wurden Wörterbücher für die Heiligen und Feste, die temporalen Relationen (nächster, kommender etc.) sowie Wochentage in deren unterschiedlichen Schreibformen unter besonderer Kodierung der Formen für Sonntag angelegt.

3. Auswertung

Der bisherige Ansatz hat mithilfe von Bootstrapping eine korpusbezogene Entitätensammlung in den Wörterbüchern hinterlegt. Eine Auswertung der Erkennungsfähigkeit des Graphen bezieht sich auf den Recall (Auffinden der entsprechenden Datierungen) und die Precision (korrektes Tagging der Entitäten).

Zum gegenwärtigen Zeitpunkt – ohne Vergleichskorpus – kann lediglich angegeben werden, dass die Entitäten-erkennenden Graphen 935 Wochentage (eine Sonntag-Form) und 721 Heiligennamen fanden; der Ausgabegraph 4438 Datumsangaben mit 1523 Heiligennamen erkannte. Die erkannten Entitäten können in einem iterativen Verfahren wiederum den Wörterbüchern hinzugefügt werden, was den Recall theoretisch erhöhen würde.

4. Verallgemeinerung des Strukturgraphen

Der Korpusprozessor Unitex bietet die Möglichkeit in einer „Cascade“ mehrere Graphen hintereinander in unterschiedlichen Modi anzuwenden. Der Bootstrap-Graph wird so modifiziert, dass er keine Ausgabe sondern eine interne, wörterbuchanaloge Kodierung vornimmt. Die strukturellen Leerstellen können auch vereinzelt und dementsprechend mehrere Fassungen des Graphen erzeugt werden.

Placeholder
Abbildung 3: Ausgabegraph (Transducer). Die Ergebnisse können unter www.reichstagsakten.de/feriafestum überprüft und die Erkennungsgraphen ausprobiert werden.

5. Ausblick: Erkannte Entitäten sinnvoll verlinken

Naheliegend ist einerseits die Umrechnung der erkannten Zahlangaben in einen numerischen Wert. Interessanter erscheint es die besonderes Tagesangaben zunächst auf eine stabile URL zu leiten. Mithilfe der Wörterbücher läßt sich rekonstruieren, welches Lemma einer Variante zugrundeliegt.

Eine erste Sichtung ergab, dass Datierungen mit Bezug auf „Jacobi apostoli“ häufigste Heiligennennung darstellten. Beim Versuch, dies auf die Grotefend.digital - Einträge zu beziehen, zeigte sich, dass die dazugehörige Ontologie (Ontologie 2021) Heiligennamen (Jacobus / -i) und Funktion (apostoli) über die Werte in den Aussagen prefLabel (bevorzugte Bennenung) und hasFunction (hat Funktion) abbilden. Für die Bennenung prefLabel = “Jacobi” und den Wert hasFunction = “ap.” gibt es eine beinahe vollständig übereinstimmende Eintrag. Bereits bei Datierungen auf „Viti“ ergibt sich, dass die Ontologie den exakt übereinstimmenden, aber irreführenden Wert prefLabel = “Viti” (Konzept #viti_epcf_viennen) vorhält. Der inhaltlich passende Wert für prefLabel = “Viti, Modesti et Crescentie” wäre aus dem Konzept #vitimodestietcrescentie_m für eine Verlinkung herzunehmen.

Die Ableitung eines Datumwerts aus dem Grotefend muss die geografische Verortung der Datierung berücksichtigen: gleiche Heiligennamen können in verschiedenen Orte an unterschiedlichen Tagen gefeiert worden sein. Hier könnte die geografische Angabe des edierten Stückes herangezogen werden, jedoch muss der Ausstellungsort, z.B. auf dem Reichstag, nicht mit dem konfessionellen Bezugsort des Ausstellers übereinstimmen. Dies würde das automatische Berechnen des tatsächlichen Datums noch erschweren, wenn nicht unmöglich machen.

Dank

Ich danke Dr. Dietmar Heil für Korrekturen und Hinweise zur Datierungspraxis, die sich in den Reichstagsakten findet.


Bibliographie

  • Annas, Gabriele. [2021]. Die „Deutschen Reichstagsakten“: Einleitung, in: Mathias Kluge (Hg.), Mittelalterliche Geschichte. Eine digitale Einführung (2021).
  • Grotefend, Hermann. 1898. Zeitrechnung des Deutschen Mittelalters und der Neuzeit. 2 Bde., Hannover 1891-1898. nach der HTML-Version von Horst Ruth. 2004. .
  • Maurel, Denis, Nathalie Friburger, Jean-Yves Antoine, Iris Eshkol-Taravella, und Damien Nouvel. 2011. „Cascades de transducteurs autour de la reconnaissance des entités nommées [CasEN: a transducer cascade to recognize French Named Entities]“. Traitement Automatique des Langues 52 (1): 69–96.
  • Ontologie zu „Grotefend.digital. Kalender, Feste, Heilige“. [2021]
  • Paumier, Sébastien (with the collaboration of Wolfgang Flury, Franz Guenthner, Eric Laporte, Friederike Malchok, Clemens Marschner, Claude Martineau, Cristian Martínez, Denis Maurel, Sebastian Nagel, Alexis Neme, Maxime Petit, Johannes Stiehler, Gilles Vollant). 2021. “Unitex 3.3. User manual”, Marne-la-Vallée. .
  • Raunig, Elisabeth. 2021. Grotefend - digital : eine digitale Kalenderanwendung für liturgische Kalender auf Basis einer RDF-Repräsentation von Grotefends Heiligenverzeichnis und Kalendersammlung. .
  • Reichstagsakten digital. 2012ff. https://www.reichstagsakten.de.
  • Stotz, Sophia, Valentina Stuß. 2014. “Relationsextraktion mit lokalen Grammatiken am Beispiel der Relation „emigrieren“”. Vortrag bei 1. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd 2014), Universität Passau, 25.-28. März 2014.
  • Wolgast, Eike. 2008. Deutsche Reichstagsakten, in: Lothar Gall (Hg.), „…für deutsche Geschichts- und Quellenforschung“. 150 Jahre Historische Kommission bei der Bayerischen Akademie der Wissenschaften, München 2008, S. 79-120.