Kolophone digital Digital Humanities Tools in der Anwendung
https://zenodo.org/records/10698514
Projektziele
Das vorgestellte DFG-geförderte Forschungsprojekt (wissenschaftliche Arbeit am Germanistischen Seminar der CAU Kiel, Datenmanagement und technische Realisierung in Kooperation mit der Universitätsbibliothek Kiel, Webseite: www.kolophone.de) hat die systematische Erfassung und Erforschung von Kolophonen in deutschsprachigen Handschriften des Mittelalters als Ziel. Kolophone sind SchreiberInnenzusätze, die zumeist am Ende von Handschriften bzw. der enthaltenen Texte stehen. Sie enthalten Informationen wie Schreibernamen, Entstehungszeit und -ort der Handschrift, sie werden aber auch zur Kommentierung der Schreibtätigkeit und der Texte genutzt und sind eine der wenigen Quellen, die Rückschlüsse auf das Text- und Selbstverständnis der Schreibenden erlauben (Dahm, 2020). Mit dem Projekt erfolgt erstmalig eine systematische Sammlung von Kolophonen in deutschsprachigen Handschriften, die der scientific community in digitaler Form verfügbar gemacht wird. Zugleich bietet die Datenbank, die auch inhaltliche Parameter erfasst, umfassende Möglichkeiten zur quantitativen wie auch qualitativen Untersuchung von Kolophonen.
An die digitale Umsetzung des Vorhabens wurden folgende Anforderungen gestellt:
Das Projekt mit einer Laufzeit von drei Jahren ist 08/2021 gestartet, die Veröffentlichung der Datenbank wird Mitte 2024 erfolgen.
Werkzeugkasten und Daten
Zur Dokumentation der Kolophone und der zugehörigen Handschriften wurde das Dokumentenformat TEI-XML gewählt, da die P5-Guidelines mit dem Modul Manuscript Description mittlerweile den internationalen De-Facto-Standard bei der Beschreibung mittelalterlicher Handschriften darstellen (Schaßan, 2019, 201). Der mensch- und maschinenlesbare TEI-Standard ermöglicht die strukturelle und semantische Auszeichnung der erfassten Texte und stellt eine sinnvolle Grundlage für die quantitative/statistische Analyse und Durchsuchbarkeit sowie die Nachnutzung der Daten in anderen Forschungsprojekten dar. Das Datenmodell des Kolophon-Projekts orientiert sich am etablierten Vorgehen bei der Handschriftenkatalogisierung in TEI-XML (Schaßan 2019, 189–193). Über eine ODD-Datei wird XML-Schema erzeugt, in dem kontrollierte Vokabulare hinterlegt werden, so dass für viele Felder Vorschlagslisten zur Verfügung stehen (Beispiel bei Schaßan, 2017, 170–171).
Für das Projekt werden Metadaten im JSON-Format zu den händisch über Kataloge recherchierten Handschriften und zugehörige Register (Orte, Personen, Werke) aus dem Handschriftencensus (Wolf, 2009) (www.handschriftencensus.de) abgerufen. Es erfolgt eine schrittweise Konvertierung nach TEI-XML mithilfe der Python-Bibliotheken json (Python Software Foundation, 2020) und xml.etree.ElementTree (Lundh, 2008) und des Kommandozeilenwerkzeuges XMLStarlet (Grushinskiy, 2002), gefolgt von einer Anreicherung der Handschriften-Metadaten im TEI-Header durch Abruf von Normdaten (GND) über OpenRefine (Delpeuch und Huynh, 2010-2021). Anschließend werden die Daten in die Editionsdatenbank importiert. Diese Datenbank ist eine native XML-Datenbank namens eXist-db (Retter, 2022). Für die editorische Arbeit kommt der XML-Editor oXygen (Syncro Soft SRL, 2021) zum Einsatz. Die grundlegenden Funktionalitäten im Zusammenspiel der beiden zuletzt genannten Technologien und der nutzungsfreundlichen Arbeitsoberfläche liefert das Framework ediarum (Fechner et al., 2020; Fechner et al., 2021; Fechner und Dumont, 2022), welches an die speziellen Bedürfnisse des Projekts angepasst wurde. Ediarum ist eine etablierte und an komplexe editorische Anforderungen anpassbare Lösung.
Aus der Editionsdatenbank werden die XML-Dateien regelmäßig automatisch in die öffentliche Recherchedatenbank synchronisiert. Die Recherchedatenbank ist ebenfalls eine eXist-db, auf der die ebenfalls auf ediarum (Fechner, 2022) basierende, öffentliche Rechercheplattform aufsetzt. Zur Einbindung der Digitalisate wird auf den Standard IIIF gesetzt, d. h. externes Material über entsprechende Schnittstellen abgerufen und im Mirador-Viewer (Project Mirador, 2021) im Projektportal angezeigt. Die Abbildungen werden entweder von den IIIF-Image-Servern externer Repositorien oder von einem Projekt-Server basierend auf der open-source Software Cantaloupe (Cantaloupe-Project, 2021) abgerufen. Die Rechercheplattform bietet eine über das Web frei zugängliche Schnittstelle, die die Handschriftendaten im JSON-Format und als TEI-XML abrufbar macht. Ediarum ermöglicht diese Funktionalität. Die Schnittstelle steht für andere Vorhaben zur Nutzung bereit und kann bspw. dazu dienen, die Daten zum Handschriftencensus zurück zu transferieren. Eine Langzeitarchivierung der XML-Dateien und ggf. Bilder wird mittels Datenübertragung in das TextGrid Repository (TextGrid Konsortium, 2006-2014) umgesetzt.
Fazit und Ausblick
Durch das Zusammenwirken von Kompetenzen aus germanistischer Mediävistik, Digital Humanities, Informatik und bibliothekarischem Metadatenmanagement sowie die Adaption etablierter DH-Technologien werden die Projektanforderungen effizient erfüllt. Das Vorhaben leistet einen signifikanten Beitrag zur Grundlagenforschung in der germanistischen Mediävistik und soll Ausgangspunkt weiterer literaturwissenschaftlicher und kodikologischer Forschungen zu Kolophonen als einem bislang kaum erforschten Bereich sein. Dabei werden perspektivisch verbesserte Recherche- und Visualisierungsmöglichkeiten (Karte, Zeitstrahl) sowie die Vernetzung mit weiteren Projekten zur Handschriftenerforschung wie dem Handschriftenportal angestrebt.
Bibliographie
- Cantaloupe-Project. 2021. „Cantaloupe“. V. 5.0.5. University Library, University of Illinois. https://github.com/cantaloupe-project/cantaloupe (zugegriffen: 18. Juli 2023).
- Dahm, Margit. 2020. „Auf den Spuren des Schreibers - Kolophone in deutschsprachigen Handschriften des Mittelalters.“ editio - Internationales Jahrbuch für Editionswissenschaft 34: 23-44.
- Delpeuch, Antonin und David Huynh. 2010-2021. OpenRefine. V. 3.4.1. Ubuntu 20.04. https://github.com/OpenRefine/OpenRefine (zugegriffen: 18. Juli 2023).
- Fechner, Martin, Nadine Arndt, Stefan Dumont und Sascha Grabsch. 2020. ediarum.REGISTER.edit. V. 1.0.3. TELOTA – BBAW. https://github.com/ediarum/ediarum.REGISTER.edit (zugegriffen: 18. Juli 2023).
- Fechner, Martin, Nadine Arndt, Stefan Dumont, Sascha Grabsch und Lou Klappenbach. 2021. ediarum.BASE.edit. V. 2.0.0. TELOTA – BBAW. https://github.com/ediarum/ediarum.BASE.edit (zugegriffen: 18. Juli 2023).
- Fechner, Martin. 2022. ediarum.WEB. V. 2.1.1. TELOTA – BBAW. https://github.com/ediarum/ediarum.WEB (zugegriffen: 18. Juli 2023).
- Fechner, Martin und Stefan Dumont. 2022. ediarum.DB. V. 4.0.2. TELOTA – BBAW. https://github.com/ediarum/ediarum.DB (zugegriffen: 18. Juli 2023).
- Grushinskiy, Mikhail. 2002. XMLStarlet. V.1.6.1. Ubuntu 20.04. https://sourceforge.net/projects/xmlstar/files (zugegriffen: 18. Juli 2023).
- Lundh, Fredrik. 2008. ElementTree. V. 1.3.0. Python Software Foundation. Ubuntu 20.04. https://github.com/python/cpython/blob/3.9/Lib/xml/etree/ElementTree.py (zugegriffen: 18. Juli 2023).
- Project Mirador. 2021. Mirador. V. 3.3.0. Project Mirador. https://github.com/projectmirador/mirador (zugegriffen: 18. Juli 2023).
- Python Software Foundation. 2020. JSON encoder and decoder. V. 2.0.9. Python Software Foundation. https://github.com/python/cpython/tree/3.9/Lib/json (zugegriffen: 18.07.2023).
- Retter, Adam. 2022. eXist-db – Open Source Native XML Database. V.6.0.1. eXist Solutions. Debian 11. https://github.com/eXist-db/exist (zugegriffen: 18. Juli 2023).
- Schaßan, Torsten. 2017. „Some Roads to Script Classification: Via Taxonomy and Other Ways.“ In Kodikologie und Paläographie im digitalen Zeitalter 4, hg. von Hannah Busch, Franz Fischer, Patrick Sahle, 165-177. Norderstedt: BoD.
- Schaßan, Torsten und Timo Steyer. 2019. „Vom lokalen Bestand zur weltweiten Vernetzung. Mittelalterliche Handschriften im Netz.“ Das Mittelalter 24: 188–204.
- Syncro Soft SRL. 2021. oXygen XML Editor. V. 23.1. https://www.oxygenxml.com/ (zugegriffen: 18. Juli 2023).
- TextGrid Konsortium. 2006–2014. TextGrid: Virtuelle Forschungsumgebung für die Geisteswissenschaften. Göttingen: TextGrid Konsortium. https://www.textgrid.de (zugegriffen: 18.07.2023).
- Wolf, Jürgen. 2009 „Handschriftencensus – Eine Bestandsaufnahme.“ ZfdA 138: 279f http://www.zfda.de/beitrag.php?id=806&mode=maphilinet (zugegriffen: 18. Juli 2023).