Szenario-basierte Planung eines semantischen Digitalisierungsvorhabens in der digitalen Geschichtswissenschaft

Scheltjens, Werner; Schlieder, Christoph
Zum TEI/XML Dokument

Die Retrodigitalisierung von nicht urheberrechtlich geschützten Bibliothekssammlungen hat zahlreiche gedruckte Texte als digitale Quellen verfügbar gemacht und fordert HistorikerInnen heraus, sich mit neuen Methoden der Nutzung dieser Quellen vertraut zu machen (Paju et.al. 2020). Für die historisch metrologische Forschung sind Nachschlagewerke und Lexika zu Handel und Gewerbe von besonderem Interesse, die im 18. und 19. Jahrhundert versuchten, das Wissen ihrer Zeit zu systematisieren. Insbesondere in der Übergangszeit zum metrischen System (bis etwa 1870) waren diese Werke weit verbreitet. Sie kombinierten eine positivistisch anmutende Neugier auf Maße, Gewichte und Münzen in aller Welt mit dem Versuch den neuen Anforderungen einer zunehmend auf Standardisierung und Systematisierung hinarbeitenden Gesellschaft gerecht zu werden (Kramper 2019). Wie alle historischen Texte sind auch metrologische Nachschlagewerke und Lexika Zeugen einer Epoche. In digitalisierter Form liegen sie nunmehr als neue Quellen für historische Untersuchungen vor.

Ein bekanntes Beispiel ist das angesehene und bis heute häufig zitierte Vollständige Taschenbuch der Münz-, Maass- und Gewichtsverhältnisse von Christian und Friedrich Noback (Noback & Noback 1850; Denzel 2002; Witthöft 2018). Die Bayerische Staatsbibliothek hat dieses Nachschlagewerk digitalisiert und stellt zusammen mit den Scans im PDF-Format auch eine Textdatei mit dem Volltext aus der OCR für die nicht-kommerzielle Nutzung zur Verfügung. Die Retrodigitalisierung hat eine digitale Version des Vollständigen Taschenbuchs hervorgebracht, die den lesenden Zugriff auf einzelne Artikel des Lexikons erheblich vereinfacht. Erkenntnisse über die Zusammensetzung historischer metrologischer Systeme ergeben sich aber vor allem aus der vergleichenden Auswertung einer großen Zahl von Lexikonartikeln, etwa aus allen Artikeln zu Handelsorten einer Wirtschaftsregion mit den darin aufgeführten Getreidemaßen. Solche eine Auswertung lässt sich durch Blättern oder Volltextsuche im Digitalisat nur sehr mühsam durchführen. Auch wenn Nachschlagewerke über die historische Metrologie, wie das Vollständige Taschenbuch, in digitaler Form vorliegen, steht die semantische Erschließung ihrer Inhalte noch aus.

Wir argumentieren, dass für bestimmte, konkret identifizierbare Forschungsfragen der historischen Metrologie eine zweite oder semantische Retrodigitalisierung unabdingbar ist. Diese ergänzt die erste, größtenteils automatisch realisierte Retrodigitalisierung und strebt die Extraktion und explizite Modellierung der semantischen Struktur des enzyklopädischen Wissens an. Für die Planung der auf die Explizierung semantischer Beziehungen zielenden Digitalisierung historischer Quellen steht im Prinzip das allgemeine Methodeninventar der ontologischen Modellierung zur Verfügung. An erster Stelle sind hier szenario-basierte Methoden zu nennen, die den Planungsprozess an sogenannten Kompetenzfragen orientieren, d.h. einem Katalog derjenigen Fragen, die FachanwenderInnen anhand der Modellierung untersuchen und beantworten wollen (Kendall, McGuinness, 2019). Dieses bewährte szenario-basierte Vorgehen haben insbesondere Lodi et al. (2017) sowie Carriero et al. (2021) auf Fragestellungen der Digital Humanities übertragen. Konkret waren Metadaten italienischer Gedächtnisinstitutionen semantisch zu modellieren, was durch Abbildung der Kompetenzfragen auf Ontologieentwurfsmuster gelöst wurde.

Wir zeigen, dass sich dieser Ansatz zwar grundsätzlich, im Detail aber eben doch nur begrenzt, auf die beschriebene Problemstellung der digitalen Geschichtswissenschaft anwenden lässt. Eine erste Schwierigkeit ergibt sich aus dem Unterschied zwischen Modellierungsvorhaben, die sich auf Metadaten beziehen und solchen, die sich auf (Primär-)Daten stützen. Am Beispiel der Planung der semantischen Modellierung des Vollständigen Taschenbuchs der Nobacks führen wir vor, dass anhand der Kompetenzfragen zunächst beurteilt werden muss, welche semantischen Beziehungen explizit zu repräsentieren sind und welche durch Anfragen abgeleitet werden sollen. Auch stellt sich heraus, dass Domänenontologien, die nicht dem Umfeld der DH-Forschung entstammen, z.B. die von Martín-Recuerda et al. (2020) beschriebenen metrologischen Ontologien für die Naturwissenschaften, kaum direkt verwendet werden können. Wir stellen einen Prozess für die Planung semantischer Modellierungsvorhaben vor, der den von Lodi et al. (2017) beschriebenen in mehreren Punkten variiert bzw. detailliert.

Anhand eines Beispiels aus dem Bereich der historischen Metrologie werden Arbeitsabläufe für das Explizieren von semantischen Beziehungen in historischen Texten vorgestellt und diskutiert. Ziel des semantischen Digitalisierungsvorhabens ist es, einen Beitrag zur Erforschung von historischen Texten zu liefern, indem zwischen der Planung der „ersten“ und der Planung der „zweiten“ oder semantischen Retrodigitalisierung unterschieden wird und Vorschläge für die systematische Erschließung der semantischen Ebene digitalisierter historischer Texte formuliert werden.


Bibliographie

  • Carriero, Valentina Anita / Gangemi, Aldo / Mancinelli, Maria Letizia / Nuzzolese, Andrea Giovanni / Presutti, Valentina / Veninata, Chiara (2021): “Pattern-based Design Applied to Cultural Heritage Knowledge Graphs”, in: Semantic Web 12: 313 – 357. 10.3233/SW-200422
  • Denzel, Markus A. (2002): “Handelspraktiken als wirtschaftshistorische Quellengattung vom Mittelalter bis in das frühe 20. Jahrhundert. Eine Einführung” in: Denzel, Markus A. / Hocquet, Jean-Claude / Witthöft, Harald (eds.): Kaufmannsbücher und Handelspraktiken vom Spätmittelalter bis zum beginnenden 20. Jahrhundert — Merchant’s Books and Mercantile Pratiche from the Late Middle Ages to the Beginning of the 20th Century . Stuttgart: Steiner Verlag 11-45.
  • Kendall, Elisa F. / McGuinness, Deborah L. (2019): Ontology engineering. (= Synthesis Lectures on The Semantic Web: Theory and Technology, Lecture 18). [California]: Morgan and Claypool. 10.2200/S00834ED1V01Y201802WBE018
  • Kramper, Peter (2019). The Battle of the Standards. Messen, Zählen und Wiegen in Westeuropa, 1660-1914 . Berlin / Boston: De Gruyter.
  • Lodi, Giorgia / Asprino, Luigi / Nuzzolese, Andrea Giovanni / Presutti, Valentina / Gangemi, Aldo / Recupero, Diego Reforgiato / Veninata, Chiara / Orsini, Annarita  (2017): “Semantic Web for Cultural Heritage Valorisation”, in: Hai-Jew, Shalin (ed.): Data Analytics in Digital Humanities . Multimedia Systems and Applications. Springer: Cham 3-37. https://doi.org/10.1007/978-3-319-54499-1_1
  • Martín-Recuerda, Francisco / Walther, Dirk / Eisinger, Siegfried / Moore, Graham / Andersen, Petter / Opdahl, Per-Olav / Hella, Lillian (2020): “Revisiting Ontologies of Units of Measure for Harmonising Quantity Values – A Use Case”, in: Pan, Jeff Z. / Tamma, Valentina / d’Amato, Claudia / Janowicz, Krzysztof / Fu, Bo / Polleres, Axel / Seneviratne, Oshani / Kagal, Lalana (eds.): The Semantic Web – ISWC 2020 . (= Lecture Notes in Computer Science, vol. 12507). Springer: Cham 551-567. https://doi.org/10.1007/978-3-030-62466-8_34
  • Noback, Christian / Noback, Friedrich (1850): Vollständiges Taschenbuch der Münz-, Maass-, und Gewichtsverhältnisse, der Staatspapiere, des Wechsels- und Bankwesens, und der Usanzen aller Länder und Handelsplätze . Leipzig: F.A. Brockhaus.
  • Paju, Petri / Oiva, Mila / Fridlund, Mats (2020): “Digital and distant histories: Emergent approaches within the new digital history”, Fridlund, Mats / Oiva, Mila / Paju, Petri (eds.): Digital histories: Emergent approaches within the new digital history . Helsinki: Helsinki University Press 3-18. https://doi.org/10.33134/HUP-5-1
  • Witthöft, Harald (2018): “Numerical Communication in Intercontinental Trade and Monetary Matters: Coins and Weights in China and East Asia in Merchants’ Pocketbooks and Commercial Guides (16th–19th Centuries)”, in: Theobald, Ulrich / Cao, Jin (eds.): Southwest China in a Regional and Global Perspective (c. 1600-1911) . Leiden / Boston 225-290. https://doi.org/10.1163/9789004353718_009