Sharing the CROWN - Von Sammlungsdaten zu Linked Open Research Data

Grießer, Martina; Hanzer, Helene; Kirchweger, Franz; Kloser, Peter; Lamers, Teresa; Pollin, Christopher; Scholger, Martina; Steiner, Elisabeth; Vasold, Gunter
Zum TEI/XML Dokument

Die Reichskrone des Heiligen Römischen Reiches ist eines der wichtigsten Symbole europäischer Geschichte. Heute ist sie Teil der Sammlungen des Kunsthistorischen Museums (KHM) in Wien. Im Zuge des vom KHM initiierten CROWN-Projekts1  wird eine umfassende Analyse der Reichskrone durchgeführt. Ziel dieser Analyse ist es nicht nur den konservatorischen Status des Objektes zu bestimmen, sondern auch die Diskussion um Entstehungszeit und Entstehungsort voranzubringen. Dazu werden alle Bestandteile der Krone, die Platten, das Stirnkreuz, der Bügel, die Edelsteine und Zierelemente etc. aus unterschiedlicher Perspektive - naturwissenschaftlich, konservatorisch, (kunst)historisch - analysiert. Dieses interdisziplinäre Vorhaben läuft noch bis 2024.

Im Rahmen des CROWN-Projekts wird ein einzelnes Objekt - die Reichskrone - im Vergleich zu einigen wenigen ausgewählten Vergleichsobjekten eingehend und möglichst umfassend beschrieben und analysiert. Die Forschungsdaten, die sich aus der Anwendung naturwissenschaftlicher Analysetechniken zur Untersuchung der Herstellungstechniken und der verwendeten Materialien ergeben, werden mit The Museum System (TMS)2  erfasst. TMS ist eine weit verbreitete, aber proprietäre Softwarelösung, die für Museen entwickelt wurde. Sie bietet eine relationale Datenbank, die für die Inventarisierung, Dokumentation und Verwaltung von Sammlungen verwendet wird. Die Verwendung von TMS ist nicht nur auf vorhandene Ressourcen zurückzuführen, sondern hat pragmatische Gründe: Die Etablierung eines weiteren Systems zur Erfassung kann im jetzigen Projektkontext nicht erfolgen. Bei den im CROWN-Projekt erfassten Daten handelt es sich nicht um Inventardaten, also deskriptive Daten, die Objekte in einer Sammlung beschreiben und wofür TMS primär entwickelt wurde, sondern um hochspezifische Forschungsdaten. Ziel dieses Beitrags ist es, einen Workflow zur Überführung der in TMS erfassten Daten zu beschreiben, an dessen Ende eine hochstrukturierte, den FAIR-Kriterien entsprechende und Linked-Open-Data-fähige (LOD) Ressource steht.

LOD beschreibt die freie und offene Zurverfügungstellung von strukturierten Daten über das Web. Oft wird der Technologiestack des Semantic Web verwendet. Fundamentale Grundlage ist dabei das Resource Description Framework (RDF)3  , das ein standardisiertes und graphenbasiertes Modell zur Darstellung und zum Austausch von Daten und deren Semantik.

Die verschiedenen Forschungsfragen können nur im Rahmen einer interdisziplinären Untersuchung der gemeinsamen Auswertung und Interpretation des Datenmaterials, zu dem auch historische Bild- und Schriftquellen gehören, beantwortet werden. Diese wiederum, d.h. die Verbindung von wissenschaftlichen Messungen und Quellen, geht weit über die übliche Beschreibung von Objekten in Sammlungen hinaus. Da den Autor*innen für dieses Vorhaben kein geeigneter Standard bekannt ist, wird ein Semantic-Web-Ansatz verfolgt. Dieser beinhaltet die Entwicklung einer domänenspezifischen Ontologie und deren Anbindung an die Top-Level-Ontologien CIDOC-CRM4  und Basic Formal Ontology (BFO)5  . Im Ontology Engineering Prozess wird auf etablierte Ontology Design Patterns6  und Modellierungswerkzeuge zurückgegriffen. Die Domäne umfasst die formale Abbildung der im CROWN-Projekt erfassten Daten, also die Zusammenführung technologischer Untersuchungen und naturwissenschaftlicher Analysen mit Ergebnissen der historischen bzw. kunsthistorischen Forschung. Folgendes Beispiel soll die Domäne veranschaulichen:

Eine “Hochfassung für Perle mit Einsteckstiften” ist eine Komponente an einer Platte der Reichskrone. Dabei handelt es sich um eine 30 x 30 x 20 mm große Fassung aus Gold. Fünf Punkte auf dieser Fassung werden im Zuge des CROWN-Projektes mit drei Analyseverfahren untersucht: 3D Mikroskopie, Röntgenfluoreszenzanalyse (XRF) und Multispectral Imaging (MSI). Jede Analyse umfasst eine Beschreibung des Messvorgangs, Messdaten in tabellarischer Form als CSV oder XLSX, sowie Ergebnisse in Form von Diagrammen als bspw. BMP, sowie eine (kon-)textuelle Interpretation bzw. Schlussfolgerung der Messung durch die Fachwissenschaftler*in. Zusätzlich gibt es ggf. eine historische Quelle, etwa eine überlieferte Beauftragung eines Goldschmieds, in der weitere Informationen enthalten sind, oder eine kunsthistorische Quelle in Form eines Gemäldes in dem die Fassungen zu einem bestimmten Zeitpunkt abgebildet sind. Ziel der domänenspezifischen Ontologie ist es, genau diese Informationen formal zusammenzuführen und als Forschungsressource nachnutzbar zu machen. 

Der dabei entwickelte Best-Practice-Workflow kann von anderen Forschungsvorhaben in Museen, die TMS nutzen, nachgenutzt werden. Dieser beinhaltet das Ontology Engineering, also die Umsetzung der Domäne als Ontologie und den Export und die Transformation von TMS nach LOD mittels Python. Python erlaubt weiters ein Semantic Enrichment, also die Normalisierung von Entitäten mittels Reconciliation durch Wikidata, sowie andere kontrollierte Vokabularien (z. B. Getty7  oder GND8  )


Am Ende dieser Überlegungen steht nicht eine Software, sondern ein beschriebener Workflow, in dem unterschiedliche Komponenten modular austauschbar sind. Das heißt konkret: statt TMS könnte auch ein anderes System zur Verwaltung und Erfassung von Inventardaten stehen, oder auch eine andere Programmiersprache verwendet werden als Python, mit der man in der Lage ist, programmatisch über einen Export oder eine Schnittstelle Daten nach RDF zu überführen. Der Fokus liegt auf der Interoperabilität verschiedener Werkzeuge und der Gestaltung dieser Schnittstellen. Die Autor*innen sind sich bewusst, dass ein Modell, das dieses Vorhaben auf generischer Ebene löst (Top Level Ontology), von zentralem Interesse ist. Das gegenständliche Projekt ist als eine prototypische Vorarbeit zu einem solchen Vorhaben zu verstehen. 


Fußnoten

1 CROWN. Untersuchungen zu Materialität, Technologie und Erhaltungszustand der Wiener Reichskrone. https://www.khm.at/erfahren/forschung/forschungsprojekte/restauratorisch-konservatorische-projekte/crown-untersuchungen-zu-materialitaet-technologie-und-erhaltungszustand-der-wiener-reichskrone/ , 20.06.2022.
2 The Museum System, https://www.gallerysystems.com/solutions/tms-classic/ , 20.06.2022.
3 RDF 1.1 Concepts and Abstract Syntax, https://www.w3.org/TR/rdf11-concepts/ , 13.12.2022.
4 CIDOC Conceptual Reference Model, https://www.cidoc-crm.org/ , 20.06.2022.
5 Basic Formal Ontology, https://basic-formal-ontology.org/ , 20.06.2022.
6 Ontology Design Patterns, http://ontologydesignpatterns.org/wiki/ , 13.12.2022.
7 Getty Vocabularies, https://www.getty.edu/research/tools/vocabularies , 13.12.2022.
8 Gemeinsame Normdatei, https://www.dnb.de, 13.12.2022.

Bibliographie

  • Boettiger, Carl. “ rdflib: A high level wrapper around the redland package for common rdf applications” (Version 0.1.0). Zenodo, 2018, https://doi.org/10.5281/zenodo.1098478.
  • Bruseker, George, Nicola Carboni, and Anaïs Guillem. “ Cultural Heritage Data Management: The Role of Formal Ontology and CIDOC CRM”. In Heritage and Archaeology in the Digital Age. Quantitative Methods in the Humanities and Social Sciences, edited by M. Vincent, V. López-Menchero Bendicho, M. Ioannides, T. Levy, 93-131. Cham: Springer, 2017, https://doi.org/10.1007/978-3-319-65370-9_6.
  • Cavalcante, J. “ reconciler 0.2.1“. GitHub, 2021, https://github.com/jvfe/reconciler.
  • Delpeuch, Antonin. Running a Reconciliation Service for Wikidata. In Proceedings of the 1st Wikidata Workshop (Wikidata 2020), edited by Lucie-Aimée Kaffee, Oana Tifrea-Marciuska, Elena Simperl, Denny Vrandečić. Virtual Conference, November 2-6, 2020, http://ceur-ws.org/Vol-2773/paper-17.pdf
  • Doerr, Martin, Richard Light, and Gerald Hiebel. “ Implementing the CIDOC Conceptual Reference Model in RDF”. Version 1.0. 2020,  https://cidoc-crm.org/sites/default/files/Implementing%20the%20CIDOC%20Conceptual%20Reference%20Model%20in%20RDF.pdf
  • Hitzler, Pascal, “ A review of the semantic web field”, Communications of the ACM. 64(2), (February 2021): 76-83,  https://doi.org/10.1145/3397512
  • Kamrin, Janice, and Jennie Choi, “ Taking Advantage of TMS”, CIPEG Journal: Ancient Egyptian & Sudanese Collections and Museums, No. 3, (2019): 17-25, https://doi.org/10.11588/cipeg.2019.3.66053
  • Otte, J. Neil, John Beverley, and Alan Ruttenberg, “ BFO: Basic Formal Ontology”, Applied Ontology, 17 (1), (2022): 17-43, https://doi.org/ 10.3233/ao-220262.
  • Vlachidis, A., A. Antoniou, A. Bikakis, and M.M. Terras. “ Semantic metadata enrichment and data augmentation of small museum collections following the FAIR principles”. In Information and Knowledge Organisation in Digital Humanities, edited by Koraljka Golub and Ying-Hsang Liu, London & New York: Routledge 2021. 106-129.
  • Wilkinson, Mark D. et al., “ The FAIR Guiding Principles for scientific data management and stewardship”, Sci Data 3:160018. (2016), https://doi.org/10.1038/sdata.2016.18