Qualitativ hochwertige Metadaten in digitalen Editionen
https://zenodo.org/records/14943264
Einführung1
Metadaten sind Informationen über (digitale) Objekte und Ressourcen, die u. a. Inhalt, Form und Zugangsbedingungen in strukturierter und einheitlicher Form beschreiben und so die Erschließung, aber auch die Auffindbarkeit gewährleisten. Sie dienen zudem der Darstellung von Beziehungen zwischen einzelnen bzw. zu anderen Objekten und Ressourcen (Assfalg, 2023: 245–256).
Metadaten spielen in allen digitalen Projekten eine wesentliche Rolle, „[sie] diktieren, wie Informationen zirkulieren – sie haben die Macht zu bezeichnen, zu verbreiten, zu normalisieren, zu unterdrücken und auszuschließen. Sie tun mehr als nur zu beschreiben – sie sind Wissen“2 (Allison-Cassin und Seeman, 2022: 1).
Problemstellung
In digitalen Editionen treffen verschiedene Metadatentypen3 und -formate4 aufeinander. Sie finden sich beispielsweise in den TEI-Headern von XML-Files, betreffen objektbeschreibende Metadaten zu Digitalisaten, die Normdaten von Registern (Personen, Orte, Werke, Datierungen, Stellenregister, Quellenverzeichnisse usw.). Nicht in jedem Editionsprojekt wird auf dieselben Metadatenstandards zurückgegriffen, wenn auch mit der Text Encoding Initiative (TEI) ein De facto-Standard etabliert wurde, der in verschiedenen Anwendungsprofilen Ausformung findet.
Jens Dierkes sieht die Verantwortung für die beschreibenden Metadaten und für die administrativen Metadaten hinsichtlich der Provenienz bei den datenerzeugenden Wissenschaftler:innen selbst (Dierkes, 2021: 320). Die mit den zugehörigen Standards verbundenen Kompetenzen sind über die Informationswissenschaften hinaus jedoch nicht notwendigerweise in einer für den Arbeitsalltag tauglichen Tiefe verankert. Gerade in den interdisziplinär arbeitenden Editionswissenschaften, die Grundlagenforschung leisten, stellt die standardisierte Erfassung von Metadaten eine beständige Herausforderung dar. Die Verantwortung für technische, prozessuale und bibliographische Metadaten wird insbesondere den Archiven, Bibliotheken und kulturbewahrenden Institutionen zugerechnet, aber auch zu diesen Metadaten sollten Wissenschaftler:innen über solide Kenntnisse verfügen, um deren Qualität bewerten zu können.
Angesichts eines großen Metadatenuniversums, wie Jenny Riley es 2010 bezeichnete (Abb.1),5 das inzwischen kaum noch zu überblicken ist, ist es erforderlich, die für digitale Editionen relevanten Metadatenstandards herauszuarbeiten und eine Orientierung zu bieten. Für fast jeden Standard existiert inzwischen ein Handbuch (Rühle, 2012), ein Tutorial für Metadatenprofile (Deutsche Initiative für Netzwerkinformation e.V., 2020a) oder eine Einführung in Metadaten und Metadatenformate (Deutsche Initiative für Netzwerkinformation e.V., 2020b). Dennoch bestehen Unsicherheiten bei der konkreten Anwendung dieser Standards. Die Schwierigkeiten beginnen, wenn über einen Minimaldatensatz an Pflichtfeldern hinaus Metadatensets erstellt bzw. bearbeitet werden sollen, und enden nicht selten bei der Frage: Was sollte nun idealerweise in dieses spezifische Feld eingetragen werden?
In der editionswissenschaftlichen Community wurde, z. B. im Austausch mit Vertreter:innen des NFDI-Konsortiums Text+, der Wunsch nach Orientierung klar formuliert: die Verfügbarmachung von auf digitale Editionen zugeschnittenen Informationen zu Standardisierungsthemen. Die Form, sei es als Leitfaden, Handreichung oder übersichtliche Sammlung von Empfehlungen, spiele dabei keine ausschlaggebende Rolle.
Der Einstieg in das Universum der Metadatenstandards
Tatsächlich existieren für digitale respektive „elektronische Editionen“ schon seit den 1990er-Jahren Kriterienkataloge, in denen beispielsweise Hinweise zur Besprechung von Editionen6 formuliert wurden oder Minimalvorgaben,7 die die Wissenschaftlichkeit der digitalen Publikation im Fokus haben. Pointierter formuliert die Modern Language Association of America die Guidelines for Editors of Scholarly Editions, zuletzt 2022 aktualisiert. Als Kriterien werden hier „accuracy, adequacy, appropriateness, consistency, explicitness“ angeführt (Modern Language Association of America 2022). Ähnlich wie bei den FAIR-Prinzipien, die auf Maschinenlesbarkeit von dargestellten bzw. verarbeiteten Informationen ausgerichtet sind, fehlen jedoch konkrete Umsetzungshinweise, die z. B. relevante Metadatenstandards berücksichtigen oder praxisnahe Qualitätskriterien aufzeigen, um Metadatensets in digitalen Editionen bewerten und bearbeiten zu können. Zu diesen Kriterien gehören Aktualität, Fehlerfreiheit, Genauigkeit, Konformität, Konsistenz, Transparenz und Vertrauenswürdigkeit, Verlässlichkeit, Verständlichkeit, Vollständigkeit sowie Zugänglichkeit und Verfügbarkeit (Bruns et al., 2019: 14). Denn Metadaten von geringer Qualität wirken sich negativ auf die gesamte Wahrnehmung von Qualität und Nutzer:innenfreundlichkeit einer Sammlung bzw. Ressource aus. In der konkreten Arbeit sind dabei kontrollierte Vokabulare zur Qualitätssicherung unerlässlich. Auf Ebene der Entitäten hat die Qualität der Metadaten zudem direkten Einfluss auf Linked Data Anwendungen oder die Erstellung von aggregierten Datensets. Auch hier formulieren Wissenschaftler:innen den Bedarf nach Orientierung.
Um einen guten Einstieg in die großen Felder der Metadatenstandards und Qualitätskriterien zu erhalten, bietet es sich an, zuerst einen kleineren Ausschnitt zu betrachten. Sowohl LIDO als auch Dublin Core stellen solche basale, kleinformatige Standards dar – im Vergleich zu TEI-XML, wofür es zudem bereits ein großflächiges Schulungsangebot gibt. Beide Formate können Ersteller:innen digitaler Editionen in Form von „Zulieferformaten” begegnen – sei es, wenn externe Ressourcen in die Edition eingebunden werden, oder um zusätzliche Metadaten über die eigene Edition für eine Nachnutzung bereitzustellen bzw. diese für Repositorien oder Katalogen leichter beschreibbar zu machen.
LIDO (Lightweight Information Describing Objects) ist ein Metadatenschema für die Darstellung und Publikation von Informationen zu Objekten des kulturellen Erbes. (Knaus et al., 2019: 11–31) Die AG Minimaldatensatz, ein Zusammenschluss wichtiger Akteur:innen im Bereich der Kulturgutdigitalisierung,8 hat auf LIDO aufbauend eine Minimaldatensatz-Empfehlung für Museen und Sammlungen9 erarbeitet. Diese Definition einer kleinstmöglichen Schnittmenge von sammlungsübergreifend relevanten Datenfeldern unterstützt die Online-Veröffentlichung musealer Erschließungsinformationen. Die Empfehlung orientiert sich an relevanten Dokumentationsstandards und ist als sogenanntes LIDO-Anwendungsprofil vollumfänglich kompatibel mit dem LIDO-Austauschformat. Die Minimaldatensatz-Empfehlung ist für den praktischen Einsatz im Museumsalltag konzipiert. Durch ihren niedrigschwelligen Ansatz soll das Bewusstsein für Datenqualität in den Einrichtungen gefördert werden. Darüber hinaus erleichtert sie den Datenaustausch und die Datenweitergabe, u. a. an die Deutsche Digitale Bibliothek und Europeana, ein Aspekt, der gerade für diese Daten nachnutzende digitale Projekte von entscheidender Bedeutung ist. Insofern könnte LIDO als Metadatenstandard auch in digitalen Editionsprojekten dazu beitragen, spezielle Bedarfe abzudecken.
Ein weiterer Metadatenstandard, der Daten auf einer übergeordneten Ebene anschlussfähig macht, ist Dublin Core. Dieser Standard wurde domänenübergreifend in Zusammenarbeit von Museen, Bibliotheken, Archiven, Regierungsbehörden, Wirtschaft etc. entwickelt und dient dazu, Metadaten auf einer übergeordneten Ebene interoperabel und nachnutzbar zu machen. Dublin Core wird insbesondere zur Beschreibung von Dokumenten und anderen (digitalen) Objekten, z. B. Internetseiten, digitalen Filmen, dreidimensionalen Museumsobjekten, Behördenakten, Bilddateien etc. verwendet. Es handelt sich, wie bei LIDO, um eine XML-Anwendung für den Metadatenaustausch. Die Metadaten stehen auch als RDF (Resource Description Framework) für Semantic Web-Anwendungen zur Verfügung (Dublin Core Metadata Initiative, 2024).
Eine wichtige Voraussetzung für die inhaltliche Verknüpfung von Daten bilden Normdaten und kontrollierte Vokabulare mit eindeutigen Entity- oder Begriffsbestimmungen. Durch Verwendung der Identifikatoren der Datensets aus dem jeweiligen Vokabular, etwa der Gemeinsamen Normdatei (GND) oder des Art & Architecture Thesaurus (AAT), können z. B. Bezeichnungen in verschiedenen Sprachen und Schreibweisen subsumiert, Begriffe in eine Hierarchie gebracht oder Zeichenketten inhaltlich eindeutig bestimmt werden.
Ziel des Workshops
Ausgehend von konkreten Use Cases in einer Problemdarstellung sollen im Workshop praxisnah Kenntnisse zur Bewertung und Verbesserung der Qualität von Metadaten in digitalen Editionen vermittelt werden. Zu diesem Zweck werden kurze Einführungen zu Basisthemen (Metadaten, Normdaten und kontrollierte Vokabulare, Datenqualität, Datenkuratierung) mit Praxisübungen anhand zweier konkreter – für Ersteller:innen digitaler Editionen relevanter – Metadaten-Standards kombiniert. Durch den Einbezug von 3 verschiedenen Metadatenstandards wird der Fokus auf den Inhalt der einzelnen Metadaten gelegt, anstatt auf deren Form. Gerade in der Formulierung inhaltlich qualitativ hochwertiger Metadaten liegt die Herausforderung. Die Praxisübungen erfolgen in Kleingruppen und werden jeweils durch kurze informative Einführungen in die Standards sowie Anleitungen zu Hilfsmitteln eröffnet und mit einem gemeinsamen Erfahrungsaustausch abgerundet. Eine Abschlussdiskussion und ein Ausblick „Was nehme ich mit für meine zukünftige Arbeit?“ komplettieren den Workshop. Die Praxisübungen zielen darauf ab, die Erstellung von Metadatensets, auch anhand von Metadateneditoren, zu üben und aus der eigenen Erfahrung, in Verbindung mit den Impulsen zu Basisthemen, Methoden zur Bewertung der Qualität und zur Bereinigung eigener bzw. bereits vorhandener Metadatensets zu entwickeln.
Zielgruppe: Editionswissenschaftler:innen, Entwickler:innen, DH-Mitarbeiter:innen, Geistes- und Kulturwissenschaftler:innen
Anzahl der Teilnehmer:innen: max. 25
Angaben zum erforderlichen Vorwissen: keine Vorkenntnisse erforderlich, Interesse für (digitale) Editorik ist wünschenswert
Von Teilnehmer:innen mitzubringen: für die Praxisübungen ist ein eigener Laptop erforderlich
Benötigte technische Ausstattung: Beamer, Moderationskoffer, Flipcharts + Papier
Informationen zu den Workshopleiter:innen
- Barbara Fichtl (ORCiD: 0000-0003-0981-4409), Verbundzentrale des GBV (VZG), Platz der Göttinger Sieben 1, 37073 Göttingen, Barbara.Fichtl@gbv.de; Wissenschaftliche Mitarbeiterin in der Abteilung Digitale Bibliothek, Forschungsdatenmanagement, Museumsdokumentation
- Fernanda Alvares Freire (ORCiD: 0000-0002-6414-5212), Technische Universität Darmstadt, Residenzschloss 1, 64283 Darmstadt | Universität Rostock, Ulmenstraße 69, 18057 Rostock, fernanda.freire@tu-darmstadt.de ; Wissenschaftliche Mitarbeiterin im NFDI-Konsortium Text+; Digitale Editionen, Digital History, Social Network Analysis
- Anja Gerber (ORCiD: 0000-0003-2576-1511), Klassik Stiftung Weimar, Burgplatz 4, 99423 Weimar, Tel. +49 3643 545-683, anja.gerber@klassik-stiftung.de ; Wissenschaftliche Mitarbeiterin NFDI4Objects (Task Area 6); Datenintegration und –harmonisierung, Forschungsdatenmanagement
- Dr. Sandra König (ORCiD: 0000-0002-0615-0523), Nationale Akademie der Wissenschaften Leopoldina, Emil-Abderhalden-Str. 36, 06108 Halle (Saale), Tel. +49 (0)345 47239–131, sandra.koenig@leopoldina.org; Wissenschaftliche Mitarbeiterin im NFDI-Konsortium Text+; Standardisierung und Qualitätssicherung geisteswissenschaftlicher Forschungs- und Sammlungsdaten
- Dr. Anna-Lena Körfer (ORCiD: 0000-0002-1644-5042), Herder-Institut für historische Ostmitteleuropaforschung – Institut der Leibniz-Gemeinschaft, Gisonenweg 5-7, 35037 Marburg, Tel. +49 6421 184-242, anna-lena.koerfer@herder-institut.de ; Wissenschaftliche Mitarbeiterin Forschungsdatenmanagement und NFDI4Memory (Task Area 1: Data Quality); Forschungsdatenmanagement, Qualitätsmanagement, Digitale Editionen, Spätantike Literatur
- Karoline Lemke (ORCiD: 0000-0002-1604-672X), Berlin-Brandenburgische Akademie der Wissenschaften (TELOTA), Jägerstraße 22/23, 10117 Berlin, Tel. +49 30 20370 492, karoline.lemke@bbaw.de ; Wissenschaftliche Mitarbeiterin im NFDI-Konsortium Text+; Digitale Editionen, Standardisierungsprozesse
- Harald Lordick (ORCiD: 0000-0002-5070-4263), Salomon Ludwig Steinheim-Institut für deutsch-jüdische Geschichte, Edmund-Körner-Platz 2, 45127 Essen, Tel. + 49 201 2016 4434, lordick@steinheim-institut.org ; Wissenschaftlicher Mitarbeiter im NFDI-Konsortium Text+; Historische Forschung, Anwendung von Normdaten, Digitale Editionen, Forschungsdatenmanagement
- Markus Schnöpf (ORCiD: 0000-0003-2529-8248), Berlin-Brandenburgische Akademie der Wissenschaften (TELOTA/FDM), Jägerstraße 22/23, 10117 Berlin, Tel. +49 30 20370 504, schnoepf@bbaw.de ; Wissenschaftlicher Mitarbeiter; Forschungsdatenmanagement, Digitale Editionen
- Dr. Domenic Städtler (ORCiD: 0000-0001-7118-3295), Institut für Museumsforschung, In der Halde 1, 14195 Berlin, Tel. +49 30 266 42 6923, d.staedtler@smb.spk-berlin.de ; Wissenschaftlicher Mitarbeiter im Forschungsvorhaben Nutzung von Normdaten zur Optimierung von Suche und Filter für Museumsobjekte in der DDB, Koordination AG Minimaldatensatz
Fußnoten
Bibliographie
- AG Minimaldatensatz, Chiara Marchini, Domenic Städtler, Sybille Greisinger, Elisabeth Böhm, Anne-Marie Bernhard, Stephanie Götsch et al. 2024. Minimaldatensatz-Empfehlung für Museen und Sammlungen (v1.0.1). Zenodo 10.5281/zenodo.12759620 und www.minimaldatensatz.de .
- Allison-Cassin, Stacy und Dean Seeman. 2022. „Metadata as Knowledge.” KULA: Knowledge Creation, Dissemination, and Preservation Studies 6, Nr. 3: 1–4 10.18357/kula.244.
- Assfalg, Rolf. 2023. „B 9 Metadaten.” In Grundlagen der Informationswissenschaft, hg. von Rainer Kuhlen, Dirk Lewandowski, Wolfgang Semar und Christa Womser-Hacker, 245–256, Berlin, Boston: De Gruyter Saur 10.1515/9783110769043-021.
- Association for Documentary Editing. 2002. „Minimum Standards for Electronic Editions.” https://www.documentaryediting.org/wordpress/?page_id=508 (zugegriffen: 23. Juli 2024).
- Bruns, Lina, Benjamin Dittwal, Fritz Meiners, Mirco Schwarz und Thomas Wooge. 2019. Leitfaden für qualitativ hochwertige Daten und Metadaten. Berlin: Fraunhofer FOKUS. 10.24406/publica-fhg-299946.
- Burger, Marleen, Anette Cordts und Ted Habermann. 2021. „Wie FAIR sind unsere Metadaten? Eine Analyse der Metadaten in den Repositorien des TIB-DOI-Services.” Bausteine Forschungsdatenmanagement 3: 1–13 10.17192/bfdm.2021.3.8351.
- Deutsche Digitale Bibliothek. 2015. „Metadatenformat.” https://pro.deutsche-digitale-bibliothek.de/glossar/metadatenformat (zugegriffen: 23. Juli 2024).
-
Deutsche Initiative für Netzwerkinformation e. V. 2020a. „Einführung in die Gestaltung von Metadatenprofilen.” https://wiki.dnb.de/download/attachments/272237368/Einf%C3%BChrung_in_die_Gestaltung_von_Metadatenprofilen.pdf?api=v2 (zugegriffen: 23. Juli 2024).
-
Deutsche Initiative für Netzwerkinformation e. V. 2020b. „Einführung in Metadaten und Metadatenformate.“ https://wiki.dnb.de/download/attachments/272237368/Einf%C3%BChrung_in_Metadaten_und_Metadatenformate_final.pdf?api=v2 (zugegriffen: 23. Juli 2024).
- Dierkes, Jens. 2021. „4.1 Planung, Beschreibung und Dokumentation von Forschungsdaten.” In Praxishandbuch Forschungsdatenmanagement, hg. von Markus Putnings, Heike Neuroth und Janna Neumann, 303–326, Berlin, Boston: De Gruyter Saur. 10.1515/9783110657807-018.
- Dublin Core Metadata Initiative. „About DCMI.” https://www.dublincore.org/about/ (zugegriffen: 23. Juli 2024).
- Fichtl, Barbara. 2023. NFDI4Culture Handreichung: LIDO-Schulung. NFDI4Culture Knowledge Base. https://nfdi4culture.de/go/E5247 (zugegriffen: 22. Juli 2024).
- Jannidis, Fotis. 1999. „Bewertungskriterien für elektronische Editionen.” IASL online. https://iasl.uni-muenchen.de/discuss/lisforen/jannidis.html (zugegriffen: 23. Juli 2024).
- Kesper, Arno, Markus Matoni, Julia Rössel, Michelle Weidling und Viola Wenz. 2020. Catalog of Quality Problems in Data, Data Models and Data Transformations. Zenodo 10.5281/zenodo.3955500.
- Kindling, Maxi. 2013. „Qualitätssicherung im Umgang mit digitalen Forschungsdaten / Quality assurance of digital research data / La garantie de la qualité des données numériques de recherche.” Information – Wissenschaft & Praxis 64, 2–3: 137–148 10.1515/iwp-2013-0020.
- Király, Péter und Jan Brase. 2021. „4.3 Qualitätsmanagement.” In Praxishandbuch Forschungsdatenmanagement, hg. von Markus Putnings, Heike Neuroth und Janna Neumann, 357–380, Berlin, Boston: De Gruyter Saur 10.1515/9783110657807-020.
- Knaus, Gudrun, Regine Stein und Angela Kailus. 2019. LIDO-Handbuch für die Erfassung und Publikation von Metadaten zu kulturellen Objekten: Band 1: Graphik. Heidelberg: arthistoricum.net 10.11588/arthistoricum.382.544.
- Knaus, Gudrun, Angela Kailus und Regine Stein. 2022. LIDO-Handbuch für die Erfassung und Publikation von Metadaten zu kulturellen Objekten: Band 2: Malerei und Skulptur. Heidelberg: arthistoricum.net 10.11588/arthistoricum.1026.
- Modern Language Association of America. 2022. „Guidelines for Editors of Scholarly Editions.” https://www.mla.org/Resources/Guidelines-and-Data/Reports-and-Professional-Guidelines/Guidelines-for-Editors-of-Scholarly-Editions (zugegriffen: 23. Juli 2024).
- Porta Historica. 2008. „Qualitätskriterien für elektronische Quelleneditionen.“ Huygens Institute for the History of the Netherlands. http://www.portahistorica.eu/editions/qualitaetskriterien-fur-elektronische-quelleneditionen (zugegriffen: 23. Juli 2024).
- Quartz. The Quartz guide to bad data. https://github.com/Quartz/bad-data-guide/ (zugegriffen: 22. Juli 2024).
- Research Data Alliance. 2024. „RDA Metadata Standards Catalog.“ https://rdamsc.bath.ac.uk/ (zugegriffen: 23. Juli 2024).
- Riley, Jenn (Content) und Devin Becker (Design). 2009–2010. „Seing Standards: A Visualization of the Metadata Universe.” https://jennriley.com/metadatamap/seeingstandards.pdf (zugegriffen: 23. Juli 2024).
- Rühle, Stefanie. 2012. „Kleines Handbuch Metadaten.“ Kompetenzzentrum Interoperable Metadaten. https://wiki.dnb.de/download/attachments/43523047/201209_metadaten.pdf (zugegriffen: 23. Juli 2024).
- Zeterberg, Max-Ferdinand, Lasse Clausen, Lisa-Katharina Heyhusen. 2022. „Vom gedruckten Buch zur digitalen Analyse am Beispiel der Klaus-Mollenhauer-Gesamtausgabe.“ In Digital Turn und Historische Bildungsforschung. Bestandsaufnahme und Forschungsperspektiven, hg. von Andreas Oberdorf, 49–64. Bad Heilbrunn: Verlag Julius Klinkhardt 10.25656/01:24852; 10.35468/5952-04.