Ob Werkzeugkoffer, Werkstatt oder Baumarkt: offene, community-kuratierte Tool Registries mit Wikidata
https://zenodo.org/records/10698252
Tools oder Werkzeuge, im Folgenden verstanden als Software und Verfahren, sind nicht nur Mittel zum Zweck, sondern als solche auch Gegenstand von Verzeichnissen. Dabei richten sich Toolverzeichnisse, die im Kontext der Digital Humanities angelegt werden, weniger auf die Verzeichnung von Objekten, die in absehbarer Zeit auch historisch werden, sondern bedienen zunächst ein instrumentelles Interesse. In diesem Zusammenhang hat sich das Toolverzeichnis in den Digital Humanities inzwischen als eigenes Genre etabliert: von DiRT zu Bamboo und TAPoR (3.0)1 (Grant u. a. 2020), großen EU-Projekten wie dem Social Sciences and Humanities Open Marketplace,2 den Konsortien der deutschen Nationalen Forschungsdateninfrastruktur (NFDI), den Fachinformationsdiensten (FID) oder individuellen Bibliotheken und Instituten. Allen ist gemeinsam, dass sie einen Bedarf der Forschungscommunities nach einem Überblick über computergestützte Werkzeuge mit kuratorischen Ansätzen der Wissensorganisation bedienen. Für die meisten Ansätze gilt, dass sie über keine dauerhafte Finanzierung verfügen, dass sie primär auf die Kuratierung durch (unbezahlte) Expert_innen-Gremien oder Crowdsourcing setzen, diesen Prozess aber nicht dauerhaft und nachhaltig gewährleisten können, dass Datensilos mit proprietären Infrastrukturen (Datenmodelle, Backends und Frontends) geschaffen werden, und dass nur in geringem Maße APIs angeboten und dokumentiert werden. Die zum Teil umfassenden Ansprüche an möglichst vollständige Katalogisierung verfügbarer Möglichkeiten computergestützter Werkzeuge sind dabei mit einem Gegenstand konfrontiert, der oft nur schwer abgrenzbar ist und sich im Rhytmus von Release-Zyklen ständig verändert. Der Anspruch eines umfassenden oder repräsentativen Abbilds aktuell verfügbarer Werkzeuge für die computergestützte Forschung in den Digital Humanities ist daher kaum einzulösen und kann, wo er formuliert wurde, als gescheitert gelten. (Dombrowski 2021). Die Bedarfe bleiben natürlich bestehen. Wünschenswert wäre daher, dass zumindest die Daten von Verzeichnisprojekten dauerhaft, mit Bezug auf ein Referenzdatenmodell, permanenten URIs und in einem stabilen, maschinenlesbaren Format als Basis zur Verfügung stünden.
Der Beitrag stellt unseren Vorschlag einer offenen Basisinfrastruktur für Toolverzeichnisse vor. Dabei steht Wikidata3 als eine verteilte, community-kuratierte Normdatei und offene Softwareplattform im Zentrum unseres Vorschlages. Wikidata erlaubt es, minimale Datenmodelle iterativ zu entwickeln, Datensätze zu pflegen und sie in Wikiprojekten zu kuratierten Sammlungen zusammenzustellen. Auf der Datenebene erlaubt Wikidata die unmittelbare Nutzung sämtlicher Informationen als Linked Open Data über SPARQL, APIs sowie das etablierte Webinterface. Wikidata ist außerdem eine der Quellen für das Virtual International Authority File (VIAF)4 und für zusammenfassende Informationen in den Ergebnislisten der dominanten Suchmaschinen, was die Sichtbarkeit der Datensätze enorm erhöht. Darüber hinaus bieten Wikidata und ihre Schwesterprojekte eine etablierte Governancestruktur für nutzergenerierte und -kuratierte Inhalte. Jede_r kann die Einträge beitragen und pflegen, die für ihre je konkrete Forschung relevant sind. Anders als bei vielen Infrastrukturen der Digital Humanities ist die Vielsprachigkeit von Interfaces und Datensätzen ein grundlegendes Feature. Auf dieser Datenbasis lassen sich dann Fachcommunity-spezifische Toolverzeichnisse kuratieren und anreichern. Denkbar ist etwa eine Klassifizierung unter Anwendung der TaDiRAH-Taxonomie5 (Borek u. a. 2021) oder die Hinterlegung von Anwendungsbeispielen, Publikationen oder Tutorials im angereicherten Datensatz.
Um für verteilt angelegte Datensätze ein gemeinsames Referenzmodell zu schaffen schlagen wir ein reduziertes Basisdatenmodell für DH-Werkzeuge vor, das minimale bibliografische und technische Eigenschaften definiert und anschlussfähig bleibt für bereits existierende Datenmodelle wie dem des Software Preservation Network oder von RIDE (Christopherson u. a. 2022; Sichani und Spadini 2022). Dieses Basisdatenmodell garantiert den Zugriff auf die gemeinsam verbindlich vereinbarten Basisdaten für die Nachnutzung von Einträgen in eigenen kuratierten Sammlungen.
Die Wikidata-Plattform erlaubt die Umsetzung des Ansatzes ohne weitere Software. Denkbar ist aber auch, Wikidata ausschließlich als Normdatei und Datenprovider für eigene Frontends einzusetzen, so wie es z.B. Scholia6 für die Profile von Wissenschaftler_innen tut (Nielsen, Mietchen, und Willighagen 2017). Schließlich adressiert unser Vorschlag die Nachhaltigkeit von Projektförderungen durch den kontinuierlichen Beitrag von Daten zu den Digital Commons (Wittel 2013) in Gestalt von Wikidata während der Projektlaufzeit und die Weiternutzung dieser Daten nach der Projektlaufzeit. Damit ist unser Vorschlag Teil einer Bewegung, Wikidata in der Wissenschaft und GLAM-Institutionen nicht mehr nur als Anbieter von Inhalten wahrzunehmen (vgl. Zhao 2022; Fischer und Ohlig 2019).
Fußnoten
Bibliographie
- Borek, Luise, Canan Hastik, Vera Khramova, Klaus Illmayer, und Jonathan D. Geiger. 2021. „Information Organization and Access in Digital Humanities: TaDiRAH Revised, Formalized and FAIR“. In Information Between Data and Knowledge, 321–32. Schriften Zur Informationswissenschaft 74. Glückstadt: Werner Hülsbusch. https://doi.org/doi.org/10.5283/epub.44951.
- Christopherson, Allan, Elena Colón-Marrero, Dianne Dietrich, Patricia Falcao, Claire Fox, Karen Hanson, Allen Kwan, und Matthew McEniry. 2022. „Software Metadata Recommended Format Guide“. Cornell University Library. https://doi.org/10.7298/XE9S-3B15.
- Dombrowski, Quinn. 2021. „The Directory Paradox“. In People, Practice, Power: Digital Humanities Outside the Center, herausgegeben von Anne B. McGrail, Angel David Nieves, und Siobhan Senier. Debates in the Digital Humanities. Minneapolis: University of Minnesota Press. https://dhdebates.gc.cuny.edu/read/people-practice-power/section/ca87ec4c-23a0-452d-8595-7cfd7e8d6f0c.
- Fischer, Barbara, und Jens Ohlig. 2019. „‚GND Meets Wikibase‘ - Eine Kooperation. Eine Bundesbehörde Geht Auf Expedition Im Wikiversum: Ein Neues Testfeld Für Wikibase“. GND (blog). 8. Mai 2019. https://wiki.dnb.de/pages/viewpage.action?pageId=147754828.
- Grant, Kaitlyn, Quinn Dombrowski, Kamal Ranaweera, Omar Rodriguez-Arenas, Stéfan Sinclair, und Geoffrey Rockwell. 2020. „Absorbing DiRT: Tool Directories in the Digital Age“. Digital Studies / Le Champ Numérique 10 (1). https://doi.org/10.16995/dscn.325.
- Nielsen, Finn Årup, Daniel Mietchen, und Egon Willighagen. 2017. „Scholia, Scientometrics and Wikidata“. In The Semantic Web: ESWC 2017 Satellite Events, herausgegeben von Eva Blomqvist, Katja Hose, Heiko Paulheim, Agnieszka Ławrynowicz, Fabio Ciravegna, und Olaf Hartig, 237–59. Lecture Notes in Computer Science. Cham: Springer International Publishing. https://doi.org/10.1007/978-3-319-70407-4_36.
- Sichani, Anna-Maria, und Elena Spadini, Hrsg. 2022. RIDE, Nr. 15: Tools and Environments (Dezember). https://ride.i-d-e.de/issues/issue-15/.
- Wittel, Andreas. 2013. „Counter-commodification: The economy of contribution in the digital commons“. Culture and Organization 19 (4): 314–31. https://doi.org/gmqgqq.
- Zhao, Fudie. 2022. „A systematic review of Wikidata in Digital Humanities projects“. Digital Scholarship in the Humanities, Dezember, 1–22. https://doi.org/10.1093/llc/fqac083.