Der DHd Data Steward Maßnahmen zur Entwicklung einer nachhaltigen Datenstrategie für die Digital Humanities im deutschsprachigen Raum
Der DHd Data Steward
Mit der Ernennung eines Data Stewards hat der Verband Digital Humanities im deutschsprachigen Raum e.V. (DHd) auf der Jahreskonferenz 2020 in Paderborn eine Funktion geschaffen, um eine umfassende Datenstrategie für alle Materialien, Publikationen und Ergebnisse, die im Kontext des DHd-Verbandes entstanden sind/entstehen werden, zu entwickeln.1 Sie sollen im Sinne der FAIR-Prinzipien (Wilkinson et al. 2016) (1) langfristig gesichert und archiviert als auch (2) nach Möglichkeit nachhaltig publiziert und verfügbar gemacht werden.
Mit diesem Posterbeitrag soll die bisherige Arbeit des DHd Data Stewards präsentiert sowie ein Blick in die Datenzukunft des Verbandes gegeben werden.
Materialien der DHd-Konferenzen
Langfristige Verfügbarkeit von DHd-Konferenzwebsites
Einen zentralen Gegenstand und Zugangspunkt einer DHd-Jahreskonferenz stellt die Konferenzwebsite dar. Die Erstellung und das Hosting werden von den lokalen Organisator*innen übernommen. Nach einer Konferenz fehlt es häufig an notwendigen Mitteln für den langfristigen Betrieb dieser Konferenzwebsites.
Zur Gewährleistung einer dauerhaften Erreichbarkeit wurde damit begonnen, statische HTML-Versionen einzelner Konferenzwebsites zu erzeugen, um mögliche technische Abhängigkeiten aufzulösen und den Kurationsaufwand herunterzufahren. Mit einem Umzug auf die technische Infrastruktur der Alliance of Digital Humanities Organizations (ADHO) sollen die Konferenzwebsites langfristig als Unterseite der Verbandswebsite bereitgestellt.2
Nachhaltige Publikation aller einzelnen DHd-Beiträge
Das Book of Abstracts einer Jahreskonferenz stellt ein wichtiges Publikationsinstrument dar. Seit 2016 wurden die Book of Abstracts via Zenodo publiziert (siehe Burr 2017; Stolz 2017; Vogeler 2018; Sahle 2019; Schöch 2020). Für die erste DHd-Jahreskonferenz 2014 wurde kein Book of Abstracts publiziert. Die Beiträge zur DHd-Jahreskonferenz 2015 sind als PDF-Datei über die Konferenzwebsite verfügbar (siehe Stiegler 2015).
Wenngleich die Books of Abstracts ein wichtiges Schaufenster der deutschsprachigen Digital Humanities (Sahle 2019; Schöch 2020) sind, ermöglichen sie weder eine eindeutige Zitierbarkeit einzelner Beiträge noch ihre Erfassung in digitalen Katalogen. Potentiale und Lösungsansätze zum Umgang mit DHd-Beiträgen wurden bereits in verschiedenen Formaten community-getrieben adressiert (Cremer 2018; Andofer 2019: Andorfer et al. 2019; Lordick 2020; Steyer et al. 2020).
Um die DHd-Beiträge einzeln zitierbar zu veröffentlichen, wurden alle Beiträge gesammelt:
- 2016, 2018-2020: TEI-Dateien via GitHub 3
- 2017: TEI-Dateien von lokalen Organisator*innen
- 2015: gesammelte PDF-Datei von lokalen Organisator*innen
- 2014: gesammelte, unvollständige PDF-Datei von lokalen Organisator*innen + weitere Beiträge durch Autor*innen als PDF- und Word-Dateien
Zur Erstellung einzelner PDF-Dateien zu jedem Abstract wurde für die Jahrgänge 2016-2020 auf bestehende Transformationsskripte zur Erstellung von Book of Abstracts aus TEI-Dateien zurückgegriffen.4 Die Skripte wurden angepasst, um für jedes Abstract einzeln eine PDF-Datei zu generieren.5
Zur persistenten Publikation der DHd-Beiträge wurde das generische Online-Repositorium Zenodo gewählt.6 Hier wird bereits seit 2019 eine DHd-Community als zentraler Publikationsort kuratiert.7
Mit Hilfe weiterer XSL-Transformationsskripte wurden für die Jahrgänge 2016-2020 jeweils eine Konferenz-Metadatendatei generiert, die dem DataCite-Schema und den Anforderungen von Zenodo entspricht (siehe Abb. 1).8 ,9
Für den Upload der Abstracts auf Zenodo wurde automatisiert für jedes Abstract ein Ordner (Bundle) mit PDF-Datei, TEI-Datei (sofern vorhanden) und Metadatensatz im JSON-Format generiert. Die Publikation dieser Bundles erfolgte automatisiert durch einen eigenen Publikationsworkflow (siehe Abb. 2) über die Zenodo REST API-Schnittstelle in die DHd-Zenodo Community.10 Die DHd-Beiträge verfügen über Digital Object Identifier (DOI), sind via OpenAIRE auffindbar und wurden durch die computer science bibliography (dblp) katalogisiert.11 ,12
Ausblick und nächste Schritte
Der Umzug von alten Konferenzwebsites auf die ADHO-Infrastruktur soll vorangetrieben werden. Empfehlungen für die technische Umsetzung zukünftiger Konferenzwebsites soll deren Umzug auf die ADHO-Infrastruktur vereinfachen. Zusätzlich bedarf es einer Policy zur Speicherung, Archivierung und ggf. Publikation von DHd-Materialien die außerhalb von der Jahreskonferenzen entstanden sind. Zuletzt sollen die entwickelten Workflows und die technische Realisation zur Sicherung und Publikation der einzelnen DHd-Abstracts im Rahmen einer durch die Community getragenen TaskForce zur kontinuierlichen Unterstützung der wechselnden Konferenz-Organisator*innen weiterentwickelt und optimiert werden. Die Einrichtung einer solchen TaskForce ist im Kontext der DHd 2022 Konferenz in Potsdam geplant. Ein Aufruf zur Beteiligung der Community wird im Vorfeld kommuniziert.13 Ein wichtiger Ansatz ist hier die Aufbereitung der TEI-Dateien, damit diese auch im Index of Digital Humanities Conferences (Weingart, Eichmann-Kalwara und Lincoln 2020) katalogisiert werden. Eine entsprechende Initiativgruppe hat sich bereits in einem Workshop auf der vDHd-Konferenz 2021 (Andorfer, Busch, Cremer et al. 2021) formiert.14
Fußnoten
Bibliographie
- Andorfer, Peter (2019): dhd-boas-app, Online: https://dhd-boas-app.acdh-dev.oeaw.ac.at/ (letzter Zugriff: 14. Juli 2021).
- Andorfer, Peter / Busch, Anna / Cremer, Fabian / Henrich, Andreas / Helling, Patrick / Lordick, Harald / Mischke, Dennis / Steyer, Timo (2021): "Bericht zur vDHd2021-Veranstaltung: Zukunftslabor DHd-Abstracts". DHd-Blog, Online: https://dhd-blog.org/?p=15980 (letzter Zugriff: 14. Juli 2021).
- Andorfer, Peter / Cremer, Fabian / Steyer, Timo (2019): “DHd 2019 Book of Abstracts Hackathon”, Beitrag auf der DHd 2019 Digital Humanities multimedial und multimodal. 6. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" (DHd 2019). Frankfurt am Main und Mainz, Online: http://doi.org/10.5281/zenodo.4622102 .
- Burr, Elisabeth (ed.) (2017). DHd 2016 Modellierung - Vernetzung - Visualisierung. Die Digital Humanities als Fächerübergreifendes Forschungsparadigma. Konferenzabstracts. Leipzig, Online: http://doi.org/10.5281/zenodo.3679331.
- Cremer, Fabian (2018): „Nun sag, wie hältst Du es mit dem Digitalen Publizieren, Digital Humanities?“. Digitale Redaktion Blog, Online: https://editorial.hypotheses.org/113 (letzter Zugriff: 14. Juli 2021).
- Lordick, Harald (2020): DH(d) Konferenzbeiträge, Online: http://www.steinheim-institut.de/dhd/ (letzter Zugriff: 14. Juli 2021).
- Sahle, Patrick (ed.) (2019): DHd 2019 Digital Humanities: multimedial & multimodal. Konferenzabstracts. Frankfurt am Main, Online: https://doi.org/10.5281/zenodo.2596095.
- Schöch, Christof (ed.) (2020): DHd 2020 Spielräume: Digital Humanities zwischen Modellierung und Interpretation. Konferenzabstracts. Paderborn, Online: https://doi.org/10.5281/zenodo.3666690.
- Steyer, Timo / Andorfer, Peter / Cremer, Fabian (2020): „Abstract Enhancement. Potentiale der DHd-Konferenzabstracts als Daten/Publikation“, Beitrag auf der DHd 2020 Spielräume: Digital Humanities zwischen Modellierung und Interpretation. 7. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" (DHd 2020). Paderborn, Online: http://doi.org/10.5281/zenodo.4621706.
- Stiegler, Johannes (ed.) (2015): DHd 2015 Von Daten zu Erkenntnissen: Digitale Geisteswissenschaften als Mittler zwischen Information und Interpretation. Konferenzabstracts. Graz, Online: https://dhd2015.uni-graz.at/de/nachlese/book-of-abstracts/ (letzter Zugriff: 14. Juli 2021).
- Stolz, Michael (ed.) (2017): DHd 2017 Digitale Nachhaltigkeit. Konferenzabstracts. Bern, Online: http://doi.org/10.5281/zenodo.3684825.
- Vogeler, Georg (ed.) (2018): DHd 2018 Kritik der digitalen Vernunft. Konferenzabstracts. Köln, Online: http://doi.org/10.5281/zenodo.3684897.
- Weingart, Scott B. / Eichmann-Kalwara, Nickoal / Lincoln, Matthew (2020): The Index of Digital Humanities Conferences. Carnegie Mellon University, Online: https://dh-abstracts.library.cmu.edu/ (letzter Zugriff: 14. Juli 2021).
- Wilkinson, Mark D. / Dumontier, Michel / Aalbersberg, IJsbrand Jan / Appleton, Gabrielle / Axton, Myles / Baak, Arie / Blomberg, Niklas / Boiten, Jan-Willem / da Silva Santos, Luiz Bonino / Bourne, Philip E. / Bouwman, Jildau / Brookes, Antony J. / Clark, Tim / Crosas, Mercè / Dillo, Ingrid / Dumon, Oliver / Edmunds, Scott / Evelo, Chris T. / Finkers, Richard / Gonzalez-Beltran, Alejandra / Gray, Alasdair J.G. / Groth, Paul, Goble, Carole / Grethe, Jeffrey S. / Heringa, Jaap / A.C’t Hoen, Peter / Hooft, Rob / Kuhn, Tobias / Kok, Ruben / Kok, Joost / Lusher, Scott J. / Martone, Maryann E. / Mons, Albert / Packer, Abel L. / Persson, Bengt / Rocca-Serra, Philippe / Roos, Marco / van Schaik, Rene / Sansone, Susanna-Assunta / Schultes, Erik / Sengstag, Thierry / Slater, Ted / Strawn, George / Swertz, Morris A. / Thompson, Mark / van der Lei, Johan / van Mulligen, Erik / Velterop, Jan / Waagmeester, Andrea / Wittenburg, Peter / Wolstencroft, Katherine / Zhao, Jun / Mons Barend (2016): "The FAIR Guiding Principles for scientific data management and stewardship" in: Scientific Data 3, Article number: 160018. DOI: https://doi.org/10.1038/sdata.2016.18 .