Under Construction: NFDI-weite Basisdienste innerhalb von Base4NFDI
https://zenodo.org/records/14943046
Das Verbundprojekt Base4NFDI wird nicht zu Unrecht teilweise als “Maschinenraum der NFDI” (Nationale Forschungsdateninfrastruktur) bezeichnet. Denn als gemeinsame Initiative aller NFDI-Konsortien (Bernard et al. 2023) will Base4NFDI das Rahmenwerk für die bedarfsorientierte (Weiter-)Entwicklung und Integration NFDI-weiter Basisdienste bilden. Mit dem Poster wird ein Blick auf das sich im Aufbau befindliche NFDI-Basisdiensteportfolio geworfen, seinen Nutzen für die digitale geisteswissenschaftliche Forschung sowie die Möglichkeit der Teilhabe daran.
Derzeit befinden sich sechs Basisdienstkandidaten (Stand: Juni 2024) im insgesamt drei Phasen (Initialisierung, Integration, Ramping-Up) durchlaufenden Prozess, der in den nachhaltigen Betrieb eines Basisdienstes mündet. Die Anträge wurden zuvor innerhalb einer NFDI-Sektion entwickelt, von einem technischen Expertenkomitee positiv bewertet und von der NFDI-Konsortialversammlung als Basisdienstkandidat zur Finanzierung bewilligt. Während sie in unterschiedlicher Art auch zur Forschungsförderung beitragen, variiert ihre Wichtigkeit in verschiedenen Disziplinen (Schimmler et al. 2023). Für die digitale Geisteswissenschaft soll hier ein Schlaglicht auf drei Basisdienstprojekte geworfen werden, die in besonderem Maße zur geisteswissenschaftlichen Forschung beitragen können.
Der sich bereits in der Integrationsphase befindliche Basisdienstkandidat IAM4NFDI will durch die Verbindung bestehender Zugriffs- und Identitätsmanagementlösungen die Grundlage für den (vereinfachten) Zugang zu Forschungsdaten und Forschungsservices auf nationaler und internationaler Ebene schaffen (Pempe et al. 2023a und Pempe et al. 2023b). Forschende profitieren dadurch von einem schnelleren Zugriff, der weit weniger Authentifizierungsschritte benötigt, oder gar von der Ermöglichung eines Zugriffs zu Daten und Tools, die einen wichtigen Beitrag zum Forschungsergebnis liefern können. Da IAM4NFDI folglich zu (vereinfachter) Zugänglichkeit von Forschungsdaten und -services führt, wird eine Zeitersparnis im Forschungsprozess sowie die Vermeidung von Doppelarbeit begünstigt und das zur Verfügung stehende Untersuchungsmaterial erheblich vergrößert.
Innerhalb der Geistes- und Kulturwissenschaften werden verschiedene Terminologien (z.B. Iconclass, LIDO, Getty Vocabularies) genutzt. Terminologien werden in diversen Formaten (z.B. SKOS) an unterschiedlichen Quellen zur Verfügung gestellt. Der Service BARTOC beispielsweise stellt eine Übersicht für Terminologiequellen bereit. Durch Annotationen mit standardisierten Terminologien werden Forschungsdaten und -dienste interoperabler, auffindbarer und nachhaltiger. Der von NFDI4Culture entwickelte Annotationsdienst ANTELOPE (Rossenova/Bailly/Blümel 2024 ) ermöglicht Datenannotationen mit unterschiedlichen Terminologiequellen. Der Basisdienst TS4NFDI (Terminology Services, Koepler et al. 2024) hilft Services wie ANTELOPE und BARTOC in ihrer Arbeit, und hat darüber hinaus weitere Ziele: TS4NFDI unterstützt neben dem zentralen Zugriff auf diverse aufeinander abgestimmte Terminologiedienste (z.B. Skosmos) auch disziplinübergreifende Mappings, wodurch die Harmonisierung und Konsensbildung über Disziplingrenzen hinweg ermöglicht wird. Die Forschung in den digitalen Geisteswissenschaften wird dadurch sowohl disziplinintern als auch für andere Wissenschaften anschlussfähiger.
Jupyter Notebooks sind ein in den digitalen Geisteswissenschaften mittlerweile etabliertes Instrument bei der (kollaborativen) Verarbeitung, Analyse und Visualisierung von großen und kleinen Datenmengen (z.B. im DNBlab, vgl. Taube/Palek 2024, oder in Text+, vgl. Dogaru/Jander 2022), das beispielsweise im Bereich des Natural Language Processings und beim maschinellen Lernen zum Einsatz kommt. Jupyter4NFDI (Hagemeier et al. 2024) möchte die fragmentierte Verwendung von Juypter durch einen zentral zur Verfügung gestellten Jupyter Hub ersetzen und eine föderierte Organisation von Rechenkapazitäten aufbauen. Durch die einfache Zugriffsmöglichkeit via IAM4NFDI (s.o.) sinkt die Nutzungsschwelle; gleichzeitig kann durch die Bereitstellung großer Rechenleistung das Nutzungserlebnis verbessert sowie der Forschungsprozess ermöglicht und beschleunigt werden, z.B. bei rechenintensiven Untersuchungen mit großen Textmengen oder dem Training großer Sprachmodelle.
Neben den genannten Beispielen befinden sich außerdem die Basisdienstkandidaten PID4NFDI (persistente Identifikatoren, Bingert et al. 2022), DMP4NFDI (Datenmanagementpläne, Diederichs et al. 2024) und KGI4NFDI (Knowledge Graphs, Rossenova et al. 2023) in der Initialisierungsphase. Auch diese können je nach Forschungsfrage von besonderer Bedeutung in der geistes- und kulturwissenschaftlichen digitalen Forschung sein.
Da sich fünf der sechs Basisdienstkandidaten noch in der Initialisierungsphase befinden (Stand: Juni 2024), bei der v.a. Bedarfsabfragen und die Kartierung der innerhalb der Disziplinen bestehenden Lösungen im Vordergrund stehen, bietet sich weiterhin erhebliches Mitgestaltungspotenzial über die NFDI-Konsortien und die Sektionen des NFDI-Vereins, auch für die digitalen Geisteswissenschaften. Gleichzeitig ist die flächendeckende Nutzung der Basisdienste noch nicht gewährleistet; das Portfolio kann und wird um weitere Kandidaten erweitert werden, sodass folglich noch große Entwicklungsschritte zu erwarten sind. Das Basisdiensteportfolio bleibt under construction.
Bibliographie
- Bernard, Lars, Reinhard Altenhöner, Franziska Böhm, Michael Diepenbroek, Barbara Ebert, Juliane Fluck, Sonja Herres-Pawlis, Axel Klinger, Oliver Koepler, Sören Lorenz, Brigitte Mathiak, Bernhard Miller, Peter Pelz, Nanette Rißler-Pipka, Raphael Ritz, Ulrich Sax, Sonja Schimmler, Thomas Schörner, Torsten Schrade, Moritz Schubotz, Alexander Sczyrba, Regine Stein und Dirk von Suchodoletz. 2023. Base4NFDI - Basic Services for NFDI. Zenodo. https://doi.org/10.5281/zenodo.10245518 (zugegriffen: 18. Juli 2024).
- Bingert, Sven, Jan Brase, Felix Burger, Britta Dreyer, Stephanie Hagemann-Wilholt, Paul Vierkant und Philipp Wieder. 2022. Concept for Setting up the Persistent Identifier Services Working Group in the NFDI Section "Common Infrastructures" (1.0). Zenodo. https://doi.org/10.5281/zenodo.6507760 (zugegriffen: 18. Juli 2024).
- Diederichs, Katja, Celia Krause, Marina Lemaire, Marco Reidelbach und Jürgen Windeck. 2024. A Vision for Data Management Plans in the NFDI (1.0). Zenodo. https://doi.org/10.5281/zenodo.10570654 (zugegriffen: 18. Juli 2024).
- Dogaru, George und Melina Jander. 2022. “Jupyter-Notebooks: Ein Angebot für die Text+-Community”. Text+ Plenary 2022 (TextPlusPlenary), Mannheim. Zenodo. https://doi.org/10.5281/zenodo.7251753 (zugegriffen: 18. Juli 2024).
- Hagemeier, Björn, Arnim Bleier, Bernd Flemisch, Matthias Lieber, Klaus Reuter und George Dogaru. 2024. Jupyter4NFDI. Zenodo. https://doi.org/10.5281/zenodo.12699382 (zugegriffen: 18. Juli 2024).
- Koepler, Oliver, Julia Sasse, Naouel Karam und Roman Baum. 2024. Terminology Services 4 NFDI (TS4NFDI). Zenodo. https://doi.org/10.5281/zenodo.12188787 (zugegriffen: 18. Juli 2024).
- Pempe, Wolfgang, Peter Gietz, Sander Apweiler, Christof Pohl, Marcus Hardt, Marius Politze, und Thorsten Michels. 2023a. IAM4NFDI. Basic Service ‘Identity and Access Management’ for the National Research Data Management Infrastructure (project proposal). https://doc.nfdi-aai.de/documents/iam4nfdi_initialization.pdf (zugegriffen: 18. Juli 2024).
- Pempe, Wolfgang, Peter Gietz, Sander Apweiler, Christof Pohl, Marcus Hardt, Marius Politze, und Thorsten Michels. 2023b. IAM4NFDI – Integration Phase. Basic Service ‘Identity and Access Management’ for the National Research Data Infrastructure (project proposal). https://doc.nfdi-aai.de/documents/iam4nfdi_integration.pdf (zugegriffen: 18. Juli 2024).
- Rossenova, Lozana, Kolja Baillyund Ina Blümel. 2024. “Search, Link, Integrate: The User-Centered Approach in Developing NFDI4Culture's Antelope (Annotation & Terminology) Service”. DHd 2024 Quo Vadis DH (DHd2024), Passau, Deutschland. Zenodo. https://doi.org/10.5281/zenodo.10706064 (zugegriffen: 18. Juli 2024).
- Rossenova, Lozana, Renat Shigapov, Moritz Schubotz und Daniel Mietchen. 2023. KGI4NFDI: Knowledge Graph Infrastructure for the German National Research Data Infrastructure. Zenodo. https://doi.org/10.5281/zenodo.8337432 (zugegriffen: 18. Juli 2024).
- Schimmler, Sonja, Reinhard Altenhöner, Lars Bernard, Juliane Fluck, Axel Klinger, Sören Lorenz, Brigitte Mathiak, Bernhard Miller, Raphael Ritz, Thomas Schörner-Sadenius, Alexander Sczyrba und Regine Stein. 2023. “Base4NFDI - Creating NFDI-wide basic services in a world of specific domains”. First Conference on Research Data Infrastructure 2023 (CoRDI 2023), Karlsruhe, Germany. Zenodo. https://doi.org/10.5281/zenodo.8383123 (zugegriffen: 18. Juli 2024).
- Stein, Regine und Lukas Weimer. 2022. “Base4NFDI und Text+”. Text+ Plenary 2022 (TextPlusPlenary), Mannheim. Zenodo. https://doi.org/10.5281/zenodo.7252006 (zugegriffen: 18. Juli 2024).
- Taube, Anke und Stephanie Palek. 2024. “Hands-on-Workshop DNBLab”. DHd 2024 Quo Vadis DH (DHd2024), Passau, Deutschland. https://doi.org/10.5281/zenodo.10698396 (zugegriffen: 18. Juli 2024).