Gute Planung ist die halbe Miete? - Nutzung und Nutzen von Datenmanagementplänen in geisteswissenschaftlichen Forschungsvorhaben
https://zenodo.org/records/14943158
Einleitung
Als lebende Dokumente dienen Datenmanagementpläne (DMP) dazu, Forschende bei der Planung, Dokumentation und Umsetzung von Maßnahmen zum Management von Forschungsdaten im Rahmen eines Forschungsvorhabens zu unterstützen.1 Sie sind i.d.R. strukturell orientiert am Forschungsdatenlebenszyklus (Rümpel 2011) und fordern, dass sich Forschende zu unterschiedlichen Aspekten des Forschungsdatenmanagements (FDM) im Rahmen ihres Forschungsvorhabens, bspw. zur Datenerhebung, Speicherung, Nachnutzung oder benötigten personellen und finanziellen Ressourcen, positionieren (Jensen 2011; Dierkes 2021). Im Kern sollen Datenmanagementpläne also dazu dienen Forschende dabei zu unterstützen ihre Forschungsergebnisse durch umfassendes Forschungsdatenmanagement im Sinne der FAIR-Prinzipien (Wilkinson et al. 2016) möglichst auffindbar, zugänglich, interoperabel und nachnutzbar zu machen. Zusätzlich sollen sie helfen, insbesondere den nicht unerheblichen zeitlichen Aufwand, bspw. für die Datenkuration (Perry und Netscher 2022), durch strukturierte Planung zu verringern und das Datenmanagement effizienter zu gestalten.
Immer häufiger sind Datenmanagementpläne Voraussetzung für die erfolgreiche Einwerbung von Drittmitteln und entsprechende Drittmittelgeber erwarten zunehmend im Rahmen einer Antragseinreichung die Nutzung von Datenmanagementplänen durch die antragsstellenden Forschenden (Rathmann 2020). Entsprechend existieren mittlerweile unterschiedliche Templates und Vorlagen für Datenmanagementpläne, die von Drittmittelgebern oder anderen, meist datenmanagement-bezogenen Einrichtungen, angeboten werden. Mit Hilfe von Softwarelösungen wie dem Research Data Management Organizer (RDMO),2 besteht die Möglichkeit, für Forschungs- und FDM-Beratungseinrichtungen eigene Datenmanagementpläne zu entwickeln und anzubieten. Organisatorische und inhaltliche Erweiterungen des Konzepts von Datenmanagementplänen, bspw. in Form von maschinenlesbaren DMPs (Miksa 2019; Oblasser 2020; Philipson 2023), Domain Data Protocols (Science Europe 2018; Netscher et al. 2022; Hoffmann 2023, Jung, Helling und Pielström 2024) oder auch Software Management Plänen (SMP) (Alves et al. 2021; Giraldo et al. 2023) vervollständigen das Spektrum an Möglichkeiten zur Planung, Dokumentation und Umsetzung von Forschungsdatenmanagement im Rahmen von Forschungsvorhaben.
Entsprechend stellen Datenmanagementpläne ein zentrales Werkzeug im Forschungsdatenmanagement dar und sollten auch im Rahmen geisteswissenschaftlicher Forschungsvorhaben eine wichtige Rolle spielen. Inwieweit DMPs im Rahmen von geisteswissenschaftlichen Forschungsvorhaben tatsächlich genutzt werden, ist allerdings unklar. Außerdem ist ungeklärt, ob die Nutzung von Datenmanagementplänen im Rahmen von Forschungsvorhaben überhaupt die FAIRness entstandener Forschungsergebnisse verbessert. Untersuchungen zu Herausforderungen in der Planung von Datenmanagementkonzepten zeigen sogar, dass die Nutzung von Datenmanagementplänen selbst eine Herausforderung für Forschende darstellen kann und sie bei der Nutzung von DMPs Unterstützungsbedarf haben (Steinhart 2012).
Methodik
In diesem Vortrag stellen wir Ergebnisse einer quantitativen Umfrage zum Umgang mit und Nutzen von Datenmanagementplänen in geisteswissenschaftlichen Forschungsvorhaben vor, um so ein klareres Bild von der Rolle und Bedeutung von DMPs in der geisteswissenschaftlichen Forschung zu zeichnen.
Die anonyme Umfrage wurde mit einer von der Universität zu Köln angebotenen Instanz von LimeSurvey3 durchgeführt und besteht aus insgesamt 11 Fragen zur Nutzung von Datenmanagementplänen im Rahmen geisteswissenschaftlicher Forschungsvorhaben. Insgesamt wurde die Umfrage über zwei Wochen durchgeführt und über die Mailingliste des Verbands Digital Humanities im deutschsprachigen Raum e.V.4 sowie die DFN-Mailingliste Forschungsdaten verschickt. Sie richtete sich explizit an Personen, die in geisteswissenschaftlichen Forschungsvorhaben arbeiten/gearbeitet haben. Die Umfrage und Ergebnisse wurden via Zenodo publiziert.5
Zunächst wurde in der Umfrage abgefragt, ob die Teilnehmenden bereits mit Datenmanagementplänen in Forschungsvorhaben arbeiten oder gearbeitet haben. Sofern sie noch keine DMPs nutzen/genutzt haben, wurde schließlich nach den Gründen dafür gefragt. Wenn Teilnehmende bereits mit DMPs arbeiten/gearbeitet haben, sollten sie Angaben zur Motivation für diese und zum Arbeitsaufwand bei der Nutzung von DMPs sowie zur praktischen Arbeit mit DMPs machen. Zuletzt wurde mit der Umfrage eine subjektive Einschätzung bezüglich der Geeignetheit von DMPs für die Verbesserung des Datenmanagements in Forschungsvorhaben erfragt.
Die Ergebnisse der Umfrage wurden v.a. quantitativ ausgewertet, um einen ersten Eindruck bezüglich der Nutzung und des Nutzens von Datenmanagementplänen in geisteswissenschaftlichen Forschungsvorhaben zu erhalten.
Ergebnisse
Insgesamt wurden 72 auswertbare Antworten im Rahmen der Umfrage erfasst. Mit 52,8 % gaben etwas mehr als die Hälfte der Teilnehmenden an Datenmanagementpläne im Rahmen von Forschungsvorhaben nutzen (siehe Abb. 1).
Personen, die angegeben haben, dass sie keine Datenmanagementpläne nutzen, wurden über ein Freitextfeld gebeten, dies zu begründen. Eine Paraphrasierung bzw. Zusammenfassung von insgesamt 29 auswertbaren Angaben ergab, dass es vor allem auf eine Unkenntnis bezüglich der Möglichkeit DMPs zu nutzen zurückzuführen ist, dass Forschende keine DMPs nutzen (11 Nennungen). Darüber hinaus wurde in sechs Fällen angegeben, dass es keinen Bedarf für DMPs gibt. Vier Personen notierten, dass sie keine Zeit für DMPs hätten, jeweils dreimal wurde angegeben, dass DMPs an der eigenen Einrichtung nicht genutzt werden bzw., dass sie ungeeignet für die Planung des Datenmanagements sind. Zwei Personen gaben darüber hinaus an, dass sie bisher keine DMPs genutzt haben, weil es nicht von ihnen gefordert wurde.
Von den 38 Teilnehmenden, die angegeben haben, Datenmanagementpläne zu nutzen, haben 36 Angaben zu Gründen für die Nutzung von DMPs gemacht. Die Mehrheit (insgesamt 21 Teilnehmende) gab an, dass sie ausschließlich aus externen Gründen DMPs nutzen, bspw. weil es von den Drittmittelgebern oder der eigenen Einrichtung verlangt wird. Lediglich fünf Personen vermerkten, dass sie DMPs ausschließlich aus eigener Überzeugung nutzen. 11 Teilnehmende notierten, dass sie DMPs sowohl aufgrund externer Forderungen als auch aus eigener Überzeugung anwenden. Die Gesamtzahlen der verschiedenen Motivationen sind in Abbildung 2 dargestellt.
Von den 21 Personen, die angegeben haben, dass sie Datenmanagementpläne ausschließlich aufgrund von Vorgaben von Dritten in ihren Forschungsvorhaben anwenden/angewendet haben, beantworteten insgesamt 13 Personen die Frage, ob sie einen Datenmanagementplan auch ohne ebenjene Vorgaben nutzen würden mit Nein, fünf Personen mit Ja und drei Personen machten keine Angaben ( N/A).
32 Teilnehmende machten Angaben zum Zeitpunkt, zu dem sie das erste Mal im Rahmen eines Forschungsvorhabens einen Datenmanagementplan nutzen/genutzt haben. Hier gab die Mehrheit (62,5 %) an, dass sie bereits in der Antragsphase damit beginnen, einen Datenmanagementplan zu nutzen (siehe Abb. 3).
Vier weitere Teilnehmende wählten bei der Frage zum Zeitpunkt der ersten Nutzung eines Datenmanagementplans im Rahmen eines Forschungsvorhabens die Kategorie „Sonstiges“ aus und machten schließlich weitere Angaben über ein Freitextfeld, wobei nur zwei Angaben den Zeitpunkt konkretisierten. Hier wurde vermerkt, dass DMPs bereits vor Beginn der eigentlichen Antragsphase das erste Mal eingesetzt werden/wurden.
Von den insgesamt 33 Teilnehmenden, die Angaben zur Häufigkeit von Bearbeitungen/Aktualisierungen von Datenmanagementplänen innerhalb von Forschungsvorhaben gemacht haben, haben mit 48,5 % etwas weniger als die Hälfte vermerkt, dass sie Datenmanagementpläne 1-2 Mal bearbeiten (siehe Abb. 4). Zwei bzw. drei Personen gaben an, ihre DMPs 2-3 bzw. 3-4 Mal über eine Projektlaufzeit hinweg zu aktualisieren, viermal wurde vermerkt, dass DMPs sogar noch häufiger bearbeitet werden. Acht Teilnehmende vermerkten, niemals einen DMP zu aktualisieren, was der grundsätzlichen Idee, dass DMPs lebende Dokumente sind, die über eine Projektlaufzeit hinweg angepasst werden müssen, widerspricht.
Bezüglich der persönlichen Wahrnehmung, als wie aufwendig die Nutzung von Datenmanagementplänen wahrgenommen wird, haben die Teilnehmenden (N=34) unterschiedliche Angaben gemacht (siehe Abb. 5). 14 Personen gaben an, dass DMPs in der Nutzung nicht aufwendig bis wenig aufwendig sind, 20 Personen vermerkten jedoch, dass DMPs für sie aufwendig, sehr aufwendig oder sogar deutlich zu aufwendig in der Nutzung sind.
17 von 32 Personen gaben schließlich an, dass sie überzeugt davon sind, dass sich ihr Datenmanagement durch die Nutzung eines Datenmanagementplans verbessert hat (siehe Abb. 6). Somit sieht eine knappe Mehrheit einen Mehrwert von DMPs für die Planung und Umsetzung von Forschungsdatenmanagement. Während fünf Teilnehmende der Meinung sind, dass sich ihr Datenmanagement durch die Nutzung eines DMPs nicht verbessert hat, gaben allerdings auch 10 Personen an, dass sie sich nicht sicher sind, ob sich ihr FDM durch die Nutzung eines DMPs verbessert hat. Insgesamt drei Teilnehmende haben bei dieser Frage das Feld “Sonstiges” ausgewählt und über ein Freitextfeld ihre diesbezügliche Einschätzung beschrieben, wobei nur zwei dieser Antworten inhaltlich ausgewertet werden konnten. Während eine Person angab, dass ihre Ansprüche an FDM höher sind, als das, was über einen DMP beschrieben werden kann, wies die zweite Person darauf hin, dass sie das gesamte Konzept von Datenmanagementplänen für sinnlos erachtet.
Alle Teilnehmenden konnten zusätzlich Ihre persönliche Einschätzung bezüglich der Nützlichkeit von Datenmanagementplänen über ein Freitextfeld konkretisieren. Von den Teilnehmenden, die angaben, dass sich ihr FDM durch DMPs verbessert hat, haben zehn von 17 Personen diese Möglichkeit wahrgenommen. Kernaussage hier war, dass DMPs dazu animieren sich über alle Aspekte im FDM Gedanken zu machen, auch über die, mit denen man sich sonst tendenziell nicht beschäftigt hätte. Von den Personen, die angaben, dass ihr FDM sich nicht durch die Nutzung von DMPs verbessert hat, haben drei von fünf Teilnehmenden das Freitextfeld zur Konkretisierung genutzt und dort insbesondere angegeben, dass DMPs aus ihrer Sicht trotzdem sinnvoll sein können. Fünf der zehn Personen, die sich nicht sicher waren, ob ihr FDM sich durch die Nutzung von DMPs verbessert hat, machten auch konkretere Angaben zu ihrer Selbsteinschätzung. Neben der Wahrnehmung, dass DMPs sinnvoll sein können, gaben hier zwei Personen an, dass sie ein spezifisches Datenverständnis haben, aus dem heraus ihnen FDM wenig sinnvoll erscheint.
Zuletzt wurde im Rahmen der Umfrage in Form einer Mehrfachauswahl abgefragt, welche Förderinstitutionen Forschungsvorhaben, in denen die Teilnehmenden Datenmanagementpläne nutzen/genutzt haben, fördern/gefördert haben (siehe Abb. 7). Hier wird deutlich, dass vor allem im Rahmen von Vorhaben, die durch die Deutsche Forschungsgemeinschaft (DFG)6 gefördert werden, Datenmanagementpläne genutzt werden.
Diskussion
Die Ergebnisse der anonymisierten Umfrage zeigen zunächst ein ausgewogenes Bild in Bezug auf die Nutzung von Datenmanagementplänen im Rahmen von geisteswissenschaftlichen Forschungsvorhaben. Allerdings gaben die meisten Teilnehmenden an, dass sie DMPs nicht ausschließlich aus eigener Überzeugung, sondern eher aufgrund von externen Vorgaben bzw. Forderungen nutzen, es also weniger intrinsische Motivation auf Seiten der Forschenden gibt, Datenmanagementpläne zu nutzen. Scheinbar hat sich also noch keine Überzeugung bezüglich des Nutzens von Datenmanagementplänen in der Breite etabliert. Dies deckt sich auch mit der Tatsache, dass lediglich fünf der Personen, die angegeben haben, DMPs ausschließlich aufgrund externer Vorgaben zu nutzen, vermerkten, dass sie DMPs auch ohne externe Vorgaben genutzt hätten.
Darüber hinaus schätzt die Mehrheit der Teilnehmenden den Aufwand einen Datenmanagementplan zu nutzen als aufwendig, sehr aufwendig bzw. deutlich zu aufwendig ein, obwohl die meisten Teilnehmenden DMPs lediglich 1-2 Mal während eines Forschungsvorhabens bearbeiten bzw. aktualisieren. Dies deutet darauf hin, dass DMPs noch nicht optimal und ohne größeren Mehraufwand in Forschungsvorhaben implementiert werden können.
Trotz dieser Ergebnisse gaben insgesamt 17 von 32 Personen an, dass sie der Meinung sind, dass sich ihr Datenmanagement durch die Nutzung eines DMPs verbessert hat. Aus den Rückmeldungen der Teilnehmenden, die angegeben haben, dass sie keine DMPs nutzen/genutzt haben, wird schließlich deutlich, dass die Nicht-Nutzung von DMPs vor allem auch an der Unwissenheit über DMPs liegt.
Fazit und Ausblick
Datenmanagementpläne sind ein Werkzeug im Forschungsdatenmanagement zur Planung, Organisation und Umsetzung von FDM-Maßnahmen, dass eine immer zentralere Rolle einnimmt. Wenngleich DMPs scheinbar noch nicht funktional und ohne großen Mehraufwand in Forschungsvorhaben genutzt werden (können), wird die Nutzung von Datenmanagementplänen im Kontext geisteswissenschaftlicher Forschung grundsätzlich als hilfreich wahrgenommen, was allerdings auf einer Selbsteinschätzung der Teilnehmenden beruht.
Ob sich das Datenmanagement durch die Nutzung von DMPs im Rahmen von Forschungsvorhaben tatsächlich verbessert, müsste aus objektiver Perspektive, bspw. durch die Evaluation von Forschungsergebnissen, die in Vorhaben entstanden sind, die DMPs verwendet haben, in Bezug auf ihre FAIRness (Mangione et al. 2022), genauer untersucht werden. Eine Möglichkeit könnte hier die Anwendung der FAIR-Prinzipien, u.a. durch das FAIRplus Dataset Maturity (DSM) Model (Rocca-Serra et al. 2023) oder Evaluationstools wie FAIR-Checker,7 F-UJI8 oder die FAIR Evaluation Services,9 darstellen.
Der wahrgenommene Aufwand bei der Nutzung von Datenmanagementplänen sollte, sofern Datenmanagementpläne tatsächlich geeignet sind das Datenmanagement in Forschungsvorhaben signifikant zu verbessern, reduziert werden, bspw. durch vereinfachte DMP-Templates oder Domain Data Protocols. Zuletzt scheint auch die Steigerung der Awareness eine notwendige Maßnahme für die Steigerung der Nutzung von DMPs zu sein. Diese Steigerung von Awareness setzt allerdings voraus, dass der tatsächliche Nutzen von DMPs für das Datenmanagement objektiv festgestellt wird.
Die in diesem Paper vorgestellten und diskutierten Ergebnisse können als Ausgangspunkt für weitere Überlegungen bezüglich der Verbesserung von Datenmanagementplänen verstanden werden, die allerdings noch nicht Teil der hier vorgestellten Forschung sind. Schließlich stellt sich auf Basis der hier vorgestellten Ergebnisse nicht nur die Frage der Übertragbarkeit der Erkenntnisse auf andere Fachbereiche, sondern auch, inwieweit auf einer qualitativen Ebene Datenmanagementpläne effektiver in Forschungsvorhaben implementiert werden können, was auf den hier dargestellten Ergebnissen aufbauend noch weiter untersucht werden muss.
In unserem Vortrag werden wir die Ergebnisse der Umfrage detaillierter vorstellen und diskutieren. Dabei werden wir den Fokus darauf legen, konkrete Ansätze zur Verbesserung von Datenmanagementplänen für die effektive Nutzung im Rahmen von Forschungsvorhaben herauszuarbeiten.
Fußnoten
Bibliographie
- Alves, Renato, Dimitrios Bampalikis, Leyla Jael Castro, José María Fernández, Jennifer Harrow, Mateusz Kuzak, Eva Martin, Fotis E. Psomopoulos, und Allegra Via. 2021. „ELIXIR Software Management Plan for Life Sciences“. Preprint. BioHackrXiv. https://doi.org/10.37044/osf.io/k8znb.
- Dierkes, Jens: “Planung, Beschreibung und Dokumentation von Forschungsdaten.“ In: Putnings, Markus, Heike Neuroth, and Janna Neumann, eds. Praxishandbuch Forschungsdatenmanagement. De Gruyter, 2021. https://doi.org/10.1515/9783110657807.
- Giraldo, Olga, Danilo Dessi, Stefan Dietze, Dietrich Rebholz-Schuhmann, and Leyla Jael Castro. “Machine-Actionable Metadata for Software and Software Management Plans for NFDI.” Proceedings of the Conference on Research Data Infrastructure 1 (September 7, 2023). https://doi.org/10.52825/cordi.v1i.279.
- Hoffmann, Nicole. “Bausteine Forschungsdatenmanagement: 2023, Stamp – Standardisierter Datenmanagementplan für die Bildungsforschung. Ein Konzept zum maßgeschneiderten Forschungsdatenmanagement,” October 27, 2023. https://doi.org/10.17192/BFDM.2023.4.8593.
- Jensen, Uwe: „Datenmanagementpläne.“ In: Büttner, Stephan, Hans-Christoph Hobohm, and Lars Müller, eds. Handbuch Forschungsdatenmanagement. Bad Honnef: Bock + Herchen Verlag, 2011.
- Jung, Kerstin, Patrick Helling, und Steffen Pielström. 2024. „Vom DMP zum DDP – Erstellen fachspezifischer Datenmanagementpläne für die Computational Literary Studies im Research Data Management Organizer (RDMO)“, Februar. https://doi.org/10.5281/ZENODO.10698436.
- Mangione, Dario, Leonardo Candela, and Donatella Castelli. “A Taxonomy of Tools and Approaches for FAIRification.” Zenodo, February 10, 2022. https://doi.org/10.5281/ZENODO.6037509.
- Miksa, Tomasz, Stephanie Simms, Daniel Mietchen, and Sarah Jones. “Ten Principles for Machine-Actionable Data Management Plans.” Edited by Francis Ouellette. PLOS Computational Biology 15, no. 3 (March 28, 2019): e1006750. https://doi.org/10.1371/journal.pcbi.1006750.
- Netscher, Sebastian, Ivonne Anders, and Christin Henzen. “Bausteine Forschungsdatenmanagement: 2022, Activities and Challenges in developing Discipline-Specific Data Management Plan Templates,” March 14, 2022. https://doi.org/10.17192/BFDM.2022.1.8371.
- Oblasser, Simon Werner. “Designing an Architecture for Machine-Actionable Research Data Management Planning in an Institutional Context,” 2020, 142 pages. https://doi.org/10.34726/HSS.2020.59642.
- Perry, Anja, and Sebastian Netscher. “Measuring the Time Spent on Data Curation.” Journal of Documentation 78, no. 7 (December 19, 2022): 282–304. https://doi.org/10.1108/JD-08-2021-0167.
- Philipson, Joakim, Adil Hasan, and Hanne Moa. “Making Data Management Plans Machine Actionable: Templates and Tools.” Data Science Journal 22 (August 28, 2023): 29. https://doi.org/10.5334/dsj-2023-029.
- Rathmann, Torsten. “Anforderungen der Forschungsförderer ans FDM.” ProLibris 2018 23 (2020): 6465. https://doi.org/10.25926/93AS-Y789.
- Rocca-Serra, Philippe, Wei Gu, Vassilios Ioannidis, Tooba Abbassi-Daloii, Salvador Capella-Gutierrez, Ishwar Chandramouliswaran, Andrea Splendiani, et al. “The FAIR Cookbook - the Essential Resource for and by FAIR Doers.” Scientific Data 10, no. 1 (May 19, 2023): 292. https://doi.org/10.1038/s41597-023-02166-3.
- Rümpel, Stefanie: „Der Lebenszyklus von Forschungsdaten.“ In: Büttner, Stephan, Hans-Christoph Hobohm, and Lars Müller, eds. Handbuch Forschungsdatenmanagement. Bad Honnef: Bock + Herchen Verlag, 2011.
- Science Europe. “Guidance Document Presenting a Framework for Discipline-Specific Research Data Management,” January 18, 2018. https://doi.org/10.5281/ZENODO.4925906.
- Steinhart, Gail, Eric Chen, Florio Arguillas, Dianne Dietrich, and Stefan Kramer. “Prepared to Plan? A Snapshot of Researcher Readiness to Address Data Management Planning Requirements.” Journal of EScience Librarianship 1, no. 2 (2012). https://doi.org/10.7191/jeslib.2012.1008.
- Wilkinson, Mark D., Michel Dumontier, IJsbrand Jan Aalbersberg, Gabrielle Appleton, Myles Axton, Arie Baak, Niklas Blomberg, et al. “The FAIR Guiding Principles for Scientific Data Management and Stewardship.” Scientific Data 3, no. 1 (March 15, 2016): 160018. https://doi.org/10.1038/sdata.2016.18.