DHd Chronicles Anreicherung und Analyse der Beiträge zu den Jahrestagungen der Digital Humanities im deutschsprachigen Raum 2014-2023
https://zenodo.org/records/10698356
Einleitung
Die seit 2014 jährlich stattfindenden Tagungen1 des Verbands Digital Humanities im deutschsprachigen Raum e.V. (DHd) stellen mit ca. 130 angenommenen Beiträgen pro Tagung ein regelmäßiges Schaufenster der digital arbeitenden Geisteswissenschaften (Schöch 2020:V) dar. Sie folgen dem Anspruch, die Entwicklungen, Ergebnisse und relevanten Fragestellungen der Digital Humanities (DH) im deutschsprachigen Raum zu präsentieren. Mit der zehnten Jahrestagung blickt die folgende Analyse auf die vergangenen Beiträge und untersucht, inwieweit sich Entwicklungen, Konstanten, Muster und Phänomene erkennen und analysieren lassen. Dieser Beitrag soll 1) die angereicherten Datensätze, basierend auf den angenommenen Beiträgen der DHd-Jahrestagungen, vorstellen und kritisch beleuchten. Darüber hinaus sollen die 2) Entwicklung der DHd-Jahrestagungen auf einer strukturellen und inhaltlichen Ebene untersucht und 3) neue Impulse für die konzeptionelle Weiterentwicklung der Tagungen und der Auswertung von Tagungsbeiträgen in den DH gegeben werden.
Der Datensatz zu den DHd-Jahrestagungen
Quelldaten und Provenienz
Seit 2015 gehört das Book of Abstracts mit allen angenommenen Tagungsbeiträgen zu einer zentralen Veröffentlichung der deutschsprachigen DH (Stiegler 2015; Burr, 2017; Stolz 2017; Vogeler 2018; Sahle 2019; Schöch 2020; Geierhos 2022; Busch und Trilcke 2023).2 Im Zuge des Einreichungsprozesses (Helling et al. 2022a) werden seit 2016 durch den DHConvalidator3 TEI-XML-Dateien der Beiträge erzeugt. Darüber hinaus wurden durch den DHd Data Steward seit 2020 alle Konferenzbeiträge auch als einzelne PDF-Publikationen durch einen automatisierten Workflow (Borges et al. 2022) persistent und zitierbar veröffentlicht (Helling et al. 2022b). Insgesamt konnten so 1.207 Konferenzbeiträge sowie 109 Posterpräsentationen der DHd-Jahrestagungen 2014—2023 publiziert werden. Zusätzlich wurden für die Jahrestagungen 2016—2023 die TEI-XML-Dateien sowie ihre Metadaten in GitHub-Repositorien zur Nachnutzung verfügbar gemacht.4 Für die Jahrestagungen 2014 und 2015 stehen die veröffentlichten PDF-Dateien und die Metadaten zur Verfügung.
Erstellung und Anreicherung
Auf der Basis von ConfTool-Daten wurden zu einigen DHd-Jahrestagungen bereits Analysen durchgeführt, um ein inhaltliches und strukturelles Bild der jeweiligen Tagung zu zeichnen (siehe bspw. Calvo Tello 2016; Henny-Krahmer und Sahle 2018; Kiefer 2019; Hoenen 2019). Einige experimentelle und exemplarische Ansätze haben zusätzlich die Potentiale und Herausforderungen einer Anreicherung aller Beitragsdaten zur quantitativen Analyse gezeigt (Andorfer et al. 2020; Andorfer et al. 2021; Busch et al. 2022). Die Qualität der Metadaten in den GitHub-Repositorien ist trotz der bereits erfolgten Vereinheitlichungen noch nicht für alle Analysen ausreichend. In einem iterativen Prozess, der sowohl automatische Verfahren (String-Similarities, Geonames5 -Abfragen) als auch manuelle Bearbeitungen mittels OpenRefine6 enthält, konnten im Rahmen dieses Analysevorhabens die verzeichneten Namen der Autor:innen verbessert (5,9 % waren fehlerhaft) und alle Affiliationen auf Städte und Länder, wo vorhanden auch auf eine (übergeordnete) ROR-ID,7 abgebildet werden. Außerdem wurden alle Tagungsbeiträge 2014—2023 als plain text extrahiert und via GitHub veröffentlicht.8 Auf diese Weise konnte eine Datenbasis generiert werden, um die DH-Landschaft anhand der DHd-Jahrestagungen über die Zeit hinweg auf struktureller und inhaltlicher Ebene zu analysieren.9
Analyse der Konferenzbeiträge
Strukturelle Entwicklungen
Anzahl der Beiträge und Formate
Die Beiträge werden in den Formaten Vortrag, Workshop, Panel (ehemals Sektionen), Poster und (seit 2020) Doctoral Consortium präsentiert. Die Anzahl der Beiträge pro Tagung beträgt im Durchschnitt 134 und der Anteil der Beitragsformate bleibt über die Zeit relativ konstant (siehe Abb. 1).
Kollaborative Autor:innenschaft
Die DH definieren sich als interdisziplinäre und kollaborativ forschende Community, was sich u. a. in der Multiautor:innenschaft der Veröffentlichungen widerspiegeln sollte, aber weder in peer-reviewed Zeitschriftenartikeln (Nyhan und Duke-Williams 2014) noch in den Konferenzbeiträgen (Weingart 2015) der Fall ist. Auf den DHd-Jahrestagungen sind Einzelbeiträge jedoch seit Beginn seltener als im internationalen Vergleich und stetig rückläufig. Duos und Kleingruppen (3—5 Personen) präsentieren konstant die Mehrzahl der Beiträge. Große Gruppen (>5 Personen) sind seit 2016 mindestens in zweistelliger Zahl vertreten, bilden die zuletzt am stärksten wachsende Kooperationsform und übersteigen damit Einzelbeiträge und Duos (siehe Abb. 2).
Das Beitragsformat hat dabei zwar Auswirkungen auf die Anzahl der Autor:innenschaft, allerdings sind die unterschiedlichen Verteilungen hier vor allem der Präsentationsform geschuldet – so setzen etwa Panel und Workshop oft mehrere Beteiligte voraus. Es lassen sich keine Entwicklungen oder Muster über die Jahre verzeichnen (siehe Abb. 3).
An der Zusammenarbeit in Teams lassen sich neben der interdisziplinären und kooperativen Ausrichtung auch strukturelle Merkmale bei der institutionellen Verortung der DH finden. So sind institutionsübergreifende Teams bei Kleingruppen die Regel (95 %), während Duos häufiger aus einer Einrichtung kommen (38 % institutionsübergreifend). Großgruppen sind bereits größenbedingt eher auf mehrere Institutionen verteilt (78 %), jedoch lässt sich ein stabiler Anteil an institutionellen Großgruppen (z. B. Abteilungen und Zentren) verzeichnen.
Länder und länderübergreifende Kooperationen
Die meisten Einreichungen zu den Tagungen stammen aus Institutionen in Deutschland,
gefolgt von Österreich. Aus der Schweiz stammen mit Ausnahme von 2017, als die Tagung
in Bern stattfand, weniger Beiträge. Die Zahl der Kooperationen bei Beiträgen zwischen
Autor:innen aus DACH-Ländern und weiteren Ländern steigt im Laufe der Tagungen geringfügig,
bleibt jedoch immer unter einem Anteil von 10 %. Beiträge, die ausschließlich aus
Ländern außerhalb des DACH-Raums stammen, nehmen einen sehr geringen Anteil ein (siehe
Abb. 4). Ein ähnliches Bild ergibt die Auswertung der Autor:innen-Gesamtanzahl (siehe
Abb. 5).
Offenheit und Community
Offenheit und Kollegialität bilden zwei zentrale Werte der DH (Spiro 2012). Zwar können Beitragsstatistiken nur wenig über die gelebte Praxis dieser Werte auf den Tagungen aussagen, jedoch sollte das Verhältnis von Personen, die erstmals auf einer DHd einen Beitrag vorstellen und den Personen, die bereits schon einmal präsentiert haben, die Zusammensetzung der Tagung charakterisieren können. Nach der Aufbauphase präsentieren auf den DHd-Jahrestagungen konstant sowohl neue als auch wiederkehrende Autor:innen (siehe Abb. 6).
Geschlechterverhältnisse und Gleichstellung
Die Repräsentation der Diversität der DH-Community auf den Tagungen hat sich in der Vergangenheit bei Untersuchungen als problematisch herausgestellt, insbesondere waren bei den Beiträgen früher weibliche Autor:innen unterrepräsentiert (Weingart und Eichmann-Kalwara 2017). Um die Beiträge zu den DHd-Tagungen unter diesem Aspekt untersuchen zu können, wurden die Vornamen der Autor:innen auf Basis der genderize.io API10 hinsichtlich eines weiblichen oder männlichen Geschlechts vorhergesagt.11
Die Analyse der DHd-Daten zeigt für die ersten Jahre ein ähnliches Bild, das auch bei den internationalen ADHO-Konferenzen 2004—2013 zu sehen ist (siehe Abb. 7): Der Anteil weiblich erkannter Autor:innen verläuft bis 2019 um 30 %. Erst in den Jahren 2020—2023 steigt dieser Anteil bis 44 %. Die Lücke in der Beteiligung an den Beiträgen insgesamt (2014: 86 % männl. 47 % weibl.) verringert sich kontinuierlich und schließt sich 2023, wobei der kontinuierlich steigende Anteil an Einzelbeiträgen weiblich erkannter Personen seit 2020 hervortritt. Damit lässt sich zwar insgesamt eine Entwicklung hin zu einer verbesserten Repräsentation von weiblich gelesenen Personen ablesen, allerdings kann diese Entwicklung noch nicht als verlässlich hin zu einer Gleichstellung eingestuft werden.
Inhaltliche Entwicklungen
Um zu untersuchen, wie sich die DHd-Tagungsbeiträge über die Zeit inhaltlich entwickelt haben, wurden Topic-Modelle für alle Beiträge erstellt. Insgesamt wurden 1.196 Abstracts aus den Jahren 2014—2023 untersucht. Für die Auswertung wurde ein Modell mit 40 Topics ausgewählt.12 Es gibt einige allgemeine Topics zu DH, die im Korpus auch stark vertreten sind (z. B. T15), methodenspezifische Topics (z. B. T6), Topics zu untersuchten Gegenständen (wie T26) und auch auf die Beiträge bezogene Topics (etwa T11, siehe Abb. 8).
Im Folgenden wird die Entwicklung von Gruppen von Topics über die Jahre in den Blick genommen. Werden bestimmte Methoden über die Zeit unterschiedlich stark eingesetzt und folgt diese Entwicklung allgemeinen technologischen Trends? Welche Gegenstände standen wann im Vordergrund? Abb. 9 zeigt die Entwicklung mehrerer ausgewählter Methoden-Topics über die Jahre.13
Topics, die 2014 vergleichsweise hohe Wahrscheinlichkeiten hatten, sind z. B. “digitale Editionen/XML/TEI” (T29) und “Virtual Reality & Rekonstruktion” (T8). Beide zeigen leicht abnehmende Verläufe; das Editions-Topic bleibt aber auch 2023 eines der stärksten Methoden-Topics in der gezeigten Auswahl. Das “Stilometrie”-Topic (T16) erreichte den Höhepunkt 2018 und ist seitdem rückläufig. “Topic Modeling” selbst (T12) hält sich seit 2015 im unteren Mittelfeld relativ stabil. “Visualisierung” (T19) ist seit 2017 auf einem relativ hohen Niveau. Aufschwünge sind außerdem bei den Topics “Word Embeddings & Machine Learning” (T39) und “Sentiment Analysis” (T9) zu erkennen. Das Topic “OCR & Texterkennung” (T6) nahm bis 2019 zu und ging 2023 zurück. Der Verlauf der ausgewählten Methoden-Topics über die Jahre zeigt, dass es für einzelne Methoden verschiedene Trends und im Vergleich zu 2014 insgesamt eine ausgewogenere Methodenvielfalt als vorher gibt. Abb. 10 zeigt eine Auswahl von Topics zu Forschungsgegenständen.
Eine Zunahme über die Jahre ist beim Topic “Sammlungen, Objekte, Museum” (T10) zu erkennen, vor allem im Jahr 2023. Tendenziell abnehmend sind die Topics zu “mittelalterlichen Handschriften” (T20), “Sprachressourcen und Korpora” (T7) und “Zeitungen und Zeitschriften” (T2). “Literatur” (T26) als Gegenstand ist nach 2014 wichtiger geworden und entwickelt sich stabil. Für “Video und Film” (T27) und “Bilder” (T35) gab es 2019 Höhepunkte. Dies hängt vermutlich mit dem Thema der DHd-Tagung 2019 zusammen (“multimedial & multimodal”), was klar zeigt, dass die Wahl der Konferenzthemen auch die Forschung bzw. ihre Präsentation auf der Tagung beeinflusst. Das Thema “Musik” (T0) war besonders 2015 und 2020 präsent. 2020 fand die DHd-Tagung in Paderborn statt, wo u. a. das Zentrum “Musik - Edition - Medien” beheimatet ist. Demnach kann auch der Ort der jeweiligen Konferenz Einfluss auf die Themen haben.
In einem letzten Schritt haben wir mit der Operationalisierung einen häufig genannten und grundlegenden Tätigkeitsbereich in DH-Arbeiten (vgl. Pichler und Reiter 2022) in den Blick genommen (siehe Abb. 11). Eine ähnliche Analyse (mit deutlich mehr Fundstellen) wäre etwa zu den Begriffen der Modellierung oder Implementierung denkbar. In allen untersuchten Jahrgängen taucht der Begriff in verschiedenen sprachlichen Formen auf, häufig als Verb oder Nomen. Im Jahr 2020 steigt die Zahl der Vorkommen sprunghaft an und hält sich seitdem auf einem ähnlichen Niveau.14 Unser Interesse galt in diesem Zusammenhang auch der Frage, was eigentlich operationalisiert wird. Dabei konnten sechs große Kategorien identifiziert werden: Neben Konzepten sind dies Fragestellungen, Phänomene, Begriffe und Kategorien.15 Eine gewisse Menge an Vorkommen taucht ohne semantisches Argument auf, insbesondere wenn sich Beiträge mit theoretischen oder praktischen Folgen und Voraussetzungen von Operationalisierung befassen. Auffallend ist, dass diese Befassung mit ‘Operationalisierung als solcher’ erst ab 2020 in substanziellem Ausmaß stattfindet.
Als ein zentraler Output des Beitrags wurde schließlich mit dem webbasierten Visualisierungsframework Keshif (Yalçın et al. 2016) eine interaktive Visualisierung16 der aufbereiteten Metadaten erstellt (siehe Abb. 12), die zur Exploration zur Verfügung steht.17
Fazit
Die Anreicherung und Verwendung der Datensätze demonstrieren, dass die Beiträge der DHd-Jahrestagungen inzwischen quantitativ und qualitativ ein geeignetes Korpus zur Untersuchung struktureller und inhaltlicher Entwicklungen in den DH bilden. Dabei zeigt der Ausschnitt auf die zehn Jahre auch, dass “Trends” zwar erst über längere Zeiträume sichtbar werden können, aber einzelne Phänomene und Ansätze von Entwicklungen, die es zu beobachten oder näher zu betrachten gilt, auch kurzfristig identifizierbar werden. Der Ansatz, möglichst viele inhaltliche Attribute der Beiträge mit strukturellen und organisationsbezogenen Aspekten zu kombinieren, lässt die verschiedenen Einflussfaktoren für inhaltliche wie auch strukturelle Entwicklungen hervortreten. Damit können die Beitragsdaten Grundlage vielfältiger Untersuchungen werden, etwa für ein kontinuierliches Monitoring zu ausgewogener Repräsentation auf den Jahrestagungen im DHd-Verband oder für die wissenschaftsgeschichtliche und selbstreflexive Auseinandersetzung mit den Beitragsthemen in der DH-Community und nicht zuletzt auch für die weiterhin notwendigen Anstrengungen zur Normalisierung und Verbesserung der Datenqualität des stets wachsenden und reicher werdenden Datenbestandes.
Die in diesem Beitrag vorgestellten Ergebnisse sollen in einem Vortrag auf der DHd-Jahrestagung 2024 detaillierter besprochen und durch weitere Ergebnisse vervollständigt werden, um ein umfassendes Bild der DHd-Jahrestagungen zu zeichnen und gleichzeitig für eine datenzentriertere Perspektive auf DHd-Tagungsbeiträge zu argumentieren.
Fußnoten
Bibliographie
- Andorfer, Peter. 2019. dhd-boas-app. https://dhd-boas-app.acdh-dev.oeaw.ac.at/.
- Andorfer, Peter, Anna Busch, Fabian Cremer, Nickoal Eichmann-Kalwara, Patrick Helling, Andreas Henrich, Matthew Lincoln, u. a. 2021. „Die DHd-Abstracts im Zukunftslabor“. In vDHd21 - Experimente. Zenodo. https://doi.org/10.5281/ZENODO.4723039.
- Andorfer, Peter, Fabian Cremer, und Timo Steyer. 2020. „Abstract Enhancement. Potentiale der DHd-Konferenzabstracts als Daten/Publikation“. In DHd 2020: Spielräume: Digital Humanities zwischen Modellierung und Interpretation. Zenodo. https://doi.org/10.5281/ZENODO.4621705.
- Borges, Rebekka, Anke Debbeler, und Patrick Helling. 2022. „Der DHd Data Steward - Maßnahmen zur Entwicklung einer nachhaltigen Datenstrategie für die Digital Humanities im deutschsprachigen Raum“. In DHd 2022: Kulturen des digitalen Gedächtnisses. Zenodo. https://doi.org/10.5281/ZENODO.6322482.
- Burr, Elisabeth, Hrsg. 2017. DHd 2016: Modellierung - Vernetzung - Visualisierung. Die Digital Humanities als fächerübergreifendes Forschungsparadigma (Version 2. überarbeitete und erweiterte Ausgabe). Zenodo. https://doi.org/10.5281/ZENODO.3679331.
- Busch, Anna, Fabian Cremer, Harald Lordick, Dennis Mischke, und Timo Steyer. 2022. „Strukturen und Impulse zur Weiterentwicklung der DHd-Abstracts“. In DHd 2022: Kulturen des digitalen Gedächtnisses. Zenodo. https://doi.org/10.5281/ZENODO.6328088.
- Busch, Anna, und Peer Trilcke, Hrsg. 2023. DHd 2023: Open Humanities, Open Culture. Zenodo. https://doi.org/10.5281/ZENODO.7688632.
- Gao, Jin, Julianne Nyhan, Oliver Duke-Williams, und Simon Mahony. 2022. „Gender Influences in Digital Humanities Co-Authorship Networks“. Journal of Documentation 78 (7): 327–50. https://doi.org/10.1108/JD-11-2021-0221.
- Geierhos, Michaela, Hrsg. 2022. DHd 2022: Kulturen des digitalen Gedächtnisses. Zenodo. https://doi.org/10.5281/ZENODO.6304590.
- Helling, Patrick, Rebekka Borges, Ingo Börner, Anna Busch, Fabian Cremer, Anke Debbeler, Henning Gebhard, Harald Lordick, und Timo Steyer. 2022a. „Der DHd-Verband und seine Abstracts – Betrachtungen des Einreichungsprozesses zu den DHd-Jahrestagungen“. DHd-Blog. 21. November 2022. https://dhd-blog.org/?p=18599.
- Helling, Patrick, Anke Debbeler, und Rebekka Borges. 2022b. „Konferenzbeiträge strategisch publizieren“. o-bib. Das offene Bibliotheksjournal / Herausgeber VDB, August, 1-17 Seiten. https://doi.org/10.5282/O-BIB/5835.
- Henny-Krahmer, Ulrike, und Patrick Sahle. 2019. „Einreichungen zur DHd 2018“. DHd-Blog. 29. März 2019. https://dhd-blog.org/?p=9001.
- Hoenen, Armin. 2019. „Einreichungen zur DHd 2019 II“. DHd-Blog. 29. März 2019. https://dhd-blog.org/?p=11418.
- Keyes, Os. 2018. „The Misgendering Machines: Trans/HCI Implications of Automatic Gender Recognition“. Proceedings of the ACM on Human-Computer Interaction 2 (CSCW): 1–22. https://doi.org/10.1145/3274357.
- Kiefer, Katharina. 2019. „Einreichungen zur DHd 2019“. DHd-Blog. 29. März 2019. https://dhd-blog.org/?p=11358.
- Nyhan, Julianne, und Oliver Duke-Williams. 2014. „Joint and Multi-Authored Publication Patterns in the Digital Humanities“. Literary and Linguistic Computing 29 (3): 387–99. https://doi.org/10.1093/llc/fqu018.
- Pichler, Axel, und Nils Reiter. 2022. „Form Concepts to Texts and Back: Operationalization as a Core Activity of Digital Humanities”. Journal of Cultural Analytics, 7(4). https://doi.org/10.22148/001c.57195.
- Posner, Miriam. 2017. „Derive gender from a column of first names “. Introduction to Digital Humanities. 2017. http://miriamposner.com/classes/dh101f17/tutorials-guides/data-manipulation/derive-gender-from-a-column-of-first-names/.
- Sahle, Patrick, Hrsg. 2019. DHd 2019: Digital Humanities: multimedial & multimodal. Zenodo. https://doi.org/10.5281/ZENODO.2596095.
- Schöch, Christof, Hrsg. 2020. DHd 2020: Spielräume: Digital Humanities zwischen Modellierung und Interpretation. Zenodo. https://doi.org/10.5281/ZENODO.3666690.
- Spiro, Lisa. 2012. „‘This Is Why We Fight’: Defining the Values of the Digital Humanities“. In Debates in the Digital Humanities, herausgegeben von Matthew K. Gold, 16–35. University of Minnesota Press. https://doi.org/10.5749/minnesota/9780816677948.003.0003.
- Stiegler, Johannes, Hrsg. 2015. DHd 2015: Von Daten zu Erkenntnissen. Digitale Geisteswissenschaften als Mittler zwischen Information und Interpretation. Zenodo. https://doi.org/10.5281/ZENODO.3684490.
- Stolz, Michael. 2017. DHd 2017: Digitale Nachhaltigkeit. Zenodo. https://doi.org/10.5281/ZENODO.3684825.
- Tello, José Calvo. 2016. „DHd 2016: countries, cities and institutions of the speakers“. CLIGS. 11. März 2016. https://cligs.hypotheses.org/431.
- Vogeler, Georg, Hrsg. 2018. DHd 2018: Kritik der digitalen Vernunft. Zenodo. https://doi.org/10.5281/ZENODO.3684897.
- Weingart, Scott. 2015. „Submissions to DH2016 (Pt. 1)“. The Scottbot Irregular. 7. Dezember 2015. http://www.scottbot.net/HIAL/?p=41533.
- Weingart, Scott B., und Nickoal Eichmann-Kalwara. 2017. „What’s Under the Big Tent?: A Study of ADHO Conference Abstracts“. Digital Studies/Le Champ Numérique 7 (1): 6. https://doi.org/10.16995/dscn.284.
- Yalçın, Mehmet Adil, Niklas Elmqvist, und Benjamin B. Bederson. 2016. „Keshif: Out-of-the-box visual and interactive data exploration environment“. In Proc. of IEEE VIS 2016 Workshop on Visualization in Practice: Open Source Visualization and Visual Analytics Software.