Work(s) in progress – Datenmodellierung zum Kulturerbe Tanz in der DDR als Prozess
https://zenodo.org/records/14943024
Das Tanzarchiv Leipzig und seine Erschließung
Die 2022 in die UNESCO-Liste des immateriellen Kulturerbes aufgenommene Praxis des modernen Tanzes hat in Ostdeutschland eine einzigartige Tradition. Diese führt von der Bildungsanstalt für rhythmische Gymnastik in Hellerau/Dresden über die Tanzschulen von Mary Wigman und Gret Palucca, die Tanzinstitutionen in der NS-Zeit und die zur BRD parallele Entwicklung von Tanz in der DDR bis in die Gegenwart mit einer Vielzahl diverser Tanzkulturen. Die Sammlungsbestände des Tanzarchivs Leipzig, als ehemaligem Tanzarchiv der DDR, sowie weiterer Tanzarchive und Sammlungen in Deutschland, bieten ein breites Spektrum an Quellen, um die Auswirkungen von politischen, kulturellen und medientechnischen Entwicklungen auf den Tanz im 20. Jahrhundert genauer zu untersuchen. Eine systematische Auswertung der vorhandenen Quellen, vor allem im Kontext des Tanzes in der DDR, fehlt aber bisher noch.
Voraussetzung für eine solche systematische wie produktive Auswertung ist einerseits eine strukturierte Erfassung der Metadaten, die bisher nur sehr rudimentär erfolgte, und andererseits eine Klärung dessen, wie sich das immaterielle Kulturerbe des Tanzes in der DDR aus diesen Spuren vergangener tänzerischer Praxis konstituiert und deut- sowie sichtbar machen lässt.
Das hier vorgestellte, in Kooperation zwischen der Sächsischen Akademie der Wissenschaften und der Universität Leipzig durchgeführte Forschungsprojekt, versucht, anhand ausgewählter Inszenierungen modellhaft beides zu leisten. Im Zentrum des von August 2023 bis März 2026 geförderten Vorhabens steht dabei die Erarbeitung eines ereignisbasierten Datenmodells, das sowohl tänzerisches Schaffen, Verknüpfungen zwischen Institutionen und Personen, zeitgeschichtliche Entwicklungen als auch die Vielfalt der Bestände des Tanzarchivs adäquat abbilden kann. Datenmodellierung meint hier den Prozess, einen bestimmten Ausschnitt der Wirklichkeit rechnergestützt verarbeitbar zu machen. (vgl. Flanders/Jannidis 2015) Dieser Beitrag soll nach einer kurzen Einführung in den Forschungsgegenstand (Abschnitt 2) die spezifischen Problematiken und daraus resultierende Leitlinien für den Modellierungsprozess (Abschnitt 3) und unsere Lösungsansätze sowie Ausschnitte des Modells beschreiben (Abschnitt 4). Abschließend geben wir einen Einblick in die technische Implementierung der Datenbank (Abschnitt 5) sowie einen Ausblick auf die in der weiteren Projektlaufzeit anstehenden Aufgaben (Abschnitt 6). Wir stellen hier in erster Linie einen Modellierungs prozess und ein Modell “under construction” vor.
Das Tanzarchiv Leipzig und seine Bedeutung für das Kulturerbe Tanz in der DDR
In vielerlei Hinsicht ist bereits der Forschungsgegenstand unseres Projektes - “Kulturerbe Tanz in der DDR” – nur schwer zu erfassen. Anders als andere Kunstformen realisiert sich Tanz im Moment seiner Aufführung und ist danach nur noch fragmentarisch in Form der hinterlassenen Spuren nachvollziehbar, seien es audiovisuelle Aufzeichnungen, Dokumente oder die Erinnerungen der Teilnehmenden. Als noch komplexer erweist sich die Fassung des Kulturerbes Tanz in seiner Gesamtheit. Als symbolische Kommunikation durch eine allgemein verständliche und emotionale „Sprache“ der Bewegung ist gerade der Tanz zugleich offen für Vereinnahmungen und ideologische Besetzungen. Tanzgeschichtsschreibung diente auch immer der Identitätsbildung des jeweiligen politischen Systems (vgl. Primavesi 2021, Giersdorf 2014). So prägte die Kulturpolitik in der DDR nicht nur die tänzerische Praxis, sondern interpretierte jeweils auch die Tanzgeschichte gemäß ihren ideologischen Vorgaben, z.B. mit der Aufwertung des „Volkstanzes“ zum Symbol nationalistischer Kulturtradition. Die jeweilige Neuinterpretation der Tanzgeschichte hat zu einem komplexen Gefüge von einander widersprechenden Narrativen geführt, die im kulturellen Gedächtnis bis heute nachwirken und kritisch zu überprüfen sind.
Eine Bewahrung und methodisch reflektierte Einordnung dieses Erbes erfordert gerade im Kontext einer zunehmend digitalen Erinnerungskultur (Widmer/Kleesattel 2018, Bösch 2010, Meyer 2009) sowohl die digitale Erfassung und Vernetzung der Quellen als auch ihre Kontextualisierung. Ersteres versuchen wir durch die systematische Erfassung und Auswertung von Materialien des Tanzarchivs Leipzig in einer digitalen Wissensplattform zu bewerkstelligen, Zweiteres durch die Durchführung von Zeitzeug:innen-Interviews. Die in den Sammlungen des Tanzarchivs Leipzig an der Universitätsbibliothek Leipzig (UBL) verfügbaren Quellen umfassen Schriftdokumente (Berichte, Briefe, Urkunden, Programmhefte und Verwaltungsakten) wie auch Fotos, Plakate und Filme. Diese offiziellen Quellen werden mit dem Erfahrungswissen von Zeizteug:innen angereichert, das auch zur Überprüfung und Korrektur offizieller, von der Staatsideologie geprägter Narrative genutzt werden kann (vgl. Normann 2012, Fulbrook 2011, Wolle 2011/1999, Walsdorf 2010).
Anforderungen für ein Datenmodell
In Anbetracht der Vielschichtigkeit der Datenmodellierung in den Digital Humanities wollen wir uns in diesem Beitrag vor allem mit unserer konzeptuellen Modellierung, von Flanders und Jannidis definiert als “the identification and description of the entities and their relationship in the ‘ universe of discourse’ (i.e. that part of the world a modeler is modeling) ” (Flanders/Jannidis 2015, S.3) beschäftigen. Um unserem Forschungsgegenstand gerecht werden zu können, ist unser Modell an einer Reihe von Leitlinien orientiert.
Ereignisbasiertes Datenmodell
Tanz als ephemere Praxis realisiert sich in Ereignissen wie Proben oder Aufführungen. Das Werk selbst lässt sich auf Datenebene schwer darstellen; zum Beispiel sind Choreografien eben nicht festgeschrieben wie ein Libretto oder eine Partitur. Wie erfasst man also digital etwas, das nicht nur „Übersetzung“ ist? Bisherige Datenbanken wie die des Pina-Bausch-Archivs (vgl. Thull 2015) oder der Inszenierungsdatensatz der GND sind oft werkbasiert, erfassen also das Werk als “an sich” existierende Entität. Wir wollen tänzerische Praxis dagegen ereignisbasiert erfassen, also immer verknüpft mit tatsächlich stattfindenden Ereignissen, wie einer Premiere, weiteren Aufführungen und Proben. Dies soll dem Umstand Rechnung tragen, dass Werke nur durch Momente ihrer physischen Umsetzung existieren. Zudem können so Veränderungen und Entwicklungen über verschiedene Aufführungen hinweg in den Blick genommen werden. Das Werk existiert also ontologisch nicht als starre Einheit, sondern nur in varriierenden Formen seiner Umsetzung.
Adäquate Repräsentation des Werkbegriffs in den Tanzwissenschaften
Mit dem Erstellen eines ereignisbasierten Datenmodells geht zugleich die Schwierigkeit einer angemessenen Erfassung des tänzerischen Werks einher. Einzelne Ereignisse sind nicht identisch zueinander, auch wenn sie Aufführungen der gleichen Choreographie sind, stellen aber dennoch jeweils Realisierungen eines verbindenen künstlerischen Konzepts dar. In den Archivwissenschaften etablierte und von Normdatenquellen wie der DNB verwendete Modellierungen wie FRBR (vgl. Arbeitsstelle für Standardisierung 2006) erweisen sich als schwierig auf diese Umstände zu übertragen, müssen aber gleichzeitig als etablierte Standards im Hintergrund mitgedacht werden,
Klare Darstellung von Provenienzen und Quellennachweisen
Die Herkunft von Informationen muss klar und deutlich ersichtlich sein, der entstehende Wissensgraph deshalb eng mit den Archivmaterialien verknüpft sein und im Idealfall zu jeder Information eine direkte Betrachtung der ursprünglichen Quelle ermöglichen.
Verbesserte Verknüpfung mit Normdatensätzen
Der Werknormdatensatz in der GND weißt, wie in Punkt 2 bereits angesprochen, im Hinblick auf tänzerisches Schaffen verschiedene Probleme auf, für die noch Lösungen gefunden werden müssen. Wenige Werke sind überhaupt in den Datenbeständen zu finden, verschiedene Inszenierungen eines Stoffes zwar manchmal getrennt erfasst, aber teils ohne konkretes Premierendatum, was eine eindeutige Zuordnung schwierig macht. Besonders für Personen, Orte und Körperschaften ist eine umfassende Verknüpfung mit Normdatensätzen dagegen gut möglich.
Entwicklung auf Basis des Quellenmaterials
Unser Datenmodell soll die Bestände des Tanzarchiv Leipzig in all seinem Reichtum abbilden. Ziel des Modells ist es, eine tiefgreifende Analyse zu unterstützen und möglichst viele der in den Quellen vorhandenen Informationen darstellen zu können. Wir wollen deshalb dem Material kein Modell überstülpen sondern dieses anhand des Materials erweitern und ergänzen, um möglichst wenig Komplexität zu verlieren
Einfache Dateneingabe
Die im Archiv erfassten Inhalte sind vielfältig und komplex. Umso wichtiger ist eine klare Struktur bei der Dateneingabe, die möglichst wenig Ambiguität oder Doppelstrukturen zulässt und Fehlerquellen bei der Eingabe minimiert.
Lösungsansätze und technische Umsetzung
Die Vielzahl von Datenmodellen in den Performing Arts wirft auch vor dem Hintergrund der beschriebenen Herausforderungen die Frage auf, ob die Verwendung eines bereits existierende Datenmodells in unserem Projekt ein Schritt hin zu mehr Einheitlichkeit, Verknüpfbarkeit und der Etablierung gemeinsamer Standards sein könnte. Vielversprechende Beispiele für ereignisbasierte Datenmodellierung sind in den letzten Jahren immer wieder in der DH-Community vorgestellt worden (vgl. Tietz/Sack 2024) und haben unsere Überlegungen für ein eigenes Datenmodell beeinflusst. Wir sind dennoch der Meinung, dass die spezifischen Anforderungen unseres Materials durch kein existierendes Modell tatsächlich ausreichend abgedeckt werden können. Dies meint konkret die verschränkte Modellierung von Tanzereignissen mit Archivbeständen, Zeitzeug:inneninterviews und sonstigen Quellen, das ontologische Verständnis von tänzerischem Werk als Realisierung in Aufführungspraxis, das über einzelne Aufführungsereignisse hinweg aber Kontinuitäten aufweist, sowie ein hohes Maß an Detailliertheit beim Erfassen der Quellen. All diese Aspekte sind für uns unerlässlich, um sich unserem Forschungsgegenstand zu nähern.
Erfasst werden von uns nun Körperschaften, Orte, Personen sowie ihre Beziehungen zu Inszenierungen, Ereignissen, Werken und Rollen. Verknüpft sind diese mit Quellenobjekten und den Beständen, denen diese Quellen entnommen wurden. Zu all diesen Entitätstypen können diverse Eigenschaften und Relationen erfasst werden, die alle im Detail darzustellen den Rahmen und Zweck dieses Beitrags übersteigen würde. Wir wollen deshalb im Folgenden in unseren Augen besonders relevante Spezifika des Modells herausgreifen.
Inszenierung und Ereignis
Ereignisse werden prinzipiell als Realisierung einer getrennt davon erfassten Inszenierung verstanden. Aus dieser Inszenierung können zahlreiche Informationen für alle erfassten Ereignisse abgeleitet werden, etwa beteiligte Personen und Körperschaften. Abweichungen von diesen bei einzelnen Ereignissen, etwa wegen Krankheit einspringende Ersatz-Besetzungen, können in den Einzelereignissen erfasst werden, ohne dass für jedes Ereignis die Eingabe einer vollständigen Besetzungsliste erforderlich wäre.
Inszenierung und Werkbeziehungen
Unser Datenmodell erfasst Inszenierungen und sonstige (literarische, musikalische) Werke getrennt voneinander. Dies bildet vor allem unser fokussiertes Interesse an tänzerischem Schaffen innerhalb unseres Untersuchungsfeldes ab, während in einem breiteren Kontext beide Klassen als Instanzen von künstlerischen Werken verstanden werden müssten.
Verknüpfung mit Wikdata und GND
Für Orte, Personen und Körperschaften ist, wenn möglich, eine Verknüpfung mit den Normdatensätzen von GND und Wikidata vorgesehen, um die Interoperabilität des Datensatzes zu verbessern und weitere Informationsquellen anzubinden. Über diese sind dann Informationen recherchierbar, die unter Umständen nicht Teil unseres eigenen Datensatzes sind.
Konstruktion von “Fakten” als zentrale Elemente des Datenmodells
Die meisten Informationen innerhalb unseres Wissensgraphen werden als sogenannte “Fakten” modelliert. Innerhalb der Datenbank sind dies eigene Datenobjekte, die aber jeweils nicht für sich alleine stehen können, sondern Teil einer Entität sind, zu der dieser “Fakt” erfasst wurde. Fakten sind kombinierte Datentypen, die jeweils noch einen Quellennachweis enthalten, also auch noch mit dem Objekt verknüpft sind, dem sie entnnommen wurden. Des Weiteren können inhaltliche Beziehungen zwischen Fakten modelliert werden, die sich ergänzen, widerlegen oder widersprechen können und so auch die Erfassung uneindeutiger oder unklarer Sachverhalte ermöglichen.
Verwendung von kontrollierten Vokabularen zur Reduzierung der Zahl von Properties
Wir haben uns gegen die Einführung spezifischer Properties wie “Komponist” oder “Choreograph” zum Ausdrücken der verschiedenen Arten von Beteiligung an Inszenierungen entschieden. Wikidata beispielsweise führt für die wichtigsten Arten an Beteiligungen jeweils eigene Properties ein. Die Vielzahl möglicher Beteiligungsformen an Inszenierungen hat uns dazu gebracht, stattdessen kontrollierte Vokabulare zu verwenden, die diese Beteiligungsformen abbilden, gleichzeitig aber erweiterbar sind und die Ergänzung neuer Funktionen erlauben ohne Änderungen am Datenmodell und die Einführung neuer Properties zu erfordern. Dies ist auch ein Versuch, das Datenmodell möglichst schlank zu halten ohne dabei Komplexität einzubüßen und wird von uns in ähnlicher Weise zum Beispiel bei Beziehungen zwischen Personen, Beziehungen zwischen Werken oder Beiträgen auf der Bühne umgesetzt.
Verwaltung von Wissensbasis und Quellen/Digitalisaten in gleicher Datenbank
Quellen sowie deren digitale Repräsentationen sind Teil des Wissensgraphen. Einerseits können so alle Faktentypen direkt mit der Quelle verbunden werden, aus denen die in ihnen repräsentierte Information stammt. Andererseits wird mit einem Klick bei jedem Quellenobjekt sichtbar, welche Informationen ihm entnommen und welche Personen, Körperschaften und Orte mit ihm verknüpft sind.
Implementierung der Datenbank und User Interface
Für die technische Umsetzung des beschrieben Modells wird das an der Sächsischen Akademie der Wissenschaften bereits etablierte Open-Source Content-Management-System Plone verwendet, dessen Backend eine objektorientierte Datenbank (Zope Object Data Base) benutzt. Diese ermöglicht sehr flexibel Änderungen am Datenmodell im Sinne des beschriebenen Ansatzes der Modellierung am Material und ermöglicht durch den Verzicht auf ein explizites relationales Datenmodell eine große Nähe beim Übergang von der konzeptuellen zur logischen Modellierung.
Über das web-basierte User-Interface der Datenbank werden verschiedene Views angeboten, die auch Formulare zur Dateneingabe beinhalten. Dabei erhält grundsätzlich jede angelegte Entität eine eigene URL (vgl. Abb. 3), über die ihr Eintrag aufgerufen, bearbeitet und mit zusätzlichen Fakten angereichert werden kann.
In den Einträgen für die unterschiedlichen Quellentypen ist auch ein Upload der Digitalisate direkt möglich, sodass im System über Datentypen eine Repräsentation des Quellenreichtums von Plakaten über Briefe, historische Filmaufnahmen oder aktuelle Audio-Mitschnitte von Interviews möglich ist. Diese Quellenobjekte können dann direkt in die Faktenstruktur der Datenbank eingebunden werden, indem sie an entsprechenden Stellen zur Kenntlichmachung der Informations-Provenienz verlinkt werden (vgl. Abb. 5). Zusammen mit anderen Verlinkungen, die Beziehungen, institutionelle Hierarchien oder Beteiligungen an Produktionen abbilden, entsteht so im Hintergrund ein komplexer Wissensgraph.
Fakten können außerdem mit Daten versehen und in Beziehung zueinander gesetzt werden. So lassen sich Widersprüche, Spezifikationen oder Falsifikationen erfassen. Fakten zu einzelnen Objekten werden in deren Ansichts-Views aggregiert und können dann zum Beispiel bei Personen als zeitlich geordneter beruflicher Lebenslauf angezeigt werden (vgl. Abb. 4).
Die Erfassung der Vielzahl komplexer Beziehungen bringt auch Herausforderungen für die Dateneingabe mit sich. Auch wenn das Interface mit seinen Formularen viel Struktur vorgibt, sollten Nutzende gut mit dem Datenmodell vertraut sein um rasch die passenden Stellen zu finden, an denen Informationen eingetragen werden können.
Probleme und Ausblick
Wir hoffen, in unserem Projekt die Grundlage für eine umfassende Forschungsdatenbank zu Tanz in der DDR legen zu können.
Mithilfe des Modells kann etwa systematisch dargestellt werden, wie sich das Repertoire bestimmter Theaterhäuser oder überregional im Laufe der Zeit verändert hat. Genauso können personelle Entwicklungen an bestimmten Häusern nachvollzogen werden, Biographien verfolgt oder synchron wie diachron Inszenierungen bestimmter Stoffe miteinander verglichen werden, wobei durch direkte Quelleneinsicht auch qualitative Vergleiche von Inszenierungstechniken recherchiert werden können. Zu jeder Inszenierung können archivierte Materialien betrachtet oder zu entsprechenden Stellen in den geführten Zeitzeug:innen-Interviews gesprungen werden. Wir erfassen dabei Kulturerbe Tanz als Vielfalt tänzerischer Praktiken von Ballett bis Volkstanz, als Geflecht von persönlichen und institutionellen Beziehungen, Geschichte tänzerischer Produktionen und deren gegenseitige Beeinflussungen sowie individuelles Erfahrungswissen Tanzschaffender.
Perspektivisch ist auch die Erarbeitung einer fixen, RDF-basierten Ontologie vonnöten, auf deren Grundlage ein Datenexport aus der entstehenden Wissensbasis ermöglicht werden könnte. Diese soll in einer späteren Phase des Projektes entstehen, wenn keine Anpassungen am Modell mehr vorgenommen werden müssen. Auch die Bereitstellung von Mappings für andere Datenmodelle ist angedacht.
Eine Veröffentlichung dieser Ontologie unter Beachtung der FAIR-Prinzipien (vgl. Wilkinson et al. 2016) ist angedacht. Was für das Datenmodell möglich ist, stellt uns für die Bereitstellung des Datensets selbst noch vor Herausforderungen. In hohem Maße personenbezogene Informationen und Bildmaterial noch lebender Akteur:innen stellen uns für die Zukunft vor schwierige Fragen bezüglich dessen, wie der Zugang zu diesem möglichst offen, aber auch datenschutz- und urheberrechtskonform geregelt werden kann.
Bibliographie
- Arbeitsstelle für Standardisierung. 2006. “ Funktionelle Anforderungen an Bibliographische Datensätze. Abschlussbericht der IFLA Study Group on the Functional Requirements for Bibliographic Records”. Leipzig/Frankfurt a.M.: Deutsche Nationalbibliothek. (zugegriffen 24.07.2024)
- Bösch, Frank. 2010. “Ereignisse, Performance und Medien in historischer Perspektive“, In Medialisierte Ereignisse hg. von Ders./Patrick Schmidt: 7-29. Frankfurt a.M.: Campus.
- Flanders, Julia und Fotis Jannidis. 2015. “Knowledge Organization and Data Modeling in the Humanities.” (zugegriffen am 22.07.2024)
- Fulbrook, Mary. 2011. “Ein ganz normales Leben. Alltag und Gesellschaft in der DDR”. Darmstadt: WBG.
- Giersdorf, Jens Richard. 2014. “Volkseigene Körper. Ostdeutscher Tanz seit 1945”. Bielefeld: transcript.
- Gruß, Melanie. 2020. „(Re)Produzierte Bewegung. Techniken der Archivierung von Tanz bei Kurt Petermann“, In Technologien des Performativen hg. von Maren Butte, Kathrin Dreckmann und Elfi Vomberg, 115-125. Bielefeld: transcript .
- Meyer, Erik (Hg.). 2020. “Erinnerungskultur 2.0. Kommemorative Kommmunikation in digitalen Medien”. Frankfurt a.M.: Campus.
- Normann, Miriam. 2012. „Kultur als politisches Werkzeug? Das Zentralhaus für Laien- bzw. Volkskunst in Leipzig 1952-1962“, Online Journal für Kultur, Wissenschaft und Politik , Jg. 35, Nr. 15.
- Primavesi, Patrick, Juliane Raschel, Theresa Jacobs und Michael Wehren. 2015. „Körperpolitik in der DDR. Tanzinstitutionen zwischen Eliteförderung, Volkskunst und Massenkultur“. Denkströme. Sächsische Akademie der Wissenschaften , Bd. 14: 9-44.
- Primavesi, Patrick. 2020. „Theaterwissenschaftliche Forschung und die Methoden des Archivs“ In Methoden der Theaterwissenschaft hg. von Christopher Balme und B. Szymanski-Düll, 99-117. Tübingen: Narr Francke Attempto.
- Primavesi, Patrick. 2021. „‘Heute tanzen alle jungen Leute …‘ Spitzentanz, Staatliches Dorfensemble und der Lipsi im Wettstreit der Systeme“, Politik und Kultur 10: 26.
- Thull, Bernhard, Kerstin Diwisch und Vera Marz . 2015. “Linked Data im digitalen Tanzarchiv der Pina Bausch Foundation”. In Corporate Semantic Web hg. Von Börteçin Ege et al., 259-275. Berlin/Heidelberg: Springer .
- Tietz, Tabea und Harald Sack. 2024. “Towards Linked Stage Graph 2.0”. In Book of Abstracts - DHd2024. Digital Humanities im deutschsprachigen Raum 2024 (DHd2024) hg. von Weis, Joelle et al., 265-269. Passau. fügbar: https://doi.org/ 10.5281/zenodo.10686564 (zugegriffen 24.07.2024)
- Walsdorf, Hanna. 2010. “Bewegte Propaganda. Politische Instrumentalisierung von Volkstanz in den deutschen Diktaturen”. Würzburg: Königshausen & Neumann.
- Widmer, Ruedi und Ines Kleesattel (Hg.). 2018. “Scripted Culture. Kulturöffentlichkeit und Digitalisierung”. Zürich: Diaphanes.
- Wilkinson, Mark D., Michel Dumontier, Ijsberg Jan Aalbersberg et al . 2016. “The FAIR Guiding Principles for scientific data management and stewardship”. Sci Data 3, 160018.
- Wolle, Stefan. 1999. “Die heile Welt der Diktatur: Alltag und Herrschaft in der DDR 1971-1989”, Bonn: Bundeszentrale für politische Bildung .
- Wolle, Stefan. 2011. “Aufbruch nach Utopia: Alltag und Herrschaft in der DDR 1961-1971”. Bonn: Bundeszentrale für politische Bildung.