Fluch und Segen der Visualisierung Unterschiedliche Zielfunktionen im Forschungsprozess der historischen Netzwerkanalyse

Balck, Sandra; Menzel, Sina; Petras, Vivien; Schnaitter, Hannes; Zinck, Josefine
https://zenodo.org/records/6328123
Zum TEI/XML Dokument

In einer Interviewstudie mit sieben Forschenden der historischen Netzwerkanalyse (HNA) wurden die wichtigsten Einsatzgebiete von Visualisierungen im Forschungsprozess identifiziert: Theorieentwicklung und Datenexploration, Datenqualitätsüberprüfung, Analyse sowie Präsentation der Ergebnisse. Die Diskussion der Visualisierungen zeigt ein zwiespältiges Verhältnis der Community: sie werden von den Forschenden sehr differenziert betrachtet, sowohl wenn es um den Zeitpunkt ihres Einsatzes im Forschungsprozess geht und wer für die Entwicklung der Visualisierungen zuständig sein sollte, aber auch, ob diese der Präsentation der Forschungsergebnisse in der historischen Forschungscommunity zuträglich sind oder nicht.  Dabei werden zwei Zielfunktionen unterschieden: Visualisierungen für die Exploration bzw. Analyse und erläuternde Visualisierungen. Entscheidend für die Akzeptanz von Visualisierungen ist deren Dokumentation und Kontextualisierung einschließlich der in ihnen enthaltenen Daten, um eine verlässliche Grundlage für die Forschung zu gewährleisten.

Einleitung

Visualisierungen können ein wichtiges Werkzeug in der Analyse von Daten sowie in der Kommunikation von Forschungsergebnissen sein. Einerseits bieten sie die Möglichkeit, schnell einen Überblick über die gesammelten Daten zu erlangen und Fehler oder interessante Fälle zu finden. Sie ermöglichen es den Auswertenden, große Datenmengen ganzheitlich zu betrachten und zu interpretieren. Sie sind aber auch schnell unübersichtlich, ihre Interpretation unterliegt kulturell gelernten Biases und verständliche Visualisierungen sind aufwendig zu erstellen. Diese Dichotomie spiegelt sich auch in der Bewertung von Visualisierungen im Forschungsprozess wider: sie werden in vielen Schritten des Forschungsprozesses genutzt und können dort Mehrwert liefern. Gleichzeitig wird die Nutzung oft als problematisch angesehen und insbesondere die Erstellung guter Visualisierungen oft nicht als eigenständige Forschungsleistung gewürdigt.

In diesem Beitrag berichten wir über die Ergebnisse einer von uns im Rahmen des DFG-Projekts SoNAR (IDH) (siehe Bludau et al. 2020) durchgeführten Interviewstudie mit Forschenden aus der historischen Netzwerkanalyseforschung (HNA). Eine der Leitfragen, welche auf der Zielstellung des Projekts basiert, das Netzwerkvisualisierungen für historische Daten entwickeln soll, ist: welchen Wert haben Visualisierungen als Werkzeug für Analyse und Präsentation von Informationen in der Forschungscommunity der HNA? In der Beschreibung der Interviewstudie und deren Ergebnisse gehen wir besonders auf die Sicht der Forschenden auf Visualisierungen ein, die ein zwiegespaltenes Verhältnis aufzeigt.

Interviewstudie zur Historischen Netzwerkanalyse

Ziel der Interviewstudie war es, Forschungsprozesse und -fragen der Historischen Netzwerkanalyse zu beschreiben und Anforderungen an eine digitale Informationsinfrastruktur zu identifizieren. Dafür wurden Expert:innen zum Vorgehen bei eigenen Forschungsarbeiten im Bereich der HNA in Form qualitativer Leitfadeninterviews befragt.

Es wurden sieben Interviews mit Expert:innen der HNA durchgeführt, davon waren zwei männlich und fünf weiblich. Die Interviewten kamen aus den Bereichen Sozialwissenschaft, Geschichtswissenschaft und Wirtschaftswissenschaft, was die Interdisziplinarität des zu untersuchenden Gebiets untermalt. Die Interviews wurden im Zeitraum Juli-August 2020 durchgeführt und dauerten zwischen 37:08 und 51:28 Minuten. Als Expert:innen gelten Personen, die wissenschaftliche Arbeiten im Bereich HNA vorweisen.

Die Befragungen wurden remote über die Videokonferenzlösung Zoom durchgeführt, mit Einverständnis der Proband:innen aufgezeichnet und anschließend mittels MAXQDA transkribiert und codiert. Es folgte eine thematische Analyse, hierbei gebildete Kategorien dienten als Grundlage für die Auswertung. Insgesamt wurden 126 Kategorien gebildet, die in sechs Oberkategorien zusammengefasst wurden:

  • Community: Disziplinäres Selbstverständnis bezogen auf wissenschaftliche und disziplinäre Infrastrukturen, Wissenschaftskommunikation sowie die Einbindung digitaler Methoden in historische Curricula.
  • Netzwerke: Einschätzungen über die Verbindung der Netzwerkanalyse mit der historischen Forschung im allgemeinen und Definitionsversuche/Einordnungen der HNA durch die Interviewten.
  • Forschungsprozess: Äußerungen zum Vorgehen bei der Bearbeitung eines Forschungsvorhabens mittels historischer Netzwerkanalyse.
  • Werkzeuge: Für die Datenaufbereitung und -speicherung verwendete Software, ihre Vor- und Nachteile sowie Anforderungen an zukünftige Systeme.
  • Datenqualität: Datenqualität ist als besondere Herausforderung der HNA zu verstehen, der Fokus liegt hier auf Anforderungen und Probleme bezogen auf historische Daten.
  • Visualisierung: Bezieht sich auf die Anwendung von Visualisierungen und dem daraus resultierenden Erkenntnisgewinn sowie Kritik und Herausforderungen im Umgang mit historischen Daten.

Die Auswertung der Interviews gibt einen Überblick über exemplarische Forschungsprozesse und deren Aufbereitung in einzelne Teilschritte sowie erste Erkenntnisse zu Anforderungen an Visualisierungen für die HNA in verschiedenen Disziplinen, auf die wir uns im Folgenden besonders fokussieren.

Der Forschungsprozess in der Historischen Netzwerkanalyse

“Die Geschichtswissenschaft beschäftigt sich mit der Analyse des menschlichen Zusammenlebens in der Vergangenheit und bemüht sich, Ereignisse und Entwicklungen aus der jeweiligen Zeit heraus zu verstehen und zu deuten. [...] Historische Akteure werden [...] immer auch als Kontext der sie umgebenden Strukturen betrachtet.“ (Düring 2015: 337). Diese Strukturen manifestieren sich in sozialen Beziehungen. Die ursprünglich aus den Sozialwissenschaften kommende formale Netzwerkanalyse erlaubt es, diese nicht immer offensichtlichen Strukturen zu analysieren, indem sie es ermöglicht, diese “präzise zu beschreiben, zu verstehen, wie sie geschaffen wurden und welche Folgen sie haben.” (Lemercier 2012: 21). Die HNA ist eine Methode, die die Interpretation von historischen Strukturen unterstützt und somit als interdisziplinäres Zusammenspiel von historischer Erzählung und formaler Netzwerkanalyse beschrieben werden kann.

Die HNA setzt sich aus Komponenten der Sozialwissenschaft und Geschichtswissenschaft und damit verbunden den Digital Humanities zusammen. Der Forschungsprozess dieser Disziplinen ähnelt sich in vielen Bereichen. Bhattacherjee (2012: 20) unterteilt den sozialwissenschaftlichen Forschungsprozess in drei Phasen, welche wiederum in neun Unterphasen aufgeteilt werden. Im Vergleich dazu nennen Burghardt et al. (2014: 2) für die Geisteswissenschaften acht Phasen (siehe Tab. 1). Ausgenommen von “Kommunikation und Kollaboration”, was im weitesten Sinne auch unter Theoriebildung gefasst werden kann, sind keine Unterschiede zum sozialwissenschaftlichen Forschungsprozess zu erkennen.

Tab. 1: Modelle des Forschungsprozesses in angrenzenden Disziplinen Bhattacherjee (2012) - Sozialwissenschaften Burghardt et al. (2014) - Geisteswissenschaften exploration research question, literature review, theory research design operationalization, research method, sampling strategy research execution pilot testing, data collection, data analysis + research report Kommunikation und Kollaboration Recherche Konzeptualisierung Datenerhebung Datenaufbereitung Datenauswertung Verschriftlichung Veröffentlichung
Bhattacherjee (2012) - Sozialwissenschaften Burghardt et al. (2014) - Geisteswissenschaften

exploration

  • research question, literature review, theory

research design

  • operationalization, research method, sampling strategy

research execution

  • pilot testing, data collection, data analysis

+ research report

  • Kommunikation und Kollaboration
  • Recherche
  • Konzeptualisierung
  • Datenerhebung
  • Datenaufbereitung
  • Datenauswertung
  • Verschriftlichung
  • Veröffentlichung

Der mittels Aussagen der Proband:innen beschriebene Forschungsprozess der HNA kann insgesamt in sechs Phasen unterteilt werden, wobei Datenauswahl- und erhebung sowie Datenaustausch- und publikation zusammengefasst wurden (siehe Abb. 1): Theorieentwicklung, Datenauswahl- und Datenerhebung, Qualitätssicherung, Datenanalyse, Dokumentation sowie Datenaustausch und -publikation.

Placeholder
Abb. 1: Forschungsprozess in der Historischen Netzwerkanalyse

Hierbei lassen sich viele Parallelen zu den oben beschriebenen allgemeinen Forschungsprozessen der Geistes- sowie Sozialwissenschaften erkennen. Im Unterschied zu den anderen Studien sind zwei zusätzliche Prozessabschnitte stärker herausgehoben: Qualitätssicherung und Dokumentation. Diese zwei Phasen des Forschungsprozesses sind stark miteinander verbunden und weisen auf die Wichtigkeit von Transparenz innerhalb des Forschungsprozesses der HNA sowie die Schwierigkeiten im Umgang mit historischen Daten, bezogen auf die Datenqualität, hin. Allen vorgestellten Modellen des Forschungsprozesses ist gemein, dass dieser nicht in streng linearen Pfaden verläuft, sondern durch ständige Feedbackschleifen charakterisiert ist. Die wurden in Abbildung 1 nicht durch Pfeile dargestellt, in den Interviews aber immer wieder charakterisiert.

Visualisierung im HNA Forschungsprozess

Innerhalb des HNA-Forschungsprozesses nehmen Visualisierungen eine Sonderstellung ein: sie können am Anfang des Forschungsprozesses eingesetzt werden, um auf neue Forschungsfragen aufmerksam zu werden, sie können bei der Analyse hilfreich sein oder auf Fehler aufmerksam machen. Allgemein werden Visualisierungen im Zusammenhang mit folgenden Prozessabschnitten erwähnt:

Hypothesenbildung:

Forschungsfragen werden von HNA-Forschenden sowohl theorie- als auch datengeleitet entwickelt. Im Laufe des Forschungsprozesses können sich Forschungsfragen durch neue Impulse der Datenanalyse verändern. Visualisierungen, hier als Teil des Analyseprozesses, können durch explorative Vorgänge dazu beitragen, neue Thematiken zu entdecken: “[...] es [ist] auch ok, da mit einer nicht klaren Fragestellung ranzugehen, sondern auch explorativ zu sagen, ich schau mal, was da drin ist” (Interview 5). Strukturen werden so sichtbar und können Ausgangspunkt für konkrete Forschungsfragen bzw. die Hypothesenentwicklung sein.

Qualitätssicherung:

Die Qualitätssicherung läuft begleitend zur Datenerhebung und -analyse und kann sich im Laufe des Prozesses wiederholen. Neben intellektueller Durchsicht und statistischen Berechnungen spielen auch Visualisierungen eine Rolle bei dem Aufspüren von Fehlern.  Diese können auch erst nach der eigentlichen Qualitätssicherung, im Prozess der Datenanalyse/Visualisierung, sichtbar werden: “[...] es sind immer noch Fehler drinnen, das ist das Schöne, das fällt einem dann bei der Netzwerkanalyse, wenn man es dann visualisiert, teilweise erst auf, dass da ein Knoten absolut unverbunden ist [...]” (Interview 3).

Datenanalyse:

Die meisten Interviewten erwähnen Visualisierungen im Zusammenhang mit der Datenanalyse. Die Netzwerkanalyse macht durch die Gewichtung von Beziehungen Strukturen innerhalb eines Netzwerks sichtbar: “ich habe durch eine Visualisierung zwei Knoten gefunden, die relevant sind und zwar nur durch die Visualisierung” (Interview 6). Visualisierungen werden genutzt, um übergeordnete Muster zu erkennen und so die Interpretation zu unterstützen. In den meisten Fällen dienen sie dazu, zeitliche und geografische Entwicklungen sozialer Netzwerke sichtbar zu machen und dazu verschiedene Schichten – betreffend Person, Ort und Zeit – in Verbindung miteinander darzustellen. Erwähnt werden in diesem Zusammenhang die Identifikation von Netzwerkeigenschaften wie Zentralität, Dichte und Hubs.

Ergebnispräsentation:

Visualisierungen werden eingesetzt, um Forschungsergebnisse in Vorträgen oder Artikeln zu vermitteln: “das ist halt das Schöne an den Netzwerken, dass man da manchmal doch sehr komplizierte Sachverhalte ein bisschen runterbrechen kann und sich ein Bild häufig sehr sehr viel leichter erklären lässt, als ne umständliche Erklärung über acht Seiten, die manchmal dieses Bild bräuchte, um es in den Köpfen der Leser entstehen zu lassen” (Interview 3). Visualisierungen werden hierbei im Anschluss an den eigentlichen Forschungsprozess entwickelt und dienen lediglich der visuellen Untermalung von Analysen.

Abbildung 2 fasst die Funktionen von Visualisierungen im HNA-Forschungsprozess visuell zusammen.

Placeholder
Abb. 2: Verwendung von Visualisierungen innerhalb des Forschungsprozesses der Historischen Netzwerkanalyse

Fluch oder Segen der Visualisierung?

Visualisierungen werden von den Forschenden sehr differenziert betrachtet, sowohl wenn es um den Zeitpunkt ihres Einsatzes im Forschungsprozess geht und wer für die Entwicklung der Visualisierungen zuständig sein sollte, aber auch, ob diese der Präsentation der Forschungsergebnisse in der historischen Forschungscommunity zuträglich ist oder nicht.

Visualisierungen werden von einer eher quantitativ sozialwissenschaftlich arbeitenden Gruppe bevorzugt selbst gebaut und erst im Anschluss an die Analyse verwendet, um eine Beeinflussung durch bildliche Verzerrungen zu verhindern: “also Netzwerke würde ich mir immer selber bauen [...]“ (Interview 3) oder auch: “für mich sind die Netzwerkvisualisierungen erst das Ende des ganzen Analyseprozesses. Also ich weiß, dass man mit Visualisierungen das menschliche Auge sehr verwirren kann und in Richtungen lenken will, die vielleicht die Daten gar nicht hergeben [...]” (Interview 5).

Die andere Gruppe nutzt Visualisierungen dagegen bevorzugt während des Forschungsprozesses und erwartet von automatisch erstellten Datenrepräsentationen bessere Einsichten, die nur durch die Zusammenstellung überhaupt aufgedeckt werden können: “um etwas zu sehen, visualisiert zu bekommen, was ich vorher noch nicht wusste und so noch nicht … mir noch nicht zugänglich war durch irgendwelche Einzelinformationen, sondern diese Kumulation, dieses Aggregat quasi nur sichtbar werden kann” (Interview 4). Diese Gruppe verwendet Visualisierungen auch für die Darstellung von Forschungsergebnissen in Veröffentlichungen.

Andere verwenden hingegen Visualisierungen lediglich für den eigenen Erkenntnisgewinn und nicht zur Darstellung von Forschungsergebnissen: „[…] immer, wenn man ein Bild also so eine Grafik zeigt, muss man die erstmal eine halbe Stunde erklären und sagen, was sie jetzt nicht zeigt und was sie zeigt und warum der Algorithmus jetzt den einen Punkt in die Mitte macht und der andere am Rand, aber das eigentlich keine Wertung ist. Bilder zeigen ist sehr komplex und ich bin eher davon abgekommen“ (Interview 6).

In mehreren Interviews wird eine Skepsis gegenüber Visualisierungen und der manipulativen Kraft von Bildern deutlich. Genau wie der Datenbestand, der der Visualisierung zugrunde liegt, ist auch die Visualisierung selbst nur eine Repräsentation und keine Replikation der Realität und immer mit einer Reduktion der Komplexität verbunden. (vgl. Freyberg 2020: 1; Drucker, 2014; Kasunic & Sweetapple, 2014) Genau diese Reduktion wird kritisiert, da es Visualisierungen zu „höchst interpretierbedürftige[n] Quellen“ (Interview 7) macht und besonders in der öffentlichen Diskussion intensiver Erklärung bedarf. Kritische Reaktionen sind auch aus der “klassischen” geschichtswissenschaftlichen Community zu vernehmen: „[…] es kam dann immer so der Einwand: Ja, das ist ja spannend und sieht irgendwie cool aus, aber was hast du davon?“ (Interview 7).

Zusammenfassung und Ausblick

Für eine angemessene Nutzung in der Forschung muss die Rolle der Visualisierung klar sein. Dabei können zwei Zielfunktionen unterschieden werden: Visualisierungen für die Exploration bzw. Analyse und erläuternde Visualisierungen. Visualisierungen zur Exploration bieten den Betrachter:innen durch die Wahl passend gewählter Abstraktionsebenen und graphischer Elemente die Möglichkeit der Interpretation des Ganzen und des Auffindens interessanter Teilaspekte. Sie unterstützen die Analyse durch die Aggregation von individuellen Merkmalen in den Daten. Eine erläuternde Visualisierung soll den Betrachter:innen einen bestimmten Sachverhalt darstellen und eine bestimmte Erkenntnis kommunizieren. Sie unterstützen insbesondere die kondensierte Darstellung von komplexen Sachverhalten für die Repräsentation und den Austausch mit anderen Forschenden.

Wichtig für beide Zielfunktionen ist die Kontextualisierung von Visualisierungen und den in ihnen enthaltenen Daten sowie die Transparenz durch Dokumentation der zugrundeliegenden Datenbankstrukturen, um eine verlässliche Grundlage für die Forschung zu gewährleisten.

Basierend auf sieben Expert:inneninterviews kann kein allgemeines Bild für die gesamte Forschungscommunity gezeichnet werden. In der vorliegenden Studie konnten jedoch interessante Muster zwischen verschiedenen Gruppen entdeckt werden, die in einer späteren Nutzer:innenstudie zum SoNAR-Prototyp bestätigt wurden (vgl. Schnaitter et al., 2021). Weitere ausführliche Studien müssen jedoch folgen, um diese Ergebnisse zu validieren.

Die HNA Community sieht zwar grundsätzlich nützliche Unterstützungsmöglichkeiten durch die Visualisierung, zweifelt aber gleichzeitig an deren Interpretationskraft sowie deren Bedeutung als Erklärungswerkzeuge in der Forschungskommunikation. Dies wurde mittlerweile in vielen Studien gezeigt und auch in dieser bestätigt. Dies mag einerseits an fehlenden Standards für Darstellungsformen und Datendokumentation liegen, andererseits aber auch der gebotenen Skepsis gegenüber der Interpretationsfähigkeit von historischen Quellen geschuldet sein, die der historischen Forschung unterliegen muss. Es ist eine interessante Frage, ob Fortschritte in der Datendokumentation und -aufbereitung diese Zwiespältigkeit auflösen können.


Bibliographie

  • Bhattacherjee, Anol (2012): Social Science Research: Principles, Methods, and Practices, Textbooks Collection 3: 20 https://scholarcommons.usf.edu/oa_textbooks/3.
  • Bludau, Mark-Jan / Dörk, Marian / Halling, Thorsten / Leitner, Elena / Menzel, Sina / Müller, Gerhard / Petras, Vivien / Rehm, Georg / Neudecker, Clemens / Zellhöfer, David / Moreno-Schneider, Julian (2020): "SoNAR (IDH): Datenschnittstellen für Historische Netzwerkanalyse", in: DHd 2020 Spielräume: Digital Humanities zwischen Modellierung und Interpretation. 7. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" (DHd 2020), Paderborn https://doi.org/10.5281/zenodo.4621862.
  • Burghardt, M. / Schubert, A. / Traber, M. / Wolff, C. (2014): "Empirische Untersuchung zu digitalen, geisteswissenschaftlichen Arbeitspraktiken an der Universität Regensburg", in: Online-Proceedings der 1. Jahrestagung der “Digital Humanities im deutschsprachigen Raum” http://doi.org/10.5283/epub.35713.
  • Drucker, Johanna (2014): “ Graphesis: Visual forms of knowledge production” Cambridge, MA: Harvard University Press.
  • Düring, Marten / von Keyserlingk, Linda (2015): "Netzwerkanalyse in den Geschichtswissenschaften. Historische Netzwerkanalyse als Methode für die Erforschung von historischen Prozessen", in: Schützeichel, Rainer / Jordan, Stefan (Hrsg.): Prozesse - Formen, Dynamiken, Erklärungen . Berlin: Springer 337-350 https://doi.org/10.1007/978-3-531-93458-7_15.
  • Freyberg, Linda (2020): "Ikonizität als Erkenntnismittel – Vollständigkeit, Verständlichkeit und Kontextualisierung als Grundprinzipien der Visualisierung", in: DHd 2020 Spielräume: Digital Humanities zwischen Modellierung und Interpretation. 7. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" (DHd 2020), Paderborn https://doi.org/10.5281/zenodo.4621742.
  • Kasunic, Jacqueline Lorber / Sweetapple, Kate (2014): "Visualizing Texts A design practice approach to humanities data." In: DRHA2014 Conference Digital Research in the Humanities and Arts Theme: Communication Futures: Connecting interdisciplinary design practices in arts/culture https://core.ac.uk/download/pdf/42391357.pdf#page=88
  • Lemercier, Claire (2012): "Formale Methoden der Netzwerkanalyse in den Geschichtswissenschaften: Warum und Wie?", in: Österreichische Zeitschrift für Geschichtswissenschaften 23(1): 16-41 https://doi.org/10.25365/oezg-2012-23-1-2.
  • Schnaitter, Hannes / Balck, Sandra / Zinck, Josefine / Petras, Vivien (2021): „SoNAR (IDH) AP4-5 Evaluierung IV: Nutzerinnenstudie“ Interner Bericht. https://github.com/sonar-idh/reports/blob/main/AP4-HU-4-5-3-Evaluierung-IV.pdf