HISB vorgestellt: Eine virtuelle Arbeitsumgebung für die akademische Forschung wie auch die Digitalisierung von strukturierten Informationen aus Archivalien. Eine Anwendung der virtuellen Forschungsplattform Geovistory.

Knecht, David; Beretta, Francesco; Hotz, Gerhard
Zum TEI/XML Dokument

Kontext

Die Digitalisierung von Archivalien erlaubt einen neuartigen Zugang zum kulturellen und gesellschaftlichen Gedächtnis. Zum einen sollen sich so breitere Gesellschaftsgruppen einfach mit digitalisierten Zeitzeugnissen auseinandersetzen können (Kansy 2012: 3). Zum anderen soll dank den vielfältigen Methoden zur Bearbeitung digitaler Objekte auch die Beantwortung neuer Forschungsfragen ermöglicht werden. Dabei ist es besonders herausfordernd, Arbeitsumgebungen zu schaffen, die es erlauben digitalisierte Archivalien im Sinne von primären Forschungsdaten zu verbinden mit den sekundären Forschungsdaten, welche im Rahmen der Bearbeitung eines Forschungsgegenstandes zusätzlich erfasst werden (Maier 2020). Erst recht, wenn das digitalisierte Archivgut in einem ersten Schritt prozessiert, strukturiert und in neuer Form zugänglich gemacht werden muss, damit es den nötigen Grad an Granularität der strukturierten Informationen aufweist, welcher zur Bearbeitung der Forschungsfragen von Nöten ist. Dieser Aufgabe hat sich das Projekt HISB (Historisch-genealogisches Informationssystem Basel) angenommen, welches sich auf die Bevölkerung der Stadt Basel im 19. Jahrhundert konzentriert. Das HISB hat sich zum Ziel gesetzt, Informationen zu den Bewohnern der Stadt Basel aus den Quellen des Staatsarchivs Basel-Stadt für die Forschung, wie auch für die Nutzung durch die interessierte Öffentlichkeit aufzubereiten.

Rund um das Projekt HISB

Das HISB baut dafür auf dem akkumulierten Datenschatz des Bürgerforschungsprojekts Basel-Spitalfriedhof (BBS) auf, welches der Universität Basel (IPNA) angegliedert ist. Seit gut zwölf Jahren erschließen die rund 70 Bürgerforscher/innen des BBS historische Akten (1840-1870) aus dem Staatsarchiv Basel-Stadt. So entstanden Datensätze mit mehr als 300’000 historischen Personendaten. Die Daten helfen, Forschungslücken in der Basler Sozial- und Stadtgeschichte zu schließen, das Interesse an der Geschichte Basels zu wecken und die anthropologischen Forschungen an den identifizierten Skeletten des Basler Spitalfriedhofs (1845-1868) zu kontextualisieren. Sie dienen als Basis universitärer Forschung (Hotz et al. 2018).

Viele der im BBS erfassten Personen sind aber in mehreren Quellen erwähnt. Als Beispiel sei «Babette Saxer» exemplarisch angeführt, zu welcher es zwölf unterschiedliche Akteneinträge gibt. Das HISB aggregiert die vorhandenen Informationen zu jeder Person. Diese sollen über ein benutzerfreundliches Interface abgefragt, ergänzt und visualisiert werden. Dieser durch das BBS-Team erschlossene Aktenkomplex mit ausgewählten seriellen Daten soll solcherart einen detaillierten Einblick in die Lebensbedingungen beliebiger Personen und Personengruppen Basels im 19. Jahrhundert für den Zeitraum 1840-1870 erlauben. Die Auswahl der thematisch breitgefächerten Aktendossiers soll ermöglichen, eine große Anzahl unterschiedlicher Fragestellungen zu den Lebensbedingungen und dem Lebensalltag Basels im 19. Jahrhundert, auch unabhängig von Geschlecht, geografischer Herkunft und sozialem Stand der anvisierten Personen zu untersuchen. Die Erschließungen der Volkszählungen 1850, 1860 und 1870 lassen Migrationsbewegungen nach Basel und künftig sogar innerhalb der Stadt nachverfolgen.

Die Zielsetzung des HISB ist dreifach:

  • Historische Personendaten zur Stadt Basel aus dem 19. Jahrhundert sollen in einem webbasierten Informationssystem aufbereitet werden und für die akademische Forschung bereitstehen.
  • Eine webbasierte Arbeitsumgebung soll für die freiwilligen Mitarbeiter/innen des BBS erstellt werden, die es erlaubt, neue Digitalisierungen direkt im Informationssystem HISB vorzunehmen.
  • Es soll mittelfristig eine Online-Auftritt erstellt werden, über den die interessierte Öffentlichkeit im read-only Zugang direkt und auf einfach zugängliche Weise das Informationssystem HISB befragen, sowie eigene Analysen wie auch Visualisierungen erstellen kann.
  • Geovistory – die virtuelle Forschungsumgebung

    Um die Projektziele zu erreichen, sollen die Daten des BBS in Geovistory, einer Webplattform zur Bearbeitung, Auswertung und Publikation von historischen Informationen, importiert und anschließend publiziert werden.

    Geovistory ist eine vom DH-Startup KleioLab entwickelte Forschungsumgebung die sich in der Beta-Phase befindet und den Forschenden zum Testen frei zugänglich ist. Geovistory ist für geistes- und insbesondere geschichtswissenschaftliche Forschungsprojekte nach der partizipativen Methode des «User-Experience-Design» entwickelt. Geovistory soll Forscher/innen auf innovative und einfach zugängliche Art als digitales Werkzeug unterstützen und deren Forschung auf attraktive Weise Geschichtsinteressierten zugänglich machen. Dafür bildet Geovistory den gesamten Forschungsprozess digital ab: von der Erfassung der Quellen, über die Informationsextraktion, die Verwaltung von projektspezifischen kontrollierten Vokabularen, die Verlinkung mit externen Ressourcen, den Aufbau eines Informationsnetzes und die (räumliche) Analyse der Forschungsdaten bis hin zur Web-Publikation der Ergebnisse.

    Placeholder
    Abb. 1: Digitalisierte & verlinkte Volkszählung Basel 1860.
    Placeholder
    Abb. 2: Visualisierung der im HISB erfassten Geburten. Quellenangabe: Visualisierungen aus der Projektumgebung des HISB. Eigene Erstellung.

    Um offene und wiederverwertbare Daten nach den FAIR-Kriterien zu produzieren, baut das Datenmodell auf dem de facto Standard CIDOC-CRM (ISO 21127:2014) mit einigen, den Forschungsbedürfnissen entsprechenden Erweiterungen auf. Dies geschieht in Anknüpfung an die kollaborative Plattform Ontology Management Environment OntoME , betrieben vom Laboratoire de recherche historique Rhône-Alpes (CNRS / Université de Lyon) im Rahmen des Data for History Consortium s . Ein Poster dieses Workflows wurde auf der jährlichen Time-Machine Konferenz 2019 präsentiert (Beretta et al. 2019).

    Phase I des Projekts HISB

    In der Umsetzung der ersten Projektphase (2019-2021) wurde zum einen die Plattform Geovistory maßgeblich weiterentwickelt, um den Anforderungen des HISB an eine Arbeitsumgebung für seine Mitarbeitenden gerecht zu werden (Importer-Funktionalitäten). Zum anderen wurden erste Datensätze (Volkszählung 1850 und 1860 der Stadt Basel) des BBS ins HISB importiert und integriert (gematched). Bei beiden Aufgaben stellten sich verschiedene Herausforderungen typisch für ein Digitalisierungs- und Datentransformations-Projekt, das darauf abzielt, fein-granulare, sauber strukturierte und semantifizierte Daten zu produzieren. Zwei Herausforderungen waren besonders gross:

    Erstens hat die Entwicklung des Importer-Funktionalitäten ein vielfaches der ursprünglich budgetierten Zeit gebraucht: Zum einen wegen der Komplexität der funktionalen Anforderungen, zum anderen wegen technischen Herausforderungen, um die neue Komponente in das Gesamtsystem zu integrieren.

    Zweitens stellte sich das Matching der Volkszählung 1850 und 1860 als wissenschaftlich anspruchsvolle Aufgabe heraus. Die Herausforderungen waren dabei auf mehreren Ebenen: Innerhalb der einzelnen Tabellen von 1850, respektive 1860 gab es Inkonsistenzen wie beispielsweise verschiedene Schreibarten für die Konfession „katholisch“, die vereinheitlicht werden mussten. Anspruchsvoller aber war es Unterschiede in der Datenerhebung 1850 und 1860 zu identifizieren und zu bereinigen, um ein Matching dieser Quellen zu ermöglichen. Beispielsweise wurde 1850 bei einer in Basel wohnhaften Person die Staatszugehörigkeit „Königreich Sardinien“ vermerkt. Im Jahr 1860 aber dann „Königreich Italien“, welches dazumal gerade gegründet wurde. Solche Unterschiede beruhen auf historische Gegebenheiten, zu deren Interpretation es eine/n kundige/n Historiker/in braucht. Nur so kann anschließend ein sinnvolles Matching durchgeführt werden. Das heißt, dass eine enge Zusammenarbeit zwischen den Domänen- & Quellenexperten sowie den Data Engineers notwendig ist. Diese Herausforderungen führten dazu, dass das Matching ebenfalls deutlich mehr Zeit beanspruchte als ursprünglich budgetiert.

    Insgesamt aber ist die HISB Phase I klar als Erfolg zu werten. Denn die gestellte Aufgabe konnte gemeistert werden und mit dem HISB wurde eine webbasierte Plattform bereitgestellt, die

  • den Mitarbeitenden des BBS dienen kann, künftig direkt in einem Informationssystem strukturierte Daten aus den Archivalien zu erfassen. Das vereinfacht zu gro ß en Teilen den Prozess der Datenaggregation (Matching).
  • der Forschung dienen kann, um darauf aufbauend Forschungsfragen zu bearbeiten. Dies dank den bestehend ausgeklügelten Daten-Kurations, sowie Visualisierungs- und Analyse-Funktionalitäten.
  • den Sockel bietet, um weitere schon digitalisierte Datenquellen zu importieren und zu integrieren (matchen), um so ein stetig reicheres Informationssystem für Basel einer breiten Öffentlichkeit bereitzustellen.
  • Hands-on Workshop an der DHd-Konferenz 2022

    Der angebotene Workshop ist als Tutorial geplant. Er soll den Teilnehmenden ermöglichen, einen Einblick in ein spannendes und ambitioniertes Digitalisierungsprojekt zu gewinnen, inklusive dessen zu meisternde Herausforderungen wie auch großes Potential. Dabei ist die Zielsetzung des Workshops zweifach:

    • Zum einen möchten wir gemachte Erfahrungen – positive wie negative – in der Konzeptualisierung und Umsetzung einer virtuellen Arbeitsumgebung zur fortlaufenden Digitalisierung von Archivgütern (im Sinne der Bereitstellung fein-granularer, strukturierter Daten) teilen.
    • Zum anderen möchten wir die Teilnehmenden einladen, die Funktionalitäten der virtuellen Arbeitsumgebung von HISB hands-on zu testen. Im Sinne der Datenerfassung, aber auch der Datenanalyse und –visualisierung.

    Ablauf Workshop

    • Teil 1: Einführung in das Projekt HISB: Kontext & Grundlage des HISB und der Plattform Geovistory, Erfahrungen & Resultate der HISB Phase I.
    • Pause
    • Teil 2: Hands-On-Einblick ins HISB & die darunterliegende Plattform Geovistory. Anhand von Beispielsdaten folgen wir dem Arbeitsprozess vom HISB und testen direkt in der Webplattform Geovistory die verschiedenen Funktionalitäten (Arbeit mit digitalisierten Quellen, Annotation der Digitalisate, Erfassen fein-granularer Informationen, Abfrage & Visualisierung dieser Informationen etc.).
    • Teil 3: Offene Diskussion, um den Workshop anhand der gewonnen Eindrücke und der eigenen Erfahrungen der Teilnehmenden zu reflektieren.

    Zielpublikum und Anforderungen

    • Für diesen Workshop sind keine technischen Vorkenntnisse erforderlich. Der Workshop ist gedacht für Personen/Institutionen, die sich mit Digitalisierungsprojekten beschäftigen, wie auch für Forschende, die eine neue virtuelle Arbeitsumgebung kennenlernen möchten.
    • Es können 20 bis 30 Personen am Workshop teilnehmen. Jede/r Teilnehmende benötigt einen Laptop mit Wifi-Zugang.

    Vortragende

    Dr. habil. Francesco Beretta , LARHRA–CNRS/Université de Lyon/ENS, Frankreich. francesco.beretta@cnrs.fr : Francesco Beretta ist habilitierter Kirchenhistoriker. Seit mehr als zehn Jahren forscht er am LARHRA in Lyon zu Fragen semantischer Modellierung historischer Informationen und der Entwicklung geohistorischer Informationssysteme.

    M.A. David Knecht , KleioLab GmbH, Basel. david.knecht@kleiolab.ch : David Knecht ist Ökonom. Bei KleioLab ist er verantwortlich für die Begleitung von Forschungsprojekten und interessiert sich insbesondere für Fragen der Datenaggregation aus verschiedenen Quellen.

    Co-Autor

    Dr. Gerhard Hotz , Integrative Prähistorische und Naturwissenschaftliche Archäologie (IPNA), Universität Basel. gerhard.hotz@unibas.ch : Gerhard Hotz ist Anthropologe. Er leitet seit über zehn Jahren das Bürgerforschungs-projekt Basel-Spitalfriedhof (BBS) und verantwortet das HISB. Seine Forschungsinteressen drehen sich um interdisziplinäre Fragestellungen zwischen Anthropologie, Archäologie, Natur- und Geisteswissenschaften – insbesondere im Bereich Gesundheit, Krankheitsbelastung, Gesellschaft und Umwelt.


    Bibliographie