BEACONe unde venis et quo vadis?

Al-Eryani, Susanne; Gerstner, Eva-Maria; Hegel, Philipp; Lordick, Harald; Schnöpf, Markus; Schulz, Daniela; Sikora, Uwe
https://zenodo.org/records/10698321
Zum TEI/XML Dokument

BEACON

Der Workshop zielt im Sinne der FAIR-Prinzipien und im Hinblick auf konkrete Standardisierungsbestrebungen auf die Vernetzung geistes- und kulturwissenschaftlicher Daten durch Erstellung sogenannter BEACON-Dateien1  auf Basis der Gemeinsamen Normdatei (GND). Maschinenlesbare BEACON-Dateien stellen über normdatenbasierte Web-URLs oder eine Schnittstelle Normdaten-IDs für Ressourcen zur Verfügung und ermöglichen die gegenseitige Verlinkung von Webseiten, die ihrerseits Inhalte mittels Normdaten verknüpft haben. Das können digitale Editionen, Enzyklopädien, Bibliographien, aber auch andere Ressourcen wie wissenschaftliche Blogs sein.

Neben der Motivation, die auch für die generelle Annotation mit Normdaten gilt, nämlich die eindeutige Identifizierung von Entitäten und inhaltliche Anreicherung der eigenen Daten, geht es bei der Verwendung von BEACON-Dateien insbesondere um die gegenseitige Verlinkung und erhöhte Sichtbarkeit der eigenen Website, und das, wie die Erläuterungen zur Struktur und Anwendung dieser Dateien zeigen werden, auf niederschwelligem Weg.

In der Praxis werden dazu meist Identifier der Gemeinsamen Normdatei verwendet. Eine typische Anwendung ist eine direkt in das jeweilige digitale Angebot integrierte „See-Also“-Funktionalität, die zu passenden ‚Treffern‘ anderer Online-Angebote führt.

BEACON-Dateien werden zudem auch von der Deutschen Nationalbibliothek genutzt, um GND-bezogene Daten Dritter in den Datendienst Entity Facts2  zu übernehmen. WikiData verwendet und exportiert ebenfalls BEACON-Dateien.

Das BEACON-Findbuch3 4 , STI Linked Data Service5  und CorrespSearch6  bieten auf GND-BEACON basierende übergreifende (domänenspezifische) See-Also-Funktionen an. Außerdem werden BEACON-Dateien von biographischen und bibliographischen Portalen wie beispielsweise dem Bayerischen Musiker-Lexikon Online, der Deutschen Biographie oder der Landesbibliographie Baden-Württemberg verwendet.7 

Beispiele und praktische Übungen

In dem Workshop werden zunächst zwei Beispiele vorgeführt, an denen das grundlegende Vorgehen erläutert wird. Im ersten Beispiel werden die strukturierten Metadaten von Online-Publikationen und auch Blogbeiträgen verwendet und aus diesen eine BEACON-Datei erzeugt. Beim zweiten Beispiel wird auf die Volltextdaten der Sitzungsprotokolle der Preußischen Akademie (bis 1806) als XML-Dateien ohne Normdaten zurückgegriffen. Anhand dieser Beispiele werden verschiedene Schritte prototypisch vorgestellt und praktisch durchgespielt, die notwendig sind, um eine digitale Ressource mit einer online zugänglichen BEACON-Datei zu versehen und so ihre Vernetzung zu ermöglichen:

  • In den Beispieldaten werden die zu berücksichtigenden Entitäten festgelegt.
  • Für die definierten Entitäten werden die GND-IDs unter Verwendung von OpenRefine8  und in Kombination mit der Lobid-API9  recherchiert und eingetragen.
  • Aus den Einträgen wird eine BEACON-Datei (Plain Text, UTF-8) erstellt.
  • Die Publikation der BEACON-Datei wird anhand eines konkreten fachspezifischen Dienstes für Judaica und durch den Eintrag der neuen BEACON-Datei in die ‚Registry‘ für BEACON-Dateien (Wikipedia:BEACON) vorgeführt.
  • Der Schwerpunkt des Workshops liegt auf der praktischen Anwendung und Hands-On-Erprobung des BEACON-Verfahrens. Teilnehmer:innen können dazu eigene Daten mitbringen. Hierzu wird es im Vorfeld einen Austausch geben. Sie können für die praktische Übung aber, je nach Interesse, auch eine der vorbereiteten Online-Publikationen oder eines der genannten Sitzungsprotokolle nutzen. Die Ergebnisse, die Erfolge und Schwierigkeiten werden anschließend gemeinsam diskutiert.

    Ausblicke

    In einem ersten Ausblick wird gezeigt, was hinter den im Workshop genutzten See-Also-Services (u.a. STI Linked Data Service) steckt. In einem zweiten Ausblick sollen die Möglichkeiten von ‚Künstlicher Intelligenz‘, namentlich ChatGPT, in diesem Bereich erkundet werden. Lassen sich derartige Techniken sinnvoll und effizient einsetzen, um Entitäten in Metadaten und Volltexten zu identifizieren und mit Normdatensätzen zu verknüpfen? In einem dritten Ausblick werden mit der GND-Agentur und entityXML neuere Entwicklungen aufgezeigt, die ein agileres Zusammenspiel von Projekten und Normdaten ermöglichen.

    Weder prinzipiell noch technisch sind BEACON-Dateien auf die GND als Normdatei und auf Personen als Entitäten festgelegt. Sie sind auch nicht auf bestimmte Arten von digitalen Ressourcen eingeschränkt. Diskutiert werden kann daher auch, welche Rolle im Sinne einer Internationalisierung des Formats und der Services VIAF und Wikidata heute schon und in zukünftigen Anwendungen spielen können. Gefragt werden soll darüber hinaus, welche technischen und organisatorischen Hindernisse überwunden werden müssen, damit ein breiterer Einsatz des BEACON-Verfahrens möglich wird.

    Format, Methodik und Ziele des Workshops

    Der Workshop ist als Präsenzveranstaltung geplant. Das didaktische Konzept sieht eine einführende Vermittlung von Wissen sowie Praxisphasen in Gruppenarbeit und Plenumsdiskussionen vor. Es sind vier Stunden angesetzt, um möglichst viel Zeit für die eigene Arbeit und den Austausch zu gewährleisten. Der Workshop ist folgendermaßen strukturiert:

    • Mehrere kurze Impulsvorträge zu unterschiedlichen Aspekten münden in einem ersten Austausch zum Thema im Plenum (vgl. 1., Dauer: 45 Minuten).
    • Im Anschluss daran beginnt der praktische Teil des Workshops, in dem die Teilnehmenden nach einer kurzen Einführung in mehreren Gruppen mit unterschiedlichen thematischen Schwerpunkten BEACON-Dateien erstellen und idealtypische Workflows bis hin zur Publikation einer BEACON-Datei erproben. Auf Wunsch geschieht dies an eigenem Material. Der Block schließt mit einem Austausch zu den gemachten Erfahrungen. (vgl. 2., Dauer: 120 Minuten, exkl. Pausen).
    • Abschließend erfolgt ein Ausblick, der die bestehende BEACON-Landschaft mit aktuellen Entwicklungen kontextualisiert und nach Möglichkeiten, aber auch nach Grenzen der weiteren Entwicklung fragt (vgl. 3., Dauer: 45 bis 60 Minuten).

    Am Ende des Workshops sollten die Teilnehmer:innen wissen, was GND-BEACON-Dateien sind und welche Möglichkeiten, aber auch welche Grenzen der Vernetzung durch ihren Einsatz bestehen. Sie haben verschiedene Anwendungsfelder kennengelernt sowie Hilfsmittel, die der Erstellung von BEACON-Dateien dienen, und haben diese auch exemplarisch ausprobiert. Ebenso wissen sie, welche BEACON-bezogenen Services existieren und wo deren Schwerpunkte liegen. Sie haben darüber hinaus einen Einblick in die Funktionsweise dieser Dienste erhalten. Anhand von unterschiedlichen Beispieldaten haben sie erfahren, wie mögliche Workflows aussehen und eventuell selbsttätig eine BEACON-Datei erstellt, publiziert und dadurch ihre Daten mit anderen Daten GND-basiert vernetzt.

    Eine Publikation der im Workshop gesammelten Erfahrungen und Ergebnisse im Rahmen von Blogbeiträgen ist geplant. Ebenso werden diese Ergebnisse auch in Handreichungen des NFDI-Konsortiums Text+ zum Thema eingehen.

    Zielpublikum und Teilnehmer*innenzahl

    Der Workshop richtet sich an Forschende aller Disziplinen der (Digital) Humanities mit Interesse an Vernetzung von Daten und Linked Data, insbesondere auch an Nachwuchswissenschaftler*innen. Vorwissen wird nicht vorausgesetzt. Um einen guten Betreuungsschlüssel zu gewährleisten, können bis zu 25 Personen am Workshop teilnehmen.

    Organisationsteam bzw. Beitragende

    • Susanne Al-Eryani ist Fachreferentin für Orientalistik und Kulturanthropologie/Europäische Ethnologie an der Staats- und Universitätsbibliothek Göttingen und wirkt in der Arbeitsgruppe Metadaten und Datenkonversion der SUB Göttingen am Aufbau einer Text+ GND-Agentur mit.
    • Eva-Maria Gerstner ist Referentin für bibliothekarisch-informationswissenschaftliche Services mit Schwerpunkt Forschungsdatenmanagement.
    • Philipp Hegel ist Mitarbeiter im Sonderforschungsbereich 980: Episteme in Bewegung und im Konsortium Text+ der Nationalen Forschungsdateninfrastruktur.
    • Harald Lordick forscht zur deutsch-jüdischen Geschichte, Digital Humanities und geisteswissenschaftlichen Infrastrukturen.
    • Markus Schnöpf koordiniert das Forschungsdatenmanagement der Berlin-Brandenburgischen Akademie der Wissenschaften, darunter zahlreiche Editionsprojekte aus verschiedenen Epochen.
    • Daniela Schulz betreut an der Herzog August Bibliothek die Hybridedition der deutschsprachigen Werke des Martin Opitz sowie das NFDI-Konsortium Text+.
    • Uwe Sikora arbeitet im Bereich Metadaten und Datenkonversion an der Niedersächsischen Staats- und Universitätsbibliothek in Göttingen.

    Die Einreichenden verbindet ihr Interesse an der Verknüpfung digitaler geistes- und kulturwissenschaftlicher Ressourcen. Sie sind im NFDI-Konsortium Text+ engagiert.

    Benötigte Ausstattung

    Benötigt wird ein größerer Seminarraum mit WLAN und Beamer, der sowohl Diskussion im Plenum als auch das verteilte Arbeiten in mehreren Gruppen ermöglicht. Für die praktische Arbeit an den Daten genügt seitens der Teilnehmenden das Mitbringen eines Laptops.


    Fußnoten

    1 https://de.wikipedia.org/wiki/Wikipedia:BEACON (zugegriffen: 18. Juli 2023).
    2 https://www.dnb.de/DE/Professionell/Metadatendienste/Datenbezug/Entity-Facts/entityFacts_node.html (zugegriffen 18. Juli 2023).
    3 http://beacon.findbuch.de/ (zugegriffen: 18. Juli 2023).
    4 https://github.com/hbeyer/beacon (zugegriffen: 18. Juli 2023).
    5 http://www.steinheim-institut.de/see-also/query.html (zugegriffen: 18. Juli 2023).
    6 https://correspsearch.net/de/start.html (zugegriffen: 18. Juli 2023).
    7 https://www.bmlo.lmu.de, https://data.deutsche-biographie.de/beta/beacon-open und https://www.statistik-bw.de/LABI (zugegriffen jeweils: 18. Juli 2023).
    8 https://openrefine.org/ (zugegriffen: 18. Juli 2023).
    9 https://lobid.org/gnd/api (zugegriffen: 18. Juli 2023).

    Bibliographie

    • Lordick, Harald. 2022. „Digitale Editionen und die vernetzte GND-BEACON-Landschaft.“ In Text+ Blog, 10.11.2022. https://textplus.hypotheses.org/752 (zugegriffen am 19. Juli.2023).
    • Lordick, Harald und Mache, Beata. 2018. „Annotationen anhand der Gemeinsamen Normdatei aus einer anwendungsorientierten Perspektive historischer Forschung“. In Kritik der digitalen Vernunft, hg. von Georg Vogeler. https://doi.org/10.5281/zenodo.1188229 (zugegriffen: 19. Juli 2023).
    • Sikora, Uwe. 2022. entityXML: Handbuch. https://entities.pages.gwdg.de/entityxml (zugegriffen: 19. Juli 2023).
    • Stadler, Peter. 2012. „Normdateien in der Edition“. In Editio 26: 174-183.
    • Voß, Jakob und Mathias Schindler. 2017. BEACON Link Dump Format. https://gbv.github.io/beaconspec/beacon.html (zugegriffen: 19. Juli 2023).