Open Jean Paul. Funktionen und Potentiale offener Editionsdaten
Jean Paul (1763–1825) zählt zu den bedeutendsten Schriftstellern der deutschen Literatur um 1800 und war ein überaus produktiver und geistreicher Briefeschreiber, der mit bekannten Persönlichkeiten wie Heinrich Jacobi, Caroline und Johann Gottfried Herder, Charlotte von Kalb und Rahel Levin Varnhagen korrespondierte. Die Briefe Jean Pauls erschienen bereits Mitte des 20. Jahrhunderts in der Historisch-kritischen Ausgabe (Berend 1952–1964); Anfang des 21. Jahrhunderts folgten die Briefe an Jean Paul (Begemann et al. 2003–2017), ebenfalls im Druck. Seit 2018 ist Jean Pauls Briefkosmos auf dem Weg in die digitale Welt: Die 5562 Von-Briefe, die zunächst buchzentriert retrodigitalisiert1 und anschließend briefzentriert retrokonvertiert wurden,2 sind seitdem auf Jean Paul – Sämtliche Briefe digital verfügbar (Miller et al. 2018–2022). Daneben sind derzeit (Dezember 2022) bereits 1479 Dokumente des sich noch im Aufbau befindenden ‚born digital‘-Korpus der Umfeldbriefe erschienen,3 das die Korrespondenz von Familie, Freundinnen und Kolleginnen des Schriftstellers umfasst.4
Aus methodisch-technischer Perspektive, setzt die Edition mit der Verwendung von XML/TEI und dem Basisformat des Deutschen Textarchivs (DTA 2011–2020) sowie der Anreicherung mit Normdaten (GND, GeoNames) auf Standards. Im Zeichen von ‚Open Data‘ erscheinen die XML/TEI-Dokumente der Briefe unter Creative Commons-Lizenz (CC-BY-SA 4.0), und zwar in drei Publikationsmodi, die verschiedene Funktionen hinsichtlich ihrer Nutzung erfüllen:
(1) Zur Datenlektüre bzw. zum Abgleich zwischen einem Brieftext in HTML und den zugrundeliegenden Daten kann man jedes Dokument innerhalb der digitalen Edition einzeln als XML/TEI herunterladen. Die editorische Arbeit bzw. das ‚Wissen‘ in den Daten wird so transparent, nachvollziehbar und vollumfänglich zugänglich gemacht, da die Komplexität der Kodierung, wie in den meisten digitalen Editionen, nicht vollständig im User Interface abgebildet wird (Neuber 2023).
(2) Zur maschinellen Interaktion über technische Schnittstellen (Witt 2018) bietet die digitale Edition derzeit verschiedene BEACON-APIs und eine CMIF-API, wodurch u. a. die Deutsche Biographie und correspSearch (Dumont et al. 2021) Informationen der Edition aggregieren.5 Gleichzeitig bezieht die digitale Edition über die erfassten Normdaten auch selbst Informationen von Schnittstellen, beispielsweise Koordinaten von GeoNames zur Generierung von Karten und Bild-URLs mit Portraits von Wikimedia Commons.
(3) Zur Nachnutzung bzw. Re-kontextualisierung der Datensätze stellt die Edition die Brieftexte als Paket auf GitHub und Zenodo bereit (Neuber 2022a), wodurch die Daten archiviert und versioniert sowie mit einer DOI zitierbar sind. Durch diese Art der Datenpublikation wurde das Korpus der Briefe von Jean Paul bereits mehrfach jenseits der Edition in anderen Kontexten nachgenutzt: im Digitalen Wörterbuch der Deutschen Sprache als historisches Korpus (2022), im CorpusExplorer als korpuslinguistische Ressource6 (Oliver 2018) und auf Twitter als Bot @jeanpaultoday7 (Neuber 2022b). So wird durch die offene Bereitstellung der Daten Forschung jenseits der Edition gefördert und die Brieftexte einem gänzlich neuen Publikum zur Verfügung gestellt.
Der Beitrag, der die Publikationsmodi der Jean Paul Briefedition und ihre jeweilige Funktion illustriert, ist für die DHd-Konferenz höchst relevant, da ‚Open Data‘ im Editionskontext immer noch eher die Ausnahme als die Regel ist. Aus Greta Franzinis Editionenkatalog (2016–2022) geht hervor, dass von 320 digitalen Editionen lediglich ~27% CC-Lizenzen verwenden, ~23% TEI-Daten zum Download bereitstellen und ~5% APIs anbieten. Die Zahlen sind bedauerlich, da Daten das primäre Forschungsergebnis digitaler Editionen sind:
[...] [I]n digital editions the encoded texts themselves are the most important long-term outcome of the project, while their initial presentation within a particular application should be considered only a single perspective on the data. Any given view will be far from unique or canonical, as different usage scenarios call for different presentations (Turska et al. 2017, §4).
Im Kontext der Jean Paul-Edition gelten die Daten den Herausgeberinnen als Primärpublikation, die in der digitalen Edition im Web ihre Kernpräsentation, nicht aber ihre einzige (Re-)Präsentationsform finden müssen. Die Maßnahmen für offene Daten zielen daher auf ein Höchstmaß an Transparenz, Interoperabilität und Nachnutzbarkeit, um einer Nachnutzung durch Mensch und Maschine gerecht zu werden (Baillot und Busch 2021).8
Fußnoten
Bibliographie
- Baillot, Anne und Anna Busch. 2021. “Editing for Man and Machine. Digital Scholarly Editions and their Users” In Variants 15-16. https://doi.org/10.4000/variants.1220 (zugegriffen: 26. Juli 2022).
- Begemann, Christian, Markus Bernauer und Norbert Miller, Hg. 2003-2017 . Jean Pauls Sämtliche Werke. Vierte Abteilung: Briefe an Jean Paul. Berlin-Brandenburgischen Akademie der Wissenschaften.
- Berend, Eduard, Hg. 1952–1964 . Jean Pauls Sämtliche Werke. Vierte Abteilung: Briefe an Jean Paul. Berlin-Brandenburgischen Akademie der Wissenschaften.
- Bernauer, Markus, Norbert Miller und Frederike Neuber, Hg. 2018–2022 . Jean Paul – Sämtliche Briefe digital. Berlin-Brandenburgischen Akademie der Wissenschaften. https://www.jeanpaul-edition.de (zugegriffen: 26. Juli 2022).
- Deutsches Textarchiv, Hg. 2011–2020 . DTABf. Deutsches Textarchiv – Basisformat. Berlin-Brandenburgischen Akademie der Wissenschaften. http://deutschestextarchiv.de/doku/basisformat (zugegriffen: 26. Juli 2022).
- Digitales Wörterbuch der deutschen Sprache, Hg. 2022 . Jean Paul Briefe (Textkorpus). https://www.dwds.de/d/korpora/jean_paul (zugegriffen: 26. Juli 2022).
- Dumont, Stefan, Sascha Grabsch und Jonas Müller-Laackman. 2021. correspSearch – Briefeditionen vernetzen (2.0.0). Berlin-Brandenburgische Akademie der Wissenschaften. https://correspSearch.net (zugegriffen: 26. Juli 2022).
- Franzini, Greta. 2012—2022. Catalogue of Digital Editions. https://dig-ed-cat.acdh.oeaw.ac.at/ (zugegriffen: 26. Juli 2022).
- Neuber, Frederike, Hg. 2022a. telota/jean_paul_briefe: Daten der Briefe von Jean Paul und der Briefe aus seinem Umfeld (v.6.0) [Zenodo-Repositorium]. https://doi.org/10.5281/zenodo.6892400 (zugegriffen: 26. Juli 2022).
- Neuber, Frederike. 2022b. jeanpaultoday [GitHub-Repositorium]. https://github.com/FrederikeNeuber/jeanpaultoday (zugegriffen: 26. Juli 2022).
- Neuber, Frederike. 2023 [im Erscheinen]. “Der digitale Editionstext. Technologische Schichten, ‘editorischer Kerntext’ und Rezeption 2.0.” In Der Text und seine (Re-)Produktion (editio Beihefte), hg. von Niklas Fröhlich, Bastian Politycki, Dirk Schäfer, Annkathrin Sonder. Berlin/Boston: De Gruyter.
- Rüdiger, Jan Oliver. 2018. CorpusExplorer. Universität Kassel / Universität Siegen. http://www.CorpusExplorer.de (zugegriffen: 26. Juli 2022).
- Turska, Magdalena, James Cummings und Sebastian Rahtz. 2017. “Challenging the Myth of Presentation in Digital Editions.” In Journal of the Text Encoding Initiative 9. https://doi.org/10.4000/jtei.1453 (zugegriffen: 26. Juli 2022).
- Witt, Jeffrey C. 2018. “Digital Scholarly Editions and API Consuming Applications.” In: Digital Scholarly Editions as Interfaces 12, Hg. von Roman Bleier, Martina Bürgermeister, Helmut W. Klug, Frederike Neuber und Gerlinde Schneider, 219—247. Norderstedt: Books on Demand.