אָנהאַלטן די ווערטער

Luger, Robin
https://zenodo.org/records/14944050

אָנהאַלטן די ווערטער ist eine born-digital Übersetzung und Archivierung einer jiddischen Zeitung in Form einer annotierten und kontextualisierten digitalen Edition. Ziel dieser Masterarbeit ist die Übersetzung, Digitalisierung und der Erhalt von jiddischen Quellen, welche für weitere Forschungen frei zugänglich verwendet werden können. Die Aufmerksamkeit soll im Zuge dessen auf Minderheitensprachen und dessen unverzichtbaren Wert in der Forschung liegen, und dabei helfen, das jüdische Kulturerbe sicherzustellen.

דֶער אֱמֶת׳ר יוּד oder Der Wahre Jude wurde über neun Monate im Jahr 1904 in Lemberg, ein Ort in der heutigen Ukraine, damals Teil der Habsburgermonarchie, veröffentlicht. Insgesamt wurden 31 Ausgaben mit 218 Seiten gedruckt, wobei die Ausgaben von Februar und März – 13 Ausgaben im Umfang von 88 Seiten – im Zuge dieser Arbeit bearbeitet werden. Im Fokus der Zeitung liegt das jüdische Leben in Galizien und Osteuropa des frühen 20. Jahrhundert und inkludiert gesellschaftliche, soziale, religiöse und geschlechtliche Fragestellungen und Diskussionen. In jeder Ausgabe wird auch über politische, jüdische und weltliche Ereignisse berichtet sowie Erzählungen von wichtigen Persönlichkeiten in der jüdischen Geschichte in mehreren Teilen veröffentlicht.

Die eingescannte Quelle ist als Bild und PDF mit automatisierter Transkription in einem separaten Dokument im Online-Zeitungsarchiv der Österreichischen Nationalbibliothek¹ bereits veröffentlicht. Da sowohl die Genauigkeitsrate von automatischen jiddischen Transkriptionen – in einer Studie, die den jiddischen Bestand von Europeana untersucht hat, etwa 36 % (Pletschacher, Clausner und Antonacopoulos 2015, 44) – recht gering ausfällt, als auch Übersetzungen durch KI nicht den Anforderungen entsprechen, wird der Text nicht transkribiert, sondern manuell transliteriert, interpretiert und übersetzt. Auf die englische Übersetzung folgt die Annotation des Textes mit TEI / XML. Mithilfe einer Cookiecutter Library (Datta 2022) und XSLT-Stylesheets wird die annotierte Übersetzung auf einer statischen GitHub Pages Website² aufbereitet. Neben der annotierten Quelle sind auf der Website Register von Orten, Namen und geopolitischen Entitäten zu finden. Wichtige Ereignisse, Konzepte und Traditionen sind im Text verlinkt und werden durch externe Datenbanken erklärt und kontextualisiert. All diese Zusätzlich zu der Übersetzung möchte ich die Quellen verständlich aufbereiten, um für jene, die nicht in der akademischen Forschung wirken, aber sich mit jüdischer Geschichte in der Habsburgermonarchie auseinandersetzen möchten, zugänglich zu machen.

Dadurch werden jiddische Quellen zugänglich gemacht, um das jüdische Kulturerbe vor dem Zweiten Weltkrieg zu sichern. Während vor dem Holocaust etwa 11 bis 13 Million Menschen aktiv jiddisch gesprochen haben, liegt die Schätzung heutzutage zwischen 350.000 und 600.000 aktiv sprechenden Personen (Benor 2023, 98–99). Die Zahl steigt dank der Bemühungen, die Sprache wieder zu verbreiten, dennoch wurde im Laufe meiner Recherchen ersichtlich, dass wenig Fokus auf die Übersetzung historischer Quellen, vor allem Zeitungen, gelegt wird, sondern bevorzugt Literatur und Prosa Subjekt von kollaborativen Übersetzungsprojekten werden (Perego 2022). Die jiddische Presse spielte eine wichtige Rolle in der jüdischen Diaspora der Vorkriegszeit, dessen Kultur und Identität (Costiuc Radosav 2017, 39–42), die von anderssprachigen, zeitgenössischen Zeitungen eventuell nicht zur Gänze erfasst werden können.ָ אָנהאַלטן די ווערטער stellt mithilfe einer englischen Übersetzung Einblicke in die kulturellen, gesellschaftlichen und religiösen Lebenswelten.

Neben der Übersetzung liegt besonderer Fokus darauf, eine offene, benutzbare und zugängliche Datenbank zu kreieren, indem die Website den Schemata der FAIR Prinzipien (Gengnagel, Neuber und Schulz 2022) und den Fünf Sternen der Linked Open Data folgt (Berners-Lee 2006). Um diese Prinzipien zu gewährleisten wird, unter anderem, in andere Kataloge und Datenbanken (z.B. Wikidata oder die The YIVO Encyclopedia of Jews in Eastern Europe³ ) verlinkt, die Standardformate und einheitliche Metadaten verwendet und jeder Schritt dokumentiert und veröffentlicht. Dadurch wird die Zugänglichkeit und Wiederverwendung vereinfacht (Hawkins 2022, 321). Zusätzlich dazu werden auch die Web Content Accessibility Guidelines (Initiative 2024) beachtet, um die Website barriereärmer zu machen und Aufmerksamkeit auf die wenig beachtete digitale Barrierefreiheit in der Forschung zu lenken.

Die annotierten Übersetzungen werden laufend auf der Website ergänzt und zusammen mit einer schriftlichen Arbeit im Jahr 2025 fertig gestellt. Die daraus resultierenden Daten werden frei zugänglich als Text, CSV, HMTL und JSON auf GitHub und der Website zur Verfügung gestellt.

Fußnoten

¹ https://anno.onb.ac.at/info/emj_info.html

² https://lug-robin.github.io/tgj-data/

³ https://encyclopedia.yivo.org/

Bibliographie

Benor, Sarah Bunin. 2023. „Hebrew and Jewish Diaspora Languages.“ In The Routledge Handbook of Judaism in the 21st Century, hg. von Keren Fraiman und Dean P. Bell, 89–110. Routledge handbooks in religion Book 18. London, New York, NY: Routledge.
Berners-Lee, Tim. 2006. „Linked Data“. https://www.w3.org/DesignIssues/LinkedData.html (zugegriffen: 6. April 2024).
Costiuc Radosav, Augusta. 2017. “Tsi vos toyg a yudish blat?” Of what Use Is a Yiddish Newspaper? Yiddish as a Language of the Press in Nineteenth-Century Romania.“ SJ 22:21–49 10.24193/sj.2017.v22.2.
Datta, Ganesh. 2022. „Everything You Need to Know About Cookiecutter“ DevOps.com. https://devops.com/everything-you-need-to-know-about-cookiecutter/ (zugegriffen: 28. März 2022).
Gengnagel, Tessa, Frederike Neuber und Daniela Schulz. 2022. „FAIR principles in digital scholarly editions – RIDE“. https://ride.i-d-e.de/fair-criteria-editions/ (zugegriffen: 24. Juli 2024).
Hawkins, Ashleigh. 2022. „Archives, linked data and the digital humanities: Increasing access to digitised and born-digital archives via the semantic web.“ Archival Science 22 (3): 319–44 10.1007/s10502-021-09381-0.
Initiative, W3C Web Accessibility. 2024. „WCAG 2 Overview.“. https://www.w3.org/WAI/standards-guidelines/wcag/ (zugegriffen: 8. April 2024).
Perego, Simon. 2022. „Yiddish: Language, Culture and Memory from the late 19th century to the present“ 10.35008/TRACS-0123.
Pletschacher, Stefan, Christian Clausner und Apostolos Antonacopoulos. 2015. „Europeana Newspapers OCR Workflow Evaluation.“ In Proceedings of the 3rd International Workshop on Historical Document Imaging and Processing, hrsg. von Bertrand Coüasnon, Volker Märgner, Volkmar Frinken, Bill Barrett und Hamid Amiri, 39–46. New York, NY, USA: ACM.