Eine digitale Begriffsgeschichte des virtuellen Teilchens
https://zenodo.org/records/14942996
Einleitung
Virtuelle Teilchen sind eigentümliche Objekte. Sie spielen eine wichtige Rolle bei der Beschreibung fundamentaler Wechselwirkungen von Materie und Strahlung und weisen in diesem Sinne nachweisbare und reale Wirkungen auf. Jedoch haben virtuelle Teilchen nicht die Eigenschaften realer Teilchen und treten immer nur in vorübergehenden, nicht beobachtbaren Phasen von Zerfällen oder anderen Prozessen mit Elementarteilchen auf. Obwohl sie seit langem ein wichtiger Bestandteil der Teilchenphysik sind, hat der Begriff „virtuelles Teilchen“ bis heute vielfältige Konnotationen und Bedeutungen in der physikalischen Praxis und seine historische Entwicklung zeichnet sich durch anhaltende Bedeutungsverschiebungen und -erweiterungen aus.
Bisherige Studien legen den Fokus vor allem auf die qualitative Untersuchung bestimmter Aspekte der Geschichte des Konzepts anhand weniger ausgewählter Texte (z.B. Wüthrich 2010; Ehberger 2023; Martinez 2023). Unsere Studie versucht, seine gesamte Entwicklung, von der Einführung des Konzepts der Virtualität in die Quantenmechanik in den 1920er Jahren bis heute, nachzuvollziehen. Dafür nutzen wir den Ansatz der digitalen Begriffsgeschichte, bei welchem konzeptionelle Überlegungen mit computergestützten Methoden kombiniert werden (Hamilton et al. 2016; Wevers und Koolen 2020) und welcher auch in der Wissenschaftsgeschichte in jüngster Zeit vermehrt Verwendung findet (Kleymann et al. 2022; Simons 2024).
Datensatz
Durch eine Vereinbarung mit der American Physical Society stehen uns alle nicht frei zugänglichen Volltexte und Metadaten der renommierten Zeitschriftenfamilie Physical Review (PR) zur Verfügung. Mithilfe einer Keyword-Suche nach „virtual“ in Titel, Volltext und Abstract von acht ausgewählten Zeitschriften (PR Series II, PR A – E, PR Letters, Reviews of Modern Physics) identifizieren wir ca. 43.000 Artikel, die für die Entwicklung des Konzepts des virtuellen Teilchens potenziell von Bedeutung sind. Abbildung 1 zeigt die zeitliche Verteilung des „virtual“-Korpus sowie dessen jeweiligen Anteil pro Jahr am Gesamtkorpus (ca. 700.000 Artikel). Deutlich zu erkennen ist die relative geringe Textmenge im Korpus vor 1950 sowie der folgende stetige Anstieg der relevanten Publikationen. Erwähnenswert ist außerdem die Hochphase des Anteils von Artikeln mit „virtual“ von ungefähr 1960 bis 1980 in Folge einiger bahnbrechender Veröffentlichungen um 1950 (siehe weiter unten).
Methode
Mithilfe eines BERT-Modells, welches durch Re-Training an die hochspezialisierte wissenschaftliche Sprache unseres Korpus angepasst wurde (Domain Adaptation), erzeugen wir kontextualisierte Word Embeddings für alle ca. 125.000 Okkurrenzen des Begriffs “virtual” in unserem Korpus. Diese Embeddings können dann für die automatisierte Erkennung unterschiedlicher Aspekte begrifflicher Veränderung genutzt werden (Semantic Change Detection, vgl. Periti und Montanelli 2024). Der Fokus unserer Studie ist die Untersuchung der Dynamik der dominanten Bedeutung von “virtual” einerseits und der Veränderung des Grads der Polysemie andererseits. Die Quantifizierung dieser Bedeutungsverschiebungen wird mithilfe von Ähnlichkeitsmaßen wie der Kosinus-Distanz und informationstheoretischen Maßen auf Grundlage von Clustering wie der Shannon-Entropie erreicht. Die Evaluation der Ergebnisse erfolgt durch Kookkurrenz-Analysen mithilfe von Dependency Parsing und qualitativen Auswertungen.
Dominante Bedeutung stabilisiert sich
Ein vorläufiges zentrales Ergebnis unserer Studie ist die zunehmende Stabilisierung der dominanten Bedeutung von “virtual”. Abbildung 3 zeigt pro Jahr die invertierte Kosinus-Ähnlichkeit (PRT) des durchschnittlichen Vektors von “virtual” zum vorhergehenden Jahr. Die Grafik deutet eine Trennung der konzeptionellen Entwicklung des virtuellen Teilchens in zwei Phasen an: Die erste Periode bis in die 1950er Jahre ist gekennzeichnet durch ausgeprägte Schwankungen, was auf wiederholte konzeptionelle Neuorientierungen während der frühen Entwicklung des Konzepts hinweist, ohne dass sich dabei bereits eine feste oder dominante Bedeutung herausgebildet hat.
| Jahrzehnt | Top 1 | Top 2 | Top 3 | Top 4 |
| 1920 | cathode (23%) | orbit (14%) | oscillator (12%) | radiation (7%) |
| 1930 | height (22%) | level (18%) | state (9%) | oscillator (5%) |
| 1940 | height (13%) | quanta (11%) | level (8%) | state (8%) |
| 1950 | photon (11%) | state (10%) | meson (9%) | process (6%) |
| 1960 | photon (13%) | state (12%) | transition (5%) | excitation (5%) |
| 1970 | photon (21%) | state (11%) | excitation (5%) | transition (3%) |
| 1980 | photon (15%) | state (11%) | transition (4%) | excitation (4%) |
| 1990 | photon (14%) | state (8%) | transition (3%) | correction (3%) |
| 2000 | photon (14%) | state (8%) | correction (4%) | excitation (3%) |
| 2010 | photon (12%) | state (7%) | correction (4%) | process (3%) |
| 2020 | photon (14%) | state (7%) | correction (3%) | orbital (2%) |
Diese Ergebnisse decken sich mit den qualitativen Erkenntnissen der Forschungsliteratur: Um 1950 tragen die bahnbrechenden Beiträge von Richard Feynman und Freeman J. Dyson (Feynman 1949; Dyson 1949) in Physical Review - Series II wesentlich zur Etablierung des Konzepts des virtuellen Teilchens bei. Mit dem nachfolgenden Beginn der zweiten Phase beginnt sich diese vorherrschende Bedeutung allmählich zu stabilisieren, ab 1950 erkennbar an den zunehmend dominanten Dependencies „photon“ und „state“ (siehe Tabelle 1). Unerwartet ist der Ausschlag in den frühen 1980er Jahren, welcher auf eine kurzfristige begriffliche Instabilität oder Neuorientierung hinweist.
Grad der Polysemie nimmt zu
Gleichzeitig nimmt der Grad der Polysemie über den gesamten Untersuchungszeitraum zu (Abbildung 4). Dargestellt ist die normalisierte Shannon-Entropie des jeweiligen Jahres, welche auf Grundlage von K-Means-Clustering misst, wie viel Information durchschnittlich benötigt wird, um ein zeitspezifisches Embedding von “virtual” einem Bedeutungscluster zuzuordnen. Der Grad der Polysemie schwankt in den frühen Jahren deutlich, nimmt ab 1950 immer langsamer zu und lässt sich somit ebenfalls grob in die zwei beschriebenen Phasen einteilen. Eine mögliche Erklärung dafür könnte die Diversifizierung des Konzepts in den unterschiedlichen Disziplinen der Physik sein. Gleichzeitig bleibt die dominante Verwendung im Sinne des virtuellen Teilchens (insbesondere des virtuellen Photons) bestehen.
Ausblick
In der nächsten Phase der Analyse möchten wir einige Aspekte weiter vertiefen: Die Textmenge ist in der Frühphase des Konzepts relativ gering. Erste Versuche mit statistischen Testverfahren wie Permutationstests (Liu et al. 2021) weisen auf stabile Ergebnisse der Metriken bei der Untersuchung der dominanten Bedeutung hin. Für die Polysemie konnte bisher allerdings kein geeignetes Testverfahren identifiziert werden. Wir planen außerdem die genaue Untersuchung der Bedeutungsverschiebungen in den Disziplinen bzw. disziplinenspezifischen Journals des Korpus sowie eine tiefgehende Eingrenzung und Analyse des Ausschlags der dominanten Bedeutung in den frühen 1980er Jahren. Eine ausführlichere Beschreibung unserer Studie findet sich in Zichert und Wüthrich 2024.
Bibliographie
- American Physical Society. 2023. „APS Data Sets for Research“. https://journals.aps.org/datasets.
- Dyson, F. J. 1949. „The S Matrix in Quantum Electrodynamics“. Physical Review 75 (11): 1736–55. https://doi.org/10.1103/PhysRev.75.1736 .
- Ehberger, Markus. 2023. „From virtual oscillators to virtual transitions to virtual particles: Practices and representations in the formation of the virtual particle concept“. Phd.
- Feynman, R. P. 1949. „Space-Time Approach to Quantum Electrodynamics“. Physical Review 76 (6): 769–89. https://doi.org/10.1103/PhysRev.76.769 .
- Hamilton, William L., Jure Leskovec, und Dan Jurafsky. 2016. „Diachronic Word Embeddings Reveal Statistical Laws of Semantic Change“. In Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics. https://doi.org/10.18653/v1/P16-1141.
- Kleymann, Rabea, Andreas Niekler, und Manuel Burghardt. 2022. „Conceptual Forays: A Corpus-Based Study of “Theory” in Digital Humanities Journals“. Journal of Cultural Analytics 7, Nr. 4. https://doi.org/10.22148/001c.55507.
- Liu, Yang, Alan Medlar, und Dorota Glowacka. 2021. „Statistically significant detection of semantic shifts using contextual word embeddings“. In Proceedings of the 2nd Workshop on Evaluation and Comparison of NLP Systems, 104–13. https://doi.org/10.18653/v1/2021.eval4nlp-1.11 .
- Martinez, Jean-Philippe. 2023. „Virtuality in modern physics in the 1920s and 1930s: Meaning(s) of an emerging notion“. Perspectives on Science, Juni, 1–40. https://doi.org/10.1162/posc_a_00610 .
- Periti, Francesco, und Stefano Montanelli. 2024. „Lexical Semantic Change through Large Language Models: a Survey“. ACM Comput. Surv. 56 (11): 282:1-282:38. https://doi.org/10.1145/3672393 .
- Simons, Arno. 2024. „Meaning at the Planck scale? Contextualized word embeddings for doing history, philosophy, and sociology of science“. arXiv. https://doi.org/10.48550/arXiv.2411.14073.
- Wevers, Melvin, und Marijn Koolen. 2020. „Digital begriffsgeschichte: Tracing semantic change using word embeddings“. Historical Methods: A Journal of Quantitative and Interdisciplinary History 53 (4): 226–43. https://doi.org/10.1080/01615440.2020.1760157 .
-
Wüthrich, Adrian. 2010.
The genesis of feynman diagrams. Archimedes series (ed. jed Z. Buchwald). Dordrecht: Springer.
Zichert, Michael, und Adrian Wüthrich. 2024. „Tracing the Development of the Virtual Particle Concept Using Semantic Change Detection“. https://ceur-ws.org/Vol-3834/paper95.pdf.