Automatisierte Löschung: Wie ein Algorithmus historische Texte von Max Planck verschwinden ließ
In der digitalen Archivierung von Forschungstexten lauern Tücken, die mitunter groteske Züge annehmen. Ein aktueller Fall zeigt sehr deutlich, was passiert, wenn automatisierte Kontrollsysteme ohne menschliche Aufsicht historische Dokumente bewerten. weiterlesen auf t3n.de
In der digitalen Archivierung von Forschungstexten lauern Tücken, die mitunter groteske Züge annehmen. Ein aktueller Fall zeigt sehr deutlich, was passiert, wenn automatisierte Kontrollsysteme ohne menschliche Aufsicht historische Dokumente bewerten.
Algorithmen liegen nicht immer richtig, wenn sie einen Text beurteilen. (KI-generiertes Bild: Midjourney / t3n)
Der Verlag Springer Nature hat zwei historische Fachartikel des Physik-Nobelpreisträgers Max Planck aus dem eigenen Bestand nachträglich zurückgezogen. Die beiden in den frühen 1940er Jahren erschienenen Texte wurden aus dem digitalen Archiv der Fachzeitschrift The Science of Nature entfernt und durch Dokumente ohne jeden inhaltlichen Wert ersetzt.
Wie das US-amerikanische Wissenschaftsmagazin Science berichtet, waren angebliche Urheberrechtsverletzungen der offizielle Grund für diese weitreichende Löschung aus dem digitalen Gedächtnis der Wissenschaft. Zwei Wissenschaftshistoriker vermuten nach einer Untersuchung jedoch, dass ein fehlerhafter Algorithmus des Verlags die Texte fälschlicherweise als unzulässige Selbstplagiate eingestuft hat.
Die Wissenschaftshistoriker Yves Gingras und Mahdi Khelfaoui von der kanadischen Universität von Quebec haben den Vorfall detailliert analysiert. In einem auf der Plattform Arxiv veröffentlichten Dokument erklären die beiden Männer, dass der Verlag heutige Veröffentlichungsstandards auf eine völlig andere Epoche der Wissenschaftsgeschichte anwendet.
Einer der betroffenen Texte aus dem Jahr 1942 beruht auf einem Vortrag über die exakte Wissenschaft, den Planck zuvor in der Berlin vor Publikum gehalten hatte. Es war in dieser Zeit üblich und von der akademischen Gemeinschaft ausdrücklich gewünscht, identische Inhalte in verschiedenen Publikationen zu veröffentlichen, um eine möglichst große Leserschaft über sprachliche Grenzen hinweg zu erreichen.
Im frühen 20. Jahrhundert lag der redaktionelle Fokus auf der größtmöglichen Verbreitung von Wissen in einer stark fragmentierten wissenschaftlichen Gemeinschaft. Die strikte Trennung zwischen Vorträgen, gesammelten Essays und wissenschaftlichen Zeitschriftenartikeln existierte in der damaligen Zeit noch nicht in der heutigen starren Form.
Der zweite gelöschte Artikel aus dem Jahr 1940 trägt den exakt gleichen Titel wie eine kurze Zeit vorher erschienene Kritik des Philosophen Aloys Müller zur realen Außenwelt in der Wissenschaft. Planck hatte diesen Titel für seine inhaltliche Erwiderung auf die Kritik absichtlich übernommen, was laut Ars Technica bei einem modernen Katalogisierungs-Algorithmus unweigerlich zu ei
📌 Kaynak
Bu haber XML kaynağından derlenmiştir. Tamamı için orijinal habere gidin.
Orijinal haberi oku →