KI-Forschung: LLMs glauben Lügen trotz expliziter Warnung
Eine Studie hat untersucht, ob sich LLMs von offensichtlichen Falschaussagen abbringen lassen. Das Ergebnis ist überraschend. ( KI , Wissenschaft )
Wissenschaftler haben festgestellt, dass große Sprachmodelle (LLMs) Schwierigkeiten haben, falsche Informationen zu erkennen, selbst wenn explizite Warnungen vorhanden sind. In Experimenten mit Modellen wie GPT-4.1 glaubten die KIs unwahre Aussagen, wie etwa, dass Ed Sheeran Olympiasieger im 100-Meter-Lauf wurde, mit hoher Wahrscheinlichkeit. Dies geschah auch nach dem Training und trotz der Einbindung von Hinweisen, die die Falschinformationen widerlegen sollten. Die Forscher bezeichnen dieses Phänomen als "Negation Neglect".
Diese Erkenntnis ist wichtig, da sie die Anfälligkeit von KI-Systemen für Desinformation aufzeigt und die Notwendigkeit robusterer Trainingsmethoden unterstreicht, um die Zuverlässigkeit von KI-Anwendungen zu gewährleisten.
📌 Kaynak
Bu özet Golem kaynağından otomatik derlenmiştir. Tamamı için orijinal habere gidin.
Orijinal haberi oku →