Nvidia stellt Cosmos 3 als Weltmodell vor: Aber was ist das eigentlich?
Cosmos 3 ist Nvidias neues KI-Modell für Robotik und autonome Systeme. „Weltmodelle“ werden oft als „wichtiger Schritt“ zur Superintelligenz bezeichnet. Aber was sind „Weltmodelle“ und was hat das mit Künstlicher Intelligenz zu tun? weiterlesen auf t3n.de
Cosmos 3 ist Nvidias neues KI-Modell für Robotik und autonome Systeme. „Weltmodelle“ werden oft als „wichtiger Schritt“ zur Superintelligenz bezeichnet. Aber was sind „Weltmodelle“ und was hat das mit Künstlicher Intelligenz zu tun?
Auch Google Deepmind bringt Genie 3 und bezeichnet das KI-Modell als Weltmodell. (Bild: Google)
Nvidia hat mit Cosmos 3 ein neues Weltmodell für Robotik und autonome Systeme vorgestellt. Anders als bisher vereine das Modell mehrere Funktionen, schreibt das Unternehmen – darunter Simulation, Szenenverständnis und Handlungsplanung. Bisher mussten Entwickler noch mit separaten Modellen für die verschiedenen Funktionen arbeiten. Aber was ist eigentlich ein „Weltmodell“ und was hat das mit fortgeschrittener Robotik, autonomen Systemen und Künstlicher Intelligenz zu tun?
Weltmodelle werden so genannt, weil sie nach den Anweisungen aus einem Prompt eine virtuelle Welt erzeugen – oder besser gesagt eine 3D-Szene, die einen Ausschnitt aus einer virtuellen Welt darstellt. Über Prompts kann ein User oder auch ein Software-Agent begrenzt mit dieser Welt interagieren. Sich also zum Beispiel darin bewegen oder einen Gegenstand greifen. Das Modell reagiert auf solche Prompts, indem es die damit modifizierte Welt darstellt. Das eignet sich natürlich auch dazu, autonome Roboter zu trainieren.
Zuletzt hatte Deepmind im August 2025 mit Genie 3 ein neues KI-Modell vorgestellt, das interaktive 3D-Welten in Echtzeit generieren kann. Solche Weltmodelle sieht DeepMind als zentrale Bausteine bei der Entwicklung einer Superintelligenz.
Das Unternehmen arbeitet schon lange daran, KIs intelligenter zu machen, indem sie selbstständig lernen, Probleme zu lösen: Die Software probiert zunächst wahllose Aktionen aus, um ein Problem zu lösen. Eine Feedback-Schleife sorgt jedoch dafür, dass erfolgreiche Aktionen belohnt werden. Das System probiert diese Aktionen also öfter und wird mit der Zeit immer besser. Dieser Ansatz wird Verstärkungslernen (Reinforcement Learning) genannt.
Im Prinzip sei dieses Meta-Learning „ein wesentlicher Schlüssel zur künstlichen allgemeinen Intelligenz“, sagte der KI-Forscher Matthew Botvinick 2018 – damals bei DeepMind. „Denn unsere Welt besitzt eine spezifische Eigenart: Wir erleben niemals dieselbe Situation zweimal, aber wir erleben auch niemals eine komplett neue Situation. Jedes intelligente System muss also die Fähigkeit besitzen, die Erfahrungen der Vergangenheit zu nutzen, um sie auf elegante und schnelle Weise auf neue Aufgaben zu übertragen.“
Die große Herausforderung bestünde allerdings darin, Systeme zu bauen, d
📌 Kaynak
Bu özet t3n kaynağından otomatik derlenmiştir. Tamamı için orijinal habere gidin.
Orijinal haberi oku →