智源王仲远谈世界模型与未来AI发展

🤖 Yapay Zekâ 📰 China 🕐 4 saat önce

作者 | 邱晓芬编辑 | 袁斯来过去几个月，“世界模型”（World Model）从学术黑话迅速膨胀成AI和机器人行业里的关键词。行业的目光转向背后是切实的焦虑。一方面，经过了过去两年的野蛮生长，具身智能暴露了当前AI在物理世界中的短板——机器人能识别物体，却不懂“推杯子会掉”；能听懂指令，却无法预判“拧瓶盖需要多大的力”。世界模型正是试图补上这个短板，让机器人学会物理世界的规律、因果。也就是说，世界模型与具身智能的关系，本质上是“大脑”与“身体”的关系。另一面，大模型在经历了大语言、视觉模型、多模态的探索之后，需要从虚拟走向真实世界的下一阶段。只是，当资本、技术专家、产业资源都倾注于此，世界模型到底如何上岸，人们没有答案。在智源研究院院长王仲远看来，眼下全球围绕世界模型的探索，正被撕扯成四条截然不同的分岔路—— 第一类是以语言为中心的世界模型，包括VLM、VLA，模型在文本空间中预测下一个词，学到的是语言描述的世界，并不能理解背后的物理后果；第二类是以像素为中心的世界模型，像Sora和Seedance等视频生成类模型，

近年来，世界模型成为AI和机器人行业的重要关键词，引发了广泛关注。行业对世界模型的探索存在不同路线，包括以语言、像素、三维结构和视觉表征为中心的模型。智源研究院院长王仲远认为，世界模型的发展仍处于早期阶段，面临诸多挑战。他强调，世界模型需要具备长时序一致性、因果逻辑推断和多场景应用能力。智源研究院尝试将语言和视觉融合到统一的潜空间表征中，以提升模型的理解和决策能力。王仲远认为，世界模型是连接数字世界和物理世界的关键，未来将在机器人、工业和科学研究等领域发挥重要作用。

世界模型的发展将推动AI从虚拟走向现实，解决具身智能的短板，具有重要的技术价值和应用前景。

#chatgpt#openai#gemini#人工智能#space

📌 Kaynak

Bu özet China kaynağından otomatik derlenmiştir. Tamamı için orijinal habere gidin.

Orijinal haberi oku →

📱

News AI World — Mobil uygulama

Bu haberleri 45 dilde, anlık çeviriyle cebinde. Erken erişim için Gmail adresini bırak.

← Tüm haberlere dön

智源王仲远谈世界模型与未来AI发展

📌 Kaynak

📰 Önerilen haberler