智源王仲远谈世界模型与未来AI发展

🤖 Yapay Zekâ 📰 China 🕐 4 saat önce
智源王仲远谈世界模型与未来AI发展

作者 | 邱晓芬 编辑 | 袁斯来 过去几个月,“世界模型”(World Model)从学术黑话迅速膨胀成AI和机器人行业里的关键词。 行业的目光转向背后是切实的焦虑。 一方面,经过了过去两年的野蛮生长,具身智能暴露了当前AI在物理世界中的短板——机器人能识别物体,却不懂“推杯子会掉”;能听懂指令,却无法预判“拧瓶盖需要多大的力”。世界模型正是试图补上这个短板,让机器人学会物理世界的规律、因果。 也就是说,世界模型与具身智能的关系,本质上是“大脑”与“身体”的关系。 另一面,大模型在经历了大语言、视觉模型、多模态的探索之后,需要从虚拟走向真实世界的下一阶段。 只是,当资本、技术专家、产业资源都倾注于此,世界模型到底如何上岸,人们没有答案。 在智源研究院院长王仲远看来,眼下全球围绕世界模型的探索,正被撕扯成四条截然不同的分岔路—— 第一类是以 语言为中心 的世界模型,包括VLM、VLA,模型在文本空间中预测下一个词,学到的是语言描述的世界,并不能理解背后的物理后果; 第二类是以 像素为中心 的世界模型,像Sora和Seedance等视频生成类模型,

近年来,世界模型成为AI和机器人行业的重要关键词,引发了广泛关注。行业对世界模型的探索存在不同路线,包括以语言、像素、三维结构和视觉表征为中心的模型。智源研究院院长王仲远认为,世界模型的发展仍处于早期阶段,面临诸多挑战。他强调,世界模型需要具备长时序一致性、因果逻辑推断和多场景应用能力。智源研究院尝试将语言和视觉融合到统一的潜空间表征中,以提升模型的理解和决策能力。王仲远认为,世界模型是连接数字世界和物理世界的关键,未来将在机器人、工业和科学研究等领域发挥重要作用。

世界模型的发展将推动AI从虚拟走向现实,解决具身智能的短板,具有重要的技术价值和应用前景。

#chatgpt#openai#gemini#人工智能#space

📌 Kaynak

Bu özet China kaynağından otomatik derlenmiştir. Tamamı için orijinal habere gidin.

Orijinal haberi oku →
📱
News AI World — Mobil uygulama
Bu haberleri 45 dilde, anlık çeviriyle cebinde. Erken erişim için Gmail adresini bırak.
← Tüm haberlere dön