机器人世界模型与VLA基础模型
物理AI基础模型密集发布:英伟达Cosmos 3世界模型、通义Qwen-RobotWorld与Qwen-RobotManip的VLA模型、大晓开悟世界模型登顶RoboTwin评测,日本国家队为百万机器人开发物理AI多模态基础模型
7月1日
日本应对劳动力短缺:为1000万台机器人开发的AI模型
日本经济产业省与NEDO正式委托Noetra和AIST开发“物理AI”多模态基础模型,可同时理解语言、图像、视频和传感器数据,
6月16日
Qwen-RobotWorld:具身智能体的无界世界
Qwen-RobotWorld以语言为统一动作接口,采用双流Multimodal Diffusion Transformer(MMDiT)架构,
6月16日
Qwen-RobotManip:对齐解锁机器人操作基础模型的规模化能力
Qwen-RobotManip 是通义千问基于 Qwen-VL 的视觉-语言-动作(VLA)基础模型,引入覆盖表示、运动和行为三维度的统一对齐框架。
6月12日
大晓机器人开悟世界模型在RoboTwin 2.0等具身智能评测中居首 超越Cosmos3
据获悉,大晓机器人开悟世界模型(Kairos)在RoboTwin 2.0、LIBERO-Plus、WorldModelBench Robot、Dream…
6月2日
物理AI爆发临近?英伟达发布“全能”世界模型 机器人、自动驾驶有望获强力助推
在今日举行的2026台北GTC大会期间,英伟达发布了Cosmos 3——一款基于突破性Transformer混合架构的物理AI世界模型。