机器人世界模型与VLA基础模型

物理AI基础模型密集发布：英伟达Cosmos 3世界模型、通义Qwen-RobotWorld与Qwen-RobotManip的VLA模型、大晓开悟世界模型登顶RoboTwin评测，日本国家队为百万机器人开发物理AI多模态基础模型

7月1日

日本应对劳动力短缺：为1000万台机器人开发的AI模型

日本经济产业省与NEDO正式委托Noetra和AIST开发“物理AI”多模态基础模型，可同时理解语言、图像、视频和传感器数据，

6月16日

Qwen-RobotWorld：具身智能体的无界世界

Qwen-RobotWorld以语言为统一动作接口，采用双流Multimodal Diffusion Transformer（MMDiT）架构，

6月16日

Qwen-RobotManip：对齐解锁机器人操作基础模型的规模化能力

Qwen-RobotManip 是通义千问基于 Qwen-VL 的视觉-语言-动作（VLA）基础模型，引入覆盖表示、运动和行为三维度的统一对齐框架。

6月12日

大晓机器人开悟世界模型在RoboTwin 2.0等具身智能评测中居首超越Cosmos3

据获悉，大晓机器人开悟世界模型（Kairos）在RoboTwin 2.0、LIBERO-Plus、WorldModelBench Robot、Dream…

6月2日

物理AI爆发临近？英伟达发布“全能”世界模型机器人、自动驾驶有望获强力助推

在今日举行的2026台北GTC大会期间，英伟达发布了Cosmos 3——一款基于突破性Transformer混合架构的物理AI世界模型。