您的位置：首页 > > 教程攻略 > ai资讯 >阿里推出千问具身大模型Qwen-Robot系列，大模型从屏幕走向物理世界

阿里推出千问具身大模型Qwen-Robot系列，大模型从屏幕走向物理世界

来源:互联网 更新时间:2026-06-19 13:45

近期，阿里巴巴正式发布了千问具身智能大模型

Qwen-Robot系列

，一个完整的具身智能模型家族。它包含三个核心模型：

Qwen-RobotManip（VLA操作模型）、Qwen-RobotNa v（VLN移动模型）和Qwen-RobotWorld（世界模型）

。可以说，这是千问大模型家族首次真正为机器人打造的“通用底座”——一个负责灵巧的手，一个负责认路的脚，还有一个负责会思考的大脑。三个模型既可以单独部署，也能协同运转，适配不同形态的机器人。

阿里推出千问具身大模型Qwen-Robot系列，大模型从屏幕走向物理世界

先看

Qwen-RobotManip

，这是一款VLA（视觉-语言-动作）操作模型，核心突破在于它定义了一套

80维统一动作表征

——说白了，就是给不同硬件机器人配了一套通用的“肢体语言”。模型学的是物理规律本身，而不是死记硬背特定动作序列。更厉害的是，它放弃了对绝对坐标的依赖，而是基于摄像头画面中的相对位置生成操作指令。这意味着，换一台机器人硬件，只需要少量反馈就能快速适配，不用从头训练。这个模型基于超过

38,100小时完全开源数据

训练，在RoboChallenge真机多任务评测中，两个版本直接包揽了榜单前两名。拧水龙头、插网线、双臂倒薯条……30项高难度任务，它都能搞定。

再看

Qwen-RobotNa v

，这是一款基于Qwen-VL构建的VLN移动导航模型。它的关键能力是把语言指令导航、目标搜索、自动驾驶等五大任务族统一到了同一个框架里，复杂任务不用手动切换模型。它还引入了一个任务自适应观察机制，记忆策略可以根据任务类型灵活调整，传统模型的记忆僵化问题在这里得到了解决。目前，搭载这个系统的宇树Go2四足机器人已经完成了自主巡逻和寻物导航任务。

最后是