热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >阿里推出千问具身大模型Qwen-Robot系列,大模型从屏幕走向物理世界

阿里推出千问具身大模型Qwen-Robot系列,大模型从屏幕走向物理世界

来源:互联网 更新时间:2026-06-19 13:45

近期,阿里巴巴正式发布了千问具身智能大模型

Qwen-Robot系列

,一个完整的具身智能模型家族。它包含三个核心模型:

Qwen-RobotManip(VLA操作模型)、Qwen-RobotNa v(VLN移动模型)和Qwen-RobotWorld(世界模型)

。可以说,这是千问大模型家族首次真正为机器人打造的“通用底座”——一个负责灵巧的手,一个负责认路的脚,还有一个负责会思考的大脑。三个模型既可以单独部署,也能协同运转,适配不同形态的机器人。

阿里推出千问具身大模型Qwen-Robot系列,大模型从屏幕走向物理世界

先看

Qwen-RobotManip

,这是一款VLA(视觉-语言-动作)操作模型,核心突破在于它定义了一套

80维统一动作表征

——说白了,就是给不同硬件机器人配了一套通用的“肢体语言”。模型学的是物理规律本身,而不是死记硬背特定动作序列。更厉害的是,它放弃了对绝对坐标的依赖,而是基于摄像头画面中的相对位置生成操作指令。这意味着,换一台机器人硬件,只需要少量反馈就能快速适配,不用从头训练。这个模型基于超过

38,100小时完全开源数据

训练,在RoboChallenge真机多任务评测中,两个版本直接包揽了榜单前两名。拧水龙头、插网线、双臂倒薯条……30项高难度任务,它都能搞定。

再看

Qwen-RobotNa v

,这是一款基于Qwen-VL构建的VLN移动导航模型。它的关键能力是把语言指令导航、目标搜索、自动驾驶等五大任务族统一到了同一个框架里,复杂任务不用手动切换模型。它还引入了一个任务自适应观察机制,记忆策略可以根据任务类型灵活调整,传统模型的记忆僵化问题在这里得到了解决。目前,搭载这个系统的宇树Go2四足机器人已经完成了自主巡逻和寻物导航任务。

最后是

Qwen-RobotWorld

,作为具身智能世界模型,它的核心是基于对物理规律的认知,去推理并模拟机器人下一时刻的动作与状态。这相当于在真实行动之前先做一次“预演”,让机器人提前知道后果。同时,它还能生成视频数据,缓解具身智能训练数据短缺的瓶颈,在动作执行前预推演轨迹,提升操作精度。

整个行业现在正处在从实验室研发向真实场景商业化跨越的临界点,最大的门槛就是机器人能否在陌生环境中听懂指令、稳定执行。Qwen-Robot系列的解题思路很直白:把视觉语言能力接入控制系统。通过标准化接口,分别接入操作控制、移动控制和世界预测,实现跨场景、跨机型的通用化。

值得一提的是,就在上个月(5月20日),阿里刚发布了旗舰模型

Qwen3.7-Max

,在Arena全球大模型盲测中超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产第一,逼近GPT、Claude、Gemini的最强水平。Qwen-Robot系列正是把这一认知引擎从数字世界延伸到物理世界的关键一步。

目前,已经有多家机器人企业启动了技术对接。预计年内,首批搭载该系统的商用产品就会出现,工业巡检、物流分拣、家庭服务等场景有望率先受益。当然,大模型在虚拟环境中的预测与真实物理世界毫秒级精密控制之间,仍然存在产业公认的落地鸿沟。实际表现到底如何,还得等量产之后用真机说话。

热门手游

相关攻略

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc