来源:互联网 更新时间:2026-06-16 12:57
6月16日下午消息,阿里巴巴发布千问具身智能大模型Qwen-Robot系列,包含VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav 和世界模型 Qwen-RobotWorld三大模型。这三个模型分别为机器人装上灵巧的手、认路的脚和会思考的大脑,既可单独部署,也能协同运转。
VLA (Vision-Language-Action,视觉-语言-动作)模型是当前具身智能最核心基础模型之一,它将视觉感知、语言理解和动作决策融合,让机器人看得懂、能动手。传统VLA模型的核心痛点是迁移能力不足,换机器人、换场景性能就下降。让不同形态的机器人能听懂一个模型指挥,需要解决动作统一和空间统一两个核心问题,Qwen-RobotManip正是从这两点切入。据悉,Qwen-RobotManip用一套80维的统一动作表征,为不同硬件定义了通用的“肢体语言”,让机器人习得基础物理规律与动作逻辑,动作不再是生硬模仿。搭载在不同的硬件中,Qwen-RobotManip只需数步反馈即可自动适配,性能稳定高效。
如果说 VLA 模型让机器人能动手,那么VLN(Vision-Language Navigation,视觉语言导航)模型,就是让机器人能认路、会跑腿。Qwen-RobotNav 基于 Qwen-VL 构建,将语言指令导航、目标搜索、自动驾驶等五大任务族统一到同一个框架,遇到复杂任务无需人工切换模型。
Qwen-RobotWorld则基于对物理规律的理解,可推理和模拟出下一个时间点机器人的合理动作和状态,让机器人在现实世界中可按图索骥般地行动。(文猛)
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
网络热词聊污是什么意思
帅气继父网名女生可爱英文(精选100个)
抖音最火沙雕男生网名(精选100个)
蒙古上单是什么梗
帅到极致的网名女生霸气(精选100个)
作家助手如何上传自制封面 作家助手如何设置小说的封面
韦一敏是什么梗
免费看电影的软件推荐
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
因空难被判“过失杀人罪” 空客、法航均被顶格处罚22.5万欧元
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
有寓意的易经网名男生(精选100个)
韩漫小少爷网名大全女生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc