来源:互联网 更新时间:2026-06-22 10:52
作者 | 邱晓芬
编辑 | 袁斯来
过去半年,国内具身智能赛道悄然完成了一次重心转移:聚光灯从硬件本体的“自由度竞赛”,逐渐投向决定机器人智能上限的深水区。
只是,当行业反复讨论“机器人能否通过暴力堆数据复刻大语言模型的Scaling Law”时,上海创智学院副教授、智元机器人首席科学家罗剑岚,给出了一个并不随大流的判断——具身智能不能简单照搬大语言模型的发展路径。
罗剑岚的表达风格极具辨识度。他习惯在中英文专业术语间快速切换,逻辑推进密集,很少给出模棱两可的答案。
相比停留在“数据、模型、Infra哪个更重要”的单点争论上,他更倾向于直指问题本质:当前具身智能的核心矛盾,不是某一个环节的孤立突破,而是这些环节能否在真实部署中形成闭环。
这一判断,源自他横跨学术研究与产业落地的深厚积淀。作为伯克利博士,他师从具身智能领域奠基性人物Sergey Levine。毕业后,他曾任Google X与DeepMind研究科学家。14个月前,他回国加入创智学院和智元机器人。
在他看来,目前行业内相当一部分所谓“具身基础模型”的训练方式,并非真正意义上的预训练,而更接近中训练或微调。
原因也很现实:当前高质量的真机交互数据仍然稀缺。尤其是那些覆盖多场景、多任务、多本体,且包含失败、纠错和长尾交互的数据,远不足以支撑类似大语言模型那样的大规模预训练。
这也造成了一个现象:在真机交互数据不足的阶段,不少团队会选择在已有开源模型底座之上,叠加高质量遥操数据,在特定任务上进行对齐或微调。
这种路径在短期内可以快速提升实验室任务表现,但它并不等同于真正意义上的具身基础模型预训练。模型在离线数据上的Loss曲线变好,更多说明它更好地拟合了已有数据;至于能否迁移到新的物理场景、处理长尾扰动和失败恢复,仍需要通过真实部署来验证。
(作者注:Loss是“模型每次猜错了多少的分数”,Loss曲线就是把这分数按时间画出来。Loss曲线往下走,通常表明模型在训练数据上拟合得更好;但在机器人领域,它并不必然等同于真实场景中的部署成功率提升。)
也正因此,罗剑岚认为,具身智能不能盲目照搬GPT式的Scaling Law。
具体而言,在大语言模型中,预训练Loss与模型能力之间存在相对稳定、可预测的统计关系。但在机器人领域,离线Loss下降并不必然对应真实部署成功率提升——机器人面对的是开放物理世界,涉及接触、扰动、长尾场景、硬件差异和任务反馈。模型“记住”了数据,并不代表它能真正“驾驭”现实。
因此,具身智能真正的突破不只是堆参数或堆数据,而是应该部署一个闭环——直到机器人部署规模扩大后,新场景适配成本能够持续下降,数据回流能够稳定提升模型能力,这才是物理世界中的“Scaling Law时刻”。
在这一逻辑框架下,罗剑岚回国后的核心任务,正是构建一个可规模化演进的具身智能闭环。他将这一年的工作重点凝练为三个技术支点:
首先是SOP(可扩展在线后训练)。SOP面向的是大规模机器人在线后训练所需的基础设施问题,包括低延迟数据回流、云端计算、训练调度和模型更新。它的价值不只是一个算法模块,而是验证机器人数据能否从部署现场高效进入训练闭环。
其次是LWD(部署中学习)。它试图打破过去“训练—部署”的割裂状态,让机器人不再是出厂即定型的产品,而是在便利店、商超等真实场景中持续进化的系统。当机器人遇到未见过的货架形态、商品摆放或操作扰动时,系统能够通过真实交互不断积累数据,并将这些经验转化为后续模型改进。
最后是近期由上海创智学院和智元机器人联合发布的τ0-WM世界模型。τ0-WM并不把视频生成当作最终目的,而是把视频预测作为学习物理动力学、评估动作后果的一种手段。更具体地说,它希望成为一个动作条件的物理推演器:在机器人真正执行动作之前,先在模型内部比较不同候选动作可能带来的未来结果,从而帮助系统选择更可靠的动作。
举个例子,面对桌边的鸡蛋,普通VLA可能直接输出抓取动作;而动作条件世界模型可以先比较几条候选轨迹的未来后果,避免选择会把鸡蛋扫落桌面的动作。
在罗剑岚看来,接下来具身智能真正的决胜点,不是硬件,更不是数据、模型、Infra单点能力的强弱,而是它们能不能彼此形成闭环——这就像是木桶的不同木板,任何一个关键环节短板过短,系统能力都难以真正释放。“谁能率先在便利店、商超、仓储等半结构化场景中,跑通‘部署—数据—迭代’的数据飞轮,谁就真正具备了大规模商业化的可能性”,他表示。而关键的时间节点,或许正是未来的12到18个月。
甚至很多中训练也不算夯实。现在行业里很多所谓“机器人基础模型”,更接近在已有开源底座上的任务适配或中训练,还没有真正进入大规模、异构、真实交互数据驱动的预训练阶段。
行业里甚至有一个半开玩笑的说法:“paper上,PI从来没赢过;现实里,PI从来没输过。”这句话背后反映的其实是一个问题:机器人模型不能只看论文指标,最终还是要看真实世界里的部署效果。
回顾LLM的路径,预训练模型本身的输出其实充满噪声,需要通过中训练进行高质量对齐,再通过后训练进一步激活特定能力。真正的机器人基础模型预训练,也应该像LLM一样,吸纳极其广泛、甚至包含噪声的数据。只不过机器人领域的数据不是静态文本,而是真实世界中的交互、失败、纠错、恢复和长尾场景。
大语言模型的Scaling Law建立在预训练Loss与模型能力之间相对稳定、可预测的统计关系上;但这一规律在具身智能领域并不自动成立。机器人的训练Loss下降,仅代表模型更好地拟合了静态数据,并不等同于其在物理世界中的部署成功率提升。物理交互的复杂性意味着,模型“记住”了数据,并不代表它能“驾驭”现实。
因此,具身智能的金标准,绝非数据规模或Loss值,而是真实场景的部署效能。真正的突破点在于,当我们观察到随着部署台数增加,新场景适配成本持续下降,模型迭代效率持续提升——这才是数据飞轮开始转动的临界点。遗憾的是,学界与业界至今无法精确计算这一临界点对应的数据量级。

《Off Campus》第二季官宣:这对CP还在,但不再是主角
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
帅气继父网名女生可爱英文(精选100个)
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
帅到极致的网名女生霸气(精选100个)
如何在夸克浏览器中开启网页视频的倍速播放功能?
作家助手如何上传自制封面 作家助手如何设置小说的封面
蒙古上单是什么梗
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
archiveofourown 实战指南:常见用法整理
韦一敏是什么梗
韩漫小少爷网名大全女生(精选100个)
网络热词聊污是什么意思
抖音最火沙雕男生网名(精选100个)
有寓意的易经网名男生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
小众游戏抖音网名男生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc