来源:互联网 更新时间:2026-05-31 08:12
5 月 30 日消息,“智元 AGIBOT”最新公众号 29 日发文宣布:具身领域热门榜单 WorldArena Track1(世界模型感知与动作响应赛道)最新评测结果揭晓,智元自研的世界模型 Genie Envisioner-Sim 2.0(以下简称 GE 2.0)登顶榜单。

先说说“世界模型”这个概念。简单理解,它就是能读懂物理世界规律的AI大脑。机器人要是掌握了这套能力,就能像人一样,知道杯子掉地上会碎、水总是往低处流、积木搭太高肯定会倒——这些常识不再是编程指令,而是模型自己的“直觉”。
在这次评测中,智元团队用了一个相当“坦诚”的策略:直接拿原生版本GE 2.0上场,没有针对赛题做任何特殊优化,仅仅是基于榜单数据做了一次基础微调。这相当于不穿“特技装备”去参赛,结果却拿了冠军。
这次发布的GE 2.0,一大亮点是首次在功能上完整覆盖了长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别这几个核心环节。可以说,它已经搭起了一个世界模拟器所需的技术闭环。
举个例子,在长时序推理任务中,GE 2.0的表现相当稳。画面质量随着推理时间拉长,其衰减幅度明显低于行业基线方案。即便是在连续推演40到50秒的长视频片段里,它生成的画面质量依然能超过基线模型前10秒的水准。这种稳定性,在现实应用中其实非常关键。
团队还做了一项很扎实的工作:大量闭环评测结果表明,GE 2.0在多项任务上都与真实世界保持着强相关性。不仅仅是宏观统计意义上的“成功率一致”,他们还进行了逐案(Case-by-case)的rollout结果对比,并借助混淆矩阵(Confusion Matrix)给出了量化的佐证。这进一步证明了GE 2.0作为策略评测器的可靠性。
技术上另一个值得关注的细节是:在奖励模型(Reward Model)的加持下,GE 2.0能够对闭环评测的rollout过程进行自动化筛选,将世界模型中产出的有效高质量数据精准回流给策略模型(Policy Model)。实验数据表明,这一机制在多项任务上都帮助策略模型实现了显著的性能提升。
来自上观新闻的报道还提到,GE 2.0这次是与英伟达最新模型DreamDojo、清华联合斯坦福的Ctrl-World团队等国内外顶尖AI团队同台竞争,最终脱颖而出。更让人意外的是,GE 2.0仅用20亿(2B)参数的模型,就击败了英伟达、微软等超大参数的旗舰模型。这也在某种意义上验证了:在人形机器人这个赛道上,轻量化模型的适配性并不输给那些巨型参数模型。
下饭影视APP下载安装指南
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
《Off Campus》第二季官宣:这对CP还在,但不再是主角
下载浏览器app下载安装选择推荐
免费影视剧APP推荐
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
抖音最火沙雕男生网名(精选100个)
网络热词聊污是什么意思
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
短剧《情绪超市》剧情介绍
短视频软件推荐
洛克王国世界S2赛季狂欢怪谈介绍
免费看电影的软件推荐
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
KuCoin基本面分析
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc