来源:互联网 更新时间:2026-06-02 07:52
先从几个核心判断说起。英伟达这次拿出的Cosmos 3,是全球首个完全开源、全模态的物理AI基础大模型。它用了一套混合Transformer架构,把视觉推理、世界生成和动作预测全部整合在了一起。模型能原生理解并生成文本、图像、视频、环境音效以及动作轨迹,物理仿真的精度在业界处于领先位置。同时,英伟达还拉上了Runway、Black Forest Labs等合作伙伴,成立了Cosmos Coalition联盟,一起推动下一代世界模型的发展。目前,Cosmos 3的Super和Nano版本已经上线,Edge版本也快来了。

它的核心是两招。
第一招是混合Transformer架构。Cosmos 3把推理Transformer和生成Transformer结合在了一起。具体来说,模型先解析物体交互、运动规律及时空关联,理解物理世界背后的逻辑,再基于这些理解去完成视频生成和动作轨迹预测。这个设计让推理和生成形成了一个闭环,确保生成的内容符合物理规律。
第二招是海量多模态物理AI数据集训练。模型训练用了数十亿条样本,覆盖文本、图像、视频、音效和动作轨迹。这种深度的物理世界理解,让开发者可以用更少的数据和更低的成本搭建物理AI系统。
拿它和Google Gemini 2.5 Pro做个比较,差异很明显。
| 维度 | Cosmos 3 | Google Gemini 2.5 Pro |
|---|---|---|
开源性 | 全开源(模型权重+架构) | 闭源API |
模态覆盖 | 文本/图像/视频/音效/动作 | 文本/图像/音频/视频 |
物理AI专注 | 专为物理世界仿真与动作生成设计 | 通用多模态大模型 |
动作生成 | 原生支持机器人/自动驾驶动作轨迹 | 不支持原生动作输出 |
物理精度基准 | Physics-IQ、PAI-Bench开源第一 | 未专门针对物理AI评测 |
训练数据 | 数十亿条物理AI多模态数据 | 通用互联网数据为主 |
部署方式 | NIM微服务/云合作伙伴/本地 | Vertex AI API |
生态联盟 | Cosmos Coalition(Runway、BFL等) | Google自有生态 |
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
网络热词聊污是什么意思
帅气继父网名女生可爱英文(精选100个)
抖音最火沙雕男生网名(精选100个)
蒙古上单是什么梗
帅到极致的网名女生霸气(精选100个)
韦一敏是什么梗
作家助手如何上传自制封面 作家助手如何设置小说的封面
免费看电影的软件推荐
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
因空难被判“过失杀人罪” 空客、法航均被顶格处罚22.5万欧元
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
有寓意的易经网名男生(精选100个)
韩漫小少爷网名大全女生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc