来源:互联网 更新时间:2026-07-04 14:59
最近英伟达在7月2日开源了一款有意思的新模型——Nemotron-Labs-TwoTower离散扩散语言模型,目标很明确:解决大模型逐token生成时速度太慢的老大难问题。模型权重已经在Huggingface上开放下载。更关键的是,它并不是从零开始训练的,而是直接基于现有的Nemotron骨干网络改造,复用预训练权重,开发成本因此大幅降低,可以说是个“站在巨人肩膀上”的方案。

这个模型总参数量60B,但拆成了两座各30B的独立神经网络协同工作,每座塔激活3B参数,搭载128个可路由专家模块。具体分工是怎样的?上下文塔是固定冻结的,负责留存全文语义信息;去噪塔则专门训练,依靠扩散机制并行生成文本。两塔之间通过交叉注意力互通数据,相当于一个负责“记笔记”,一个负责“写文章”,各司其职。
传统模型只能逐token串行输出,而双塔架构允许并行写入文本,推理吞吐量自然大幅提升。从多类基准测试的数据来看,模型综合能力保留了原版98.7%的水准,而文本生成吞吐速度直接提升了2.42倍。当然,没有十全十美的事——代码、数学类任务有小幅下滑,但在大多数场景下,这个速度与质量的平衡已经相当令人满意。
该模型采用英伟达专属开源协议开放权重,开发者可以自由下载测试以及商用部署。运行配置上需要两张H100或A100 80GB显卡才能发挥完整双塔推理能力——单卡仅支持纯自回归模式,双塔完整推理必须双卡协同。测试覆盖了常识、数学、代码、阅读理解等多项任务,多数指标与原版基本持平,可以说在生成速度与内容质量之间找到了一个不错的平衡点。
archiveofourown 实战指南:常见用法整理
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
电视剧《小欢喜》剧情介绍
俄罗斯最大yandex入口外贸日报直达链接
如何在夸克浏览器中开启网页视频的倍速播放功能?
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
美好的简约网名男生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
腾讯元宝怎么用来分析股票基金的基本面信息?
盖乐世社区怎么删除帖子?盖乐世社区个人发布内容撤回步骤
二次元男生网名可爱(精选100个)
wallpaper壁纸声音怎么开启
问题:CIA币好不?Cia Protocol币今日上线:价格预测、代币经济学和未来潜力
免费观看国外短视频的app有哪些 观看国外短视频的软件下载
国际贵金属走低,现货黄金价格跌0.49%
新浪人工智能热点小时报丨2026年06月20日02时_今日实时人工智能热点速递
独家/李宰旭入伍前「登上孤岛服役」 惊见前辈裸体:忍不住笑了
动漫《无赖勇者的鬼畜美学》剧情介绍
短剧《嫡女她是山大王》剧情介绍
AO3网址链接入口 教程:从入门到实际使用
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc