来源:互联网 更新时间:2026-04-13 16:52
12月12日消息,“蚂蚁开源”公众号发文,蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开技术报告。
这一发布打破了行业对扩散模型难以扩展的固有认知,实现了参数规模与性能的双重重大突破。
LLaDA2.0系列包含基于MoE架构的16B (mini) 和里程碑式的100B (flash) 两个版本,首次将扩散模型的参数规模成功扩展至百亿量级。

尤为引人注目的是,该模型在代码、数学及智能体任务上的性能超越了同级别的自回归(AR)模型。
通过蚂蚁创新的Warmup-Stable-Decay (WSD) 持续预训练策略,LLaDA2.0能够高效继承现有AR模型的知识储备,显著避免了从头训练的巨大成本。
在训练优化方面,LLaDA2.0结合了置信度感知并行训练(CAP)和扩散模型版DPO,不仅保障了生成质量,更充分发挥了扩散模型并行解码的先天优势。最终,模型实现了相比AR模型高达2.1倍的推理加速。
LLaDA2.0的成功有力证明:在超大规模参数下,扩散模型不仅完全可行,更能展现出比传统自回归模型更强的性能与更快的速度。

本文标签: #蚂蚁 #模型
《Off Campus》第二季官宣:这对CP还在,但不再是主角
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
archiveofourown 实战指南:常见用法整理
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
作家助手如何上传自制封面 作家助手如何设置小说的封面
如何在夸克浏览器中开启网页视频的倍速播放功能?
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
全链网:黄金价格因美元的走强及利率担忧而下跌
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
美国市场:股票相对债券的风险溢价正在消失
有寓意的易经网名男生(精选100个)
电视剧《小欢喜》剧情介绍
电影《遁甲门之消失的公主》剧情介绍
动漫《柚木家的四兄弟》剧情介绍
植物娘大战僵尸电脑端与手机端存档转移的方法
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
卡厄思梦境哀嚎螺旋塔攻略 哀嚎螺旋塔怎么玩
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc