来源:互联网 更新时间:2026-05-29 20:59
最近,国际机器学习系统顶会MLSys 2026的MoE模型推理优化挑战赛结果揭晓,来自清华大学存储实验室与腾讯混元AI Infra团队的联合方案,从一众顶尖对手中脱颖而出,拿下了全球冠军。

这张示意图清晰地展示了他们核心的优化结构,涵盖了E-Shard专家切分、连续DMA、PSUM/GEMV并发、冷启动流水和预取控制等关键技术点。
这次夺冠的关键,除了上述精巧的系统设计,还有一个“秘密武器”——团队联合研发的、基于Agent的推理算子优化器“Knight”。这个工具实现了一个从方案提出、代码落地到复盘迭代的自动化闭环,极大地拓展了优化的搜索空间,让很多过去靠人工难以穷尽的优化可能性得以实现。
效果是立竿见影的。最终,这套方案将模型的端到端推理时间从14.91秒大幅压缩到了3.56秒,性能加速比达到了4.1倍。更值得关注的是单步解码延迟的优化,从12.63毫秒降到了5.45毫秒。而在权重加载期间,DMA引擎的利用率也提升到了80%左右,这意味着硬件资源的利用效率得到了显著改善。
能够在Stanford、MIT等国际顶尖高校团队的竞争中胜出,这份成绩单的含金量不言自明。它不仅仅是一枚奖牌,更清晰地表明,我们在面向大模型的底层系统适配与核心算子优化领域,已经积累了相当深厚的工程实践能力。这项成果也为未来在超节点算力平台上,高效部署万亿参数级别的MoE大模型,提供了一个极具参考价值的工程范本。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
免费影视剧APP推荐
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
帅气继父网名女生可爱英文(精选100个)
网络热词聊污是什么意思
抖音最火沙雕男生网名(精选100个)
蒙古上单是什么梗
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
韦一敏是什么梗
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
作家助手如何上传自制封面 作家助手如何设置小说的封面
免费看片软件下载地址推荐
免费看电影的软件推荐
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
有寓意的易经网名男生(精选100个)
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc