来源:互联网 更新时间:2026-05-21 10:49
5月21日上午消息,智谱今日宣布落地部署了一项直接影响大模型推理效率的架构创新ZCube:线上Infra实测数据表明,在同等GPU配置下,将网络带宽从200Gbps提升至400Gbps,推理总吞吐提升约10%,首响时延下降19%,这一规律随着推理规模扩大会越来越显著。
通过将ZCube投入在千卡级GLM-5.1的一个线上推理集群中,在GPU型号、软件栈、业务代码全部不变的前提下,仅升级网络架构,其与传统ROFT架构的对比GPU平均推理吞吐提升15%以上,TTFT P99尾时延下降40.6%。
这意味着,同样的硬件投入下,智谱GLM大模型现在每秒能多响应15%的API请求。对于服务上百万开发者的大模型API平台而言,这直接对应更高的并发上限、更低的排队延迟,以及在流量峰值下更稳定的用户体验。
成本端的变化同样明显,ZCube 架构所需的交换机和光模块比原有方案少三分之一。规模越大,这个差值越可观。
更关键的是,这项升级的边际成本接近于零:GPU 不换,服务器不换,软件代码不改,纯粹是组网架构的替换。这意味着智谱已有的算力资产在同等投入下释放了更高的产出,相当于存量资产的效率重估。
据悉,ZCube技术被国际顶会ACM SIGCOMM 2025评价为“显著改变整个行业对网络的认知方式”,此次在智谱的落地实践是ZCube架构首次在真实大规模推理集群中完成生产验证。(文猛)
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
4D采矿者官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
BuuPo官网在哪下载 最新官方下载安装地址
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
好用的手环阅读app下载安装
无尽花界时装合辑
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
洛克王国世界雷暴平衡队终极攻略
萌神契约手游下载安装
看片软件推荐
史莱姆大魔王2官网在哪下载 最新官方下载安装地址
王者荣耀s29赛季娜可露露技能怎么加点
人声接近真人!OpenAI一口气更新三款超强语音AI
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc