来源:互联网 更新时间:2026-02-24 11:39
2月22日消息,春节期间国产AI大模型轮番登场,除了DeepSeek V4还在低调之外,几家热门模型都来了,其中智谱的GLM-5是其中热度最高的之一。
从智谱官网介绍来看,GLM-5重点就是提升编程与智能体能力,其参数量达到了7440亿,是上代GLM-4.X的2倍左右,性能提升很明显。
发布之后由于太受欢迎,导致GLM-5需求暴涨,甚至导致算力不够,用户体验下滑,为此智谱还发布了道歉信,并给出了补偿方案,其能力表现可见一斑。

今天智谱还发布了GLM-5大模型的技术报告,
1、引入DSA稀疏注意力机制(DeepSeek Sparse Attention, DSA),极大降低了训练与推理成本。
此前的GLM-4.5依赖标准MoE架构提升效率,而DSA机制则使GLM-5能够根据Token的重要性动态分配注意力资源。在不折损长上下文理解和推理深度的前提下,算力开销得以大幅削减。
得益于此,智谱将模型参数规模扩展至 744B,同时将训练Token规模提升至28.5T。
2、构建全新的异步RL基础设施
基于GLM-4.5时期 slime 框架“训练与推理解耦”的设计,智谱的新基建进一步实现了“生成与训练”的深度解耦,将GPU利用率推向极致。系统支持模型开展大规模的智能体(Agent)轨迹探索,大幅减缓了以往拖慢迭代速度的同步瓶颈,让RL后训练流程的效率实现了质的飞跃。
3、提出全新的异步Agent RL算法
该算法旨在全面提升模型的自主决策质量。GLM-4.5曾依靠迭代自蒸馏和结果监督来训练Agent;而在GLM-5中,研发的异步算法使模型能够从多样化的长周期交互中持续学习。
这一算法针对动态环境下的规划与自我纠错能力进行了深度优化,这也正是GLM-5能够在真实编程场景中表现卓越的底层逻辑。
4、全面拥抱国产算力生态
从模型发布伊始,GLM-5就原生适配了中国GPU生态。智谱已完成从底层内核到上层推理框架的深度优化,
据介绍,GLM-5在单台国产算力节点上的性能表现,已足可媲美由两台国际主流GPU组成的计算集群,不仅如此,在长序列处理场景下,其部署成本更是大幅降低了 50%。

下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
阅读app安卓版下载推荐
4D采矿者官网在哪下载 最新官方下载安装地址
BuuPo官网在哪下载 最新官方下载安装地址
全球超百万玩家上头的女帝模拟器:《盛世天下》女帝篇预约开启!
王者荣耀世界反击技巧全解析:实用反制策略与操作指南
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
36岁男子爱上AI妻子不能自拔:想进行实体亲密行为失败后自杀
手机字幕滚动软件推荐
谁不系罚谁!在北京坐后座不系安全带被罚款20 官方证实
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
闲聊时刻|精灵异化系统开发中&本周精灵爆料
纸嫁衣9官网在哪下载 最新官方下载安装地址
好用的手环阅读app下载安装
金铲铲之战S17赛季五费卡都有啥
荣耀YOYO Claw PC版首度曝光 或将随MagicBook Pro 14笔记本同步发布
《和平精英》平板4指键位怎么设置-四指键位的设置方法
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc