您的位置：首页 > > 教程攻略 > ai资讯 >沐曦股份曦云C系列GPU产品Day 0适配智谱GLM-5.2旗舰模型

沐曦股份曦云C系列GPU产品Day 0适配智谱GLM-5.2旗舰模型

来源:互联网 更新时间:2026-06-18 13:59

6月17日，智谱AI正式开源发布了全新旗舰大模型GLM-5.2。而这次，沐曦股份的曦云C系列GPU几乎是同步完成了Day 0适配——也就是说，模型一发布，算力准备就已经到位。这背后靠的是全栈自主软硬件技术，也让沐曦在国产GPU生态适配这条赛道上，又稳稳踩实了一步。 GLM-5.2，这次可以说是智谱迄今为止能力最强的开源模型。它支持真正可用的1M上下文，在长程任务上依然保持着领先位置。说实话，这个“1M上下文”能落地，本身就是个硬功夫。说起来，沐曦和智谱的合作已经不是第一次了。从GLM-5、GLM-5.1、GLM-OCR到GLM-4.6V，智谱全系列模型，沐曦都做到了Day 0同步适配。而这次对GLM-5.2的支持，凭借的是曦云C系列本身的硬件算力和MXMACA软件栈的深度优化。这套方案主打的就是全场景、高稳定、低成本——说白了，就是要解决大模型落地时那三个老大难问题：“适配慢、迁移难、性能损耗大”。帮企业尽快把GLM-5.2的技术红利变成真金白银的产业价值。自2025年12月以来，沐曦已经累计完成了27款主流顶尖模型的Day 0适配，合作名单涵盖了智谱AI、通义千问、阶跃星辰、百度飞桨、DeepSeek等头部厂商。适配的模型类型从通用语言到多模态、OCR、机器翻译，覆盖面相当广。无论从适配速度、数量，还是生态广度来看，沐曦都处在一个比较靠前的位置。这次GLM-5.2的无缝接入，无疑会进一步拉动“模型-芯片-框架-应用”这条全国产AI自主闭环的落地节奏。曦云C系列GPU采用的是沐曦全自研的核心GPU IP、指令集和架构，能效比高、通用性强，天然适合处理大模型的超大参数规模和长上下文推理。而MXMACA软件栈的作用，更像是连接硬件算力和上层应用的那座“桥”——从底层驱动、用户态接口、MXCC编译器，到算子的深度适配，再到主流训练/推理框架的对接，全链路覆盖。它原生兼容PyTorch、TensorFlow、vLLM、SGLang等40多种主流AI框架，已经跑通了500多个AI模型和4500多个热门开源项目。这样一来，传统模型适配周期被大幅压缩，曦云C系列也就顺理成章地为GLM-5.2的前沿能力提供了稳定的算力底座。

关于智谱GLM-5.2

聊几个关键的数据点。在全球百万用户参与盲测的前端开发评估系统Code Arena上，GLM-5.2拿下了全球可用模型第一的成绩。

这次GLM-5.2是专门冲着长程任务能力来的。它的几个新特点值得关注： - 扎实的1M上下文，能稳定支撑长程任务 - 更强体感、更实用的Coding能力 - 极致的Infra优化，做到了Day 0在国产算力平台上跑通 - MIT开源协议，无地域限制，技术平权

1M上下文与长程任务

GLM-5.2这次把1M Coding Agent的训练环境狠狠拓宽了，覆盖了大规模实现、自动化研究、性能优化等多个典型领域。在一些场景下，它1M上下文的真实表现甚至能超过Opus。这个1M上下文构成了GLM-5.2的长程交付能力——在FrontierSWE、SWE-Marathon、PostTrainBench等多个长程任务基准上，它的表现介于Claude Opus 4.7与4.8之间，是开源模型里排名最高的。

实际体验更直观。GLM-5.2可以自主完成从开发、联调、测试到打包上线的整个流程，最后交付一个覆盖Web、移动端和小程序的多端应用。整个过程累计处理了88万以上的tokens，几乎用满了1M上下文窗口。过去这种级别的工程，一支团队要协作好几周，现在GLM-5.2在一次连续的长程任务里就能跑完。

Coding体感

在Coding这块，GLM-5.2在前端、后端、长程任务等场景下的成功率，相比上一代GLM-5.1有了明显提升。复杂系统工程和深度调试也更加稳定。在主流编程基准上，GLM-5.2仍然保持开源SOTA，跟Claude Opus 4.8处在可比区间。举个例子，在Terminal-Bench 2.1上（评测AI Agent通过命令行操作计算机的数据集），GLM-5.2比Opus 4.8低4%，但比GLM-5.1提升了17.5%；在MCP-Atlas上（工具使用评测数据集），它只比Opus 4.8低0.8%。

GLM-5.2还引入了effort level，也就是“思考档位”控制。开发者可以根据需要，在能力、速度、成本之间灵活平衡。在相近的token预算下，GLM-5.2的Coding能力大致落在Claude Opus 4.7和Claude Opus 4.8之间。

极致Infra优化

GLM-5.2的进步，并不仅仅是模型本身的升级，更是模型架构、推理系统和训练基础设施协同设计的结果。智谱团队提出了IndexShare方案——在每四层稀疏注意力层之间复用同一个索引器（indexer），在1M上下文长度下，把单位token的FLOPs降到了2.9倍。同时，他们还改进了MTP层（用于投机解码），让接受长度（acceptance length）最多提升了20%。训练侧则依赖自研的Slime框架来支撑大规模Agentic RL和OPD训练。

面向开发者与知识工作者

凭借着扎实的1M上下文和稳定的长程任务能力，GLM-5.2可以长时间自主推进更复杂、更长链路的任务，锁定高价值场景。它正在改变开发者和知识工作者的工作方式。比如在大型重构工程上，GLM-5.2表现就很亮眼。在开发者的Moonshot实验中，它用Rust从零再造了送人类登月的计算机——阿波罗11号制导计算机（AGC）：先把约4600行的定点CPU逐比特移植为Rust，再让当年65000行、一字未改的登月飞控程序在上面原样起飞。整个过程由Agent全自主走完，甚至连那个差点中止登月的1202报警都复现了出来。通过智谱的Agent产品AutoClaw，GLM-5.2的1M上下文与长程任务能力还可以服务于设计、法务等专业场景。比如从需求一次性生成数十个原型页面，然后自主持续迭代和微调，在长上下文中保持品牌规范与一致性。

沐曦股份曦云C系列GPU产品Day 0适配智谱GLM-5.2旗舰模型

关于智谱GLM-5.2

1M上下文与长程任务

Coding体感

极致Infra优化

面向开发者与知识工作者

热门资讯

热门手游

相关攻略

热门专题