您的位置：首页 > > 教程攻略 > ai资讯 >Day-0 支持，摩尔线程完成 MiniMax M3 大模型适配

Day-0 支持，摩尔线程完成 MiniMax M3 大模型适配

来源:互联网 更新时间:2026-06-13 13:09

6月13日消息，就在前一天，MiniMax正式开源了其新一代原生多模态旗舰模型M3。几乎是同一时间，摩尔线程宣布，旗舰级AI训推一体智算卡MTT S5000已经完成了对该模型的Day-0适配。这个节奏，值得关注。

先看几个关键判断。针对M3的核心技术特性，MTT S5000从硬件算力、软件栈到开源框架，都进行了全链路的精准匹配。不是简单的能跑，而是深度优化后的“能用、好用”。

支撑超长上下文：高密度算力与大显存提供坚实支撑

M3的MSA架构带来了超长上下文窗口，这对推理阶段的KV Cache存储和访存带宽提出了极高要求。怎么理解？简单说，模型上下文越长，需要缓存的历史信息就越多，对显存的容量和带宽都是巨大考验。MTT S5000应对这个问题的方式很直接：硬件级原生FP8加速，单卡AI算力（稠密）达到1000 TFLOPS，配合80GB大容量显存和1.6TB/s的超高带宽，为百万token级别的长序列推理提供了充足的缓存空间和数据吞吐能力。话说回来，光有硬件还不够。依托MUSA C++与Triton-MUSA等抽象层，M3的新算子结构也能快速迁移到摩尔的平台上，这使得架构适配的速度大幅提升。

赋能前沿Coding与Agentic能力：实现低延迟、高吞吐的推理优化

M3重点强化了编程和智能体场景，这恰恰是目前大模型落地中最具挑战性的领域之一。摩尔线程此前已经在DeepSeek-V4、MiniMax M2.7、GLM-5.1等多款国产旗舰模型上积累了Day-0适配经验，形成了一套系统化的复杂推理任务优化方法论。这次的适配，通过原生算子定制，在保证模型精度无损的前提下，显著提升了推理吞吐、降低了响应延迟。同时，vLLM与SGLang两大主流推理框架也同步拉起，MUSA开放架构拥抱开源生态，给开发者提供了更灵活的部署选项。

推动原生多模态推理：覆盖全精度与贯通全场景

M3是从第一步就开始进行多模态混合训练的模型，这更适配当下Agentic AI多元场景的需求。但与此同时，它对算力底座也提出了多元化要求，不能只是某一种精度强。MTT S5000覆盖了从FP8到FP64的全计算精度，从模型研发到商业化落地的完整链路都能无缝适配，这才是助力国产旗舰大模型快速完成生态普及的关键。

随着MiniMax M3在MTT S5000上完成适配，开发者现在已经可以基于MUSA软件栈与vLLM/SGLang双框架进行部署，并且将持续获得算子级的性能优化。后续能跑出怎样的效果，值得期待。

Day-0 支持，摩尔线程完成 MiniMax M3 大模型适配

支撑超长上下文：高密度算力与大显存提供坚实支撑

赋能前沿Coding与Agentic能力：实现低延迟、高吞吐的推理优化

推动原生多模态推理：覆盖全精度与贯通全场景

热门资讯

热门手游

相关攻略

热门专题