您的位置：首页 > > 教程攻略 > ai资讯 >MiniMax发布新一代旗舰M3

MiniMax发布新一代旗舰M3

来源:互联网 更新时间:2026-06-02 13:17

MiniMax M3的发布，让国产大模型在长上下文与智能体能力这条赛道上，终于从跟随者变成了规则的定义者。作为国内首个同时将前沿Coding能力、1M超长上下文和原生多模态集于一身的开源模型，M3带来的不仅是一组亮眼的参数，更是一整套可供行业借鉴的技术范式。

MiniMax发布新一代旗舰M3

支撑这三大能力的，是MiniMax自研的稀疏注意力架构——MSA。这套架构的逻辑其实并不复杂：当模型需要处理一个Query时，它不会像传统注意力机制那样逐一核对全局所有Key-Value，而是先通过一个轻量级的索引分支，在已切分成Block的百万级上下文中快速打分，只挑出相关性最高的少数几个Block；再由稀疏分支对这些Block执行实际的注意力计算。整条链路可以概括为两步：先索引，再计算。一句话：把注意力用在该用的地方。

数据说明了一切。在100万tokens的超长上下文场景下，M3相比上一代M2模型，Prefill阶段提速9.7倍，Decode阶段提速15.6倍。单Token的计算量仅为M2的约二十分之一。这意味着百万上下文不再是“能用但用不起”的摆设——推理效率的跃升，让长上下文真正成为可落地的能力。更值得关注的是，相比DeepSeek V4的三层注意力混合结构，M3仅用两阶段分块选择就实现了类似的稀疏效果，索引路径与计算路径清晰分离，工程实现也更为友好。Redis创始人antirez的评价很直白：这是“正确的道路”。在他看来，在本地推理场景下，稠密注意力的开销已经难以为继。

这种架构优势最终落在了实际能力上。在衡量编码能力的SWE-Bench Pro中，M3超过了GPT-5.5和Gemini 3.1 Pro，逼近Opus 4.7；在综合评估SVG生成性能的SVG-Bench上，M3甚至超过了Opus 4.7；在面向自主Agent的端到端评测框架Claw-Eval中，M3拿下最高分；在BrowseComp智能体评测中，M3以83.5分超越Opus 4.7的79.3分。MiniMax还做了一个极具说服力的演示：他们丢给M3一篇ICLR 2025杰出论文，要求独立复现。M3连续运行近12小时，全程自主产出18次commit与23张实验图表，成功跑通核心实验。写出的代码可直接交付，而不是“能跑但需要人改”。这才是关键所在。

多模态方面，M3从训练起点就采用文本、图片、视频等多模态混合训练，是一个真正的原生多模态模型。MiniMax在技术报告中特别强调，交错数据——即文本和图像等其他模态在序列中交替自然排列的数据——对模型性能的提升比一般人想象的更加关键。为此，MiniMax重构了整套数据管线，将预训练数据Token规模推至100万亿的量级。M3不仅支持图像与视频理解，还具备桌面操作能力，可在复杂跨应用环境中执行Computer Use任务。在多模态测试集OmniDocBench上，M3得分超过Gemini 3.1 Pro。

上下文窗口方面，M3的API最高支持1M tokens，并保障至少512K tokens可用。1M tokens的概念大致相当于两本中文长篇小说的体量。这意味着在处理长文档、复杂代码仓库、多轮任务协作等场景时，模型可以在一次推理中保留更完整的信息链路。长程Agent和长程Coding，终于有了真正够用的基础设施。M3还即将在HuggingFace和GitHub上开源，支持私有集群部署和微调，兼容Claude Code等主流Agent框架及MCP协议。

模型规格上，M3采用稀疏MoE架构，总参数约196B至229.9B，但每个词元仅激活约11B参数，单请求最高支持400 TPS。这种设计兼顾了能力与效率，让高性能模型不再意味着高门槛。

商业化方面，MiniMax推出了Token Plan订阅方案：Plus版每月49元提供6亿Token，Max版每月119元提供18亿Token，Ultra版每月469元提供55亿Token。API定价上，上下文512K以内，标准版输入2.1元/百万tokens，输出8.4元/百万tokens，并提供7天限时五折优惠。MiniMax还为老套餐用户准备了迁移适应补偿，帮助平稳过渡到新的积分扣减体系。

MiniMax发布新一代旗舰M3

热门资讯

热门手游

相关攻略

热门专题