热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >MiniMax发布新一代旗舰M3

MiniMax发布新一代旗舰M3

来源:互联网 更新时间:2026-06-02 13:17

MiniMax M3的发布,让国产大模型在长上下文与智能体能力这条赛道上,终于从跟随者变成了规则的定义者。作为国内首个同时将前沿Coding能力、1M超长上下文和原生多模态集于一身的开源模型,M3带来的不仅是一组亮眼的参数,更是一整套可供行业借鉴的技术范式。

MiniMax发布新一代旗舰M3

支撑这三大能力的,是MiniMax自研的稀疏注意力架构——MSA。这套架构的逻辑其实并不复杂:当模型需要处理一个Query时,它不会像传统注意力机制那样逐一核对全局所有Key-Value,而是先通过一个轻量级的索引分支,在已切分成Block的百万级上下文中快速打分,只挑出相关性最高的少数几个Block;再由稀疏分支对这些Block执行实际的注意力计算。整条链路可以概括为两步:先索引,再计算。一句话:把注意力用在该用的地方。

数据说明了一切。在100万tokens的超长上下文场景下,M3相比上一代M2模型,Prefill阶段提速9.7倍,Decode阶段提速15.6倍。单Token的计算量仅为M2的约二十分之一。这意味着百万上下文不再是“能用但用不起”的摆设——推理效率的跃升,让长上下文真正成为可落地的能力。更值得关注的是,相比DeepSeek V4的三层注意力混合结构,M3仅用两阶段分块选择就实现了类似的稀疏效果,索引路径与计算路径清晰分离,工程实现也更为友好。Redis创始人antirez的评价很直白:这是“正确的道路”。在他看来,在本地推理场景下,稠密注意力的开销已经难以为继。

这种架构优势最终落在了实际能力上。在衡量编码能力的SWE-Bench Pro中,M3超过了GPT-5.5和Gemini 3.1 Pro,逼近Opus 4.7;在综合评估SVG生成性能的SVG-Bench上,M3甚至超过了Opus 4.7;在面向自主Agent的端到端评测框架Claw-Eval中,M3拿下最高分;在BrowseComp智能体评测中,M3以83.5分超越Opus 4.7的79.3分。MiniMax还做了一个极具说服力的演示:他们丢给M3一篇ICLR 2025杰出论文,要求独立复现。M3连续运行近12小时,全程自主产出18次commit与23张实验图表,成功跑通核心实验。写出的代码可直接交付,而不是“能跑但需要人改”。这才是关键所在。

多模态方面,M3从训练起点就采用文本、图片、视频等多模态混合训练,是一个真正的原生多模态模型。MiniMax在技术报告中特别强调,交错数据——即文本和图像等其他模态在序列中交替自然排列的数据——对模型性能的提升比一般人想象的更加关键。为此,MiniMax重构了整套数据管线,将预训练数据Token规模推至100万亿的量级。M3不仅支持图像与视频理解,还具备桌面操作能力,可在复杂跨应用环境中执行Computer Use任务。在多模态测试集OmniDocBench上,M3得分超过Gemini 3.1 Pro。

上下文窗口方面,M3的API最高支持1M tokens,并保障至少512K tokens可用。1M tokens的概念大致相当于两本中文长篇小说的体量。这意味着在处理长文档、复杂代码仓库、多轮任务协作等场景时,模型可以在一次推理中保留更完整的信息链路。长程Agent和长程Coding,终于有了真正够用的基础设施。M3还即将在HuggingFace和GitHub上开源,支持私有集群部署和微调,兼容Claude Code等主流Agent框架及MCP协议。

模型规格上,M3采用稀疏MoE架构,总参数约196B至229.9B,但每个词元仅激活约11B参数,单请求最高支持400 TPS。这种设计兼顾了能力与效率,让高性能模型不再意味着高门槛。

商业化方面,MiniMax推出了Token Plan订阅方案:Plus版每月49元提供6亿Token,Max版每月119元提供18亿Token,Ultra版每月469元提供55亿Token。API定价上,上下文512K以内,标准版输入2.1元/百万tokens,输出8.4元/百万tokens,并提供7天限时五折优惠。MiniMax还为老套餐用户准备了迁移适应补偿,帮助平稳过渡到新的积分扣减体系。

热门手游

相关攻略

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc