MiniMax 今日正式发布M3模型支持1M上下文
来源:互联网
更新时间:2026-06-01 19:28
# MiniMax M3:首个开放权重的百万上下文多模态模型
在大模型竞争进入“深水区”的今天,各家厂商的更新几乎已经到了日新月异的程度。就在这个节骨眼上,MiniMax 正式推出了他们的新一代旗舰文本模型——MiniMax M3。这款模型不只是在性能上摸到了前沿水平的门槛,更关键的是,它带着“首个开放权重、且同时具备顶尖代码能力、超长上下文与原生多模态”这几个标签杀进了战场。对于那些需要复杂代码生成和自主任务规划的开源方案来说,M3 无疑是目前最值得关注的选择。
**核心要点**
- 上下文窗口支持 100 万个 token
- 稀疏注意力(MSA)架构,将预训练数据规模扩展到 100T
- 在 BrowseComp 测试中,M3 得分 83.5,超过了 Opus 4.7(79.3),整体水平略低于 Claude Opus 4.7、GPT 5.5,但部分单项指标高于国外水平

### 核心亮点速览
快速了解 M3 的硬核实力,核心参数与特性如下:
| 特性维度 | MiniMax M3 关键指标 |
| 上下文长度 | 高达 1M(100万)tokens,基于 MSA 架构 |
| 模型类型 | 原生多模态(Native Multimodal) |
| 核心能力 | 顶尖代码生成、智能体(Agentic)任务处理 |
| 开源状态 | 开放权重(Open-Weight) |
| 架构创新 | MiniMax 稀疏注意力(MSA) |
---
### 深度解析:M3 的三大杀手锏
**1. 真正的“原生多模态”与海量上下文**
M3 并没有走那条“先有文本,再拼视觉”的老路。它从预训练的第一步就重建了整个数据流水线,全程进行多模态训练。这意味着文本和视觉语义空间从一开始就对齐得相当彻底——无论你在解析图表、公式还是图片内容,它都游刃有余。
配合专有的 MiniMax Sparse Attention(MSA)架构,M3 支撑起了高达 100 万 tokens 的上下文窗口。这可不只是一个营销数字:处理长篇代码库、长时间视频理解、以及复杂的智能体任务,都需要这种级别的底层基础设施支撑。

**2. 智能体(Agentic)能力的飞跃**
自主任务分解、工具调用、多步骤推理——这几个老大哥看了都头疼的项目,M3 打出了不错的成绩。文档中提到了两个实际案例,相当有说服力:
- **学术复现:** M3 曾经被委以重任,独立自主地复现了一篇 ICLR 2025 的杰出论文。这家伙连续跑了接近 12 小时,自主完成了 18 次代码提交和 23 张实验图表的生成,核心实验完美复刻。具体来说,M3 被提供了四个仅经过预训练的基础模型,要求在 12 小时内自主完成整个流程——数据合成、训练、评估和迭代,最终让模型具备数学推理、代码生成和知识质量保证等能力。全程无人干预,M3 最终拿到 37.1 分,总排名第三,仅次于 Opus 4.7(42.4)和 GPT-5.5(39.3),但显著甩开了其他所有对手。

- **工业级优化:** 在 CUDA 内核优化任务中,M3 在没有人类插手的情况下,经过 147 次基准测试提交,愣是把 FP8 GEMM 内核的硬件利用率从 7.6% 拉到了 71.3%——整整 9.4 倍的速度提升。

**3. 顶尖的基准测试成绩**
在多项国际权威基准测试中,M3 的表现稳在了世界领先的水平线,尤其是在代码和智能体任务上:
- SWE Bench / Terminal Bench:软件工程和终端执行任务的得分极高
- 自主浏览能力:在 BrowseComp 测试中,M3 拿到了 83.5 分,超过了 Opus 4.7 的 79.3 分,自主信息检索的能力相当强悍

MiniMax M3 的发布,意味着这家公司在代码、智能体和长上下文这三个关键领域,已经齐刷刷达到了前沿水平。