热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >MiniMax发布M3_大模型:首创MSA架构并支持1M上下文,全面开源对标海外旗舰

MiniMax发布M3_大模型:首创MSA架构并支持1M上下文,全面开源对标海外旗舰

来源:互联网 更新时间:2026-06-01 19:35

2026年6月1日,MiniMax正式发布了新一代大模型M3。这次发布有几个关键点值得关注:它是国内首个将顶尖代码生成能力、1M超长上下文处理以及原生多模态理解与生成能力深度融合的开源大模型,目标也非常明确——直接对标国际一线的闭源旗舰产品。

先来看看M3在底层技术上的一个核心突破。为了让智能体在复杂任务中处理更长的上下文,M3专门构建了一套自研的稀疏注意力机制——MSA。这套机制通过更精细的KV分块策略和深度算子级优化,在计算效率上实现了跨越式提升。结果很直接:整体推理速度比主流开源方案提升了4倍以上;在1M超长上下文场景下,单Token的计算开销降到了前代模型的十分之一,预填充和自回归解码阶段分别快了9倍和15倍。

M3之所以能实现这样的表现,还得益于原生百亿亿级交错结构化数据的联合训练。这种方式让模型的语义表征达到了高度统一和泛化,反映在基准测试上就是实打实的成绩。在SWE-Bench Pro等权威软件工程和多模态基准测试中,M3的性能已经全面超越了GPT-5.5和Gemini 3.1 Pro。更有意思的是极限任务验证环节的表现:M3不仅连续运行12小时独立复现了ICLR顶会论文的全部实验流程,还在零参考代码的条件下稳定运行了24小时,累计调用外部工具近2000次。它成功将Hopper架构上FP8精度矩阵乘法的硬件利用率从7.6%大幅提升至71.3%,并在开放式PostTrainBench评测中,全程自主完成了“数据准备→模型训练→效果迭代”的闭环优化——完全是独立作战。

和M3一同发布的,还有面向长周期协同开发场景深度定制的MiniMax Code智能体平台,以及高性价比的Token订阅计划和API接入服务。官方承诺在发布后10日内全面开源模型权重。客观来说,M3的发布,不仅意味着国内在前沿多模态和超长上下文技术上终于有了自己的扛鼎之作,更重要的是,它以全栈开源的形式,重新定义了国产大模型生态的价值尺度和落地边界。

mini免费正版
mini免费正版

类型:动作格斗

大小:409MB

语言:简体中文

平台:互联网

游戏下载

热门手游

相关攻略

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc