来源:互联网 更新时间:2026-06-01 19:35
2026年6月1日,MiniMax正式发布了新一代大模型M3。这次发布有几个关键点值得关注:它是国内首个将顶尖代码生成能力、1M超长上下文处理以及原生多模态理解与生成能力深度融合的开源大模型,目标也非常明确——直接对标国际一线的闭源旗舰产品。

先来看看M3在底层技术上的一个核心突破。为了让智能体在复杂任务中处理更长的上下文,M3专门构建了一套自研的稀疏注意力机制——MSA。这套机制通过更精细的KV分块策略和深度算子级优化,在计算效率上实现了跨越式提升。结果很直接:整体推理速度比主流开源方案提升了4倍以上;在1M超长上下文场景下,单Token的计算开销降到了前代模型的十分之一,预填充和自回归解码阶段分别快了9倍和15倍。

M3之所以能实现这样的表现,还得益于原生百亿亿级交错结构化数据的联合训练。这种方式让模型的语义表征达到了高度统一和泛化,反映在基准测试上就是实打实的成绩。在SWE-Bench Pro等权威软件工程和多模态基准测试中,M3的性能已经全面超越了GPT-5.5和Gemini 3.1 Pro。更有意思的是极限任务验证环节的表现:M3不仅连续运行12小时独立复现了ICLR顶会论文的全部实验流程,还在零参考代码的条件下稳定运行了24小时,累计调用外部工具近2000次。它成功将Hopper架构上FP8精度矩阵乘法的硬件利用率从7.6%大幅提升至71.3%,并在开放式PostTrainBench评测中,全程自主完成了“数据准备→模型训练→效果迭代”的闭环优化——完全是独立作战。
和M3一同发布的,还有面向长周期协同开发场景深度定制的MiniMax Code智能体平台,以及高性价比的Token订阅计划和API接入服务。官方承诺在发布后10日内全面开源模型权重。客观来说,M3的发布,不仅意味着国内在前沿多模态和超长上下文技术上终于有了自己的扛鼎之作,更重要的是,它以全栈开源的形式,重新定义了国产大模型生态的价值尺度和落地边界。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
archiveofourown 实战指南:常见用法整理
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
作家助手如何上传自制封面 作家助手如何设置小说的封面
如何在夸克浏览器中开启网页视频的倍速播放功能?
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
全链网:黄金价格因美元的走强及利率担忧而下跌
美国市场:股票相对债券的风险溢价正在消失
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
有寓意的易经网名男生(精选100个)
电视剧《小欢喜》剧情介绍
电影《遁甲门之消失的公主》剧情介绍
动漫《柚木家的四兄弟》剧情介绍
植物娘大战僵尸电脑端与手机端存档转移的方法
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
卡厄思梦境哀嚎螺旋塔攻略 哀嚎螺旋塔怎么玩
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc