来源:互联网 更新时间:2026-05-27 16:11
5月27日,AI领域传来新动向。上海稀宇科技有限公司(MiniMax)在其官方X平台账号发布预告,正式宣布即将推出MiniMax M3系列模型。

这条推文同时转发了一篇于5月26日发表在预印本平台arxiv上的论文,题为《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》。这篇论文可以看作是对已发布的MiniMax M2.x系列模型背后技术工作的系统性回顾与总结。
根据论文披露的信息,M2.x系列模型在架构设计上颇具巧思。其总参数量达到2299亿,但通过创新的稀疏激活机制,每个词元(token)实际激活的参数仅为98亿。这种“小激活,大智能”的设计理念,旨在以更低的计算成本换取更高的实际性能。模型配备了长达192K的上下文窗口,其预训练数据规模更是达到了惊人的29.2万亿词元。
具体到模型结构,M2系列采用了62层的解码器式Transformer架构。其核心在于引入了多达256个细粒度专家(Expert),并为每个处理到的词元动态选择激活其中的8个专家。这种混合专家模型(MoE)的设计,是实现高效稀疏激活的关键。
更值得关注的是其在训练系统层面的创新。论文中,MiniMax团队提出了名为“Forge”的强化学习系统,该系统旨在面向智能体(Agent)进行优化。Forge系统的特点在于能够统一接入白盒与黑盒智能体,并通过将训练、推理与智能体逻辑解耦,配合窗口化FIFO调度、前缀树合并和专门的推理加速技术,显著降低了长轨迹任务(long-horizon tasks)的训练成本。
在M2.7版本中,一个被称为“自我进化”雏形的能力开始显现。论文描述,模型已经能够自主排查训练失败的原因、阅读系统日志、并修改相关的脚手架代码,进而在内部任务上完成多达100轮的自主迭代优化。这听起来是不是有点“AI自我改进”的早期影子了?
数据显示,这套自我进化系统已经能够承担团队30%到50%的日常迭代工作量。在内部的一项编程脚手架优化任务中,它甚至带来了30%的性能提升。这意味着,模型正开始参与到其自身开发与优化的闭环中,虽然尚处早期,但方向已然明确。
相关论文:《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》。
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
BuuPo官网在哪下载 最新官方下载安装地址
4D采矿者官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
免费影视剧APP推荐
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
萌神契约手游下载安装
好用的手环阅读app下载安装
人声接近真人!OpenAI一口气更新三款超强语音AI
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
短视频软件推荐
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc