来源:互联网 更新时间:2026-06-13 19:05
2026年6月13日,MiniMax正式开源了新一代原生多模态旗舰大模型M3。与此同时,国产GPU企业摩尔线程宣布,旗下AI训推一体智算卡MTT S5000已完成对该模型的首发适配。这或许是个值得留意的信号:国产AI基础设施与大模型之间的协同演进,正在进入一个更务实的阶段。
M3创下了几个“国内首次”:同时支持百万级超长上下文、具备先进编程能力,且原生支持多模态输入输出。更关键的是,它基于自研的MSA稀疏注意力机制,将上下文窗口一举推至100万Token量级。在多项目国际主流基准测试中,M3的表现相当亮眼。
从训练阶段开始,M3就把文本与视觉信息深度融到了一起,能高效支撑智能体任务编排、代码生成与理解、超长文档分析这些高复杂度的应用场景。当然,能力越强,对底层硬件的考验就越大——算力密度、显存容量与带宽、软件栈的兼容性与优化深度,每一项都会被拉高到新的门槛。
为了让M3模型真正跑起来、跑得好,摩尔线程围绕硬件、软件和框架三个环节做了系统性优化。硬件方面,MTT S5000配备了80GB高带宽显存、1.6TB/s的显存带宽,支持原生FP8精度加速,单卡稠密AI算力达到1000 TFLOPS——这样的配置,刚好能接住百万级Token序列在缓存管理和数据吞吐上的极限需求。软件生态方面,基于MUSA统一架构及配套开发工具链,新引入的算子可以快速迁移;通过定制化原生算子,在不牺牲精度的前提下,进一步压缩推理延迟、提升吞吐能力。与此同时,这张卡还全面兼容vLLM和SGLang两大主流推理框架,开发者可以根据实际场景灵活选择部署路径。
如果你想亲手试试,现在就可以通过官方发布的预置镜像,结合摩尔线程MUSA软件栈,快速完成M3模型的本地部署和实机体验。
从更广的视角看,摩尔线程已经持续完成了多款国产主流大模型的首发适配工作,逐步构建起覆盖模型接入、运行部署与性能调优的全流程支持体系。这种软硬一体化的推进,无疑会加快大模型技术向真实业务场景的规模化落地。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
免费影视剧APP推荐
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
抖音最火沙雕男生网名(精选100个)
网络热词聊污是什么意思
蒙古上单是什么梗
帅气继父网名女生可爱英文(精选100个)
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
免费看片软件下载地址推荐
免费看电影的软件推荐
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
韦一敏是什么梗
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
晨字沙雕网名大全女生(精选100个)
帅到极致的网名女生霸气(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc