来源:互联网 更新时间:2026-06-04 15:41
JetBrains最近开源了一个叫Mellum2的模型,目标很明确——专为软件工程系统打造。它的总参数量12B,但每个token只激活2.5B参数,这在推理成本和性能之间找到了一个相当巧妙的平衡点。简单说,就是用更少的计算资源做更多的事,尤其适用于代码生成、智能路由、子Agent调用以及企业级私有化部署场景。在LiveCodeBench这类代码评测中,它的表现相当抢眼,算得上是构建AI编程助手和工作流的实用选择。
| 对比维度 | Mellum2 |
Qwen3.5-9B |
SeedCoder-8B |
|---|---|---|---|
| 模型架构 | 12B MoE(64专家,8激活,2.5B活跃参数) | 9B密集模型(Dense) | 8B密集模型(Dense) |
| 开源协议 | Apache 2.0 |
开源(可商用) | 未明确/部分受限 |
| 模态支持 | 仅文本+代码(垂直专精) | 文本、代码、图像、视频(多模态通用) | 仅代码(单领域) |
| 每Token计算量 | ≈2.5B参数 |
9B参数(全量激活) | 8B参数(全量激活) |
| LiveCodeBench v6 | 69.9 |
68.3(Thinking) | 28.1(Non-thinking) |
| BFCL V4工具调用 | 45.6(Thinking) | 42.7(Thinking) | N/A(不支持) |
| AIME数学推理 | 58.4(Thinking) | 73.4 |
0(不支持) |
| 上下文长度 | 128K(YaRN扩展) | 128K+ | 通常4K-8K |
| 推理模式 | 双模式:Thinking + Non-thinking | 双模式:Thinking + Non-thinking | 仅Non-thinking |
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
帅气继父网名女生可爱英文(精选100个)
帅到极致的网名女生霸气(精选100个)
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
蒙古上单是什么梗
韦一敏是什么梗
韩漫小少爷网名大全女生(精选100个)
网络热词聊污是什么意思
如何在夸克浏览器中开启网页视频的倍速播放功能?
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
作家助手如何上传自制封面 作家助手如何设置小说的封面
抖音最火沙雕男生网名(精选100个)
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
因空难被判“过失杀人罪” 空客、法航均被顶格处罚22.5万欧元
有寓意的易经网名男生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc