热门搜索：和平精英　原神　街篮2　

您的位置：首页 > > 教程攻略 > ai资讯 >Hermes上线MoA功能！比Opus 4.8和GPT-5.5还猛

Hermes上线MoA功能！比Opus 4.8和GPT-5.5还猛

来源:互联网 更新时间:2026-07-01 14:17

顶尖闭源模型接连被禁，而单打独斗的模型又总有搞不定的事情，那想要高质量输出结果的用户该怎么办？

最近，Hermes Agent上线了MoA（Mixture of Agents）功能，允许用户自由组合多种模型当作一个虚拟模型来用。在Nous Research即将发布的基准测试中，这个混合模型的评分竟然超过了Opus 4.8和GPT-5.5。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

Fable 5、Mythos 5被禁，多模型组合成为潮流

Nous Research在官推上说了这样一句话：“最强大的模型是受限的，只有少数人才能获得访问权限。”这话明晃晃地指向了Fable 5等模型被封禁的事。在这种背景下，MoA的终极目标就清晰了——用开源模型的组合来达到顶尖闭源模型的水准。就像Hermes Agent联合创始人Teknium说的，他们正在测试各种开源模型组合，看看能不能用更便宜的模型达到Opus的水平。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

这种多模型组合的思路，最近其实有不少实践。比如日本AI独角兽Sakana AI发布的Sakana Fugu系列编排器模型，会根据任务选择最优模型来处理，和MoA的思路非常相似。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

而MoA的技术并非新鲜事。2024年6月，Together AI就发表过一篇论文叫《Mixture-of-Agents Enhances Large Language Model Capabilities》，核心是多LLM组合——每一层模型都会参考上一层模型的输出，再继续生成自己的回答。论文把模型分成了两类，也就是现在Hermes所用的参考模型和聚合模型。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

具体来说，当用户提出问题时，参考模型会先分析判断，给出参考意见，然后由聚合模型综合判断，并调用工具执行具体任务。这里有一个关键点：参考模型只生成意见，不会使用任何工具，也不能执行任何命令。这种模式可以发挥不同模型的独特优势，让擅长规划的模型来提意见，让长于实践的模型去完成任务。

使用起来也很简单。以桌面版为例，在设置里点开模型选项，向下翻就能看到Mixture of Agents的选项，直接选择你想用的模型进行组合即可。默认是两个参考模型加一个聚合模型，当然也可以手动添加多个参考模型。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

实测做游戏更丝滑，Token消耗量相差不大

有海外博主专门做了实测，用两种组合分别生成了游戏和交互页面。结果发现，使用MoA任务完成的时间并不一定会变长，而是会因模型选择不同而变化；同时，Token的消耗量也没有想象中那么恐怖。

博主先是测试了一个小游戏的制作——用Three.js开发一个原力海盗训练竞技场游戏。为了对比效果，他先用单一模型glm-5.2来测试，输入提示词：

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

Hermes花费了0.38美元，用时13分钟搞定了这个游戏。可以看到，单一glm-5.2生成的游戏整体效果不错，但在移动速度和流畅程度上存在一些问题——比如飞船很难躲避敌人的攻击，可玩性稍弱。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

随后博主启用了MoA，用kimi-k2.6和minimax-m3做参考模型，glm-5.2做聚合模型，新开对话，输入同样的提示词。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

这一次，Hermes花费了0.47美元，用时35分钟完成任务。价格比单一模型稍高，时间上翻了接近三倍。但MoA模式下的生成效果也明显更好，移动速度、流畅程度以及关卡合理性都比单一模型的输出强很多。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

接着，博主又用顶尖闭源模型GPT-5.5进行了测试。这次是让Hermes生成一个可交互的动漫多元宇宙仪表盘，包括火影忍者、海贼王、龙珠等IP。对照组依旧是单一模型，使用GPT-5.5执行任务。由于是订阅制，博主直言没办法核算成本。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

Hermes用了接近7分钟完成任务。设计的仪表盘中间的光球周围的光圈略显简单，缺少质感，但交互上非常流畅。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

随后博主用了三个grok模型做参考模型，GPT-5.5为聚合模型进行同样的测试。出乎意料的是，MoA模式下的Hermes生成速度竟然更快，博主推测可能是用了grok快速模型的原因。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

这次的生成结果明显更有质感，中间的光球设计感很强，整体交互非常丝滑，而且点击不同的星球还有远近景的切换。

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

结语：未来比拼的不只是模型

过去，大模型竞争几乎都是围绕着“谁家的模型更强”展开的，用户需要不断切换模型，在编程、写作、推理之间寻找最适合的那个。

但MoA、Sakana Fugu等已经在另一条路上前进：与其等待一个“万能模型”，不如让多个擅长不同能力的模型共同完成一项任务。

这种走向“编排”的趋势，其实刚好符合Agent的要求。模型是底层能力，Agent负责组织不同模型协作——让规划能力强的模型负责思考，让执行能力强的模型负责落地。

当然，目前MoA需要承担更高的推理成本，在部分任务上耗时也会明显增加，并不是所有场景都值得开启。但随着推理成本持续下降、开源模型能力不断提升，多模型协作很可能会成为Agent未来的默认工作方式。

热门资讯

热门手游

1

网名带郑和霍字的网名女有哪些

角色扮演 | 1

详情

相关攻略

1 Midjourney绘画提示词进阶写法：细节增强方法 07-01

1

Midjourney绘画提示词进阶写法：细节增强方法

07-01
2 A社你解释下，啥叫Sonnet5比Fable5还贵？ 07-01

2

A社你解释下，啥叫Sonnet5比Fable5还贵？

07-01
3 刚刚，Fable 5全球解禁 07-01

3

刚刚，Fable 5全球解禁

07-01
4 Codex，1 个月吃掉 150GB 流量，写满 4T 硬盘，疯了吗？ 07-01

4

Codex，1 个月吃掉 150GB 流量，写满 4T 硬盘，疯了吗？

07-01
5 顶刊生物实验难复现？统一操作话术来了！编译通过率98.6% 07-01

5

顶刊生物实验难复现？统一操作话术来了！编译通过率98.6%

07-01
6 年薪百万，在旧金山开始租不起房了 07-01

6

年薪百万，在旧金山开始租不起房了

07-01
7 Token 降价的尽头，是一度电的账 07-01

7

Token 降价的尽头，是一度电的账

07-01
8 贝索斯豪掷百亿美金：普罗米修斯AI实验室估值冲向 380 亿 07-01

8

贝索斯豪掷百亿美金：普罗米修斯AI实验室估值冲向 380 亿

07-01
9 2026游戏圈招聘困境：盘点7372个岗位，会不会AI的都懵了 07-01

9

2026游戏圈招聘困境：盘点7372个岗位，会不会AI的都懵了

07-01
10 巨头下场，AI漫剧狂飙 07-01

10

巨头下场，AI漫剧狂飙

07-01

热门专题

手机号码测吉凶
本站所有软件，都由网友上传，如有侵犯你的版权，请发邮件haolingcc@hotmail.com 联系删除。版权所有 Copyright@2012-2013 haoling.cc