来源:互联网 更新时间:2026-06-11 13:20
来了。Anthropic凌晨正式发布了新模型,但这次的方式有点特别——Claude Fable 5面向大众全面开放,而Claude Mythos 5只对“受信任的安全合作伙伴”开放。
新模型的命名延续了Claude系列一向的文艺气质。
从Haiku(俳句)到Sonnet(十四行诗),再到Opus(鸿篇巨制),Anthropic始终在用文学与艺术的概念来划分模型层级。这次迈入Mythos(神话),名字本身已经从具体的文本形态,升维到了文明母题。Fable这个词源自拉丁语的fabula,意思是“被讲述之事”,与希腊语的mythos同源,中文常译作“寓言”。这个命名其实很妙,恰好呼应了新模型的定位——一个“Mythos级”的模型,但却是“面向公众的神话”。
根据Anthropic的最新说明,Fable 5与Mythos 5基于同一底层架构,区别只在于前者被封装进了更适配公开部署的安全框架中。在最新公布的能力图谱上,二者被并列放在了同一性能坐标上。

不过,分数一致不等于表现无异。如果两者能力完全等同,恐怕也无需区分命名了。
神话经过删减、压缩、附加训诫后,就成了寓言。
根据最新文档,Fable 5是公开版本,面向普通用户和开发者开放。但在网络安全、生物、化学以及模型蒸馏这些高风险领域,系统会启动额外的安全分类器。一旦检测到请求涉及上述敏感方向,响应将不再由Fable 5生成,而是自动切换至Claude Opus 4.8处理。
Mythos 5虽然与Fable 5共享底层模型,却在部分领域解除了前者的限制。Anthropic提到,参与Project Glasswing的网络安全合作伙伴可以调用“完整版”Mythos 5。未来,部分生命科学领域的研究人员也有望通过“受信任访问计划”,获得解除生物与化学限制的版本。
先放一放尚未开放的Mythos,我们来看看实际可用的信息。
首先是定价,一个字:高。
Fable 5的费用为
claude-fable-5。
这个价格恰好是Opus 4.8的两倍,与其fast mode持平,说明Anthropic明确将其定位在高于Opus的定价梯队。
不过Anthropic强调,此定价还不到此前Claude Mythos Preview报价的一半——但由于Mythos Preview并未面向公众提供标准API服务,这个对比其实缺乏可验证的基准。
订阅用户还需要留意一点:Fable 5未必会长期纳入基础订阅套餐。
Anthropic在公告中明确表示,
这家公司的资源管控越来越严,好在还保留了大约半个月的过渡期。公告中也留了点弹性空间:如果6月23日后算力充足,Anthropic会尽力维持Fable 5在Pro、Max等订阅服务中的常规接入。

高价本身不是问题,前提是能力必须匹配这个定位。
从基准测试来看,Fable 5/Mythos 5基本上代表了Anthropic当前公开能力矩阵的巅峰水平。
不过最新表格附了一条注释:Claude Fable 5与Claude Mythos 5的得分通常只相差1–3个百分点(网络安全、生物相关测试项除外,标有星号),因此表中所列均为两者中的更高者。这一点难免让人有些疑问。

Anthropic将Fable 5的核心能力聚焦在五大方向:软件工程、知识型工作、视觉理解、长上下文记忆以及生命科学研究。
其中,软件工程的表现尤为突出。数据显示,Fable/Mythos 5在SWE-Bench Pro上达到了80.3%,明显优于Opus 4.8的69.2%。在更具挑战性的FrontierCode Diamond测试中,它取得了29.3%的成绩,远超Opus 4.8的13.4%和GPT-5.5的5.7%。


在知识型任务与视觉处理方面,Anthropic提供了两类佐证:
一类是标准化评测结果。最新表格显示,Fable/Mythos 5在GDPval-AA中获得了1932分,领先Opus 4.8、GPT-5.5和Gemini 3.1 Pro;在GDP.pdf这类融合视觉理解的文档任务中,准确率达到29.8%,同样超越了主流竞品。
另一类是早期客户实测反馈。Anthropic称,Fable 5在Hebbia高级金融推理基准中拿到了最高分,优势主要集中在文档推理、图表与表格解析、复杂问题求解;IMC也证实,其在交易分析评估中几乎全项达标。
为了凸显Fable 5的视觉能力,Anthropic举了一个很有意思的例子:此前Claude系列需要依赖复杂辅助工具才能运行《宝可梦 火红》,而Fable 5仅凭纯视觉输入就能通关。

在长程任务与记忆维持方面,Anthropic指出,Fable 5可以在数百万token规模的持续性任务中保持专注,并借助内部笔记机制持续优化输出质量。
比如说在《杀戮尖塔》这类依赖连续决策与长期策略的游戏场景中,如果为其接入持久化文件记忆,使其能够记录过往选择与经验,其表现会有大幅提升——相较Opus 4.8,提升幅度达到三倍,抵达最终关卡的频次也翻了三倍。
顺带提一句,“Fable”本身也是一款经典RPG游戏的名字,中文译作《神鬼寓言》——说不定哪天我们就能看到Fable亲手通关《Fable》了。
另外,在网络安全能力维度,Fable/Mythos 5在ExploitBench Cap%测试中达到了78.0%,超越了Claude Mythos Preview的69.0%,接近Opus 4.8的两倍水平。这里的分数应该取自Mythos 5,因为Fable 5在高风险请求下会回退至Opus 4.8处理。
Anthropic这次将模型能力的具象呈现设计成了类似“作品集”的滑动页面,每个案例只配了简短说明。

比如,Fable 5自主构建了一个太阳系物理模拟系统,从牛顿力学第一性原理出发推导行星轨道运动,并据此精准预测了日食的发生时间。

再比如,它可以独立运行《异星工厂》——这款深受工程师喜爱的工业自动化游戏,要求玩家完成资源采集、产线规划、物流调度与能源管理等多项复杂任务。Anthropic借此案例强调:Fable 5能在开放环境中自主制定策略,并持续推进大规模系统的构建与迭代。

另一个演示中,Fable 5首先开发了一款基于浏览器的CAD编辑器,随后利用这个工具设计出了一个可以直接3D打印的完整结构模型。这个编辑器内嵌了AI协作者,可以实时辅助建模流程。这个案例的关键在于闭环能力:Fable 5完成了“创造工具→使用工具→交付实体成果”的全链路任务。

最后一个案例,Anthropic展示了Fable 5生成的流体动力学模拟,其运动节奏与一段古典音乐EDM混音严格同步。公告还特别注明:这段背景音乐也是由Fable 5通过代码实时生成的。

这些演示看起来挺炫目,但核心指向是一致的:Fable 5擅长跨域协同——将编程、视觉识别、物理建模、工程设计与长期规划有机整合在一起。
如果说前面这些案例体现的是Fable 5在开发者手中的上限,那么接下来的内容则揭示了Mythos 5在科研人员手中所能释放的能量——以及Anthropic为什么坚持要将二者分离。
Anthropic透露,在内部蛋白设计专家评估中,Mythos 5将药物研发流程中若干关键环节提速了大约10倍。在某项典型任务中,Mythos 5在没有任何人工干预的前提下,接入了蛋白设计与生物信息学工具,表现甚至可以媲美甚至超越资深人类操作员。这项任务不是简单的问答,而是一整套科研工作流:靶点结合位识别、蛋白设计工具选型与执行、失败后的自动恢复。公告称,在针对14个蛋白靶点的实验中,Mythos 5成功产出了9个强效候选分子,目前正进入深度验证阶段。

Anthropic还指出,Mythos 5能够稳定提出新颖且具有科学价值的分子生物学假说。在与Opus级别模型的盲测对比中,内部科学家大约有80%倾向于选择Mythos提出的假设,其中部分已经进入了实验验证环节。
尤为值得注意的是,Mythos 5关于大肠杆菌蛋白作用机制的一项原创假说,已经被另一家独立开展同类研究的实验室实验证实。
它甚至还完成了一项基因组学探索。
Anthropic称,Mythos 5在一周多的时间里,几乎自主完成了一项全新的基因组学研究:整合了覆盖138种动物、数百万细胞的单细胞数据集,自主设计并训练了定制化的机器学习模型,用于跨物种识别功能同源的细胞类型。更令人惊讶的是,Mythos 5所训练模型的性能,超越了近期发表于《Science》期刊的同类模型,而它的参数量仅为后者的百分之一。Anthropic表示,相关成果计划在未来数月内正式发表。
当然,这些结论还有待论文披露与外部复现验证。但仅就Anthropic此次披露的信息来看,Mythos 5在生命科学领域展现的能力已经逼近了科研智能体(Research Agent)的水准:它能理解科学问题、调用专业工具、处理海量数据、训练专用模型、提出可验证假说,并推动整项研究走向可发表阶段。
一旦模型真正在药物设计、病毒载体开发、蛋白结构预测、基因组学分析这些方向上切实推进科研进程,它的双重用途属性就自然浮现出来了。
换句话说,生命科学这部分并不是Fable 5的功能秀,而是Mythos 5能力边界的直观呈现。之所以要公开展示这部分内容,正是为了印证Anthropic所掌握的这套底层模型,已经强大到必须依靠“受信任访问”机制来进行分发了。
耐人寻味的是,以往的模型发布更像纯粹的技术产品发布:参数量、基准分、定价、上下文长度、API接口名——强就是强,发布就是发布。
但Mythos的登场,让事情变得复杂了:同一个底层模型被拆解为两个版本——普通用户拿到的是Fable 5,安全研究者与特定生命科学家获取的是Mythos 5;前者被置于更严密的安全围栏内,后者则需要通过可信通道准入。
模型能力不再只有“强弱”之分,而是衍生出了“权限”、“场景”与“责任”的维度。
在某种意义上,这标志着前沿大模型商业化进入了一个新纪元——越强大的模型,越难直接面向普罗大众。它们会被模块化切割,嵌入差异化的安全边界,并定向交付给不同角色的使用者。
Anthropic率先迈出了这一步,因为它的模型“强得无法完全公开”。未来,其他渴望讲述技术故事的厂商,如果想要证明自身模型同样具备顶尖实力,或许也会沿着这条路径走下去。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
免费影视剧APP推荐
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
抖音最火沙雕男生网名(精选100个)
网络热词聊污是什么意思
帅气继父网名女生可爱英文(精选100个)
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
我的末日校园海斗手游上线时间是哪天
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
蒙古上单是什么梗
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
免费看电影的软件推荐
韦一敏是什么梗
晨字沙雕网名大全女生(精选100个)
帅到极致的网名女生霸气(精选100个)
短剧《情绪超市》剧情介绍
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc