来源:互联网 更新时间:2026-06-19 07:26
6月9日,Anthropic 放出了 Claude Fable 5。这是它第一次把「Mythos 级」模型对公众开放。按官方的说法,这一档的能力在 Opus 之上。
如果你只想知道一句话,那听好了:现在你能在 Claude API 和 Claude Code 里用上一个比 Opus 4.8 更强的模型,代价是更贵,外加一个有点特别的安全设计。下面把这件事拆开讲,所有数字都来自官方公告或报道,标了出处。
先把名字理清楚。Anthropic 这次同时发了两个东西:Claude Fable 5 和 Claude Mythos 5。官方说它们是同一个底层模型,都属于「Mythos 级」,这一档「在我们的 Opus 类之上」。
Mythos 这个模型今年 4 月以预览形式出现过,但当时因为网络安全方面的顾虑,只给了少数合作伙伴。这次 6 月 9 日是它第一次以公开可用的形态落地,公开的那一版就叫 Fable。
名字本身有讲究:Fable 来自拉丁语 fabula,意思是「被讲述的东西」,和希腊语 mythos 同源。官方明说,真正区分 Fable 和 Mythos 的,不是模型,是安全阀。
这是这次发布里最该看懂的一点。
换句话说,Anthropic 这次卖的不是两个模型,是同一个模型配两套安全策略。能力天花板一样,区别只在「哪些问题允许它放开手回答」。这种「把安全做成产品分层」的思路,本身就值得做工程的人留意。
Fable 的安全机制不是简单的「拒答」,而是「换一个模型来答」。
官方列了三个会触发回退的领域:网络安全、生物与化学、蒸馏。在这些话题上,按官方原话,回答会「转由我们次强的模型 Claude Opus 4.8 给出」。
也就是说,你以为自己全程在用 Fable,但有一小部分回答其实来自 Opus 4.8,而且这个切换是模型替你做的。好在比例不高:官方说安全阀「平均在不到 5% 的会话里触发」,「超过 95% 的 Fable 会话完全没有回退」。
对做工程的人,这件事有两面。一面是省心,绝大多数时候你拿到的就是这一档的满血能力。另一面是要心里有数:如果你的任务正好擦着这三条线,你拿到的回答可能不是 Fable 的水平,而是 Opus 4.8 的,而你未必当场知道发生了什么。
安全这块官方还给了两个数据点:外部赏金计划跑了 1000 多个小时,没找到通用越狱手段;另外对 Mythos 级的流量启用了 30 天保留策略,数据不用于训练,所有人工访问都会留日志。
官方给的能力证据基本都是合作方的评测,我照搬可以,但需要说清楚,这些都是别人测出来的。
软件工程这块:Stripe 说 Fable 5 把「几个月的工程压缩到几天」——一个 5000 万行的 Ruby 代码库迁移,人工要两个月,它一天做完。在 Cognition 的 FrontierCode 评测里,官方称 Fable 5「在前沿模型里得分最高,哪怕只用中等 effort」。
知识工作这块:在 Hebbia 的金融基准上是「所有模型里最高分」;IMC 说它「几乎全面拿下了他们的交易分析评测」。
还有两个有意思的非典型例子。视觉:官方称它是视觉任务的 SOTA,能「只靠视觉」通关宝可梦火红版,不用地图不用工具。长上下文与记忆:在玩《杀戮尖塔》时,带持久记忆带来的提升「是 Opus 4.8 的三倍」,打到游戏最终章的频率也是三倍。
这些数字怎么看?合作方评测天然偏正面,但即便打个折,方向是清楚的:这一档在复杂工程任务上确实又上了一个台阶。尤其「中等 effort 就能拿高分」这句,对天天要权衡成本和效果的人是个有意义的信号。
落到具体怎么上手。
claude-fable-5。--model 已经把 fable 列为模型别名,也就是 claude --model fable,或者在会话里用 /model 切。价格:官方是每百万输入 token 10 美元、每百万输出 token 50 美元,按官方说法「不到 Mythos 预览版的一半」。据 CNBC、TechCrunch 等报道,这个价大约是 Opus 4.8 的两倍。
分场景,别无脑切。
值得用 Fable 的场景,是那种「难、值钱、且你愿意为效果多付钱」的任务,比如大规模重构、复杂迁移、卡了很久的架构问题。这一档「中等 effort 就拿高分」的特性,意味着你不一定要拉满 effort 去烧钱,性价比反而可能不差。
不太值得的场景,是日常那些 Sonnet、Opus 4.8 就能稳稳搞定的活。Fable 贵一倍,日常任务上多花的钱换不回对等的体感提升。再就是前面说的:如果你的活擦着安全那三条线,要知道自己可能在不知不觉中被切到了 Opus 4.8。
还有个朴素的提醒:新模型刚放出来,社区的真实手感、踩坑、和各家 harness 的适配都还没沉淀。如果你是把模型用在生产流程里,不妨先在非关键任务上跑两天,看它在你自己的活上到底什么表现,再决定要不要换默认。官方评测是官方评测,你自己的代码库才是你的基准。
来源:Anthropic 官方公告、TechCrunch、CNBC 报道。模型能力数据为 Anthropic 及其合作方口径,本文如实转述并标注,不代表独立测评结论。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
帅气继父网名女生可爱英文(精选100个)
帅到极致的网名女生霸气(精选100个)
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
蒙古上单是什么梗
韦一敏是什么梗
韩漫小少爷网名大全女生(精选100个)
网络热词聊污是什么意思
如何在夸克浏览器中开启网页视频的倍速播放功能?
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
作家助手如何上传自制封面 作家助手如何设置小说的封面
抖音最火沙雕男生网名(精选100个)
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
因空难被判“过失杀人罪” 空客、法航均被顶格处罚22.5万欧元
有寓意的易经网名男生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc