来源:互联网 更新时间:2026-06-11 14:48
Anthropic发布Mythos级模型,图片经由AI处理
北京时间6月10日,Anthropic扔出了一枚重磅冲击波——全新顶级模型Claude Fable 5正式发布,内部分级直接定在了“Mythos级”。
一起露面的,还有它的“孪生兄弟”Claude Mythos 5。俩模型共享同一个底层大脑,但Mythos 5在特定高风险领域摘掉了限制,只提供给经过严格审核的合作方使用。
这次Fable 5的能力可以说是全方位碾压了Anthropic之前所有公开发布的模型。因此,Anthropic给它配了一套全新的安全防护系统:一旦用户涉及网络安全、生物化学这类敏感问题,模型会自动切换到一个稍弱的Claude Opus 4.8来回答,相当于把那些危险能力“关进了笼子里”。
价格方面也诚意十足。两款新模型的定价大幅降低,还不到此前预览版的一半。开发者即日起就能通过API调用,订阅用户也可以在6月22日前免费体验,之后再转为按量消耗。Anthropic表示,等容量充足后会把它恢复为标准套餐的一部分。
Fable 5和Mythos 5之间,区别全在安全防护上。
可以这么理解:Claude Fable 5是给所有人准备的通用版,而Mythos 5是为特定领域专家提供的无限制版本。它们拥有完全相同的“大脑”,只不过Fable 5身边多了一位极其保守的“安全管家”。
这个管家的职责很明确——基于安全分类器,当用户通过Fable 5请求涉及网络安全、生物学与化学(尤其是危险物质或武器相关知识),或者试图“蒸馏”模型能力训练竞品时,分类器会直接拦截,不让Fable 5亲自响应,而是由能力稍弱但也同样强大的Claude Opus 4.8代为回答。
那日常使用会不会受影响?Anthropic的数据显示,超过95%的会话根本触碰不到这个分类器。换句话说,绝大多数场景下,Fable 5的性能与无限制版的Mythos 5完全一致。
Mythos 5走的则是另一条路。它面向经过审核的合作方,移除了网络安全或生物化学的防护,目前主要开放给两类用户:通过“玻璃翼计划”与美国政府合作的网络防御者,以及即将通过可信访问计划加入的生物学研究人员。
Anthropic的设计思路很清晰:绝大多数场景下,Fable 5完全够用。只有那些真正涉及危险能力的应用,才需要动用Mythos 5。
在超过1000小时的外部漏洞悬赏以及长时间智能体任务中,Anthropic没有发现任何通用的越狱方法。但他们的防护措施被刻意调校得比较谨慎,有时可能会误拦一些良性请求。此外,Anthropic还出台了新的数据保留政策:所有Mythos级模型的流量要求保留30天,数据不用于训练新模型或任何非安全目的。同时还设立了新的隐私保护措施,记录所有对数据的人工访问,30天后自动删除。
安全机制说清楚了,那Fable 5本身的能力到底怎么样?
一句话总结:它擅长处理那些需要极长时间、极高专注度的复杂软件工程任务,而且任务越复杂、周期越长,它相对于其他模型的领先优势就越大。
举个例子,支付巨头Stripe在一个包含5000万行Ruby代码的庞大代码库里测试了Fable 5。结果,模型在一天之内就独立完成了一项原本整个团队手动操作需要耗时两个多月的代码库迁移工作。打个比方,这就相当于一个团队手搓两个月的活,让模型一天干完了。
在具体的基准测试上,Fable 5同样拿下了漂亮的数据。

在SWE-bench Pro(衡量模型完成困难软件工程任务的能力)上,Fable 5达到了80.3%,而GPT-5.5(OpenAI最新通用旗舰)大约在58–60%,Claude Opus 4.8(Anthropic上一代旗舰)则是50–55%。在两项智能体编程测试中,Fable 5的表现也都超过了Claude Opus 4.8和GPT-5.5。
在Cognition FrontierCode(测试模型在满足高质量生产代码库标准的同时完成困难编码任务的能力)评估中,即使在中等努力水平下,Fable 5在顶尖模型中也拿到了最高分。而在更严苛的FrontierCode Diamond(测试高质量、可维护的智能体编码能力)基准上,Fable 5得分29.3%,Claude Opus 4.8是13.4%,GPT-5.5仅为5.7%,其他多数前沿模型甚至低于10%。
有意思的是,随着成本增加,Fable 5的准确率还在稳步提高,表现优于Claude Opus 4.8和GPT-5.5。

新加入Anthropic的顶尖AI研究员安德烈·卡帕西对此评价颇高。他认为,Fable 5的份量相当于2025年11月Claude Opus 4.5那次重大更新。他原话是这么说的:“当你给它一个真正困难、需要长时间琢磨的任务时,模型像是真的‘懂了’,然后闷头就去执行。那种想让人彻底不看代码、放手让它干的感觉,以前从来没有这么强烈过。”当然,他也补了一句:生产环境里可别真这么干。
Fable 5的视觉能力也往前迈了一大步。
它现在不光能描述图片里有什么,还能看懂图表里的精确数据,甚至根据一张截图就重建出整个网页的源代码。对于每天要处理大量PDF、扫描件、报表和仪表盘的企业来说,这意味着自动化处理那些“非结构化”的混乱信息,变得更加可行。
为了展示这种“看懂并执行”的能力,Anthropic做了两个有趣的内部测试。
第一个是让模型玩经典的《宝可梦·火红》。以前的Claude模型,就算借助额外辅助工具的复杂框架,也很难顺利完成这个游戏。而Fable 5,仅靠一个极简的纯视觉框架,盯着原始游戏截图,就一路击败了游戏。

第二个测试是让模型玩卡牌构筑游戏《杀戮尖塔》。通过赋予模型基于文件的持久记忆能力,Fable 5的性能提升幅度是此前旗舰模型的三倍,到达游戏最终幕的频率也提高了三倍。
对企业用户来说,这个信号很明确:Fable 5能够在长达数百万token的长期任务中保持专注,并利用自身的笔记改进输出。那些需要运行数天甚至数周的内部智能体——比如跟踪客户研究的销售运营智能体、管理迁移的工程智能体,或者记住在多轮交互中尝试过哪些方法的支持智能体——可能会因此受益匪浅。
在不受安全防护限制的Mythos 5上,科学领域的潜力更加惊人。Anthropic内部的蛋白质设计专家使用Mythos 5,把药物设计流程的多个环节加速了大约十倍。
在一个案例中,他们发现配备了蛋白质设计和生物信息学工具、但无人协助的Mythos 5,能够匹敌甚至超越熟练的人类操作员。模型执行了通常由科学家完成的所有任务:选择结合位点、选择并运行蛋白质设计工具,以及从失败中恢复。这项研究中的14个蛋白质靶点中有9个产生了很有潜力的药物设计候选,Anthropic目前正在对其进行研究。
基因组学方面,Mythos 5在超过一周的自主工作中完成了一项新研究。它梳理了138个动物物种、数百万个细胞的单细胞数据,自己设计并训练了一个机器学习模型,用来识别不同物种中功能相同的细胞,哪怕这些物种亲缘关系很远。人类只需要给个大方向,Mythos 5训出来的模型就超过了一个近期发表在《科学》上的模型,规模却小了100倍。
不过,这些能力同时也带来了风险。Anthropic测试了Mythos 5在腺相关病毒(AA V)设计上的表现。AA V是基因疗法里用来递送药物的组件,但同样的技术也能被用来设计危险病毒。测试中,Mythos级模型仅凭生物学推理,就超过了专门为蛋白质任务训练的复杂模型。这既说明它在基因治疗研发上有前途,也暴露出双重用途的风险。
Anthropic用自动评估工具测了Mythos 5的对齐表现,结果发现模型出现欺骗、被用户滥用等失调行为的概率很低,跟Opus 4.8差不多。Fable 5和它同底层的模型,表现也基本一致。

Claude Fable 5和Mythos 5的发布,明确展示了Anthropic打算怎么把那些具有危险双重用途能力的前沿模型推向市场。既不向所有用户敞开全部能力,也不简单粗暴地拒绝高风险查询,而是把特定请求转给能力较低的模型处理,同时为绝大多数日常工作保留最强模型。
Anthropic坦言,发布如此强大的模型伴随着风险。如果没有防护措施,Mythos 5在网络安全这些领域的强大能力,很可能被滥用来造成严重损害。
在网络安全领域,Mythos 5首先通过与美国政府合作的“玻璃翼计划”部署,作为此前Mythos预览版的升级。它拥有全球最强的网络安全能力。在相关基准测试中,该模型在衡量漏洞发现与利用能力的ExploitBench上得分78.0%,显著高于Claude Mythos Preview(69.0%)和Claude Opus 4.8默认防护版(40.0%)。在考察已知漏洞复现能力的CyberGym上,Mythos 5得分83.8%,与Claude Mythos Preview(83.1%)基本持平,两者均维持在83%以上的高水平。不久后,Anthropic计划通过一个更广泛的“可信访问计划”来扩大Mythos 5的访问权限。

在安全测试中,Anthropic分类器阻止了Fable 5发动各类网络攻击
生命科学领域也有一条类似的路径。Anthropic计划为生物学研究者单独开设一个可信访问计划,提供移除了生物化学防护但保留网络安全防护的Fable 5。初期只面向一小部分经过筛选的研究人员,覆盖基础和转化研究,后续再逐步扩大范围。
Fable 5目前已经全面开放。用户只需登录claude.ai或手机App,Pro、Max、Team以及企业席位订阅用户,在模型选择器里切换到Claude Fable 5就能使用。开发者可以在Claude Console获取API Key,模型ID是claude-fable-5。也可以通过Amazon Bedrock、Google Vertex AI、Microsoft Foundry这些云平台调用。命令行工具Claude Code也同步支持,用`/model claude-fable-5`切换就行。
Mythos 5不对外开放,只提供给“玻璃翼计划”里已经通过审核的客户,当天起可以升级使用。Mythos 5需要通过Anthropic官方渠道申请,主要看安全资质和用途合法性,只限于防御性网络安全工作。
“玻璃翼计划”目前的规模已经很大。今年4月启动时约有50家机构,包括亚马逊AWS、苹果、博通、思科、CrowdStrike、谷歌、JPMorganChase、Linux基金会、微软、英伟达以及Palo Alto Networks等核心合作伙伴。6月2日,Anthropic新增了约150家机构,分布在15个国家和地区,覆盖电力、水务、医疗、通信、硬件制造等关键基础设施领域,也纳入了硬件厂商和关键开源软件维护者。至此,参加“玻璃翼计划”的机构总数达到约200家。
另外,开源维护者可通过Claude for Open Source程序单独申请,主要面向开源项目维护者或核心成员,要求仓库有5000以上GitHub星标,或月均NPM下载量超过100万,近三个月有活跃贡献记录。
Fable 5和Mythos 5的定价为每百万输入token 10美元,每百万输出token 50美元。不到此前Mythos预览版价格的一半,但依然是全球主要AI模型中最昂贵的之一。

对于订阅用户,Anthropic采取了一个分阶段的推出方式。从美国当地时间6月9日到6月22日,Fable 5免费包含在Pro、Max、Team和基于席位数的企业计划中。6月23日起,它将从这些计划中移除,之后使用需要消耗使用额度。如果容量允许,Anthropic会延长免费使用窗口,之后尽快将Fable 5恢复为订阅计划的标准组成部分。

此次发布引发了行业内外的广泛讨论和不同声音。
知名投资人、A16Z普通合伙人阿尼什·阿查里亚(Anish Acharya)指出,Anthropic这次刻意用Fable和Mythos这样的品牌名来压住模型编号。他认为,用户根本不在乎这是第几代,只想知道是不是最前沿,淡化编号反而能让用户更聚焦于这一点。
不过,在一片叫好声中,也有冷静甚至尖锐的观察。开源模型研究员内森·兰伯特(Nathan Lambert)直言不讳地评论道,Anthropic成天把安全挂在嘴边,但连社交平台上那些懂技术的人都看得出来,这不过是给产品做安全包装罢了。
archiveofourown 实战指南:常见用法整理
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
电视剧《小欢喜》剧情介绍
如何在夸克浏览器中开启网页视频的倍速播放功能?
作家助手如何上传自制封面 作家助手如何设置小说的封面
植物娘大战僵尸电脑端与手机端存档转移的方法
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
美好的简约网名男生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
有寓意的易经网名男生(精选100个)
腾讯元宝怎么用来分析股票基金的基本面信息?
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
独家/李宰旭入伍前「登上孤岛服役」 惊见前辈裸体:忍不住笑了
国际贵金属走低,现货黄金价格跌0.49%
《金铲铲之战》高校赛夏季赛总决赛观赛指南来袭 还有铲铲教学一同献上
动漫《情色漫画老师OVA》剧情介绍
wallpaper壁纸声音怎么开启
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc