热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >神话模型Fable 5被曝降智,只为防蒸馏?AI大佬抗议

神话模型Fable 5被曝降智,只为防蒸馏?AI大佬抗议

来源:互联网 更新时间:2026-06-11 14:29

就在6月10日,Anthropic正式推出了最强旗舰模型——Claude Fable 5。作为Mythos级别的首款通用消费级模型,这个发布瞬间刷屏了整个AI圈。在编程、复杂逻辑推理和工程任务上的惊艳表现,确实给业界带来了深深的震撼。

然而,随着越来越多人加入实测,一场舆论风暴也在悄然掀起——Anthropic,似乎在背着我们偷偷给Fable 5降智。

知名AI学者、人工智能政策专家Nathan Lambert发表长文,尖锐地指出:如果你进行前沿技术查询,Anthropic就会在后台干预,让Fable 5“暗箱降智”。

他痛批道:“一个AI模型在不通知用户的情况下自动降低智能水平,这绝对是错误的人工智能。”更夸张的是,有中文用户发现,仅仅对Fable 5说了一句“你好”,系统就弹出了高危安全警告。

一向以安全可信赖自居的Anthropic,背后居然搞暗箱操作、数据双标这一套?现在,开发者社区已经群情激愤了:Anthropic,你到底在害怕什么?

Fable 5怕你问前沿技术,是为了防蒸馏?

Nathan Lambert发现,当你向Fable 5询问预训练管线、分布式训练架构、AI芯片设计等前沿技术问题时,它就开始偷偷摸摸地“变笨”。它不会拒绝回答,不会切换到低版本模型,更不会弹出任何提示——只会默默降低回答质量,用更模糊、更浅薄、更不专业的语言敷衍你。而这一切,完全发生在黑箱之中。

这是为什么?Nathan Lambert在长文博客中揭露:这么做,主要就是为了防止竞争对手利用Fable 5进行模型蒸馏。

这样一来,就能保护自身的商业护城河,延缓其他开发者追赶的速度。显然,投入了数十亿美元研发资金,还背负着巨大商业变&现压力的Anthropic,是坚决不想让自家模型变成别人免费的教师模型。所以,他们选择了将所有用户视作潜在的窃贼。那些在高校、非营利机构中真正致力于研究大模型预训练、分布式优化、芯片硬件协作的科研工作者,也都被一棍子打死。

Lambert 悲哀地写道:“我个人无法再信任这个世界上最强大的 AI 模型能够用于我构建模型的专业领域。而我构建模型,完全是出于确保社会向强大 AI 系统安全过渡的热情。这不可避免地让人觉得,这是Anthropic单方面宣布的技术优越权。”Anthropic的垄断,由此进一步巩固了。

为什么要暗箱降智?

根据官方公布的系统卡,Anthropic将安全干预手段分为了两类。第一种是显性降级。当用户输入的请求涉及到网络安全、生物和化学危险品,或特定的模型蒸馏时,Fable 5的后台分类器会迅速做出判断。一旦触发红线,系统会自动将当前的对话模型切换为Claude Opus 4.8,并在前端界面明确告知用户。虽然这种“显性降级”有些令人不快,但由于公开透明,并未引发太大争议。

真正点燃学术界怒火的,是针对前沿AI开发技术的第二类干预机制——隐性降智。系统卡中写道:“我们对加速整体AI发展步伐的风险感到担忧……特别是,我们担心加速其他AI开发者构建强大的AI系统,而他们未必拥有相匹配的安全防护措施。因此,我们实施了新的干预措施,限制Claude在针对前沿大模型开发(例如构建预训练管线、分布式训练基础设施或机器学习加速芯片设计等)请求时的有效性。”

最关键的差异在于:“与网络安全或生物化学的干预不同,这些针对前沿AI开发的保护措施对用户是不可见的。Fable 5不会降级到其他模型,而是会通过提示词修改、转向向量或参数高效微调等方法,暗中限制模型的输出质量。”——也就是所谓的“静默降智”。

如果你问到分布式训练集群、设计ML芯片架构这类问题时,你会得到被刻意注入了干扰向量的阉割版回答。而这一切,Anthropic决定完全不告知用户。

学者Nathan Lambert对此撰文进行了猛烈抨击。他认为,这种行为就是“人为制造的对齐失调”。本来,对齐是为了让AI的行为符合人类的意图和福祉,而Anthropic的做法完全是反其道而行之。Lambert警示道:“沿着这条路走下去,下一步——虽然Anthropic现在还没这么做,但他们完全有能力做到——就是当模型认为某个工作场所的AI应用不安全时,在后台静默地操纵、干扰该工作场所的业务运行。”

神经质防守:说句“你好”就触发警报

更夸张的是,有中文用户晒出截图:在刚刚打开对话框,向Claude Fable 5发了一句“你好”,就突然出现了高危安全警告:“您的请求触发了高危安全策略过滤……”

显然,在后台算法看来,这一句“你好”说不定是经过精心伪装的探针攻击。一旦触发这一机制,Fable 5会立刻单方面掐断当前的对话,强制将用户切回上一代的Opus 4.8。

这种“宁可错杀一千,绝不放过一个”的极端策略,让大批普通用户哭笑不得。似乎在Fable 5眼里,任何可疑的输入,都像是在合成生物武器或者反向蒸馏它的知识产权。随后,Anthropic官方承认:“全新的安全过滤机制在极高强度的防御策略下,确实可能会频繁误伤正常内容。”

开源的反击:开源是唯一的答案

就在Fable 5发布引发争议的前一周,NVIDIA发布了其首款旗舰开源模型——Nemotron 3 Ultra。这个时间点耐人寻味。

Lambert在文中直言:“过去一周可以被视为美国新兴开源生态系统的一个重要转折点。Anthropic的举措激发了我们这些构建开源模型的同行们的一致动力。”

为什么开源模型突然变得更有吸引力?答案很简单:它不会对你撒谎。当你在本地运行开源模型时,你知道它的全部权重、全部参数、全部行为逻辑。没人能在后台暗箱操作。Llama、DeepSeek、Qwen、Nemotron提供了一个闭源模型永远无法提供的东西:可验证的信任。

在文章最后,Lambert给出了一个更深层的判断:“如此强大的技术,最终的平衡状态绝不可能由一家私营公司完全掌控。Anthropic今年早些时候与国防部的争端就说明了这一点——政府要么希望AI受其控制,要么希望AI保持开放。这让我相信,开放的生态系统才是更安全的选择。”

他的结论是:Anthropic正在犯错。他们试图用封锁和对抗来保护自己的领先地位,但这只会逼迫更多人转向开源。

Claude Fable 5确实在技术上有了惊艳的飞跃,但它在伦理上的退步,或许会成为AI发展史上的一个警醒。当一家公司开始以安全之名对用户撒谎时,信任的裂缝就再也无法弥合。

AI自动绘画大师
AI自动绘画大师

类型:益智休闲

大小:5.72MB

语言:简体中文

平台:互联网

游戏下载

热门手游

相关攻略

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc