您的位置：首页 > > 教程攻略 > ai资讯 >A社你解释下，啥叫Sonnet5比Fable5还贵？

A社你解释下，啥叫Sonnet5比Fable5还贵？

来源:互联网 更新时间:2026-07-01 15:41

刚刚，Claude又更新了。

这一次不是旗舰级的大模型，而是Anthropic推出的新版性价比模型——Sonnet 5。按照官方说法，这是迄今为止"最能干活"的Sonnet，可以自己规划任务、调用浏览器和终端，像个真正的智能助手。

有意思的是，它的跑分竟然逼近了自家最贵的Opus 4.8，而价格却只要后者的六成左右。看起来，Anthropic是想把Sonnet 5打造成一款"Opus平替"。但事情真的有这么简单吗？

具体数字摆在这儿：agentic coding跑分SWE-bench Pro达到了63.2%，比上一代Sonnet 4.6高出5个百分点。标价却和4.6一模一样——从发布会的口径上看，能力涨了，价格没涨。

真的没涨……吗？

开发者Simon Willison做了一件很简单的事：他把同一段文字分别喂给新旧两个模型计数。结果发现，Sonnet 5虽然表面上价格一样，但账单上的Token消耗数字却悄悄涨了三成左右。这就有点意思了——Anthropic这是玩起了"偷梁换柱"那一套。

"Opus平替"

Sonnet 5这次升级的重点，是Agentic能力的提升。模型可以自己拆解任务、调用浏览器和终端这类工具，把一件多步骤的活一口气干完，中间不掉链子，干完之后还会主动检查一遍自己的输出，完全不用人提醒。

跑分上能看到具体的台阶。在agentic coding测试SWE-bench Pro上，Sonnet 5拿到了63.2分，Sonnet 4.6是58.1分，Opus 4.8是69.2分——Sonnet 5站在两代之间，离Opus只差6分。在computer use测试OSWorld-Verified上，Sonnet 5是81.2%，Opus 4.8是83.4%，差距缩到2.2个百分点。而在知识工作类测试GDPval-AA v2上，Sonnet 5拿到1618分，反而比Opus 4.8的1615分还高出3分。

早期用上这款模型的两家公司给出的反馈，也印证了这一点。AI编程平台Factory的工程师Zimu Li说，Sonnet 5给他们的智能体提供了一层扎实的执行能力，能在杂乱的技术环境里持续编码、调用工具、排查问题，尤其适合那种需要长时间跟进、对技术细节要求高的工作流。

自动化平台Zapier的工程师Daniel Shepard给了一个更具体的例子：他们交给Sonnet 5一项两段式任务，先更新Salesforce里的客户账户等级，再给企业客户发一封产品上线公告邮件。这种任务过去常常卡在中间——比如账户等级改完了，公告却没发出去，或者反过来。这次Sonnet 5把两段任务从头跑到尾，没有中途停下来等人接手。Shepard的原话是："对日常自动化来说，这种模型不用多想就该用。"

Anthropic同时公布的安全评估结果，跟这条主线是配套的。Sonnet 5的幻觉率和谄媚倾向都比Sonnet 4.6低，在自主调用工具的场景下，Sonnet 5也更能抵抗提示词注入这类劫持攻击。

而这组性能数字放在价格旁边看，意味才真正显现出来。Opus 4.8的标价是每百万输入/输出Token分别要5/25美元，Sonnet 5则是3/15美元——只要Opus的六成左右，叠加8月底前的限时优惠则只要四成。从账面上看，性能够到对方九成以上，价格却只要四到六成，Sonnet 5确实是一款"Opus平替"。

Sonnet 5，真的更便宜吗？

性能这条线讲完了，价格这条线开始露出另一面。Sonnet 5用了一套新的分词器——也就是模型把文字切成Token的方式。新的分词器当中，同一段文字现在被切成了更多份Token，算下来的总费用自然就比以前高了。

发现这一点的，正是开发者Simon Willison。他没有停在官方那句"价格不变"上，转头拿自己写的Token计数工具实测了几份不同语言的真实文档。结果令人吃惊：英文版，Sonnet 4.6算出2356个token，Sonnet 5算出3341个，涨了42%；西班牙语版涨了33%；一份4279行的Python代码，Token数则是从44014涨到56118，涨了27%。唯独简体中文版几乎没动，从3334涨到3360，只多了1%。同一次分词器换代，对不同语言的影响差出去四十多个百分点，这个反差本身比涨价这件事更值得多看一眼。

把这几个数字摆在一起，能看出"单价不变"这句话没有说谎，但也没有说全。同样一段英文文字，现在要花掉的钱比Sonnet 4.6时代多出四成多。但这样算下来，应该也比Opus便宜？结果很快就有开发者来打脸了。

有开发者发现，实际运行当中，Sonnet的花费竟然比Opus还贵。跑一个Artificial Analysis Intelligent Index上的任务，Opus 4.8平均（加权）要花1.8美元，而Sonnet 5要2.29美元，多出了27%。

他进一步发现，对于同一个任务，Sonnet 5消耗的Token竟然高达Opus的两倍。

如果看跑完整个Benchmark的消耗，那Sonnet 5花的钱比fable还多了6.8%。

幸好开发者手里有Token计数工具，能把这层差异精确量出来，这也是Willison这次能在发布当晚就把"隐藏式涨价"摆到桌面上的原因。换成普通用户，大概率只会在月底账单上模糊地觉得"这个月怎么花得有点多"。

开发者应如何选择？

把Sonnet 5"明降暗涨"这件事放回到整个行业里看，涨价这件事本身这两年并不罕见，真正区别在于走哪条路。OpenAI今年4月给GPT-5.5调价，走的是摆在台面上那条路——直接把每百万输入/输出Token的价格从2.5/15美元提到5/30，整整翻了一倍，谁打开价格页都能看到这个数字变了。Sonnet 5走的是另一条路，标价那一栏一个字没动，涨幅藏在分词器换代这层技术细节里，不主动去量就发现不了。

对要把工作流迁移到Sonnet 5的开发者来说，有一件事比记住"价格表变没变"更有用——先拿自己真实的工作负载，用Token计数工具实测一遍，预估一下实际价格。毕竟标价表只能告诉你单价，账单才能告诉你这次升级到底要花多少钱。

那张被悄悄改写的账单，"Opus平替"其实是同一件事的两面。Sonnet 5确实用更低的价格换来了更接近Opus的能力，只是这次，"更低的价格"五个字背后，藏着一把换了刻度的尺子。

最后，还有开发者指出，把视线放大就会发现，并不是只有Claude一家可以选择。虽然Sonnet在Anthropic内部是个性价比之选，但智谱GLM-5.2的性能与Sonnet 5相差无几，而价格方面，GLM-5.2的输入价格只有Sonnet 5的七成，输出价格更是连一半都不到。