热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >A社你解释下,啥叫Sonnet5比Fable5还贵?

A社你解释下,啥叫Sonnet5比Fable5还贵?

来源:互联网 更新时间:2026-07-01 15:41

刚刚,Claude又更新了。

这一次不是旗舰级的大模型,而是Anthropic推出的新版性价比模型——Sonnet 5。按照官方说法,这是迄今为止"最能干活"的Sonnet,可以自己规划任务、调用浏览器和终端,像个真正的智能助手。

有意思的是,它的跑分竟然逼近了自家最贵的Opus 4.8,而价格却只要后者的六成左右。看起来,Anthropic是想把Sonnet 5打造成一款"Opus平替"。但事情真的有这么简单吗?

具体数字摆在这儿:agentic coding跑分SWE-bench Pro达到了63.2%,比上一代Sonnet 4.6高出5个百分点。标价却和4.6一模一样——从发布会的口径上看,能力涨了,价格没涨。

真的没涨……吗?

开发者Simon Willison做了一件很简单的事:他把同一段文字分别喂给新旧两个模型计数。结果发现,Sonnet 5虽然表面上价格一样,但账单上的Token消耗数字却悄悄涨了三成左右。这就有点意思了——Anthropic这是玩起了"偷梁换柱"那一套。

"Opus平替"

Sonnet 5这次升级的重点,是Agentic能力的提升。模型可以自己拆解任务、调用浏览器和终端这类工具,把一件多步骤的活一口气干完,中间不掉链子,干完之后还会主动检查一遍自己的输出,完全不用人提醒。

跑分上能看到具体的台阶。在agentic coding测试SWE-bench Pro上,Sonnet 5拿到了63.2分,Sonnet 4.6是58.1分,Opus 4.8是69.2分——Sonnet 5站在两代之间,离Opus只差6分。在computer use测试OSWorld-Verified上,Sonnet 5是81.2%,Opus 4.8是83.4%,差距缩到2.2个百分点。而在知识工作类测试GDPval-AA v2上,Sonnet 5拿到1618分,反而比Opus 4.8的1615分还高出3分。

早期用上这款模型的两家公司给出的反馈,也印证了这一点。AI编程平台Factory的工程师Zimu Li说,Sonnet 5给他们的智能体提供了一层扎实的执行能力,能在杂乱的技术环境里持续编码、调用工具、排查问题,尤其适合那种需要长时间跟进、对技术细节要求高的工作流。

自动化平台Zapier的工程师Daniel Shepard给了一个更具体的例子:他们交给Sonnet 5一项两段式任务,先更新Salesforce里的客户账户等级,再给企业客户发一封产品上线公告邮件。这种任务过去常常卡在中间——比如账户等级改完了,公告却没发出去,或者反过来。这次Sonnet 5把两段任务从头跑到尾,没有中途停下来等人接手。Shepard的原话是:"对日常自动化来说,这种模型不用多想就该用。"

Anthropic同时公布的安全评估结果,跟这条主线是配套的。Sonnet 5的幻觉率和谄媚倾向都比Sonnet 4.6低,在自主调用工具的场景下,Sonnet 5也更能抵抗提示词注入这类劫持攻击。

而这组性能数字放在价格旁边看,意味才真正显现出来。Opus 4.8的标价是每百万输入/输出Token分别要5/25美元,Sonnet 5则是3/15美元——只要Opus的六成左右,叠加8月底前的限时优惠则只要四成。从账面上看,性能够到对方九成以上,价格却只要四到六成,Sonnet 5确实是一款"Opus平替"。

Sonnet 5,真的更便宜吗?

性能这条线讲完了,价格这条线开始露出另一面。Sonnet 5用了一套新的分词器——也就是模型把文字切成Token的方式。新的分词器当中,同一段文字现在被切成了更多份Token,算下来的总费用自然就比以前高了。

发现这一点的,正是开发者Simon Willison。他没有停在官方那句"价格不变"上,转头拿自己写的Token计数工具实测了几份不同语言的真实文档。结果令人吃惊:英文版,Sonnet 4.6算出2356个token,Sonnet 5算出3341个,涨了42%;西班牙语版涨了33%;一份4279行的Python代码,Token数则是从44014涨到56118,涨了27%。唯独简体中文版几乎没动,从3334涨到3360,只多了1%。同一次分词器换代,对不同语言的影响差出去四十多个百分点,这个反差本身比涨价这件事更值得多看一眼。

把这几个数字摆在一起,能看出"单价不变"这句话没有说谎,但也没有说全。同样一段英文文字,现在要花掉的钱比Sonnet 4.6时代多出四成多。但这样算下来,应该也比Opus便宜?结果很快就有开发者来打脸了。

有开发者发现,实际运行当中,Sonnet的花费竟然比Opus还贵。跑一个Artificial Analysis Intelligent Index上的任务,Opus 4.8平均(加权)要花1.8美元,而Sonnet 5要2.29美元,多出了27%。

他进一步发现,对于同一个任务,Sonnet 5消耗的Token竟然高达Opus的两倍。

如果看跑完整个Benchmark的消耗,那Sonnet 5花的钱比fable还多了6.8%。

幸好开发者手里有Token计数工具,能把这层差异精确量出来,这也是Willison这次能在发布当晚就把"隐藏式涨价"摆到桌面上的原因。换成普通用户,大概率只会在月底账单上模糊地觉得"这个月怎么花得有点多"。

开发者应如何选择?

把Sonnet 5"明降暗涨"这件事放回到整个行业里看,涨价这件事本身这两年并不罕见,真正区别在于走哪条路。OpenAI今年4月给GPT-5.5调价,走的是摆在台面上那条路——直接把每百万输入/输出Token的价格从2.5/15美元提到5/30,整整翻了一倍,谁打开价格页都能看到这个数字变了。Sonnet 5走的是另一条路,标价那一栏一个字没动,涨幅藏在分词器换代这层技术细节里,不主动去量就发现不了。

对要把工作流迁移到Sonnet 5的开发者来说,有一件事比记住"价格表变没变"更有用——先拿自己真实的工作负载,用Token计数工具实测一遍,预估一下实际价格。毕竟标价表只能告诉你单价,账单才能告诉你这次升级到底要花多少钱。

那张被悄悄改写的账单,"Opus平替"其实是同一件事的两面。Sonnet 5确实用更低的价格换来了更接近Opus的能力,只是这次,"更低的价格"五个字背后,藏着一把换了刻度的尺子。

最后,还有开发者指出,把视线放大就会发现,并不是只有Claude一家可以选择。虽然Sonnet在Anthropic内部是个性价比之选,但智谱GLM-5.2的性能与Sonnet 5相差无几,而价格方面,GLM-5.2的输入价格只有Sonnet 5的七成,输出价格更是连一半都不到。

用这名开发者的话说:何必要花更多的钱买更少的东西呢?

热门手游

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc