热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >Claude刷爆5亿,一夜涨60倍,你的Token账单还撑得住?

Claude刷爆5亿,一夜涨60倍,你的Token账单还撑得住?

来源:互联网 更新时间:2026-06-01 19:40

1个月烧出5亿美元账单!

近期,科技圈爆出一桩令人瞠目结舌的事件。据Axios报道,一家企业竟在短短一个月内,于Claude平台刷爆了5亿美元!

别急,这事的起因,挺让人哭笑不得的:管理层给员工开通Claude账号权限时,忘了设置使用额度上限。

AI账单“爆雷”的案例远不止这一个。

今年4月,一名谷歌云用户因公开服务中遗留的API key被恶意滥用,原本只有7美元预算的账户,一夜之间收到了1.8万美元的账单。

这位倒霉的用户叫Jesse Da vies,澳大利亚AI顾问,也是Agentic Labs的创始人。他自认为给自己的Google Cloud账户设了两道保险:一个10澳元(约7美元)的预算预警,外加一个1400美元的硬性消费上限。

据Tom's Hardware报道,攻击者发现了他几个月前从AI Studio发布的一个Cloud Run服务,狂发了6万多个请求。结果,两道防线全部失守:账单计算存在延迟,等系统反应过来,金额已经飙到了1.8万美元。

5月中旬,开源项目OpenClaw的创始人Peter Steinberger在X上贴出一张截图:30天,OpenAI API账单高达130万美元。

他的团队只有三个人,却指挥着100个Codex智能体并行运作:30天烧掉6030亿个Token,跑出760万次请求。不过,这130万美元并非他自掏腰包。

Steinberger今年2月加入了OpenAI,这130万美元被当作一次内部实验:

测试在不考虑Token成本的情况下,AI编程能达到什么极限。他补充说,这还是在Codex“高速档计费”下的结果,关掉之后大概只需30万美元。

更早一些,Uber的CTO Pra veen Neppalli Naga也向The Information坦言,公司4月份就已将全年的Claude Code预算消耗殆尽。其COO更是公开表示,AI成本已经越来越“难以自圆其说”。

5亿、130万、1.8万,这些金额虽然差出几个数量级,却共同指向一个事实:

在智能体时代,无论是失控的密钥、昼夜无休的智能体军团,还是忘了设置上限的账号,任何一个疏忽,都能让你的Token账单一夜爆仓。

AI账单为什么会爆仓?

答案主要藏在计费方式的变革里。

从今年4月起,OpenAI的包月计费方式开始转向按Token用量计费。

4月2日,Codex计费从按消息估算改为按Token用量对齐:输入、缓存输入、输出三类Token分开计算。到了4月23日,这套规则已经扩展到所有Enterprise、Edu、Health、Gov方案——月费里那笔看不见的折扣被悄然抽走了。

GitHub也紧随其后,刚刚官宣:所有Copilot套餐从2026年6月1日起,转向按用量计费。旧的高级请求逻辑被废除,取而代之的是AI额度,按输入Token、输出Token、缓存Token的实际消耗,对照每个模型的API费率进行结算。

GitHub官方解释了这么做的原因:

眼下,一个快速的聊天提问,和一次跑好几个小时的自主编码任务,用户花的钱却一样多。GitHub一直在为那些跑重度任务的用户暗中买单,但这套模式已经难以为继。

在AI智能体崛起之前,聊天和代码补全的成本相差无几,月费还能兜得住。

但智能体崛起后,一次任务能连续跑几个小时、改动整个代码库,重度用户和轻度用户的成本差直接拉大到几个数量级。月费制在这种差距面前,最终崩盘。

消息一出,Reddit和X上一片哗然。

一位ID为JBusu的开发者晒出了账单截图,直言新定价就是个“笑话”。原本28.12美元/月的开销,按新制要支付746.01美元。他已决定退订,并感慨道:“这个价格,我自己租云服务器都还便宜。”

另一位用户的截图更夸张,费用从50美元一路飙升到3000美元。他直呼定价如此离谱,“还有人继续订阅吗?”

不过,也有Copilot老用户出来反驳:这些极端账单多半是“vibe-coder”(凭感觉编码者)们不把烧Token当回事给烧出来的,未必能代表正常使用。

一位老用户在评论区留言:“

我整天都在用,月底基本不超额,很难相信这是工作复杂度的差异。

”另一位用户则更直接:“

就是有人要全自动的YOLO模式开发,让AI随便跑。这种浪费被剔除,对其他人反而是好事。

有一点必须清楚:GitHub并没有废除月费,基础订阅价格并未改变。真正变化的,是额外用量、智能体任务、更贵的模型调用,从此进入了用量计费时代。

受到冲击最大的,是那些依赖Copilot运行长链任务的重度智能体用户。

被自己人玩坏的排行榜

月费模式失守,一面是平台更改了计费规则,另一面则是使用AI的人,自己也在拼命烧钱。

5月,Business Insider报道,Amazon下线了一个名为KiroRank的内部AI使用排行榜。

该报道援引知情人士的话称,这个榜单悄然催生出一种奇怪的工作方式:部分员工为了在榜单上多爬几位,会去刷一些并不能解决实际问题的Token消耗,纯粹为了排名。

事情曝光后,Amazon高级副总裁Da ve Treadwell直接向全员喊话:

“别为了用AI而用AI。用它去解决客户问题,解决业务问题,去创新。”

这事虽有些荒唐,却毫不意外。当“烧Token”能上榜,员工自然就会去烧Token。

硅谷给这种现象起了个专门的名字:

Token maxxing

(极限烧Token),把消耗量当成了生产力。

Axios的报道也提到,有CTO发现员工拿AI模型查天气、写日常邮件,这些简单到不行的事,却套上了最贵的前沿模型,账单就这样悄无声息地飞涨。

KiroRank并非Amazon官方考核体系,而是员工自发搭建的非正式工具。但它清楚地暴露了一个经典的管理学规律:

当KPI设错的时候,人就会用最聪明的方式钻空子

把“用了多少”等同于“干得好不好”——这正是这一轮AI浪费的制度性根源。

算Token账的人,已经在赚钱

Token账单焦虑的另一面,有人悄悄把它做成了生意。

第一条路:用上下文“喂饱”AI。

Glean是Arvind Jain自己的公司,做的就是企业AI工作助手:把分散在公司各处的知识统一打通,让员工的AI直接拿到上下文,不必再四处翻箱倒柜。AI少绕路,烧的Token自然就少。

这套机制让Glean的年度营收在15个月内翻了3倍,跨越3亿美元大关,客户包括Databricks、Reddit、Samsung。

第二条路:把活分给对的模型。

模型路由初创公司Factory AI干的就是这件事——自动把每个任务派给最合适的模型:简单任务走便宜档,复杂任务走顶配。Arvind也曾说过:

路由做对了,能省10倍

这两条路殊途同归:

让AI干活,但别让它乱烧

学术圈的研究,也在为这种转向奠基。

https://arxiv.org/pdf/2604.22750

2026年4月的一篇arXiv论文,第一次系统拆解了智能体编码任务到底是怎么烧钱的。

结论一:智能体任务的Token消耗,可达普通代码推理和代码对话的上千倍,推高成本的主因是输入Token。

结论二

:同一个任务跑多次,Token消耗能差出30倍。

结论三

更高的Token消耗,并不必然带来更高准确率

。精度往往在中等成本处见顶——再往上烧,钱花了,效果反而饱和。

论文还发现,前沿模型甚至连预测自己要烧多少Token都做不到,普遍低估真实成本。

你以为多花钱就能多办事。实际是

钱花了,活不一定更好,预算还总算不准

当AI账单开始赶超人力成本

“这是我记忆中第一次,技术成本开始和人力成本持平。”

5月29日,Glean CEO Arvind Jain在接受CNBC记者Deirdre Bosa采访时这样说道。

英伟达应用深度学习副总裁Bryan Catanzaro的观察也印证了这一点。

他在Axios的访谈中提到,对于他的团队来说,算力成本已经远远超过员工薪资。

类似的现象正在多家公司涌现:从做企业AI的Glean,到卖AI算力的英伟达,再到应用AI的Uber,都在重新审视这笔账。

在Arvind看来,历史上技术只是企业整体成本中很小的一块,但现在AI成本已经能追平工资单了。很多企业的年度AI预算,通常一两个月就烧光了。

过去一年,AI使用率是一个被追捧的指标:多用就是先进,烧Token就是拥抱未来。如今,许多企业开始反思那句朴素的话:这些烧掉的Token,到底换来了什么?

免费包月畅用的窗口期,正在此刻悄然关上。

接下来,摆在所有开发者面前的是这样一个问题:如何精打细算,让每一个Token发挥出最大价值。

未来真正的赢家,毫无疑问将是最先学会算Token账的那一个。

热门手游

相关攻略

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc