您的位置：首页 > > 教程攻略 > ai资讯 >Claude刷爆5亿，一夜涨60倍，你的Token账单还撑得住？

Claude刷爆5亿，一夜涨60倍，你的Token账单还撑得住？

来源:互联网 更新时间:2026-06-01 19:40

1个月烧出5亿美元账单！

近期，科技圈爆出一桩令人瞠目结舌的事件。据Axios报道，一家企业竟在短短一个月内，于Claude平台刷爆了5亿美元！

别急，这事的起因，挺让人哭笑不得的：管理层给员工开通Claude账号权限时，忘了设置使用额度上限。

AI账单“爆雷”的案例远不止这一个。

今年4月，一名谷歌云用户因公开服务中遗留的API key被恶意滥用，原本只有7美元预算的账户，一夜之间收到了1.8万美元的账单。

这位倒霉的用户叫Jesse Da vies，澳大利亚AI顾问，也是Agentic Labs的创始人。他自认为给自己的Google Cloud账户设了两道保险：一个10澳元（约7美元）的预算预警，外加一个1400美元的硬性消费上限。

据Tom's Hardware报道，攻击者发现了他几个月前从AI Studio发布的一个Cloud Run服务，狂发了6万多个请求。结果，两道防线全部失守：账单计算存在延迟，等系统反应过来，金额已经飙到了1.8万美元。

5月中旬，开源项目OpenClaw的创始人Peter Steinberger在X上贴出一张截图：30天，OpenAI API账单高达130万美元。

他的团队只有三个人，却指挥着100个Codex智能体并行运作：30天烧掉6030亿个Token，跑出760万次请求。不过，这130万美元并非他自掏腰包。

Steinberger今年2月加入了OpenAI，这130万美元被当作一次内部实验：

测试在不考虑Token成本的情况下，AI编程能达到什么极限。他补充说，这还是在Codex“高速档计费”下的结果，关掉之后大概只需30万美元。

更早一些，Uber的CTO Pra veen Neppalli Naga也向The Information坦言，公司4月份就已将全年的Claude Code预算消耗殆尽。其COO更是公开表示，AI成本已经越来越“难以自圆其说”。

5亿、130万、1.8万，这些金额虽然差出几个数量级，却共同指向一个事实：

在智能体时代，无论是失控的密钥、昼夜无休的智能体军团，还是忘了设置上限的账号，任何一个疏忽，都能让你的Token账单一夜爆仓。

AI账单为什么会爆仓？

答案主要藏在计费方式的变革里。

从今年4月起，OpenAI的包月计费方式开始转向按Token用量计费。

4月2日，Codex计费从按消息估算改为按Token用量对齐：输入、缓存输入、输出三类Token分开计算。到了4月23日，这套规则已经扩展到所有Enterprise、Edu、Health、Gov方案——月费里那笔看不见的折扣被悄然抽走了。

GitHub也紧随其后，刚刚官宣：所有Copilot套餐从2026年6月1日起，转向按用量计费。旧的高级请求逻辑被废除，取而代之的是AI额度，按输入Token、输出Token、缓存Token的实际消耗，对照每个模型的API费率进行结算。

GitHub官方解释了这么做的原因：

眼下，一个快速的聊天提问，和一次跑好几个小时的自主编码任务，用户花的钱却一样多。GitHub一直在为那些跑重度任务的用户暗中买单，但这套模式已经难以为继。

在AI智能体崛起之前，聊天和代码补全的成本相差无几，月费还能兜得住。

但智能体崛起后，一次任务能连续跑几个小时、改动整个代码库，重度用户和轻度用户的成本差直接拉大到几个数量级。月费制在这种差距面前，最终崩盘。

消息一出，Reddit和X上一片哗然。

一位ID为JBusu的开发者晒出了账单截图，直言新定价就是个“笑话”。原本28.12美元/月的开销，按新制要支付746.01美元。他已决定退订，并感慨道：“这个价格，我自己租云服务器都还便宜。”

另一位用户的截图更夸张，费用从50美元一路飙升到3000美元。他直呼定价如此离谱，“还有人继续订阅吗？”

不过，也有Copilot老用户出来反驳：这些极端账单多半是“vibe-coder”（凭感觉编码者）们不把烧Token当回事给烧出来的，未必能代表正常使用。

一位老用户在评论区留言：“

我整天都在用，月底基本不超额，很难相信这是工作复杂度的差异。

”另一位用户则更直接：“

就是有人要全自动的YOLO模式开发，让AI随便跑。这种浪费被剔除，对其他人反而是好事。

”

有一点必须清楚：GitHub并没有废除月费，基础订阅价格并未改变。真正变化的，是额外用量、智能体任务、更贵的模型调用，从此进入了用量计费时代。

受到冲击最大的，是那些依赖Copilot运行长链任务的重度智能体用户。

被自己人玩坏的排行榜

月费模式失守，一面是平台更改了计费规则，另一面则是使用AI的人，自己也在拼命烧钱。

5月，Business Insider报道，Amazon下线了一个名为KiroRank的内部AI使用排行榜。

该报道援引知情人士的话称，这个榜单悄然催生出一种奇怪的工作方式：部分员工为了在榜单上多爬几位，会去刷一些并不能解决实际问题的Token消耗，纯粹为了排名。

事情曝光后，Amazon高级副总裁Da ve Treadwell直接向全员喊话：

“别为了用AI而用AI。用它去解决客户问题，解决业务问题，去创新。”

这事虽有些荒唐，却毫不意外。当“烧Token”能上榜，员工自然就会去烧Token。

硅谷给这种现象起了个专门的名字：

Token maxxing

（极限烧Token），把消耗量当成了生产力。

Axios的报道也提到，有CTO发现员工拿AI模型查天气、写日常邮件，这些简单到不行的事，却套上了最贵的前沿模型，账单就这样悄无声息地飞涨。

KiroRank并非Amazon官方考核体系，而是员工自发搭建的非正式工具。但它清楚地暴露了一个经典的管理学规律：

当KPI设错的时候，人就会用最聪明的方式钻空子

。

把“用了多少”等同于“干得好不好”——这正是这一轮AI浪费的制度性根源。

算Token账的人，已经在赚钱

Token账单焦虑的另一面，有人悄悄把它做成了生意。

第一条路：用上下文“喂饱”AI。

Glean是Arvind Jain自己的公司，做的就是企业AI工作助手：把分散在公司各处的知识统一打通，让员工的AI直接拿到上下文，不必再四处翻箱倒柜。AI少绕路，烧的Token自然就少。

这套机制让Glean的年度营收在15个月内翻了3倍，跨越3亿美元大关，客户包括Databricks、Reddit、Samsung。

第二条路：把活分给对的模型。

模型路由初创公司Factory AI干的就是这件事——自动把每个任务派给最合适的模型：简单任务走便宜档，复杂任务走顶配。Arvind也曾说过：

路由做对了，能省10倍

。

这两条路殊途同归：

让AI干活，但别让它乱烧

。

学术圈的研究，也在为这种转向奠基。

https://arxiv.org/pdf/2604.22750

2026年4月的一篇arXiv论文，第一次系统拆解了智能体编码任务到底是怎么烧钱的。

结论一：智能体任务的Token消耗，可达普通代码推理和代码对话的上千倍，推高成本的主因是输入Token。

结论二

：同一个任务跑多次，Token消耗能差出30倍。

结论三

：

更高的Token消耗，并不必然带来更高准确率

。精度往往在中等成本处见顶——再往上烧，钱花了，效果反而饱和。

论文还发现，前沿模型甚至连预测自己要烧多少Token都做不到，普遍低估真实成本。

你以为多花钱就能多办事。实际是

钱花了，活不一定更好，预算还总算不准

。

当AI账单开始赶超人力成本

“这是我记忆中第一次，技术成本开始和人力成本持平。”

5月29日，Glean CEO Arvind Jain在接受CNBC记者Deirdre Bosa采访时这样说道。

英伟达应用深度学习副总裁Bryan Catanzaro的观察也印证了这一点。

他在Axios的访谈中提到，对于他的团队来说，算力成本已经远远超过员工薪资。

类似的现象正在多家公司涌现：从做企业AI的Glean，到卖AI算力的英伟达，再到应用AI的Uber，都在重新审视这笔账。

在Arvind看来，历史上技术只是企业整体成本中很小的一块，但现在AI成本已经能追平工资单了。很多企业的年度AI预算，通常一两个月就烧光了。

过去一年，AI使用率是一个被追捧的指标：多用就是先进，烧Token就是拥抱未来。如今，许多企业开始反思那句朴素的话：这些烧掉的Token，到底换来了什么？

免费包月畅用的窗口期，正在此刻悄然关上。

接下来，摆在所有开发者面前的是这样一个问题：如何精打细算，让每一个Token发挥出最大价值。

未来真正的赢家，毫无疑问将是最先学会算Token账的那一个。

Claude刷爆5亿，一夜涨60倍，你的Token账单还撑得住？

Steinberger今年2月加入了OpenAI，这130万美元被当作一次内部实验：

AI账单为什么会爆仓？

AI账单为什么会爆仓？

我整天都在用，月底基本不超额，很难相信这是工作复杂度的差异。

就是有人要全自动的YOLO模式开发，让AI随便跑。这种浪费被剔除，对其他人反而是好事。

被自己人玩坏的排行榜

被自己人玩坏的排行榜

“别为了用AI而用AI。用它去解决客户问题，解决业务问题，去创新。”

Token maxxing

当KPI设错的时候，人就会用最聪明的方式钻空子

算Token账的人，已经在赚钱

算Token账的人，已经在赚钱

路由做对了，能省10倍

让AI干活，但别让它乱烧

结论二

结论三

更高的Token消耗，并不必然带来更高准确率

钱花了，活不一定更好，预算还总算不准

当AI账单开始赶超人力成本

当AI账单开始赶超人力成本

热门资讯

热门手游

相关攻略

热门专题