来源:互联网 更新时间:2026-06-01 19:40
1个月烧出5亿美元账单!
近期,科技圈爆出一桩令人瞠目结舌的事件。据Axios报道,一家企业竟在短短一个月内,于Claude平台刷爆了5亿美元!
别急,这事的起因,挺让人哭笑不得的:管理层给员工开通Claude账号权限时,忘了设置使用额度上限。

AI账单“爆雷”的案例远不止这一个。
今年4月,一名谷歌云用户因公开服务中遗留的API key被恶意滥用,原本只有7美元预算的账户,一夜之间收到了1.8万美元的账单。

这位倒霉的用户叫Jesse Da vies,澳大利亚AI顾问,也是Agentic Labs的创始人。他自认为给自己的Google Cloud账户设了两道保险:一个10澳元(约7美元)的预算预警,外加一个1400美元的硬性消费上限。
据Tom's Hardware报道,攻击者发现了他几个月前从AI Studio发布的一个Cloud Run服务,狂发了6万多个请求。结果,两道防线全部失守:账单计算存在延迟,等系统反应过来,金额已经飙到了1.8万美元。
5月中旬,开源项目OpenClaw的创始人Peter Steinberger在X上贴出一张截图:30天,OpenAI API账单高达130万美元。

他的团队只有三个人,却指挥着100个Codex智能体并行运作:30天烧掉6030亿个Token,跑出760万次请求。不过,这130万美元并非他自掏腰包。
测试在不考虑Token成本的情况下,AI编程能达到什么极限。他补充说,这还是在Codex“高速档计费”下的结果,关掉之后大概只需30万美元。
更早一些,Uber的CTO Pra veen Neppalli Naga也向The Information坦言,公司4月份就已将全年的Claude Code预算消耗殆尽。其COO更是公开表示,AI成本已经越来越“难以自圆其说”。
5亿、130万、1.8万,这些金额虽然差出几个数量级,却共同指向一个事实:
在智能体时代,无论是失控的密钥、昼夜无休的智能体军团,还是忘了设置上限的账号,任何一个疏忽,都能让你的Token账单一夜爆仓。
答案主要藏在计费方式的变革里。
从今年4月起,OpenAI的包月计费方式开始转向按Token用量计费。
4月2日,Codex计费从按消息估算改为按Token用量对齐:输入、缓存输入、输出三类Token分开计算。到了4月23日,这套规则已经扩展到所有Enterprise、Edu、Health、Gov方案——月费里那笔看不见的折扣被悄然抽走了。
GitHub也紧随其后,刚刚官宣:所有Copilot套餐从2026年6月1日起,转向按用量计费。旧的高级请求逻辑被废除,取而代之的是AI额度,按输入Token、输出Token、缓存Token的实际消耗,对照每个模型的API费率进行结算。

GitHub官方解释了这么做的原因:
眼下,一个快速的聊天提问,和一次跑好几个小时的自主编码任务,用户花的钱却一样多。GitHub一直在为那些跑重度任务的用户暗中买单,但这套模式已经难以为继。
在AI智能体崛起之前,聊天和代码补全的成本相差无几,月费还能兜得住。
但智能体崛起后,一次任务能连续跑几个小时、改动整个代码库,重度用户和轻度用户的成本差直接拉大到几个数量级。月费制在这种差距面前,最终崩盘。
消息一出,Reddit和X上一片哗然。
一位ID为JBusu的开发者晒出了账单截图,直言新定价就是个“笑话”。原本28.12美元/月的开销,按新制要支付746.01美元。他已决定退订,并感慨道:“这个价格,我自己租云服务器都还便宜。”


另一位用户的截图更夸张,费用从50美元一路飙升到3000美元。他直呼定价如此离谱,“还有人继续订阅吗?”

不过,也有Copilot老用户出来反驳:这些极端账单多半是“vibe-coder”(凭感觉编码者)们不把烧Token当回事给烧出来的,未必能代表正常使用。
一位老用户在评论区留言:“
有一点必须清楚:GitHub并没有废除月费,基础订阅价格并未改变。真正变化的,是额外用量、智能体任务、更贵的模型调用,从此进入了用量计费时代。
受到冲击最大的,是那些依赖Copilot运行长链任务的重度智能体用户。
月费模式失守,一面是平台更改了计费规则,另一面则是使用AI的人,自己也在拼命烧钱。
5月,Business Insider报道,Amazon下线了一个名为KiroRank的内部AI使用排行榜。
该报道援引知情人士的话称,这个榜单悄然催生出一种奇怪的工作方式:部分员工为了在榜单上多爬几位,会去刷一些并不能解决实际问题的Token消耗,纯粹为了排名。

事情曝光后,Amazon高级副总裁Da ve Treadwell直接向全员喊话:
这事虽有些荒唐,却毫不意外。当“烧Token”能上榜,员工自然就会去烧Token。
硅谷给这种现象起了个专门的名字:
Axios的报道也提到,有CTO发现员工拿AI模型查天气、写日常邮件,这些简单到不行的事,却套上了最贵的前沿模型,账单就这样悄无声息地飞涨。
KiroRank并非Amazon官方考核体系,而是员工自发搭建的非正式工具。但它清楚地暴露了一个经典的管理学规律:
把“用了多少”等同于“干得好不好”——这正是这一轮AI浪费的制度性根源。
Token账单焦虑的另一面,有人悄悄把它做成了生意。
第一条路:用上下文“喂饱”AI。
Glean是Arvind Jain自己的公司,做的就是企业AI工作助手:把分散在公司各处的知识统一打通,让员工的AI直接拿到上下文,不必再四处翻箱倒柜。AI少绕路,烧的Token自然就少。
这套机制让Glean的年度营收在15个月内翻了3倍,跨越3亿美元大关,客户包括Databricks、Reddit、Samsung。
第二条路:把活分给对的模型。
模型路由初创公司Factory AI干的就是这件事——自动把每个任务派给最合适的模型:简单任务走便宜档,复杂任务走顶配。Arvind也曾说过:
这两条路殊途同归:
学术圈的研究,也在为这种转向奠基。

https://arxiv.org/pdf/2604.22750
2026年4月的一篇arXiv论文,第一次系统拆解了智能体编码任务到底是怎么烧钱的。
结论一:智能体任务的Token消耗,可达普通代码推理和代码对话的上千倍,推高成本的主因是输入Token。
论文还发现,前沿模型甚至连预测自己要烧多少Token都做不到,普遍低估真实成本。
你以为多花钱就能多办事。实际是
“这是我记忆中第一次,技术成本开始和人力成本持平。”
5月29日,Glean CEO Arvind Jain在接受CNBC记者Deirdre Bosa采访时这样说道。

英伟达应用深度学习副总裁Bryan Catanzaro的观察也印证了这一点。
他在Axios的访谈中提到,对于他的团队来说,算力成本已经远远超过员工薪资。
类似的现象正在多家公司涌现:从做企业AI的Glean,到卖AI算力的英伟达,再到应用AI的Uber,都在重新审视这笔账。
在Arvind看来,历史上技术只是企业整体成本中很小的一块,但现在AI成本已经能追平工资单了。很多企业的年度AI预算,通常一两个月就烧光了。

过去一年,AI使用率是一个被追捧的指标:多用就是先进,烧Token就是拥抱未来。如今,许多企业开始反思那句朴素的话:这些烧掉的Token,到底换来了什么?
免费包月畅用的窗口期,正在此刻悄然关上。
接下来,摆在所有开发者面前的是这样一个问题:如何精打细算,让每一个Token发挥出最大价值。
未来真正的赢家,毫无疑问将是最先学会算Token账的那一个。
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
BuuPo官网在哪下载 最新官方下载安装地址
4D采矿者官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
免费影视剧APP推荐
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
萌神契约手游下载安装
好用的手环阅读app下载安装
人声接近真人!OpenAI一口气更新三款超强语音AI
短视频软件推荐
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc