您的位置：首页 > > 教程攻略 > ai资讯 >一天烧1亿：第一次“Token大撤退”，来了

一天烧1亿：第一次“Token大撤退”，来了

来源:互联网 更新时间:2026-06-01 21:02

最近，一则消息在硅谷刷屏：某家企业，一个月在Claude上的支出，高达5亿美元——折合软妹币约33亿元，相当于每天烧掉超1亿元。

现在，整个AI圈都在“寻找”这家公司。

几乎同一时间，Uber、微软等海外大厂，也开始陆续削减AI Token预算。

账单失控的原因之一，也与Claude有关：按Token计费、权限无上限。

过去两年，整个AI行业几乎只有一个共识：AI，一定比人便宜。

于是，全世界公司开始疯狂烧Token。程序员用AI写代码，运营用AI生成内容，客服用AI回复消息，设计师用AI出图……大量企业一边裁员，一边“All in AI”。

但现在，第一次出现了“AI倒退潮”，狠狠地扇了“All in AI”论调的脸——难道，AI泡沫要来了吗？

来看几组真实烧钱数据：

1、一夜烧掉上百万元。

有团队做Multi-Agent（多AI协同）实验，仅一晚上，Token费用直接突破百万元。

2、半小时烧穿一周预算。

有的企业只是改一个简单网页，结果AI连续调用、反复推理，30分钟就耗光了一周额度。

3、月费上百万美元。

有海外开发者公开账单：如果按OpenAI官方价格计算，单月AI费用轻松突破100万美元。

4、每天5000万Token，不知道怎么花。

很多大厂高管，手中每天有超5000万的Token预算，但“不知道该怎么花”，只能硬烧。

这些数据让人倒吸一口凉气，但比烧钱更值得追问的是：钱到底烧到哪里去了？是真需求，还是纯浪费？是技术必然，还是管理失控？

对此，洋葱集团创始人李淙，扔出一颗冲击波：“很多员工，其实在拿公司的Token摸鱼，甚至接私活。白天在公司上班，同时接外面的私活：开发单、设计单、运营单。”

开发者生产力平台Entelligence.AI汇总2444家企业数据发现，每投入1美元AI Token费用，仅18美分产生触达用户的实际价值，44美分用于修复AI自身引入的Bug，27美分流向返工，11美分消耗于审查摩擦。数据来源：Entelligence.AI

上海财经大学特聘教授、DCCI互联网数据中心创始人胡延平则分析，“Token消耗”原因有三：优化不到位，简单任务也耗Token；算力成本上涨；不少场景需求刚性不足。

接下来，将从4个维度，为你解读这场正在发生的“AI倒退潮”。

一、谁在偷你的Token？——企业AI账单里的“内鬼”和“黑洞”。

二、KPI之殇：为什么越考核AI使用率，公司亏得越多？

三、省钱密码：什么样的公司，正在把Token当“外汇”来管？

四、值钱机会：依靠Token，已经有一批公司开始快速赚钱。

谁在“偷”你的Toekn？摸鱼、接私活、管理

李淙，洋葱集团创始人

美股“跨境品牌电商第一股”，主营跨境零售、B 端供应链及海外品牌孵化

最近，Uber等海外大厂开始削减Token预算，一点都不让人意外。

因为现在很多企业的问题，根本不是AI没价值，而是大量Token被无效消耗了。甚至说得再直接一点，很多员工其实是在拿公司的Token摸鱼，比如接私活等。

亚马逊内部KiroRank排行榜催生"Tokenmaxxing"现象，员工为提升排名执行无意义AI任务推高算力消耗，后被亚马逊下线。图片来源：Business Insider

比如白天在公司上班，同时用公司配发的模型额度，去接外面的开发单、设计单、运营单，甚至帮别人跑跨境电商、做内容矩阵、写程序。闲鱼平台上卖技能的基本就是这些。

很多企业现在AI预算失控，问题根本不在AI本身，而是老板自己都没想清楚：AI到底应该用在哪。

现在很多海外大厂会把AI使用量做成KPI，比如要求员工一天必须消耗多少Token，或者把AI使用率纳入绩效考核。结果员工为了完成指标去烧Token，但没有方向感和明确的目标，所以大多都去干了和公司效益无关的事。

有个在大厂的朋友，老板给他发了5000万一天的Token预算，但他真实工作里根本不知道该怎么花。可KPI在那里，怎么办？只能硬烧。

现在企业里，真正烧Token最多的，其实就三个场景。

第一个是Research，包括内容调研、资料搜集、信息分析。

第二个是Coding，这个一定是大头，现在很多企业最烧Token的就是开发部门。

第三个是自动化内容生产，包括视频、图文、直播素材等批量生成及电商全链路的运营工作。

但最大的问题不是“有没有用AI”，而是考核方式不对。考核AI，不能用KPI，而要用ROI（投入产出比）。

只看Token能不能换回利润（或者效益）。

给你1亿Token预算，能换回ROI，继续给；换不回来，那就停。或者能明显提高效益，提升交付物的质量或者数量。比如原来一周写3篇稿，现在能写30篇，以前三个人做的事情，现在一个人做完。

本质上，Token在企业里的逻辑更像市场投放预算，ROI是正的继续投，不是正的别烧。

GitHub Copilot转向按量计费后，有用户晒出账单从50美元/月飙升至3000美元/月。

现在很多企业还有一个特别大的误区，就是贵的人用最贵的模型。这其实特别不划算。

比如一个月薪五六万的高级工程师，再给他配最贵的Codex模型，他的效率会提升，但不会提升得特别夸张，因为他本来就已经很强，天花板效应很明显。尤其还有本能性的排斥感。

但把最贵的模型，给一个只学了两三年编程的毕业生，效果反而可能特别惊人。因为AI会瞬间把他的能力拉高一大截，把他不会的那些技能短板，一次性全给补齐了。

企业真正正确的逻辑应该是：便宜的人加贵的模型，而不是贵的人加更贵的模型。

真正把这套逻辑跑通的，目前看到最多的其实是电商公司，尤其是二类电商，社群私域电商，以及做品牌的公司。这些行业，AI带来的ROI非常明显。

这就是最直接的案例。

以前做亚马逊分销时，光设计和创作团队就有五六十人，还不算视频团队。现在整个设计创作团队只剩4个人。以前一个优秀设计师一天做20-30张高质量图片已经很厉害了，现在一个毕业生培训三五天，一天能批量跑几百张图，质量还不差。

服装行业也一样。以前摄影、设计、运营、素材生产全是重人力岗位，中后台员工占比超50%。现在摄影师快没了，模特图不用拍了，一句话就能生成素材。很多公司只需以前10%的人，就能完成同样工作量。利润立刻释放，因为这些过去全是硬成本。

OpenClaw创始人Peter Steinberger公开的OpenAI账单：3人团队指挥100个Codex智能体，30天烧掉6030亿Token、760万次请求，账单130万美元（Fast Mode）。图片来源：Peter Steinberger

这件事带来的变化不只是“效率提升”，它会直接改变公司的组织结构。以前公司里一个运营、一个设计各干各的，但现在变成一个人加一堆AI Agent，“多岗合一”变成现实。

具体怎么实现这些目标？可以分为两步。

第一步：先搭一个企业自己的“AI 智能基座”。

简单理解，就是公司内部有一个统一的AI操作系统。把员工的能力和技能，经验进行蒸馏，完成 skills 化。

像商品上架、素材生成、标题优化、客服回复、物流处理这些高度标准化的流程，完全可以交给AI自动化处理。而选品、运营分析、内容判断这类需要经验判断的工作，则可以用高级推理模型，配合企业的知识库和数据，让AI辅助决策。大部分时候，人工基本不用插手。

第二步，把员工的经验“蒸馏”进AI。简单说，就是把人的能力、经验、工作方法，沉淀成AI可以调用的“技能包”。人走了，能力留下。国外大厂如Meta也在做。这称之为AI EVO AI——让AI不断自我复盘、迭代。

因为未来大量中层岗位、基础执行岗位，本质上都会被蒸馏掉。这个事情其实已经不是预测了，已经发生了。

尤其现在经济环境本来就不好，企业最大的成本本来就是人力成本。所以很多公司现在的逻辑很简单：能不招就不招，能优化就优化。尤其年收入10亿软妹币以内的中小企业，未来几年这会是一个持续状态。

因为AI最先解决的其实不是“收入暴增”，而是降本。

举个很现实的例子：一个员工到手工资可能1万元，但公司真实成本其实是1.3万到1.4万元。让企业多赚1.4万元净利润很难，但让AI替代10个人可能很容易，只是替代进程和替代率的周期问题。

以前10个人干的活，现在1个人加9个AI Agent就能做完。所以很多企业现在都会非常关注效率利润，也就是人均产值。未来很长一段时间，在 AI 普及化的公司，人均产值一定是很明显提升。

与此同时，很多新的机会正在出现，比如AI Agent 基座的研发和服务、企业级的业务 AI 化改造等，甚至包括很多人投身的AI 中转站和算力出海业务。

因为OpenAI、Claude这些海外顶级模型，在中国一直存在支付、账号等各种门槛，于是就有人专门做海外账号代充、Token销售、中转服务。

抛开法规问题，只谈业务本身，这不仅是个短期套利机会，是个长期赛道。

本质上有点像早年的贸易公司，以前是把海外商品卖进中国，现在是把海外Token卖进中国。

这个行业现在增长非常快，因为中国企业对顶级模型的需求一定会持续增长，但海外模型又很难真正完全进入中国市场。

一夜烧掉数百万：AI的预算黑洞时刻，来了

深行智能CEO崔伟，长期从事AI咨询及算法、系统研究，清华大学电机工程系博士，浙江大学经济学院硕士生导师

最近，Uber、微软等海外大厂，陆续开始削减AI Token预算。很多人第一反应会觉得：是不是AI不行了？恰恰相反。

从观察来看，现在真正的问题不是AI没价值，而是很多企业过去一年，对Token这件事，太乐观了。甚至很多公司，已经开始发现：AI，不一定比人便宜。

过去一年，明显感觉到：企业对AI的态度，已经开始进入第三阶段——算账。

第一阶段，是“不信”。很多老板觉得AI不靠谱，担心胡说八道。第二阶段，是“疯狂上头”。大量公司开始“All in AI”，恨不得每个人都用AI。有些企业甚至把AI调用量做成KPI，比如要求员工每天必须消耗多少Token。

但现在，行业开始进入第三阶段：开始算账了。因为越来越多公司突然发现：AI账单，开始失控。

据外媒报道，Token价格自2026年2月底以来已上涨约65%。高盛One-Delta部门指出，AI交易核心变量已从"技术是否可行"转向"成本是否可承受"。

前几天，有团队做Multi-Agent（多AI协同）实验，一晚上烧掉上百万元。还有海外开发者公开过账单：如果按OpenAI官方价格计算，一个月AI费用能达到上百万美元。

很多老板看到这个数字，第一反应都是：“AI怎么比员工还贵？”但现实就是这样。尤其是研发部门。

因为真正最烧Token的，不是写文案，而是编程。代码生成，本质上是指数级膨胀。你写一篇文章，可能就几千字。但程序不是。程序会不断生成上下文、调试、推理、调用Agent、重复运行。

很多时候，一个任务跑着跑着，Token就爆了。最可怕的是：你根本没法提前预测。很多企业现在的问题，其实不是“花不起”，而是：不知道自己到底会花多少。你可能只是改一个网页，结果半小时烧掉原本预计一周的预算。

这件事和过去云计算行业特别像。

当年所有人都说：“上云更便宜，不用自己买服务器。”结果很多企业后来发现：长期用云，比自己建私有云还贵。

于是很多公司又重新开始搞私有化部署。现在AI行业，也开始出现类似情况。越来越多企业开始意识到：AI不是简单“接个API”那么轻松。它已经变成一套新的财务系统。

甚至最近一直在研究一个方向：未来可能会出现一个新岗位，叫FinAI。类似过去云计算行业里的FinOps（云成本管理）。

什么意思？简单说：未来企业最重要的能力之一，不再只是“会不会用AI”，而是：会不会控制AI成本。比如：哪些部门该用顶级模型？哪些工作70分模型就够？哪些任务值得烧Claude？哪些地方根本没必要？

因为现在很多公司最大的问题是：“贵的模型，到处乱用。”

比如很多员工，本来只需要普通模型，结果上来就用Claude、Codex、GPT顶级套餐。老板一开始还觉得：“没事，提高效率。”

但几个月后财务一看账单，人麻了。很多企业现在，其实根本没有建立AI使用规范。谁能用什么模型？什么场景能烧高端Token？哪些任务必须限制调用？很多公司完全没有规则。

于是AI调用，慢慢开始失控。一个基本判断是：现在AI预算失控，70%是管理问题，30%才是技术问题。

管理问题包括：KPI乱设、员工滥用、模型乱选、没有ROI考核、没有成本约束。尤其是研发部门最明显。因为程序员本来就是AI重度用户，而编程又是最烧Token的场景之一。

过去几年，很多公司都在裁程序员、拥抱AI。但现在一些企业突然发现：如果全员都按Claude Code这种模式跑，成本可能比原来还高。因为AI不是一次性费用，它是“无限续杯”，而且还是越喝越贵那种。

现在还有个更麻烦的问题：AI成本，本身存在巨大不确定性。今天的大模型，其实还做不到“我限定预算，你来完成任务。”

它只能告诉你：Token用完了，没法精准控制：这个任务，到底应该花多少钱。你很难提前知道。有时候一个Agent跑偏了，能直接给你烧穿预算。

这也是为什么，很多海外公司现在开始控制Token。不是他们不用AI了，而是开始意识到：AI也需要财务纪律。

当然，从长期看，Token价格一定会下降，因为算力本质上还是基础设施。现在贵，主要是因为GPU紧缺、存储涨价、算力供给不足。但这个阶段不会永远持续。

尤其是中国企业这两年正在疯狂扩产。行业很多预测认为：到2028年前后，算力和存储产能会明显释放。但这里面有个特别有意思的现象。即便Token价格下降，企业总支出，也未必下降。因为：你会用得更多。

这其实是典型的“杰文斯悖论”。成本越低，消耗越大。以前企业可能一天只调用几次AI，未来很可能：所有系统、所有员工、所有流程都挂Agent。

到时候，Token总消耗量反而会继续暴涨。所以未来真正重要的，不是Token降不降价，而是：企业有没有能力建立自己的AI财务模型。比如要解决最重要的问题，才烧最贵模型。

最后再说一个最近特别火的生意：Token中转站。现在国内很多企业，对Claude、GPT这些海外顶级模型需求特别强。但问题是：账号、支付、实名认证，全是门槛。于是大量“中转服务”开始出现。本质上，它赚的是“使用门槛”的差价。

国外100美元的调用额度，国内翻倍卖，依然很多人买。因为很多用户自己根本用不了。这个市场现在确实能赚钱。但风险也非常大。因为它同时面临：海外平台封号、数据风险、合规问题、国内监管问题。很多中转站今天还能做，明天可能就没了。

真正长期有价值的，不是简单“卖号”，而是像OpenRouter这种平台。它不是单纯中转，它是在做：模型调度、优化、加速。可以理解成：它更像AI时代的“云操作系统”。

整个AI行业，现在其实已经开始进入一个关键转折点：过去一年，大家比的是“谁烧Token更猛。”接下来，大家比的会是：“谁更会经营Token。”而这，可能才是真正商业化的开始。

Token涨价，反而救了AI

李笛，明日新程创始人

明日新程主攻群体多智能体，连续获得两轮融资

Token不够烧，是过渡阶段一定会遇到的问题。

无论是coding，还是现在很流行的FDE（前线工程师），背后AI在企业里面承担的其实是两件事：第一，它承担组织协同；第二，它承担单点生产力。今天很多问题，都是围绕这两件事展开的。

先说单点生产力。比如编程，现在AI在Repo level，也就是软件仓库这个层级，其实已经相当有效了。如果你把任务严格限制在这个范围内，它的ROI很多时候已经是成立的，甚至是非常划算的。

你会发现，AI在简单和中等复杂度任务上，其实已经证明了自己比传统方式更高效。但复杂度一旦继续增加，Token消耗就会呈指数级上涨。

第二个更大的问题，是协同。

很多人会像甲方一样：“我要A、我要B、我要C、最好再来个D。”但他自己并没有真正想清楚需求。由于AI的协同能力还远远不够成熟，这种模糊表达会导致大量返工和废动作。而这些返工，本质上都在烧Token。

第三个问题，是模型本身的技术路径。

比如超长上下文。现在很多模型开始做到百万字上下文，从技术演进角度，它当然是进步；但从推理成本角度，是巨大的浪费。现在整个模型层，包括Harness这一层，都需要大量优化。

另外一个原因，是很多人以前误判了推理成本下降速度。

2023 年的时候，很多人都觉得，模型推理成本会迅速下降。但现实并不是这样。因为技术在进步，新的模型会不断填满旧模型节省出来的成本空间。

最终，AI一定会走到“投入小于产出”那个阶段，但现在还在过渡期。这个方向本身，已经非常接近真正的商业化了。

今天用AI的企业大概分成两类。

第一类，是传统企业。它们现在做AI，本质上还是“降本增效”逻辑。也就是说，它原来已经有成熟的业务流程和组织结构，现在只是把 AI 插进去，优化原有流程。

比如一家咨询公司，以前需要很多数据分析师帮客户整理数据，现在AI可以更快、更便宜地完成这部分工作，这就是降本。

再比如，以前一个咨询团队最多服务50个客户，如果客户翻倍，团队规模也必须翻倍。但用了AI之后，客户规模扩大时，团队未必要同比扩大，这就是增效。

这是今天大部分企业的AI使用方式。

但另一类企业，更愿意称它们为AI Native超级组织。

它们从一开始，就不是把AI嵌入旧流程，而是按照AI的特性，重新设计整个组织结构和业务逻辑。

举个例子。传统自媒体，原来的逻辑是：持续收集信息、分析热点、结合媒体自己的审美和观点，输出内容。

但AI Native的组织不一定这样。它可能不是“定期收集数据”，而是通过Agent持续获取更新。可能每 3 分钟、5 分钟就自动完成一次行业扫描。于是行业洞察会从“断续洞察”，变成“连续洞察”。

这个变化其实是非常大的。它会催生新的产品形态、新的用户体验，甚至新的商业模式。

再比如组织结构。

传统企业是典型的人财物、产供销结构，有HR、财务、运营等中心化部门。但AI Native组织可能完全不是这样。

比如HR职能，很可能会被拆散到每个业务团队里。用人团队自己生成JD、自己筛选候选人、自己完成初步面试，AI负责大量中间流程。于是你会发现，它已经不是过去那个中心化组织结构了。

所以AI Native企业，本质上不是降本增效，而是在创造新物种。

很多企业现在都在拼命转型AI Native，但员工在实际工作中会发现，模型产品仍然有大量问题，于是就会出现很多有意或无意的浪费。虽然没有精确统计，但这种浪费比例至少占30%以上。

现在做多智能体，其实也更愿意服务AI Native 的组织。

因为并不想用新技术，去硬适配那些已经非常臃肿、虽然有效但极其陈旧的组织结构。更愿意和那些愿意重构业务逻辑的企业一起做事情。

有一家内容平台，是最早排斥AI内容的平台之一。但今天它会面临一个非常尴尬的问题：如果拥抱 AI，大量AI创作者会冲进来，原有生态会被冲击；但如果不拥抱 AI，它又会被未来淘汰。

经常说，这有点像“他杀”和“自杀”的区别。不拥抱 AI，可能是自杀；拥抱 AI，则可能被 AI 创作者“他杀”。

但综合来看，“他杀”反而可能更好。因为至少你还在主动改变自己，还有机会跨越这轮技术周期。

企业会不会因为Token太贵，而放弃AI？

答案是：会。

因为Token成本，会非常直接地反映在企业当月财务报表上。如果这个月没效果，下个月它一定会踩刹车。

这反而是一个好信号。因为正是这种压力，才会逼着整个行业进入真正的精细化管理阶段。

比如：使用更小参数规模的模型，达到接近大模型的效果；让更多推理发生在端侧，而不是全部放在云端；不再什么任务都调用最强模型；在Harness层做更复杂、更细粒度的任务分配。

这些事情，都会被今天的成本压力倒逼出来。

2023 年的时候，还有很多投资人告诉我：“所有业务都应该用最好的模型。”

当时就说，这不科学。

对于模型公司，未来真正重要的方向，并不是无限追求更大的模型，而是小型化，小模型是否也能实现能力涌现。

而企业这边，已经越来越务实了。很多企业今天才开始感受到Token贵，并不是因为今天才开始浪费，而是以前这些成本一直被模型公司补贴掉了。

今天企业真正应该思考的，不是“我现在要不要追 AI 热点”，而是：我该如何为未来的 AI Native 组织做准备。

至于机会，会出现两个特别重要的方向。

第一个，是群体智能。

群体智能最大的魅力，就是它不依赖单个智能体有多聪明，而是依赖多个智能体协同后产生的智慧涌现。

它天然具有两个优势：鲁棒性更强，ROI 更高。

其实人类社会本身，就是一种群体智能结构。

现在OpenAI也开始投资类似方向，国内像Kimi、MiniMax，也已经开始做相关产品。去年谈群体智能时，很多人还觉得很抽象，但现在正在慢慢形成行业共识。

第二个方向，是端侧。

互联网时代、移动互联网时代，云服务是最优解，因为边际成本递减。

但AI时代不一样，推理成本是无法忽略的。因此未来一定会出现“云+端”的重新平衡，而且会越来越向端侧迁移。

本文不构成任何投资建议。

一天烧1亿：第一次“Token大撤退”，来了

过去两年，整个AI行业几乎只有一个共识：AI，一定比人便宜。

1、一夜烧掉上百万元。

2、半小时烧穿一周预算。

3、月费上百万美元。

4、每天5000万Token，不知道怎么花。

谁在“偷”你的Toekn？摸鱼、接私活、管理

谁在“偷”你的Toekn？摸鱼、接私活、管理

李淙，洋葱集团创始人

美股“跨境品牌电商第一股”，主营跨境零售、B 端供应链及海外品牌孵化

一夜烧掉数百万：AI的预算黑洞时刻，来了

一夜烧掉数百万：AI的预算黑洞时刻，来了

深行智能CEO崔伟，长期从事AI咨询及算法、系统研究，清华大学电机工程系博士，浙江大学经济学院硕士生导师

Token涨价，反而救了AI

Token涨价，反而救了AI

李笛，明日新程创始人

明日新程主攻群体多智能体，连续获得两轮融资

热门资讯

热门手游

相关攻略

热门专题