来源:互联网 更新时间:2026-06-01 21:02
最近,一则消息在硅谷刷屏:某家企业,一个月在Claude上的支出,高达5亿美元——折合软妹币约33亿元,相当于每天烧掉超1亿元。
现在,整个AI圈都在“寻找”这家公司。
几乎同一时间,Uber、微软等海外大厂,也开始陆续削减AI Token预算。

账单失控的原因之一,也与Claude有关:按Token计费、权限无上限。
于是,全世界公司开始疯狂烧Token。程序员用AI写代码,运营用AI生成内容,客服用AI回复消息,设计师用AI出图……大量企业一边裁员,一边“All in AI”。
但现在,第一次出现了“AI倒退潮”,狠狠地扇了“All in AI”论调的脸——难道,AI泡沫要来了吗?
来看几组真实烧钱数据:
有团队做Multi-Agent(多AI协同)实验,仅一晚上,Token费用直接突破百万元。
有的企业只是改一个简单网页,结果AI连续调用、反复推理,30分钟就耗光了一周额度。
有海外开发者公开账单:如果按OpenAI官方价格计算,单月AI费用轻松突破100万美元。
很多大厂高管,手中每天有超5000万的Token预算,但“不知道该怎么花”,只能硬烧。
这些数据让人倒吸一口凉气,但比烧钱更值得追问的是:钱到底烧到哪里去了?是真需求,还是纯浪费?是技术必然,还是管理失控?
对此,洋葱集团创始人李淙,扔出一颗冲击波:“很多员工,其实在拿公司的Token摸鱼,甚至接私活。白天在公司上班,同时接外面的私活:开发单、设计单、运营单。”

开发者生产力平台Entelligence.AI汇总2444家企业数据发现,每投入1美元AI Token费用,仅18美分产生触达用户的实际价值,44美分用于修复AI自身引入的Bug,27美分流向返工,11美分消耗于审查摩擦。数据来源:Entelligence.AI
上海财经大学特聘教授、DCCI互联网数据中心创始人胡延平则分析,“Token消耗”原因有三:优化不到位,简单任务也耗Token;算力成本上涨;不少场景需求刚性不足。
接下来,将从4个维度,为你解读这场正在发生的“AI倒退潮”。
一、谁在偷你的Token?——企业AI账单里的“内鬼”和“黑洞”。
二、KPI之殇:为什么越考核AI使用率,公司亏得越多?
三、省钱密码:什么样的公司,正在把Token当“外汇”来管?
四、值钱机会:依靠Token,已经有一批公司开始快速赚钱。
最近,Uber等海外大厂开始削减Token预算,一点都不让人意外。
因为现在很多企业的问题,根本不是AI没价值,而是大量Token被无效消耗了。甚至说得再直接一点,很多员工其实是在拿公司的Token摸鱼,比如接私活等。

亚马逊内部KiroRank排行榜催生"Tokenmaxxing"现象,员工为提升排名执行无意义AI任务推高算力消耗,后被亚马逊下线。图片来源:Business Insider
比如白天在公司上班,同时用公司配发的模型额度,去接外面的开发单、设计单、运营单,甚至帮别人跑跨境电商、做内容矩阵、写程序。闲鱼平台上卖技能的基本就是这些。
很多企业现在AI预算失控,问题根本不在AI本身,而是老板自己都没想清楚:AI到底应该用在哪。
现在很多海外大厂会把AI使用量做成KPI,比如要求员工一天必须消耗多少Token,或者把AI使用率纳入绩效考核。结果员工为了完成指标去烧Token,但没有方向感和明确的目标,所以大多都去干了和公司效益无关的事。
有个在大厂的朋友,老板给他发了5000万一天的Token预算,但他真实工作里根本不知道该怎么花。可KPI在那里,怎么办?只能硬烧。
现在企业里,真正烧Token最多的,其实就三个场景。
第一个是Research,包括内容调研、资料搜集、信息分析。
第二个是Coding,这个一定是大头,现在很多企业最烧Token的就是开发部门。
第三个是自动化内容生产,包括视频、图文、直播素材等批量生成及电商全链路的运营工作。
但最大的问题不是“有没有用AI”,而是考核方式不对。考核AI,不能用KPI,而要用ROI(投入产出比)。
只看Token能不能换回利润(或者效益)。
给你1亿Token预算,能换回ROI,继续给;换不回来,那就停。或者能明显提高效益,提升交付物的质量或者数量。比如原来一周写3篇稿,现在能写30篇,以前三个人做的事情,现在一个人做完。
本质上,Token在企业里的逻辑更像市场投放预算,ROI是正的继续投,不是正的别烧。

GitHub Copilot转向按量计费后,有用户晒出账单从50美元/月飙升至3000美元/月。
现在很多企业还有一个特别大的误区,就是贵的人用最贵的模型。这其实特别不划算。
比如一个月薪五六万的高级工程师,再给他配最贵的Codex模型,他的效率会提升,但不会提升得特别夸张,因为他本来就已经很强,天花板效应很明显。尤其还有本能性的排斥感。
但把最贵的模型,给一个只学了两三年编程的毕业生,效果反而可能特别惊人。因为AI会瞬间把他的能力拉高一大截,把他不会的那些技能短板,一次性全给补齐了。
企业真正正确的逻辑应该是:便宜的人加贵的模型,而不是贵的人加更贵的模型。
真正把这套逻辑跑通的,目前看到最多的其实是电商公司,尤其是二类电商,社群私域电商,以及做品牌的公司。这些行业,AI带来的ROI非常明显。
这就是最直接的案例。
以前做亚马逊分销时,光设计和创作团队就有五六十人,还不算视频团队。现在整个设计创作团队只剩4个人。以前一个优秀设计师一天做20-30张高质量图片已经很厉害了,现在一个毕业生培训三五天,一天能批量跑几百张图,质量还不差。
服装行业也一样。以前摄影、设计、运营、素材生产全是重人力岗位,中后台员工占比超50%。现在摄影师快没了,模特图不用拍了,一句话就能生成素材。很多公司只需以前10%的人,就能完成同样工作量。利润立刻释放,因为这些过去全是硬成本。

OpenClaw创始人Peter Steinberger公开的OpenAI账单:3人团队指挥100个Codex智能体,30天烧掉6030亿Token、760万次请求,账单130万美元(Fast Mode)。图片来源:Peter Steinberger
这件事带来的变化不只是“效率提升”,它会直接改变公司的组织结构。以前公司里一个运营、一个设计各干各的,但现在变成一个人加一堆AI Agent,“多岗合一”变成现实。
具体怎么实现这些目标?可以分为两步。
第一步:先搭一个企业自己的“AI 智能基座”。
简单理解,就是公司内部有一个统一的AI操作系统。把员工的能力和技能,经验进行蒸馏,完成 skills 化。
像商品上架、素材生成、标题优化、客服回复、物流处理这些高度标准化的流程,完全可以交给AI自动化处理。而选品、运营分析、内容判断这类需要经验判断的工作,则可以用高级推理模型,配合企业的知识库和数据,让AI辅助决策。大部分时候,人工基本不用插手。
第二步,把员工的经验“蒸馏”进AI。简单说,就是把人的能力、经验、工作方法,沉淀成AI可以调用的“技能包”。人走了,能力留下。国外大厂如Meta也在做。这称之为AI EVO AI——让AI不断自我复盘、迭代。
因为未来大量中层岗位、基础执行岗位,本质上都会被蒸馏掉。这个事情其实已经不是预测了,已经发生了。
尤其现在经济环境本来就不好,企业最大的成本本来就是人力成本。所以很多公司现在的逻辑很简单:能不招就不招,能优化就优化。尤其年收入10亿软妹币以内的中小企业,未来几年这会是一个持续状态。
因为AI最先解决的其实不是“收入暴增”,而是降本。
举个很现实的例子:一个员工到手工资可能1万元,但公司真实成本其实是1.3万到1.4万元。让企业多赚1.4万元净利润很难,但让AI替代10个人可能很容易,只是替代进程和替代率的周期问题。
以前10个人干的活,现在1个人加9个AI Agent就能做完。所以很多企业现在都会非常关注效率利润,也就是人均产值。未来很长一段时间,在 AI 普及化的公司,人均产值一定是很明显提升。
与此同时,很多新的机会正在出现,比如AI Agent 基座的研发和服务、企业级的业务 AI 化改造等,甚至包括很多人投身 的AI 中转站和算力出海业务。
因为OpenAI、Claude这些海外顶级模型,在中国一直存在支付、账号等各种门槛,于是就有人专门做海外账号代充、Token销售、中转服务。
抛开法规问题,只谈业务本身,这不仅是个短期套利机会,是个长期赛道。
本质上有点像早年的贸易公司,以前是把海外商品卖进中国,现在是把海外Token卖进中国。
这个行业现在增长非常快,因为中国企业对顶级模型的需求一定会持续增长,但海外模型又很难真正完全进入中国市场。
最近,Uber、微软等海外大厂,陆续开始削减AI Token预算。很多人第一反应会觉得:是不是AI不行了?恰恰相反。
从观察来看,现在真正的问题不是AI没价值,而是很多企业过去一年,对Token这件事,太乐观了。甚至很多公司,已经开始发现:AI,不一定比人便宜。
过去一年,明显感觉到:企业对AI的态度,已经开始进入第三阶段——算账。
第一阶段,是“不信”。很多老板觉得AI不靠谱,担心胡说八道。第二阶段,是“疯狂上头”。大量公司开始“All in AI”,恨不得每个人都用AI。有些企业甚至把AI调用量做成KPI,比如要求员工每天必须消耗多少Token。
但现在,行业开始进入第三阶段:开始算账了。因为越来越多公司突然发现:AI账单,开始失控。

据外媒报道,Token价格自2026年2月底以来已上涨约65%。高盛One-Delta部门指出,AI交易核心变量已从"技术是否可行"转向"成本是否可承受"。
前几天,有团队做Multi-Agent(多AI协同)实验,一晚上烧掉上百万元。还有海外开发者公开过账单:如果按OpenAI官方价格计算,一个月AI费用能达到上百万美元。
很多老板看到这个数字,第一反应都是:“AI怎么比员工还贵?”但现实就是这样。尤其是研发部门。
因为真正最烧Token的,不是写文案,而是编程。代码生成,本质上是指数级膨胀。你写一篇文章,可能就几千字。但程序不是。程序会不断生成上下文、调试、推理、调用Agent、重复运行。
很多时候,一个任务跑着跑着,Token就爆了。最可怕的是:你根本没法提前预测。很多企业现在的问题,其实不是“花不起”,而是:不知道自己到底会花多少。你可能只是改一个网页,结果半小时烧掉原本预计一周的预算。
这件事和过去云计算行业特别像。
当年所有人都说:“上云更便宜,不用自己买服务器。”结果很多企业后来发现:长期用云,比自己建私有云还贵。
于是很多公司又重新开始搞私有化部署。现在AI行业,也开始出现类似情况。越来越多企业开始意识到:AI不是简单“接个API”那么轻松。它已经变成一套新的财务系统。
甚至最近一直在研究一个方向:未来可能会出现一个新岗位,叫FinAI。类似过去云计算行业里的FinOps(云成本管理)。
什么意思?简单说:未来企业最重要的能力之一,不再只是“会不会用AI”,而是:会不会控制AI成本。比如:哪些部门该用顶级模型?哪些工作70分模型就够?哪些任务值得烧Claude?哪些地方根本没必要?
因为现在很多公司最大的问题是:“贵的模型,到处乱用。”
比如很多员工,本来只需要普通模型,结果上来就用Claude、Codex、GPT顶级套餐。老板一开始还觉得:“没事,提高效率。”
但几个月后财务一看账单,人麻了。很多企业现在,其实根本没有建立AI使用规范。谁能用什么模型?什么场景能烧高端Token?哪些任务必须限制调用?很多公司完全没有规则。
于是AI调用,慢慢开始失控。一个基本判断是:现在AI预算失控,70%是管理问题,30%才是技术问题。
管理问题包括:KPI乱设、员工滥用、模型乱选、没有ROI考核、没有成本约束。尤其是研发部门最明显。因为程序员本来就是AI重度用户,而编程又是最烧Token的场景之一。
过去几年,很多公司都在裁程序员、拥抱AI。但现在一些企业突然发现:如果全员都按Claude Code这种模式跑,成本可能比原来还高。因为AI不是一次性费用,它是“无限续杯”,而且还是越喝越贵那种。
现在还有个更麻烦的问题:AI成本,本身存在巨大不确定性。今天的大模型,其实还做不到“我限定预算,你来完成任务。”
它只能告诉你:Token用完了,没法精准控制:这个任务,到底应该花多少钱。你很难提前知道。有时候一个Agent跑偏了,能直接给你烧穿预算。
这也是为什么,很多海外公司现在开始控制Token。不是他们不用AI了,而是开始意识到:AI也需要财务纪律。
当然,从长期看,Token价格一定会下降,因为算力本质上还是基础设施。现在贵,主要是因为GPU紧缺、存储涨价、算力供给不足。但这个阶段不会永远持续。
尤其是中国企业这两年正在疯狂扩产。行业很多预测认为:到2028年前后,算力和存储产能会明显释放。但这里面有个特别有意思的现象。即便Token价格下降,企业总支出,也未必下降。因为:你会用得更多。
这其实是典型的“杰文斯悖论”。成本越低,消耗越大。以前企业可能一天只调用几次AI,未来很可能:所有系统、所有员工、所有流程都挂Agent。
到时候,Token总消耗量反而会继续暴涨。所以未来真正重要的,不是Token降不降价,而是:企业有没有能力建立自己的AI财务模型。比如要解决最重要的问题,才烧最贵模型。
最后再说一个最近特别火的生意:Token中转站。现在国内很多企业,对Claude、GPT这些海外顶级模型需求特别强。但问题是:账号、支付、实名认证,全是门槛。于是大量“中转服务”开始出现。本质上,它赚的是“使用门槛”的差价。
国外100美元的调用额度,国内翻倍卖,依然很多人买。因为很多用户自己根本用不了。这个市场现在确实能赚钱。但风险也非常大。因为它同时面临:海外平台封号、数据风险、合规问题、国内监管问题。很多中转站今天还能做,明天可能就没了。
真正长期有价值的,不是简单“卖号”,而是像OpenRouter这种平台。它不是单纯中转,它是在做:模型调度、优化、加速。可以理解成:它更像AI时代的“云操作系统”。
整个AI行业,现在其实已经开始进入一个关键转折点:过去一年,大家比的是“谁烧Token更猛。”接下来,大家比的会是:“谁更会经营Token。”而这,可能才是真正商业化的开始。
Token不够烧,是过渡阶段一定会遇到的问题。
无论是coding,还是现在很流行的FDE(前线工程师),背后AI在企业里面承担的其实是两件事:第一,它承担组织协同;第二,它承担单点生产力。今天很多问题,都是围绕这两件事展开的。
先说单点生产力。比如编程,现在AI在Repo level,也就是软件仓库这个层级,其实已经相当有效了。如果你把任务严格限制在这个范围内,它的ROI很多时候已经是成立的,甚至是非常划算的。
你会发现,AI在简单和中等复杂度任务上,其实已经证明了自己比传统方式更高效。但复杂度一旦继续增加,Token消耗就会呈指数级上涨。
第二个更大的问题,是协同。
很多人会像甲方一样:“我要A、我要B、我要C、最好再来个D。”但他自己并没有真正想清楚需求。由于AI的协同能力还远远不够成熟,这种模糊表达会导致大量返工和废动作。而这些返工,本质上都在烧Token。
第三个问题,是模型本身的技术路径。
比如超长上下文。现在很多模型开始做到百万字上下文,从技术演进角度,它当然是进步;但从推理成本角度,是巨大的浪费。现在整个模型层,包括Harness这一层,都需要大量优化。
另外一个原因,是很多人以前误判了推理成本下降速度。
2023 年的时候,很多人都觉得,模型推理成本会迅速下降。但现实并不是这样。因为技术在进步,新的模型会不断填满旧模型节省出来的成本空间。
最终,AI一定会走到“投入小于产出”那个阶段,但现在还在过渡期。这个方向本身,已经非常接近真正的商业化了。
今天用AI的企业大概分成两类。
第一类,是传统企业。它们现在做AI,本质上还是“降本增效”逻辑。也就是说,它原来已经有成熟的业务流程和组织结构,现在只是把 AI 插进去,优化原有流程。
比如一家咨询公司,以前需要很多数据分析师帮客户整理数据,现在AI可以更快、更便宜地完成这部分工作,这就是降本。
再比如,以前一个咨询团队最多服务50个客户,如果客户翻倍,团队规模也必须翻倍。但用了AI之后,客户规模扩大时,团队未必要同比扩大,这就是增效。
这是今天大部分企业的AI使用方式。
但另一类企业,更愿意称它们为AI Native超级组织。
它们从一开始,就不是把AI嵌入旧流程,而是按照AI的特性,重新设计整个组织结构和业务逻辑。
举个例子。传统自媒体,原来的逻辑是:持续收集信息、分析热点、结合媒体自己的审美和观点,输出内容。
但AI Native的组织不一定这样。它可能不是“定期收集数据”,而是通过Agent持续获取更新。可能每 3 分钟、5 分钟就自动完成一次行业扫描。于是行业洞察会从“断续洞察”,变成“连续洞察”。
这个变化其实是非常大的。它会催生新的产品形态、新的用户体验,甚至新的商业模式。
再比如组织结构。
传统企业是典型的人财物、产供销结构,有HR、财务、运营等中心化部门。但AI Native组织可能完全不是这样。
比如HR职能,很可能会被拆散到每个业务团队里。用人团队自己生成JD、自己筛选候选人、自己完成初步面试,AI负责大量中间流程。于是你会发现,它已经不是过去那个中心化组织结构了。
所以AI Native企业,本质上不是降本增效,而是在创造新物种。
很多企业现在都在拼命转型AI Native,但员工在实际工作中会发现,模型产品仍然有大量问题,于是就会出现很多有意或无意的浪费。虽然没有精确统计,但这种浪费比例至少占30%以上。
现在做多智能体,其实也更愿意服务AI Native 的组织。
因为并不想用新技术,去硬适配那些已经非常臃肿、虽然有效但极其陈旧的组织结构。更愿意和那些愿意重构业务逻辑的企业一起做事情。
有一家内容平台,是最早排斥AI内容的平台之一。但今天它会面临一个非常尴尬的问题:如果拥抱 AI,大量AI创作者会冲进来,原有生态会被冲击;但如果不拥抱 AI,它又会被未来淘汰。
经常说,这有点像“他杀”和“自杀”的区别。不拥抱 AI,可能是自杀;拥抱 AI,则可能被 AI 创作者“他杀”。
但综合来看,“他杀”反而可能更好。因为至少你还在主动改变自己,还有机会跨越这轮技术周期。
企业会不会因为Token太贵,而放弃AI?
答案是:会。
因为Token成本,会非常直接地反映在企业当月财务报表上。如果这个月没效果,下个月它一定会踩刹车。
这反而是一个好信号。因为正是这种压力,才会逼着整个行业进入真正的精细化管理阶段。
比如:使用更小参数规模的模型,达到接近大模型的效果;让更多推理发生在端侧,而不是全部放在云端;不再什么任务都调用最强模型;在Harness层做更复杂、更细粒度的任务分配。
这些事情,都会被今天的成本压力倒逼出来。
2023 年的时候,还有很多投资人告诉我:“所有业务都应该用最好的模型。”
当时就说,这不科学。
对于模型公司,未来真正重要的方向,并不是无限追求更大的模型,而是小型化,小模型是否也能实现能力涌现。
而企业这边,已经越来越务实了。很多企业今天才开始感受到Token贵,并不是因为今天才开始浪费,而是以前这些成本一直被模型公司补贴掉了。
今天企业真正应该思考的,不是“我现在要不要追 AI 热点”,而是:我该如何为未来的 AI Native 组织做准备。
至于机会,会出现两个特别重要的方向。
第一个,是群体智能。
群体智能最大的魅力,就是它不依赖单个智能体有多聪明,而是依赖多个智能体协同后产生的智慧涌现。
它天然具有两个优势:鲁棒性更强,ROI 更高。
其实人类社会本身,就是一种群体智能结构。
现在OpenAI也开始投资类似方向,国内像Kimi、MiniMax,也已经开始做相关产品。去年谈群体智能时,很多人还觉得很抽象,但现在正在慢慢形成行业共识。
第二个方向,是端侧。
互联网时代、移动互联网时代,云服务是最优解,因为边际成本递减。
但AI时代不一样,推理成本是无法忽略的。因此未来一定会出现“云+端”的重新平衡,而且会越来越向端侧迁移。
本文不构成任何投资建议。
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
BuuPo官网在哪下载 最新官方下载安装地址
4D采矿者官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
免费影视剧APP推荐
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
萌神契约手游下载安装
好用的手环阅读app下载安装
人声接近真人!OpenAI一口气更新三款超强语音AI
短视频软件推荐
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc