来源:互联网 更新时间:2026-06-19 14:33
互联网公司对AI的热情来得快去得也快。上一次还在喊着全员Token-maxxing(把Token用量拉到极限),这才没过两个月,风向立刻就变了。

6月5日,腾讯内部宣布调整AI Token额度。核心变化是:全员统一额度改为按工作任务动态调配。通知说得很明确——总投入只增不减,对于能用AI带来显著提效和价值产出的同学,保障Token额度,不搞Token消耗量排名,不贩卖焦虑。
今年4月,Uber首席技术官透露,公司在4个月内就把2026年的AI预算花光了,而Uber 2025年的研发支出高达34亿美元。Meta员工在30天内消耗了60.2万亿个AI Token,成本超过1亿美元。
国内的情况异曲同工。5月20日,《崩坏》系列AI技术团队负责人郑银河透露,有员工为了实现项目,建了几十个Agent共同协作,结果一晚上烧掉了价值200万元的Token。
曾经,为了推进AI策略,不少公司希望员工最大程度调用AI工具,甚至搞Token用量排名,以此作为升职加薪的标准之一。但当看到天价Token账单后,互联网公司们清醒了。
腾讯这次的Token额度动态调整几乎没有提前通知,让一些员工措手不及。一位腾讯研发人员反映,自己根本不够用——通知发出当天,就发现自己只剩下10%的额度了,用Claude就是挺不住,烧得太快。
此次调整涵盖实习生、外包、正式员工在内所有人员。目前只有混元大模型对所有人免费。这样的调整倒也在情理之中。“用脚指头想也知道,怎么可能一直超量供应”,一位腾讯员工评价道。
一位腾讯大数据方向的外包员工说,以前他们用大模型是积分制,有10万积分,不会去关注具体Token量,但足够一个月使用。现在外包只能申请混元大模型,混元没有Token限制。
但混元在所有基础大模型中表现并不算最优秀。凭借“强推理+256K超长上下文”的能力,Hy3 preview曾连续登顶OpenRouter全球周榜,但整体能力,尤其处理复杂任务时——比如编程——Hy3和DeepSeek V4 Flash、Claude Sonnet 4.6等模型之间依然存在差距。
Token调整对不同事业部每个人的体感截然不同。有人只剩100美元,有人则有1万多元软妹币。
一位腾讯实习生表示,调整前自己只有100美元,调整后算起来有200美元了,市面上的先进模型都能用。但200美元确实不够——写代码的话,一天多的时候就能用掉50美元。一位腾讯AI预研游戏员工说,自己目前还有1.26万元,而同事有2.1万元。还有些人表示,Token直接砍半了。
一位腾讯后端研发提到,虽然Token额度有所缩减,但自己所在的组并不受影响,不够就可以向上级申请。
此前有消息说腾讯为每位员工发放了价值约22万元的Token套餐。按腾讯集团2026年Q1财报中提到的114848名员工计算,腾讯每年需要支付252亿元费用。作为对比,其2025年的研发费用为857.5亿元。
但现在,即便财大气粗的腾讯也要开始算细账了,而这只是整个行业的缩影。国内主流大厂基本都会要求员工优先使用内部大模型,内部大模型对员工免费,甚至一些公司还屏蔽了竞对模型。但最终内部模型产出的效果,仍然比不上海外模型。
一位字节跳动员工介绍,公司内部并不强制用AI。“Token额度对大厂是很大的负担,不同岗位不同部门额度存在差异。而且在字节,如果AI相关的技术研发岗位额度不够,还可以内部审批后去外面单独采购。”他补充道。
一位美团员工表示没听到内部有额度限制,自己的额度完全够用。一位百度员工则称,内部根据部门不同,额度限制也各有差异。
大厂还在犹豫是否削减Token额度,但更多中小型互联网公司已经撑不住了。
广州一家做跨境支付的企业直接决定削减员工的Token用量:从上不封顶降到人均每月500美元。而此前一个月,他们消耗掉了40万美元的Token。
“这完全不够用了”,上述公司的一位程序员直言。他所在的公司竟然出现了互相借Token的想象——一位后端开发者两天就消耗了370美元的Token,额度告急,开始向他借Token用。
以前大大小小的互联网公司践行Token-maxxing,生怕错过AI浪潮。于是员工们拼命研究如何消耗Token。尤其后端程序员,研发了各种封装包、skill,每个业务都有一堆提效工具,一些程序员一开就是好几个Agent,一小时就能烧掉上亿Token。新规发布前,有些程序员已经超出预算1000多美元。消耗1亿Token,如果使用目前编程主流选择的Claude Sonnet 4.6,至少需要花费2000元,最高甚至达到1万元。
事实也确实存在Token浪费的情况。一位新能源汽车员工说,公司每个月给他1000美元的Token额度,他根本用不完。为了消耗,只能用AI写原创小说,比如续写《红楼梦》。
上海某老牌互联网公司员工透露,公司以前是不限的,但现在开始统一管理Token额度,每个人都需要走钉钉审批申请Token,额度从几百元到1000元不等。
这种情况开始变得普遍。北京某腰部互联网公司员工称,原来大家可以不限额使用Claude Code,公司报销。现在开放了Anthropic的API接口,每个人每月1000元额度,并且要求优先使用更便宜的国产大模型。
但现实很骨感——便宜的大模型只能胜任一些简单的代码补全类任务,一旦遇到复杂任务,多轮反复交互下来,甚至不如自己手写代码。“我已经开始自己买额度了,1000元的额度可能根本用不了一周。”
一些公司则要求全栈AI化,导致Token用量大幅上升。广州某游戏公司员工说,之前Token全员免费,自己一个月用了将近3万Token,部门人人超标,之后就只能用DeepSeek的模型了。
上海一位程序员在社交平台分享,自己的部门只有4个人,但一个月就消耗掉了6万元Token。现在技术老大直接采买了DeepSeek的Token让技术切换。
Token-maxxing的另一个结果是,复盘时不少程序员发现看不懂自己写的代码,甚至找不到代码在哪里、为什么要这么写。公司的管理者们也发现,即便用了AI,整体运营效率并没有提升,甚至当大模型需要排队时,反而影响重要产品的节奏。
百度创始人李彦宏在今年AI开发者大会上首次提出日活智能体数(Daily Active Agents,简称DAA),大致对应移动互联网时代通用的日活用户数(DAU)。这个指标看起来比单纯看Token消耗量更能体现平台和生态的真实繁荣程度。
从不设上限的肆意挥霍,到如今精打细算的“配额制”和“国产替代”,互联网公司对AI的盲目崇拜正在经历一场必须的祛魅。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
帅到极致的网名女生霸气(精选100个)
帅气继父网名女生可爱英文(精选100个)
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
蒙古上单是什么梗
韦一敏是什么梗
韩漫小少爷网名大全女生(精选100个)
网络热词聊污是什么意思
如何在夸克浏览器中开启网页视频的倍速播放功能?
抖音最火沙雕男生网名(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
作家助手如何上传自制封面 作家助手如何设置小说的封面
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
因空难被判“过失杀人罪” 空客、法航均被顶格处罚22.5万欧元
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc