2026年6月第二周,一位腾讯员工像往常一样打开内部管理看板,准备调用AI处理代码审核。然后他愣住了——看板上那个熟悉的数字变了。
在此之前,他每月拥有2000美元(约1.35万元人民币)的AI Token额度,足够他随心所欲地调用GPT-5.5、Claude Opus 4.8等顶级模型,搭建Agent工作流,甚至让AI帮写周报。但现在,这个数字变成了3000元人民币,缩水近80%。
更让他措手不及的是:额度发下来三天就用完了。"Agent、Subagent跑起来,额度烧得特别快。"
他曾是腾讯"每人年均22万元Token资源"福利的受益者。从Cursor到Claude,从CodeBuddy到混元,公司曾像发糖果一样给每位员工分配AI算力。而现在,糖果罐被上了锁。
这不是腾讯一家的故事。2026年6月,一场席卷全球科技巨头的"AI算力降本运动"正在悄然发生。
要理解这件事的震撼程度,得先看看此前腾讯的AI福利有多"壕"。
2026年3月,脉脉上流传着一条消息:腾讯为员工配置了"每人年均22万元Token资源",每月包含700美元Cursor额度、700美元Claude额度、1000美元CodeBuddy额度等。这条消息很快得到多位腾讯员工证实。
在当时,腾讯是国内给Token最大方的公司之一。公司甚至鼓励员工多使用AI——有员工回忆,最开始他还被提示过"Token消耗过低"。
但到了6月,画风突变。
据经济观察报报道,腾讯调整了员工AI Token额度机制:从"全员统一配发"改为"按部门、岗位和任务场景动态分配"。调整后,不同部门差异巨大:
一位接近腾讯的人士透露,这次调整的逻辑很明确:将Token从"免费资源"转变为部门预算资产,倒逼全公司统一核算AI效率账单。
腾讯官方给出的说法是:总投入只增不减,但不搞Token消耗量排名,不贩卖焦虑,看产出不看消耗。
翻译成大白话就是:AI你们接着用,但要算ROI了。
如果只有腾讯一家这么做,可能只是个案。但事实上,2026年6月前后,一个跨国的"AI降本联盟"正在形成。
微软:Experiences + Devices团队宣布6月底关停大部分第三方Claude Code授权席位,全面切换至自家GitHub Copilot CLI。核心诉求:缓解AI成本压力。
亚马逊:悄悄下线了内部的"Token用量排行榜"——那个榜单原本是为了鼓励员工多用AI的。亚马逊还告诫员工"不要为了用AI而用AI"。
Meta:同样撤下了内部的"tokenmaxxing排行榜"。
Uber:首席运营官Andrew Macdonald在播客中坦言,公司4个月烧光了全年的AI预算。更致命的是——他们很难把员工个人生产力的提升,与公司整体业务影响联系起来。
Salesforce:每年给Anthropic开出的账单约为3亿美元。CEO Marc Benioff的期待是开发一个"智能路由器":能判断哪些查询值得用顶级模型,哪些用便宜的小模型就够了。
据极客公园报道,一家AI初创企业50人团队,一个月Token成本就高达20万美元(人均4000美元)。另一家公司的客户单月AI支出高达5亿美元。
甚至OpenAI CEO Sam Altman都在6月初的一场直播中承认:"AI支出已经成为企业的大问题,而在年初时,人们还对自己的花费非常满意。"
这波"限流"并非突发奇想。它背后是三个结构性因素的集中爆发。
以前员工用AI是问一句答一句,消耗可控。但2026年AI Agent全面普及后,情况变了——员工搭建几十个Agent协同工作,Agent之间反复对话、迭代、试错,Token消耗量呈指数级增长。
米哈游内部就曾出现过一个极端案例:有员工搭建了几十个Agent共同协作,一晚上烧掉了约200万元人民币的Token。
据清华团队的研究,当前AI Agent调用中,30%至60%的Token被浪费——历史文档累积、重复运算、无用上下文被反复加载,这些"沉默的消耗"正在吞噬企业利润。
2025年以前,AI行业的核心叙事是"训练大模型",拼的是谁算力多、谁卡多。但进入2026年,重心从训练转向推理——当AI真正被大规模部署到业务中,推理成本开始显现。
国信证券测算显示,全球AI推理算力需求正以每年数倍的速度增长。而推理成本不像训练成本那样一次性的——它是持续的、滚动的、每天都在发生的支出。
腾讯2025年在混元大模型及元宝等AI产品上投入了180亿元,管理层宣称2026年将"翻倍以上"。在这种压力下,任何一个CFO都会问同一句话:钱花在哪?值不值?
更让企业头疼的是,很大一部分Token消耗跟业务无关。
员工用公司Token写副业方案、做行情分析、帮朋友写论文,甚至有实习生用它来完成毕业设计。这些"无效Token"本质上等于企业的研发预算打了水漂。
正如一篇热门分析所指出的:员工用AI写周报快了三倍,但公司营收没有变化。工程师用AI生成代码速度翻倍,但代码被抛弃或重写的比例上升了800%。
2025年,硅谷流行一个词叫"tokenmaxxing"——字面意思是"最大化Token使用量"。企业设置使用配额、排行榜、甚至绩效考核,催着员工把AI用起来。用得越多,证明你越"数字化转型"。
结果呢?员工开始用公司的企业级AI模型查天气、写生日祝福、问今天吃什么。
投资人Shruti Gandhi用了一个精准的比喻:"tokenmaxxing企业,就像靠开着所有的灯来衡量生产力的公司——花更多钱,不等于产出更多。"
现在,行业正在经历一场集体反思。标志性的事件包括:
麦肯锡《2025年AI现状》报告调查了全球近2000家企业,结果发现:仅有39%的受访者表示AI对息税前利润有明确贡献。 超过六成的企业,AI支出不但没有拉动营收,反倒在持续蚕食公司现金流。
另一个值得关注的数据来自JPMorgan的预警:全球AI软件支出预计2026年将达到2.59万亿美元,同比增长47%。但与此同时,94%的工程负责人表示关键ROI指标仍然缺失。
额度收缩后,一个尴尬的局面出现了。
一位腾讯员工算了一笔账:额度发下来三天就用完了。他找上级主管申请提额,得到的答复是"部门预算有限",提额被拒绝。
他的选择有三个:
在字节跳动,情况也不轻松。虽然字节员工可以不限量调用内部模型,但公司内的模型接口天天排长队。即便模型在公司付费范围内,仍有员工用个人账号自费订阅,避免排队耽误进度。
这让很多人意识到一个残酷的现实:AI的"成瘾性"已经形成,但企业不再无条件买单了。
很多人会把腾讯的Token限流解读为"AI泡沫破裂"或"AI寒冬前兆"。我不同意这种判断。
恰恰相反,我认为这是AI行业从"发烧期"进入"稳定期"的必经之路——一次AI的"成年礼"。
回顾互联网发展的历史,每一轮技术革命都经历过类似的阶段:先是"不计成本烧钱铺量",然后是"算账、精细化运营",最后是"真正产生商业价值"。
云计算时代,AWS最初也是被内部当作"闲置算力变现"的副产品,后来才成为利润中心。移动互联网时代,"烧钱补贴"换用户的做法也一度被视为"不可持续",但最终跑出了美团、滴滴这样的巨头。
AI行业目前正处在这个转折点上。腾讯的Token限流,本质上不是"缩减AI投入",而是**"优化AI投入的结构"**——把资源从无效的"AI摸鱼"中抽回,投到真正能产生业务价值的地方。
有几个趋势值得关注:
第一,AI成本管理将成为一个新赛道。 Harness和CloudZero的AI成本管理工具只是开始。未来,每家企业都会需要一个"AI CFO"来算这笔账。
第二,"按结果付费"将取代"按Token付费"。 HubSpot的转型是一个信号。当AI从"工具"变成"劳动力",计费方式必然从"按消耗"转向"按产出"。
第三,员工AI素养将从"会用"升级为"会用得值"。 就像当年Excel的普及一样,未来职场竞争力的关键不是"会不会用AI",而是"能不能用AI产生ROI"。
最后,我想引用一位腾讯员工的话作为结尾。当被问到会不会自费订阅AI工具时,他说:
"虽然不想自费打工,但总比没额度用要好。"
这句看似无奈的话,其实透露了一个真相:AI的价值已经被验证了。真正的挑战是,如何让AI从"成本中心"变成"利润中心"。
2026年6月,腾讯的一纸调额通知,正式宣告了AI"烧钱时代"的终结。而那个更理性、更可持续的AI时代,才刚刚开始。