全速加载中...
首页
文章
随笔
留言
友链
关于
工具
更多
湘ICP备2021007748号-4
湘公网安备案湘公网安备43052202000137号
又拍云

从"每人年均22万"到"人均砍80%":腾讯Token限流背后,一场AI算力的"觉醒时刻"

2000美元变3000元,AI的"免费午餐"结束了

2026年6月第二周,一位腾讯员工像往常一样打开内部管理看板,准备调用AI处理代码审核。然后他愣住了——看板上那个熟悉的数字变了。

在此之前,他每月拥有2000美元(约1.35万元人民币)的AI Token额度,足够他随心所欲地调用GPT-5.5、Claude Opus 4.8等顶级模型,搭建Agent工作流,甚至让AI帮写周报。但现在,这个数字变成了3000元人民币,缩水近80%。

更让他措手不及的是:额度发下来三天就用完了。"Agent、Subagent跑起来,额度烧得特别快。"

他曾是腾讯"每人年均22万元Token资源"福利的受益者。从Cursor到Claude,从CodeBuddy到混元,公司曾像发糖果一样给每位员工分配AI算力。而现在,糖果罐被上了锁。

这不是腾讯一家的故事。2026年6月,一场席卷全球科技巨头的"AI算力降本运动"正在悄然发生。


发生了什么:腾讯的"Token大锅饭"终结

要理解这件事的震撼程度,得先看看此前腾讯的AI福利有多"壕"。

2026年3月,脉脉上流传着一条消息:腾讯为员工配置了"每人年均22万元Token资源",每月包含700美元Cursor额度、700美元Claude额度、1000美元CodeBuddy额度等。这条消息很快得到多位腾讯员工证实。

在当时,腾讯是国内给Token最大方的公司之一。公司甚至鼓励员工多使用AI——有员工回忆,最开始他还被提示过"Token消耗过低"。

但到了6月,画风突变。

据经济观察报报道,腾讯调整了员工AI Token额度机制:从"全员统一配发"改为"按部门、岗位和任务场景动态分配"。调整后,不同部门差异巨大:

  • 混元大模型团队(AI核心部门):月额度约7000元,基本不受限
  • 优图实验室(计算机视觉):月额度约5250元
  • 技术线核心员工:月额度约1万元(甚至比调整前多了40%)
  • 腾讯娱乐外包员工:月额度仅1000元
  • 部分边缘部门:额度直接砍半

一位接近腾讯的人士透露,这次调整的逻辑很明确:将Token从"免费资源"转变为部门预算资产,倒逼全公司统一核算AI效率账单。

腾讯官方给出的说法是:总投入只增不减,但不搞Token消耗量排名,不贩卖焦虑,看产出不看消耗。

翻译成大白话就是:AI你们接着用,但要算ROI了。


不止腾讯:全球大厂集体"踩刹车"

如果只有腾讯一家这么做,可能只是个案。但事实上,2026年6月前后,一个跨国的"AI降本联盟"正在形成。

微软:Experiences + Devices团队宣布6月底关停大部分第三方Claude Code授权席位,全面切换至自家GitHub Copilot CLI。核心诉求:缓解AI成本压力。

亚马逊:悄悄下线了内部的"Token用量排行榜"——那个榜单原本是为了鼓励员工多用AI的。亚马逊还告诫员工"不要为了用AI而用AI"。

Meta:同样撤下了内部的"tokenmaxxing排行榜"。

Uber:首席运营官Andrew Macdonald在播客中坦言,公司4个月烧光了全年的AI预算。更致命的是——他们很难把员工个人生产力的提升,与公司整体业务影响联系起来。

Salesforce:每年给Anthropic开出的账单约为3亿美元。CEO Marc Benioff的期待是开发一个"智能路由器":能判断哪些查询值得用顶级模型,哪些用便宜的小模型就够了。

据极客公园报道,一家AI初创企业50人团队,一个月Token成本就高达20万美元(人均4000美元)。另一家公司的客户单月AI支出高达5亿美元。

甚至OpenAI CEO Sam Altman都在6月初的一场直播中承认:"AI支出已经成为企业的大问题,而在年初时,人们还对自己的花费非常满意。"


为什么是现在?Token消耗失控的"三重暴击"

这波"限流"并非突发奇想。它背后是三个结构性因素的集中爆发。

第一重:Agent爆发,Token消耗指数级增长

以前员工用AI是问一句答一句,消耗可控。但2026年AI Agent全面普及后,情况变了——员工搭建几十个Agent协同工作,Agent之间反复对话、迭代、试错,Token消耗量呈指数级增长。

米哈游内部就曾出现过一个极端案例:有员工搭建了几十个Agent共同协作,一晚上烧掉了约200万元人民币的Token。

据清华团队的研究,当前AI Agent调用中,30%至60%的Token被浪费——历史文档累积、重复运算、无用上下文被反复加载,这些"沉默的消耗"正在吞噬企业利润。

第二重:算力成本转移,从"算力军备"到"账单压顶"

2025年以前,AI行业的核心叙事是"训练大模型",拼的是谁算力多、谁卡多。但进入2026年,重心从训练转向推理——当AI真正被大规模部署到业务中,推理成本开始显现。

国信证券测算显示,全球AI推理算力需求正以每年数倍的速度增长。而推理成本不像训练成本那样一次性的——它是持续的、滚动的、每天都在发生的支出。

腾讯2025年在混元大模型及元宝等AI产品上投入了180亿元,管理层宣称2026年将"翻倍以上"。在这种压力下,任何一个CFO都会问同一句话:钱花在哪?值不值?

第三重:Token被挪用的"灰色地带"

更让企业头疼的是,很大一部分Token消耗跟业务无关。

员工用公司Token写副业方案、做行情分析、帮朋友写论文,甚至有实习生用它来完成毕业设计。这些"无效Token"本质上等于企业的研发预算打了水漂。

正如一篇热门分析所指出的:员工用AI写周报快了三倍,但公司营收没有变化。工程师用AI生成代码速度翻倍,但代码被抛弃或重写的比例上升了800%。


行业反思:从"tokenmaxxing"到"Token ROI"

2025年,硅谷流行一个词叫"tokenmaxxing"——字面意思是"最大化Token使用量"。企业设置使用配额、排行榜、甚至绩效考核,催着员工把AI用起来。用得越多,证明你越"数字化转型"。

结果呢?员工开始用公司的企业级AI模型查天气、写生日祝福、问今天吃什么。

投资人Shruti Gandhi用了一个精准的比喻:"tokenmaxxing企业,就像靠开着所有的灯来衡量生产力的公司——花更多钱,不等于产出更多。"

现在,行业正在经历一场集体反思。标志性的事件包括:

  • 5月28日,Harness和CloudZero几乎在同一天发布AI成本管理工具——一个主打实时监控AI支出和ROI,另一个推出"AI财务控制平面"
  • HubSpot从4月起不再按Token收费,改按"解决的对话数"和"生成的线索数"计费——把卖方的利益和买方的实际产出对齐
  • 国内,阿里巴巴成立了Alibaba Token Hub事业群,以"创造Token、输送Token、应用Token"为核心目标

麦肯锡《2025年AI现状》报告调查了全球近2000家企业,结果发现:仅有39%的受访者表示AI对息税前利润有明确贡献。 超过六成的企业,AI支出不但没有拉动营收,反倒在持续蚕食公司现金流。

另一个值得关注的数据来自JPMorgan的预警:全球AI软件支出预计2026年将达到2.59万亿美元,同比增长47%。但与此同时,94%的工程负责人表示关键ROI指标仍然缺失。


员工的两难:回归"古法编程"还是自费打工?

额度收缩后,一个尴尬的局面出现了。

一位腾讯员工算了一笔账:额度发下来三天就用完了。他找上级主管申请提额,得到的答复是"部门预算有限",提额被拒绝。

他的选择有三个:

  1. 用回腾讯自研的混元大模型(不限量但体验差)。他试了之后评价:"幻觉很严重,也不是专用于编码的模型,不如手搓。"
  2. 自掏腰包。他每月花200美元订阅Codex Pro 20x。"虽然不想自费打工,但是总比没额度用要好。"
  3. 回归"古法编程"。但他说自己已经回不去了:"工作量已经涨上去了,没有因为Token减了就降下来。"

在字节跳动,情况也不轻松。虽然字节员工可以不限量调用内部模型,但公司内的模型接口天天排长队。即便模型在公司付费范围内,仍有员工用个人账号自费订阅,避免排队耽误进度。

这让很多人意识到一个残酷的现实:AI的"成瘾性"已经形成,但企业不再无条件买单了。


我的观点:这不是AI寒冬,而是AI的"成年礼"

很多人会把腾讯的Token限流解读为"AI泡沫破裂"或"AI寒冬前兆"。我不同意这种判断。

恰恰相反,我认为这是AI行业从"发烧期"进入"稳定期"的必经之路——一次AI的"成年礼"。

回顾互联网发展的历史,每一轮技术革命都经历过类似的阶段:先是"不计成本烧钱铺量",然后是"算账、精细化运营",最后是"真正产生商业价值"。

云计算时代,AWS最初也是被内部当作"闲置算力变现"的副产品,后来才成为利润中心。移动互联网时代,"烧钱补贴"换用户的做法也一度被视为"不可持续",但最终跑出了美团、滴滴这样的巨头。

AI行业目前正处在这个转折点上。腾讯的Token限流,本质上不是"缩减AI投入",而是**"优化AI投入的结构"**——把资源从无效的"AI摸鱼"中抽回,投到真正能产生业务价值的地方。

有几个趋势值得关注:

第一,AI成本管理将成为一个新赛道。 Harness和CloudZero的AI成本管理工具只是开始。未来,每家企业都会需要一个"AI CFO"来算这笔账。

第二,"按结果付费"将取代"按Token付费"。 HubSpot的转型是一个信号。当AI从"工具"变成"劳动力",计费方式必然从"按消耗"转向"按产出"。

第三,员工AI素养将从"会用"升级为"会用得值"。 就像当年Excel的普及一样,未来职场竞争力的关键不是"会不会用AI",而是"能不能用AI产生ROI"。

最后,我想引用一位腾讯员工的话作为结尾。当被问到会不会自费订阅AI工具时,他说:

"虽然不想自费打工,但总比没额度用要好。"

这句看似无奈的话,其实透露了一个真相:AI的价值已经被验证了。真正的挑战是,如何让AI从"成本中心"变成"利润中心"。

2026年6月,腾讯的一纸调额通知,正式宣告了AI"烧钱时代"的终结。而那个更理性、更可持续的AI时代,才刚刚开始。


参考链接

  1. 大厂Token不再"管够":腾讯开始限额,字节可部分报销 - 经济观察报/新浪财经
  2. 从两千美元到三千元,腾讯调整AI补贴 - 网易
  3. 疯狂烧了数十亿美元Token之后,硅谷大厂开始限制员工Token用量了 - 极客公园
  4. 叫停Token排名、设定支出上限……巨头开始审视AI账单 - 腾讯新闻
  5. 腾讯下调员工Token额度:大厂会用AI还不够,还要会算账 - CSDN
  6. 两千美元降至三千元人民币,腾讯下调员工Token额度 - 腾讯新闻
  7. 全面拥抱AI后 大厂终于给Token"算账"了 - 东方财富
【版权声明】
✨ 本文来自 [张苹果博客] ✨
🌿 你可以:自由转发到社交网络或个人网站。
🌿 你需要:标注作者并附上本文链接(就像给文章留个回家地址~)。

上一篇

评论一下

评论列表

 
等待第一条评论中…
用户头像
小苹果
发布日期:2026年06月18日