全速加载中...

从"每人年均22万"到"人均砍80%"：腾讯Token限流背后，一场AI算力的"觉醒时刻"

2000美元变3000元，AI的"免费午餐"结束了

2026年6月第二周，一位腾讯员工像往常一样打开内部管理看板，准备调用AI处理代码审核。然后他愣住了——看板上那个熟悉的数字变了。

在此之前，他每月拥有2000美元（约1.35万元人民币）的AI Token额度，足够他随心所欲地调用GPT-5.5、Claude Opus 4.8等顶级模型，搭建Agent工作流，甚至让AI帮写周报。但现在，这个数字变成了3000元人民币，缩水近80%。

更让他措手不及的是：额度发下来三天就用完了。"Agent、Subagent跑起来，额度烧得特别快。"

他曾是腾讯"每人年均22万元Token资源"福利的受益者。从Cursor到Claude，从CodeBuddy到混元，公司曾像发糖果一样给每位员工分配AI算力。而现在，糖果罐被上了锁。

这不是腾讯一家的故事。2026年6月，一场席卷全球科技巨头的"AI算力降本运动"正在悄然发生。

发生了什么：腾讯的"Token大锅饭"终结

要理解这件事的震撼程度，得先看看此前腾讯的AI福利有多"壕"。

2026年3月，脉脉上流传着一条消息：腾讯为员工配置了"每人年均22万元Token资源"，每月包含700美元Cursor额度、700美元Claude额度、1000美元CodeBuddy额度等。这条消息很快得到多位腾讯员工证实。

在当时，腾讯是国内给Token最大方的公司之一。公司甚至鼓励员工多使用AI——有员工回忆，最开始他还被提示过"Token消耗过低"。

但到了6月，画风突变。

据经济观察报报道，腾讯调整了员工AI Token额度机制：从"全员统一配发"改为"按部门、岗位和任务场景动态分配"。调整后，不同部门差异巨大：

混元大模型团队（AI核心部门）：月额度约7000元，基本不受限
优图实验室（计算机视觉）：月额度约5250元
技术线核心员工：月额度约1万元（甚至比调整前多了40%）
腾讯娱乐外包员工：月额度仅1000元
部分边缘部门：额度直接砍半

一位接近腾讯的人士透露，这次调整的逻辑很明确：将Token从"免费资源"转变为部门预算资产，倒逼全公司统一核算AI效率账单。

腾讯官方给出的说法是：总投入只增不减，但不搞Token消耗量排名，不贩卖焦虑，看产出不看消耗。

翻译成大白话就是：AI你们接着用，但要算ROI了。

不止腾讯：全球大厂集体"踩刹车"

如果只有腾讯一家这么做，可能只是个案。但事实上，2026年6月前后，一个跨国的"AI降本联盟"正在形成。

微软：Experiences + Devices团队宣布6月底关停大部分第三方Claude Code授权席位，全面切换至自家GitHub Copilot CLI。核心诉求：缓解AI成本压力。

亚马逊：悄悄下线了内部的"Token用量排行榜"——那个榜单原本是为了鼓励员工多用AI的。亚马逊还告诫员工"不要为了用AI而用AI"。

Meta：同样撤下了内部的"tokenmaxxing排行榜"。

Uber：首席运营官Andrew Macdonald在播客中坦言，公司4个月烧光了全年的AI预算。更致命的是——他们很难把员工个人生产力的提升，与公司整体业务影响联系起来。

Salesforce：每年给Anthropic开出的账单约为3亿美元。CEO Marc Benioff的期待是开发一个"智能路由器"：能判断哪些查询值得用顶级模型，哪些用便宜的小模型就够了。

据极客公园报道，一家AI初创企业50人团队，一个月Token成本就高达20万美元（人均4000美元）。另一家公司的客户单月AI支出高达5亿美元。

甚至OpenAI CEO Sam Altman都在6月初的一场直播中承认："AI支出已经成为企业的大问题，而在年初时，人们还对自己的花费非常满意。"

为什么是现在？Token消耗失控的"三重暴击"

这波"限流"并非突发奇想。它背后是三个结构性因素的集中爆发。

第一重：Agent爆发，Token消耗指数级增长

以前员工用AI是问一句答一句，消耗可控。但2026年AI Agent全面普及后，情况变了——员工搭建几十个Agent协同工作，Agent之间反复对话、迭代、试错，Token消耗量呈指数级增长。

米哈游内部就曾出现过一个极端案例：有员工搭建了几十个Agent共同协作，一晚上烧掉了约200万元人民币的Token。

据清华团队的研究，当前AI Agent调用中，30%至60%的Token被浪费——历史文档累积、重复运算、无用上下文被反复加载，这些"沉默的消耗"正在吞噬企业利润。

第二重：算力成本转移，从"算力军备"到"账单压顶"

2025年以前，AI行业的核心叙事是"训练大模型"，拼的是谁算力多、谁卡多。但进入2026年，重心从训练转向推理——当AI真正被大规模部署到业务中，推理成本开始显现。

国信证券测算显示，全球AI推理算力需求正以每年数倍的速度增长。而推理成本不像训练成本那样一次性的——它是持续的、滚动的、每天都在发生的支出。

腾讯2025年在混元大模型及元宝等AI产品上投入了180亿元，管理层宣称2026年将"翻倍以上"。在这种压力下，任何一个CFO都会问同一句话：钱花在哪？值不值？

第三重：Token被挪用的"灰色地带"

更让企业头疼的是，很大一部分Token消耗跟业务无关。

员工用公司Token写副业方案、做行情分析、帮朋友写论文，甚至有实习生用它来完成毕业设计。这些"无效Token"本质上等于企业的研发预算打了水漂。

正如一篇热门分析所指出的：员工用AI写周报快了三倍，但公司营收没有变化。工程师用AI生成代码速度翻倍，但代码被抛弃或重写的比例上升了800%。

行业反思：从"tokenmaxxing"到"Token ROI"

2025年，硅谷流行一个词叫"tokenmaxxing"——字面意思是"最大化Token使用量"。企业设置使用配额、排行榜、甚至绩效考核，催着员工把AI用起来。用得越多，证明你越"数字化转型"。

结果呢？员工开始用公司的企业级AI模型查天气、写生日祝福、问今天吃什么。

投资人Shruti Gandhi用了一个精准的比喻："tokenmaxxing企业，就像靠开着所有的灯来衡量生产力的公司——花更多钱，不等于产出更多。"

现在，行业正在经历一场集体反思。标志性的事件包括：

5月28日，Harness和CloudZero几乎在同一天发布AI成本管理工具——一个主打实时监控AI支出和ROI，另一个推出"AI财务控制平面"
HubSpot从4月起不再按Token收费，改按"解决的对话数"和"生成的线索数"计费——把卖方的利益和买方的实际产出对齐
国内，阿里巴巴成立了Alibaba Token Hub事业群，以"创造Token、输送Token、应用Token"为核心目标

麦肯锡《2025年AI现状》报告调查了全球近2000家企业，结果发现：仅有39%的受访者表示AI对息税前利润有明确贡献。 超过六成的企业，AI支出不但没有拉动营收，反倒在持续蚕食公司现金流。

另一个值得关注的数据来自JPMorgan的预警：全球AI软件支出预计2026年将达到2.59万亿美元，同比增长47%。但与此同时，94%的工程负责人表示关键ROI指标仍然缺失。

员工的两难：回归"古法编程"还是自费打工？

额度收缩后，一个尴尬的局面出现了。

一位腾讯员工算了一笔账：额度发下来三天就用完了。他找上级主管申请提额，得到的答复是"部门预算有限"，提额被拒绝。

他的选择有三个：

用回腾讯自研的混元大模型（不限量但体验差）。他试了之后评价："幻觉很严重，也不是专用于编码的模型，不如手搓。"
自掏腰包。他每月花200美元订阅Codex Pro 20x。"虽然不想自费打工，但是总比没额度用要好。"
回归"古法编程"。但他说自己已经回不去了："工作量已经涨上去了，没有因为Token减了就降下来。"

在字节跳动，情况也不轻松。虽然字节员工可以不限量调用内部模型，但公司内的模型接口天天排长队。即便模型在公司付费范围内，仍有员工用个人账号自费订阅，避免排队耽误进度。

这让很多人意识到一个残酷的现实：AI的"成瘾性"已经形成，但企业不再无条件买单了。

我的观点：这不是AI寒冬，而是AI的"成年礼"

很多人会把腾讯的Token限流解读为"AI泡沫破裂"或"AI寒冬前兆"。我不同意这种判断。

恰恰相反，我认为这是AI行业从"发烧期"进入"稳定期"的必经之路——一次AI的"成年礼"。

回顾互联网发展的历史，每一轮技术革命都经历过类似的阶段：先是"不计成本烧钱铺量"，然后是"算账、精细化运营"，最后是"真正产生商业价值"。

云计算时代，AWS最初也是被内部当作"闲置算力变现"的副产品，后来才成为利润中心。移动互联网时代，"烧钱补贴"换用户的做法也一度被视为"不可持续"，但最终跑出了美团、滴滴这样的巨头。

AI行业目前正处在这个转折点上。腾讯的Token限流，本质上不是"缩减AI投入"，而是**"优化AI投入的结构"**——把资源从无效的"AI摸鱼"中抽回，投到真正能产生业务价值的地方。

有几个趋势值得关注：

第一，AI成本管理将成为一个新赛道。 Harness和CloudZero的AI成本管理工具只是开始。未来，每家企业都会需要一个"AI CFO"来算这笔账。

第二，"按结果付费"将取代"按Token付费"。 HubSpot的转型是一个信号。当AI从"工具"变成"劳动力"，计费方式必然从"按消耗"转向"按产出"。

第三，员工AI素养将从"会用"升级为"会用得值"。 就像当年Excel的普及一样，未来职场竞争力的关键不是"会不会用AI"，而是"能不能用AI产生ROI"。

最后，我想引用一位腾讯员工的话作为结尾。当被问到会不会自费订阅AI工具时，他说：

"虽然不想自费打工，但总比没额度用要好。"

这句看似无奈的话，其实透露了一个真相：AI的价值已经被验证了。真正的挑战是，如何让AI从"成本中心"变成"利润中心"。

2026年6月，腾讯的一纸调额通知，正式宣告了AI"烧钱时代"的终结。而那个更理性、更可持续的AI时代，才刚刚开始。

参考链接

评论列表

等待第一条评论中…