73.7 万亿个 token 换一个教训:Meta 亲手制造了 tokenmaxxing,然后紧急叫停

2026.06.21 07:20
Meta 员工内部 AI token 消耗 30 天达 73.7 万亿个,2026 年内部 AI 成本预计逼近数十亿美元,迫使公司紧急建立 AI Gateway 推行 token 配额制。从鼓励 Token Legend 到围剿 tokenmaxxing 不过六个月,而 Uber、Microsoft、Priceline 等公司正在经历同样的 AI 账单冲击。当 AI 公司自己都管不住 AI 账单时,整个产业需要重新审视 token 经济的真实成本。

一、从 Token Legend 到 token 限购

如果告诉你,一家公司因为员工太爱用 AI 不得不紧急叫停——你会觉得这是个幸福的烦恼。但这家公司叫 Meta,它 2026 年仅内部 AI 使用的 token 账单就可能达到数十亿美元——足以买下一家独角兽。

2026 年 6 月,Meta 向约 6,000 名员工发出内部备忘录,措辞严厉:AI 使用量出现指数级增长,再不管,全年成本将烧掉数十亿美元。CTO Andrew Bosworth 罕见地甩出一句狠话:

"All motion is not progress and token usage alone is not a measure of impact of any kind."

这句话,距离 Meta 把 AI 驱动的 impact 列入员工绩效核心考核指标,不过几个月时间。

2025 年末,Meta 内部出现了一个叫 Claudeonomics 的排行榜,追踪超过 85,000 名员工的 AI token 使用量,只显示前 250 名。排名靠前的员工被授予 Token Legend、Session Immortal 等称号。更关键的是,高层连续释放信号:AI 使用量将成为绩效考评核心期望。Bosworth 在 2026 年 2 月公开表示,顶尖工程师花掉相当于自己薪资水平的 token、产出提升五到十倍,是不用动脑子的决定——没有上限。NVIDIA 的 Jensen Huang 也在 All-In 播客上助阵:年薪 50 万美元的工程师如果一年消费不到 25 万美元的 token,他会震惊。

结果?73.7 万亿个 token。这是 Meta 员工在约 30 天内消耗的总量。按企业 API 定价折算,仅这 30 天的成本就已突破 10 亿美元。有单个员工在同期消耗了 2,810 亿个 token——相当于一个普通工程师半年的薪资,全部花在了对话上。

2026 年 6 月,Meta 的态度 180 度逆转。应对策略三层:AI Gateway 实时追踪所有团队花费并设置警报;Token 预算 从 2027 年起正式实施配额制;工具替代 引导员工从第三方 AI 转向自研编程助手 MetaCode。Bosworth 的另一份备忘录中写道:"Nobody should be using AI tools just for the sake of using them." 曾经表彰 Token Legend 的公司,现在开始追查 tokenmaxxing 了。

二、整个行业都在烧

Meta 不是一个人。2026 年 5 月,Uber 被爆出 2026 年全年的 AI 编码预算在四个月内全部烧光。Uber 的应对方式:每款 AI 工具每人每月上限 1,500 美元。COO Andrew Macdonald 坦承——AI 使用量与可衡量的产出之间还没有建立起联系。Microsoft 收回了开发者的大部分 Claude Code 许可。Priceline 的一次 Cursor 续约价格涨了 4 到 5 倍。某公司因忘记设置使用限制,收到了一张 5 亿美元的 Claude 账单。

组织工程平台 Faros AI 的 CEO Vitaly Gordon 分享了一个案例:一位 CTO 的工程师上月花了 4 万美元的 token 费——他不知道是该阻止他还是让所有人向他学习。这正是行业的核心困境:你没法区分一个花了大钱的员工是在创造 10 倍价值,还是在空转 10 倍消耗。Jellyfish 的研究提供了更残酷的量化:token 消耗最高的工程师产出约为同行两倍,但花掉了 10 倍的 token。AI agent 普及后,工程师人均消耗量在 9 个月飙升了 18.6 倍。KPMG 调查显示,只有 26% 的公司对 AI 成本有全面可见性。D.A. Davidson 的 Gil Luria 直言:"本季度会有大量 CFO 看到 Anthropic 的账单后当场疯掉。"

三、AI 的成本悖论

这里有一个违反直觉的现象:Anthropic、OpenAI、Google 在过去一年大幅降低了每百万 token 的价格,但企业的 AI 总支出反而以更陡峭的斜率上升。这是 杰文斯悖论——当资源单价下降时,总消费量反而增加,因为更便宜的价格刺激更广泛应用。蒸汽机效率提升没有减少煤炭消耗,LED 没减少用电量,AI token 正在经历同样的命运。

这个悖论被三重力量放大:第一,AI agent 普及大幅抬高消耗基数——一轮自主思考就能吃掉成千上万 token;第二,心理账户错位——token 被抽象为数字而非钞票时,花起来毫无感觉,FinOps Foundation 的 J.R. Storment 说追踪云成本是每月数亿行问题,追踪 token 是每月数万亿行;第三,囚徒困境式竞争——OpenAI 企业业务负责人 Alexander Embiricos 描述客户问题已从"它能做什么"变成"我们花太多了,你们能提供什么可见性?" Goldman Sachs 预测,到 2030 年企业 token 消费将增长 24 倍。每家公司最终都会有自己的 AI Gateway moment。

四、Meta 的双向押注

Meta 的故事还有一层独特的讽刺。一方面它在 AI 下着人类商业史上最大的赌注——2026 年 Capex 高达 1,150 亿至 1,350 亿美元,承诺到 2028 年数据中心累计投入 6,000 亿美元。另一方面,它连员工用第三方 AI 工具写代码的账单都快付不起了。这构成了 AI 产业罕见的"双向烧钱"模式:既是基础设施的超级买家,又是 AI 服务的超级用户。

转向 MetaCode 是为了省钱,更是为了获得更大的杠杆——让每一块钱的内部 token 花费从费用变成对自身 AI 能力的投资。但这个逻辑有一个致命问题:MetaCode 有 Claude 好用吗?如果不如,强制员工切换就是把生产力给成本让路。而那个最核心的问题仍悬而未决:AI token 的投入,到底带来了多少可衡量的商业产出?

结语

Linux 基金会已宣布成立 Tokenomics Foundation——对标 FinOps 的 AI 成本治理标准组织。这本身就是一个信号:token 治理已从个别公司内部需求升格为产业级系统需求。但真正的赢家不是做治理工具的,而是能用 AI 创造可衡量业务价值的公司。避免 tokenmaxxing 陷阱的唯一方法,不是限制 AI 使用,而是把投入与产出直接挂钩。

AI 产业的第一个谎言是 AI 会让每个人都更高效。第二个谎言是用更多 AI 就能更快到达目标。Meta 用 73.7 万亿个 token 证明了:当一家公司连自己内部 AI 成本都管不住的时候,它卖给你的那把铲子,可能连它自己都铲不动了。

作品声明:内容由AI生成