文 | 象先志
2026年4月15日,黄仁勋在Dwarkesh Patel 的播客里经历了一场他很久没经历过的尖锐追问。一个多小时的对话,他反复用来定义英伟达的那句话是:“必须有东西把电子变成token。”他把自家公司形容成“全球每瓦生产token 最多的架构”——不是每瓦算力最多,是每瓦 token 最多。
这是一家卖GPU的公司,在重新定义自己。
为什么要重新定义?因为他比任何人都更早地看见一件事——AI 时代的权力,正在被分成两种不同的东西。一种是算力,在美国手里;另一种是 token,在中国手里。这两种权力不在同一个平面上,谁都吃不掉谁。而英伟达夹在中间,它原来以为自己是最大的赢家,现在发现自己是这两个结构里都没有舒服位置的那个。
这才是他焦虑的真正原因。
算力的地主,token 的租客
先看美国那半边。
4月14 日,EpochAI 发布最新数据——Amazon、Google、Meta、Microsoft、Oracle 五家美国 hyperscaler 合计持有全球 67% 的 AI 算力,按H100 等价口径折算。2024 年 Q1 这个数字是 60%。十八个月里,全球 AI 算力的集中度又提高了七个百分点,而且上行趋势看不到减速。
这五家公司有一个共同点:它们都不做前沿模型。
Google 算是一个例外,TPU 自研加 Gemini 自己做,但剩下四家的基本身位是“收租的”——Microsoft 靠 Azure 给 OpenAI 租算力,Amazon 靠 AWS 和自家 Trainium 芯片把 Anthropic 绑在身边,Oracle 靠 Stargate 项目切进 OpenAI的基础设施版图,Meta 自己造芯片但主要内用,4 月 13 日刚与 Broadcom 签了 1GW 自研芯片订单。
那谁在用这些算力?前沿 AI lab 都是它们的租客。Anthropic 刚宣布扩大与Google 的TPU 合作,未来几年要接入多GW 级算力。OpenAI 的骨干算力是Microsoft Azure 加 Oracle Stargate——OpenAI 在 2 月刚完成 1100 亿美元融资,Amazon 投了 500 亿,SoftBank 投了 300 亿,Nvidia 追加了300 亿(从原本承诺的1000 亿缩水而来)。xAI 自建集群,但芯片仍然从英伟达买。
美国 AI 产业真实的权力结构,是这样的:5 家算力地主 + 3 家前沿模型租客 + 一个 Nvidia。外界以为 OpenAI、Anthropic、xAI 是主角,实际上它们是交租的一方。它们每融一轮钱,都要把大头交给那五家地主——这五家地主同时也是它们的投资人、它们的供应商、它们的谈判对手。
Nvidia 在这个结构里,看上去是最大的赢家。它拿了 2026 财年大约 1150 亿美元的数据中心收入,市值 3 万亿美元以上。但这个身位的脆弱性,黄仁勋自己看得最清楚。
他在3月的Morgan Stanley大会上宣布,Nvidia 投资 OpenAI 的 300亿美元和投资Anthropic 的100亿美元大概率都是最后一笔。两个月前他刚把那100亿美元押给Anthropic,Anthropic转身就加大了 TPU合作——Nvidia投资的钱,流回去帮对手做非英伟达的算力。
这是商业层面的选择:Anthropic 不能只依赖一家芯片供应商,它必须分散。Nvidia 的客户结构本来就高度集中——全球算力版图上,真正的大户就是那五家美国公司。加上中国市场,那就是它过去两年数据中心业务的全部核心收入池。2025 年 4 月之后,H20 禁令让中国这一池水基本蒸发。剩下的五家客户,每一家都比 Nvidia 更想往上游吃——Meta自研芯片、Amazon 有Trainium、Google有 TPU、Microsoft 和 Oracle在押 OpenAI 的自研 Titan。
一个卖铲子的人,面对的客户是五家正在自己造铲子的人。这就是美国结构里英伟达的真实处境。
token 的工厂,没有业主也没有租客
再看中国那半边。
中国前四大云厂商——阿里云、字节火山引擎、腾讯云、百度智能云——全部都同时在做两件事:一边卖算力,一边做自己的大模型。阿里云的底下是千问(Qwen),火山引擎的底下是豆包和 Seedance,腾讯云的底下是混元,百度智能云的底下是文心。再加上对于对于 AI “新势力”们错综复杂的投资,产业布局都很完备。
中国的云厂商只能同时做业主和租客——自己造算力、自己造模型、自己消化 token,最后把 token 作为商品卖给下游企业。算力、模型、应用三层被同一家公司吃掉,整条价值链上只剩下一种东西可以作为商品出货——token。
阿里是这个链条的代表性企业, ATH大家都很熟悉了:CEO 吴泳铭在内部备忘录里给它定下了核心使命:“创造 Token、输送 Token、应用 Token。” ATH 成立后的一个月,阿里的动作密度是过去两年之最。
3 月 30 日发布Qwen3.5-Omni——Qwen 系列近年来第一次从开源走向闭源。紧接着Qwen 3.6 Plus 在OpenRouter上以 4.6 万亿/周的调用量登顶全球大模型周调用量冠军,同系列的Preview 版本拿下第三。今天,ATH 又掏出了最新的开放式世界模型产品Happy Oyster,研发效率堪称恐怖。
吴泳铭在 3 月 19 日的财报电话会上说了一句话,分量比 ATH 成立本身更大。他说:企业在消耗 Token 时不再把它当作 IT 预算,而是当作生产资料。IT 预算是成本项,是被优化的对象;生产资料是投入项,是被扩张的对象。一家万亿美金市值的中国公司的 CEO 在财报电话会上告诉华尔街——token 已经从“支出”变成了“投入”,从“IT 科目”变成了“经济活动本身”。他给出的具体数字是:未来五年,阿里云和 AI 商业化年收入要冲到1000 亿美元。按新的 Token 消耗算法,这1000 亿美元甚至可以包含电商业务产生的 AI 收入。
在企业的动作之前,监管则是更早给这场科技的盛宴定下了基调。3 月 23 日,国家数据局局长刘烈宏在中国发展高层论坛年会上正式把 token 的中文译名定为“词元”,并称其为“智能时代的价值锚点”和“连接技术供给与商业需求的结算单位”。第二天国新办发布会上,他公布了一组官方数字——中国日均词元调用量突破140 万亿,对比2024 年初的1000 亿,两年增长超过一千倍。
这是把 token 从技术概念抬升为经济统计指标的动作。“流量”之于互联网时代,“词元”之于 AI 时代。OpenRouter 平台给了这套叙事最硬的数据支点——2 月 9 日至 15 日那一周,中国大模型的 Token 调用量首次超过美国,4.12 万亿对 2.94 万亿。到 4 月初,中国模型周调用量达到 12.96 万亿,美国模型 3.03 万亿,中国已经连续五周领先,全球调用量前六全部是中国模型。MiniMax M2.5 发布后七天调用量突破 3.07 万亿。Kimi K2.5 发布不到一个月,近 20 天累计收入超过了月之暗面 2025 全年总收入。智谱 GLM-5 在春节期间因为流量爆单,公开“寻找算力合伙人”——不是营销噱头,是真实订单把产能撑爆了。
算一下结构差异。美国那半边,算力是核心资产,token 是算力的副产品。中国这半边反过来——token 是核心商品,算力是生产 token 的原料。定价逻辑、商业模型、公司估值、监管指标,全部围绕两种不同的东西展开。
大洋那边充满了算力,但 token 却源源不断从大洋这边产生。
老黄为什么焦虑
回到 Dwarkesh 的播客。
黄仁勋在访谈里给出一个他反复使用的框架——“five-layer cake”,AI产业有五层:能源、芯片、系统、模型、应用。他说美国必须在五层里每一层都领先,否则就是败局。他说中国是全世界开源软件最大的贡献者,说这话时连说两次“Fact”——事实、事实。他说中国占全球 AI 研究员的一半,制造全球 60% 以上的主流芯片,有大量满电空置的“幽灵数据中心”。他说 AI 的大部分进步来自算法进步,不是硬件本身。然后他抛出一句话——如果 DeepSeek 的下一个版本首发在华为芯片上,对美国来说是灾难。
![]()
这些话串在一起读,意思已经很清楚了。他的焦虑不是来自“中国追上来”这种宏观叙事,而是来自一个明确的尴尬窘境——在美国那半边,他正在失去议价权;在中国那半边,他正在失去入场券。
在美国那半边:5家hyperscaler 拿走了 67% 的全球算力,它们是他最大的客户,也是他最强的对手。它们每一家都在做自研芯片——Meta 刚签了 1GW的Broadcom 订单,Amazon 的Trainium 拿下了 Anthropic,Google 的TPU 在吞噬Nvidia的份额。当你的客户同时是你的对手,当你的市场集中到只剩 5 家买主,你的定价权就是一个慢慢被蚕食的过程。Anthropic 拿了 Nvidia100 亿美元投资两个月后反手加大 TPU 合作——这件事是趋势,不是偶然。
在中国那半边:token生态正在绕过英伟达。DeepSeek V4 的蓄势待发,在华为 Ascend 950PR上跑训练和推理,不走 Nvidia。阿里、字节、腾讯为此批量下单了几十万片华为芯片。Qwen、Kimi 、 MiniMax 们每周产出几万亿 token 的模型,每多跑一天,华为芯片的装机量就涨一天。更严重的是,这些模型的用户正在全球扩张——OpenRouter 上中国模型连续五周超过美国,MiniMax 主打“1 美元跑一小时 AI 数字员工”,Kimi 的海外付费用户正在反超国内。当世界开发者的默认技术栈开始从英伟达切换到华为,Nvidia 在这条链路上一个字都插不进去。
面对这两个困境,英伟达过去半年做了两件事,都可以在这个命题下被重新解读。
第一件事,亲自下场做自己本不该做的产品。3 月的 GTC 上,Nvidia 连发 Cosmos 3(世界基础模型)、Isaac GR00T N1.7(机器人)、Alpamayo1.5(自动驾驶)、Nemotron(开源大模型家族)——一整套覆盖物理 AI 和前沿模型的栈。4 月 14 日世界量子日,它发布 Ising——开源的量子 AI 模型家族,黄仁勋亲自给它定性:“AI 成为控制面,成为量子机器的操作系统。”这些发布加在一起传递的信号非常明确:英伟达不再满足于做芯片,它要做模型、做操作系统、做物理世界的模拟器、做量子计算的控制层。卖铲子的人开始自己挖矿,不是因为贪心,是因为两个结构都在挤压他的原有位置。
第二件事,他把公司的核心指标从“算力”迁移到“产出”。“electrons to tokens” 这个比喻他在 Dwarkesh 访谈里用了不下五次。他把 Nvidia 形容成“全球每瓦生产 token 最多的架构”——不是每瓦算力最多,是每瓦 token 最多。一家把核心指标从“算力”改成“token”的公司,已经承认了这个时代的硬通货在哪里。
但承认不等于解决。他手里的 GPU 本质上还是生产算力的机器,不是直接生产 token 的机器。他在两个结构里都在做对的事——在美国扩张上游、在技术栈上锁住开发者——但这些动作都没法改变基本面:算力和 token 不在同一个平面上。一家只生产算力的公司,无论怎么重新定义自己,都没法同时占据两种权力。
只做卖铲人,已经不能让 Nvidia 高枕无虞了。
结语
AI 时代的权力结构,现在已经分成了两半。
美国那半边是地产——5 家 hyperscaler 坐在 67% 的全球算力上,前沿 lab 是它们的租客。这个结构里,算力是硬资产,估值逻辑是“地皮面积 × 租金”。中国这半边是工厂——4 家云厂把算力、模型、应用压成一条流水线,token 是唯一的出货物。这个结构里,token 是硬通货,估值逻辑是“产出量 × 单价”。
两种结构互相不可吃掉。美国的算力地主没法直接进入中国的 token 工厂——监管、生态、开发者习惯都拦着。中国的 token 工厂也没法直接替代美国的算力地主——前沿训练还是要最先进的硬件,华为 Ascend 追得再快,短期内补不上与顶级Nvidia 芯片的代际差距。两种权力各自运转,各自扩张,各自找各自的出口。
黄仁勋夹在中间。他本来以为自己是这个时代最大的赢家——算力是上游,模型是下游,他给上游和下游都供货,他是唯一的瓶颈。但瓶颈的位置正在双向松动。上游那半边,5 家地主自己造芯片;下游那半边,中国用国产芯片跑出了自己的 token 生态。向左扩张(投资OpenAI、Anthropic)没守住下游,往右扩张还没证明能守住技术栈。他一个人,两条战线,都面临着增长的困境。
他在播客里说,“必须有东西把电子变成 token”。他是在替英伟达的未来辩护,但这句话本身已经承认了——这个时代的硬通货不是电子,是 token。而生产token最密集的地方,目前不在美国。
他在两种结构之间,Nvidia正在失去最舒服的位置。







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论
算力霸权和 token 霸权并行,英伟达的瓶颈位置正在松动
美国五大云厂掌控 67% 算力还自研芯片,客户直接变对手
老黄开始焦虑了英伟达夹在算力和 token 两大体系里左右为难
黄仁勋最怕 DeepSeek 跑在华为芯片上,这是美国的灾难
只做卖铲人不灵了,英伟达被迫下场做模型做系统
英伟达市值再高也挡不住客户自研,增长天花板越来越近
全球 AI 权力一分为二,英伟达两头都没占到舒服位置
中国 AI 全链条闭环,不用英伟达芯片也能跑出海量 token
token 从成本变生产资料,中国 AI 商业化逻辑领先一大步
黄仁勋反复提电子转 token,其实是在给英伟达找新出路