2024年底,当Sam Altman在内部提出要自己造芯片时,几乎所有人都认为这是典型的OpenAI式野心:宏大、昂贵、生死未卜。毕竟,全球市值最高的芯片公司英伟达估值超过3万亿美元,而当时的OpenAI年收入刚突破100亿美元。一家AI公司要跟台积电的产能赛跑,要跟Broadcom的工程团队磨合,要跟AMD和英特尔抢流片窗口。这听起来像是硅谷历史上最昂贵的降本方案。
18个月后,Jalapeño来了。
一颗芯片和一个信号
2026年6月24日,OpenAI与Broadcom联合发布了首款定制推理芯片Jalapeño。官方将其命名为Intelligence Processor,定位为专为大语言模型推理设计的AI加速器。从设计到流片仅用了9个月,早期测试结果显示其每瓦性能显著优于当前最先进方案。
消息公布后,Broadcom股价当日上涨3.4%。但比股价更值得关注的,是这颗芯片背后的部署计划。OpenAI计划2026年底开始,在微软等合作伙伴的数据中心进行吉瓦级部署,使用Broadcom的Tomahawk网络芯片进行大规模互联。Broadcom CEO Hock Tan在播客中表示:如果你自己造芯片,你就掌控了自己的命运。
这不是一次孤立的芯片发布。就在过去三周,OpenAI已宣布了约33GW的计算资源承诺,合作伙伴横跨英伟达、AMD、Oracle、Cerebras和Broadcom。而OpenAI目前实际运营的算力刚刚超过2GW。Altman说得直白:即使我们现在有30GW,用户需求也会很快把它填满。
为什么OpenAI要同时押注如此多的芯片供应商?答案藏在推理成本里。
1美元收入,1.35美元推理费
OpenAI正在经历一场前所未有的算力饥渴。据SemiAnalysis曝光的一份财务文件显示,OpenAI在2025年上半年仅在推理上就烧掉了50.2亿美元。2024年全年这个数字才37.6亿美元,这意味着一年时间推理支出翻了一倍还不止。
2025年全年,OpenAI总支出高达340亿美元(据Financial Times引述的审计数据),而收入只有130亿美元。粗略一算,这家全球估值最高的AI公司每赚1美元,要花掉约1.35美元。成本的大头并非研发或人力,而是每秒钟都在燃烧的推理算力。CFO Sarah Friar已在内部警告:如果收入增速追不上数据中心合同的扩张速度,到2028年算力成本可能飙升至850亿美元。
OpenAI给自己定的目标是到2030年累计投入6000亿美元用于算力建设。对比之下,它那2GW的现有算力显得杯水车薪。从2GW到10GW再到30GW,这个跳跃速度决定了OpenAI不能只靠英伟达。
去英伟达化,一场全行业的集体迁徙
OpenAI不是第一个走定制芯片这条路的公司。全球最大的几家科技公司都在做同一件事。
Google从2015年就开始打造TPU,到2026年已迭代至TPU v7。Anthropic在2025年11月签下了Google历史上最大的TPU订单,承诺2026年部署数十万颗Trillium TPU,2027年向百万颗迈进。Anthropic选择将自己的推理未来押注在TPU上,这是一个清晰的信号:当模型能力的竞争进入深水区,芯片选型已经成为战略决策。
亚马逊的Trainium已发展到第三代,部署在AWS自建数据中心中。微软有Maia系列,Meta有MTIA。为什么大家都在造芯片?原因很简单:GPU是通用武器,而你的工作负载是专用的。如果你知道未来几年你的AI模型将消耗数十亿次推理计算,为什么不造一颗只干这一件事的芯片?
定制ASIC的核心逻辑是去掉GPU通用的图形渲染和多任务并行能力,把每一颗晶体管都用在推理矩阵运算上。Google的TPU v6e在特定推理工作负载下被第三方评测为相比H100实现4倍性价比提升。这种效率差距在数十亿次推理调用的规模下意味着数十亿美元的成本差异。
但OpenAI的情况与Google和亚马逊都不同。它不拥有云基础设施,所以必须与Broadcom(芯片设计加制造)、Celestica(系统集成)和微软(数据中心)三方协作。这增加了复杂度,但也给了OpenAI一个独特的优势:每一颗Jalapeño直接进入OpenAI自己的推理集群,不需要先卖给云客户再自用。OpenAI是这条供应链上唯一的用户,也是唯一的决策者。
9个月流片,AI在设计自己的大脑
Jalapeño从设计到流片只用了9个月。在芯片行业,这几乎是不可想象的速度。一颗高性能ASIC的正常设计周期是18到24个月。
OpenAI总裁Greg Brockman在公司播客中解释了加速的关键:OpenAI自己的模型参与了芯片设计。他说:你拿人类工程师已经优化过的元件,往里面填计算量,模型会给出自己的优化方案。他们实现了大规模的芯片面积缩减。
这是整个故事中最具反身性的一面:AI模型在设计运行AI模型的芯片。就像Copilot帮助程序员写代码一样,AI驱动的EDA(电子设计自动化)正在从概念变成现实。9个月流片可能只是一个开始。如果这个逻辑成立,定制芯片的门槛将大幅下降,任何人都可以用AI在几个月内设计出一颗专属于自己的AI芯片。
Broadcom CEO Hock Tan在播客中的表态一语中的:你需要最好的最新的算力。当你朝着更前沿的模型和超级智能迈进时,如果你自己造芯片,你就掌控了自己的命运。
算力自主权时代,谁赢谁输
Broadcom是这场游戏中最明确的赢家。从2025年10月官宣合作到2026年6月发布首颗芯片,Broadcom不仅获得了OpenAI的长期采购承诺,更重要的是验证了自己的ASIC设计平台可以服务全球最前沿的AI公司。卖铲子的逻辑变了,不再是只卖英伟达这一把铲子。
Cerebras和AMD也从OpenAI的多源采购战略中受益。但最大的受益者可能是OpenAI自己。如果Jalapeño的每瓦性能提升在量产中得到验证,OpenAI的推理成本将大幅下降。在每赚1美元就要烧掉1.35美元的负毛利模式下,任何成本端的改善都会直接传导到利润表上。
英伟达虽然短期内不会失去训练市场的统治地位(CUDA生态和NVLink互联体系仍是行业标准),但推理侧的蛋糕正在被定制ASIC一块块切走。当OpenAI的推理流量逐步迁移到Jalapeño上,当Anthropic大举押注TPU,当AWS用Trainium抢占自营推理市场,英伟达面临的是一个长期的结构性侵蚀。Cerebras在2026年5月IPO,AMD持续拉拢AI客户,竞争格局已不可逆转地分散化。
还有一个隐蔽但极重要的信号:OpenAI在2026年6月刚刚秘密提交了IPO文件。IPO之后,华尔街会用利润表来衡量OpenAI。自研芯片带来的成本优化,将从战略防务变成直接贡献每股收益的武器。相比之下,继续依赖英伟达单一供应商不仅意味着更高的推理成本,还会在资本市场叙事中背上供应链集中风险这个减分项。
OpenAI造的第一颗芯片不是为了训练更强大的模型。它用来以更低的成本、更高的效率服务10亿用户。当模型能力趋于同质化,真正构筑护城河的不再是智能本身,而是输送智能的管道。Jalapeño很小,但它铺出了一条通往算力自主权的路。这条路一旦修通,就再也回不去了。






快报