日赚6.5亿美元还不够,英伟达下一个引爆点在哪儿?

钛度号
这只是一个开始。

文 | 极智GeeTech

当“超预期”已经习以为常,市场亟需下一个情绪引爆点。

近日,英伟达发布2027财年第一季度财报。在AI基础设施和Blackwell系统需求持续强劲的推动下,英伟达再次交出一份“超预期”答卷。

营收816亿美元,同比增长85%,GAAP净利润583亿美元,同比增长211%,毛利率74.9%,继续稳定在74%到75%之间。折算下来,英伟达日均净赚约6.5亿美元,相当于每小时进账2700万美元。

黄仁勋在财报电话会上说,“AI工厂的建设正在以惊人的速度加速,这是人类历史上最大规模的基础设施扩张。”

但市场反应显示,对全球AI龙头而言,强劲增长已不再自动等于股价上涨。有观点认为,虽然此次业绩本身较为强劲,但由于市场此前对英伟达的预期已被推至极高水平,投资者更关注的是其增长幅度是否足够“超预期”,以支撑当前的高估值和前期巨大涨幅。

市场也开始追问:英伟达的增长天花板到底在哪儿?这个已经占据AI算力90%以上市场份额的巨头,还能找到新的增量空间吗?


华尔街寻找新叙事:CPU、推理、智能体

过往两年,资本市场的AI核心叙事,始终围绕大模型训练、高端GPU算力军备竞赛展开。

市场形成了根深蒂固的认知:AI等于GPU,算力越强,价值越高。在大模型野蛮生长的训练阶段,行业的核心需求是极致的浮点运算能力,是海量参数的堆叠训练,这恰好是GPU的绝对优势。

英伟达也凭借绝对的生态和硬件优势,成为这场浪潮的唯一核心。但进入2026年,顶级投行的研究报告与资金流向,都在释放一个清晰信号:纯粹的GPU训练红利已经见顶,AI产业正式迈入下半场,全新的增长叙事,已然聚焦CPU算力价值重估、AI推理商业化爆发、智能体AI规模化落地三大核心方向。

从疯狂烧钱、堆叠算力的模型训练时代,转向降本增效、落地变现的推理与智能体时代,AI的算力架构、价值分配、商业模型正在全面重构。过去靠GPU单一算力定义的AI市场,正在迎来算力共舞、场景落地、价值兑现的全新格局,而这也是当下华尔街资金疯狂布局的核心新叙事。

汇丰银行的Frank Lee此前写道,GPU动能已经成为“相对不那么有意义”的投资叙事,因为云公司AI资本开支正流向更多领域,包括内存、网络和服务器CPU。

英伟达试图给出新的增长路径。随着AI从训练转向推理,并进一步进入智能体AI阶段,CPU的重要性上升。黄仁勋在电话会上表示,未来可能会出现数十亿个AI智能体,推理硬件需求将随之增加。他称,“思考”发生在GPU上,而编排基本运行在CPU上。

英伟达CFO科莱特·克雷斯表示,Vera CPU为英伟达打开了一个全新的2000亿美元可服务市场。她称,公司今年对CPU收入已有接近200亿美元的可见度,这将为英伟达成为全球领先CPU供应商奠定基础。

从技术底层来看,CPU拥有GPU无法替代的三大核心优势,牢牢锁定了其在AI下半场的不可替代性。

首先是复杂逻辑处理能力,智能体的核心价值是自主执行复杂任务,海量的条件判断、循环调度、分支流程,都是CPU的传统优势领域,GPU并行计算的架构特性,使其在这类场景中效率极低、难以适配。

其次是系统级调度能力,智能体的工作流程涵盖多模型协作、外部工具调用、海量数据读写、跨平台系统联动,需要一个稳定高效的核心统筹全局,而CPU正是这套复杂体系的核心调度枢纽。

最后是低延迟响应能力,无论是金融交易、自动驾驶,还是企业实时办公场景,都需要毫秒级的响应速度,CPU的缓存架构与指令集优化,能够完美适配实时性要求极高的智能体应用场景。

底层技术优势的落地,直接打开了CPU市场的增量空间。摩根士丹利在最新研报中指出,随着AI智能体的爆发,AI基础设施正从以GPU为主,转向“CPU+内存+系统协同”架构。预计到2030年,全球服务器CPU整体市场规模将突破千亿级别,相较于2025年实现翻倍增长,年均复合增长率将保持在35%以上,成为AI算力赛道增速最快的细分领域。

如果说CPU重构了AI算力的底层架构,那么AI推理的规模化爆发,就是支撑这一轮产业叙事切换的核心商业基础。随着大模型技术趋于成熟,落地场景持续丰富,推理需求迎来指数级增长,彻底完成了从成本中心到盈利引擎的身份蜕变。

最直观的变化来自市场需求的爆发式增长。IDC预测,到2030年,全球活跃AI智能体将达22.16亿,年度Token消耗量将从2025年的0.0005 Peta Tokens飙升至15.2万 Peta Tokens,增长超3亿倍。这意味着,算力需求的“天花板”远未到来。

需求爆发的背后,是AI应用的全面渗透,企业级智能体应用大规模落地,超四成的企业数字化系统嵌入了任务型自主智能体。手机、汽车、智能家居等终端设备全面搭载轻量级推理模型,端侧智能普及提速;AI辅助编程、智能办公、智能决策等场景成为行业标配,全方位拉动推理算力需求井喷。

过往AI企业的成本核心集中在模型训练、高端GPU采购,而如今,推理环节的成本占比已经攀升至7成以上,成为企业AI商业化落地的核心成本支出。这意味着,AI行业的竞争逻辑已经改变,不再是“谁能训练更大的模型”,而是“谁能以更低成本、更高效率完成推理落地”,高效推理能力,成为企业实现AI盈利的核心关键。

商业模式的成熟,更是让推理市场彻底打开商业化空间。传统单一的算力租赁模式逐步升级,形成了多元化的盈利体系。基于Token消耗量的计费模式,精准匹配推理复杂度,成为AI服务商的主流选择;办公智能体、企业数字化智能体的订阅制服务持续普及,带来稳定的持续性收入;云端推理专属服务快速落地,为企业提供算力、优化、运维一体化的推理解决方案,推理正式成为AI行业最稳定、最可观的盈利赛道。

2026年被全球资本市场公认为“AI智能体商业化元年”。历经数年的技术迭代与概念验证,AI智能体彻底摆脱了玩具化、碎片化的标签,从实验室概念、资本市场热点,转变为能够自主完成复杂工作、替代人工流程的“数字员工”,成为AI产业下半场最核心的落地载体,也是华尔街新叙事的终极落脚点。

高盛行业分析显示,未来两年内,美国企业的智能体渗透率将突破半数,AI智能体将成为企业办公、生产、运营的标配工具。

技术的持续突破,加速了智能体的规模化落地。行业已经从早期的单智能体单点作业,进化为多智能体协同工作体系。标准化交互协议的普及,打通了不同平台、不同功能智能体的通信壁垒,实现了智能体之间的角色分工、自主协作、任务联动。

同时,具身智能技术持续成熟,搭载多维度传感器的物理智能体,能够适配工业复杂场景,自主完成巡检、操作、运维等高危复杂工作,让AI智能体彻底从虚拟数字场景,走进真实的物理产业场景,赋能工业数字化转型。

从算力平台到Token工厂

受益于智能体AI时代的爆发,英伟达瞄准2000亿美元全新市场的CPU战略,试图向华尔街证明其高增长的持续性与广阔的想象空间。

当前,AI已经不再是“锦上添花”,而是提高各行业和岗位生产力的必需品。这正在推动能源、芯片、基础设施、模型和应用等AI资本支出持续投入。公司预计,到2030年,AI基础设施支出有望达到每年3万亿至4万亿美元。

公司管理层在电话会上表示,AI基础设施需求正以前所未有的速度扩张,AI工厂建设正在加速。推动这一轮建设的因素主要有两个:一是从搜索、广告到推荐系统和内容理解,超大规模云厂商的核心工作负载正在从CPU转向GPU加速计算;二是AI原生产品和服务的采用正在迎来拐点,主流AI已经从一次性推理,走向逻辑推理能力,再到向智能体阶段。

投资者下一个聚焦点,是代号“Vera Rubin”的下一代AI架构能否在2026年下半年如期进入量产爬坡阶段。高盛在财报前的一份报告中维持英伟达“买入”评级,并明确将Vera Rubin量产时程列为推动估值重估的核心催化剂之一。市场对现有Blackwell架构的增长天花板已有了充分定价,真正的增量故事需要下一代产品来接棒。

作为英伟达推出的AI超级芯片平台,Vera Rubin以暗物质研究先驱天文学家薇拉·鲁宾命名。平台定位高性能计算(HPC)与大规模AI训练场景,意在填补现有H100系列与未来超大规模模型需求之间的算力缺口,进一步巩固英伟达在数据中心AI芯片领域的主导地位,首批客户锁定亚马逊AWS、微软Azure等北美头部云服务厂商。

当前,全球AI正加速迈入“千万亿Token时代”。今年3月,中国日均Token调用量已突破140万亿,全球年化推理用量超1千万亿Token,标志着AI从“交互工具”转向“持续运行的智能基础设施”。‌‌Vera Rubin平台的定位并非传统意义上的通用计算平台,而是要成为智能体AI时代的Token生产基础设施。

Vera Rubin平台由七款芯片组成,包括Vera CPU(英伟达已进军服务器CPU)、Rubin GPU(GPU王牌产品)、NVLink 6(第六代NVLink交换机芯片,芯片内部互联)、ConnectX-9 SuperNIC(超级网卡)、BlueField-4 DPU(存储芯片)、Spectrum-6(以太网交换机芯片,支持CPO技术)以及Groq 3 LPU(收编Groq后的首款芯片),成为Blackwell的跨代接力者。

值得一提的是,Rubin GPU提供的推理算力达到前一代Blackwell的5倍,而训练大型MoE模型所需GPU数量减少3/4,每token推理成本降至十分之一,这让token能够成为像水电一样的普惠基础设施。

在技术层面,Vera Rubin采用台积电的先进封装工艺(推测为CoWoS-Lite或更高版本),把8个计算核心和4组HBM3e内存集成在单一封装内,内存总容量达到192GB,带宽突破2TB/s,比H100的1.6TB/s提升了25%。它的定制化架构针对Transformer模型的注意力机制做了优化,支持FP8、FP16及BF16混合精度计算,单芯片FP8峰值算力可达512 TFLOPS,较H100的395 TFLOPS提升30%。同时,该芯片通过动态电压调节技术,将典型功耗控制在380W以内,能效比提升20%,符合数据中心绿色节能的趋势。

对客户而言,Vera Rubin能把大模型训练时间缩短30%以上,降低训练成本约25%,助力云厂商快速部署下一代AI服务。同时,它延续了英伟达的CUDA生态,现有AI框架如TensorFlow、PyTorch无需大幅修改就能适配,降低了客户的迁移成本。

解锁物理AI万亿级市场

相比AI算力基础设施,更具想象力的是物理AI市场——数十亿个自主机器人系统将在物理世界中运行,包括工业机器人、服务机器人、自动驾驶汽车、无人机等。

在本季度的财报中,英伟达不仅强调了“AI工厂”正在以惊人的速度扩张,更通过全新的财报框架,正式将“物理AI”(Physical AI)推向了产业舞台的中间。随着财报中“边缘计算”板块的独立披露,以及一系列针对自动驾驶与具身智能的重磅技术发布,英伟达正全力打通AI进入物理世界的“最后一公里”。

英伟达在财报中明确提到,发布了NVIDIA Alpamayo 1.5开放模型和NVIDIA Omniverse NuRec技术,以支持大规模自动驾驶系统的开发。这一动作直击自动驾驶行业真实路测数据“不可交互、难以复用”的痛点。通过神经渲染技术,英伟达正在将“死数据”转化为可交互的“活场景”,为L4级自动驾驶的量产落地提供了强大的仿真与数据闭环能力。

而在自动驾驶的赛道上,全球科技企业和车企正在加速突围,与英伟达的底层算力形成了紧密的产业共振。在GTC 2026大会上,英伟达宣布携手比亚迪、吉利、日产、五十铃等海内外头部车企,基于NVIDIA DRIVE Hyperion平台共同打造L4级自动驾驶汽车,并推出了面向AI驱动型车辆的统一安全架构NVIDIA Halos OS。

同时,英伟达扩大与Uber的合作,推出搭载全栈NVIDIA DRIVE AV软件的自动驾驶车队。小马智行、文远知行、蘑菇车联等自动驾驶企业围绕自动驾驶出租车(Robotaxi)、自动驾驶巴士(Robobus)持续全球落地。

针对具身智能,英伟达本季度推出了NVIDIA Isaac GR00T N模型及新的Isaac仿真框架,旨在为具身智能提供强大的物理AI算力底座。GR00T N采用类人类认知的“快思考+慢思考”双系统架构,将高级推理与低级运动控制分离。慢思考推理层基于视觉-语言模型 (VLM),如 ‌Cosmos-Reason-2B‌,负责处理图像和语言指令,进行场景理解、任务分解和多步骤规划(例如将“组装零件”拆解为“抓取”、“对准”、“拼接”)。快思考动作层基于‌扩散 Transformer(DiT)‌或Flow Matching架构。接收推理层的高级令牌和机器人本体状态,通过去噪过程生成平滑、精确的连续动作向量,直接控制机器人关节。

随着NVIDIA IGX Thor平台的全面上市,英伟达正在加速让机器人具备更强的环境感知与交互能力,推动具身智能从实验室走向真实的工业与商业场景。NVIDIA IGX Thor是专为将实时物理AI直接部署于边缘端而打造,该平台将高速传感器处理、企业级可靠性和功能安全性整合到桌面级紧凑模组中,能够帮助开发者构建感知、推理和行动快速、安全、智能的智能系统。

值得关注的是,英伟达首次将“边缘计算”作为独立板块进行披露。财报明确指出,该板块涵盖了用于代理式AI和物理AI的数据处理设备,具体包括PC、游戏主机、工作站、AI-RAN基站、机器人以及汽车,直接印证了AI技术正在从虚拟的数字世界加速走向真实的物理世界。

对于投资者和行业从业者而言,固守旧的GPU叙事,已经无法适配当下的产业节奏。与其纠结于英伟达当前的高估值,不如关注它在CPU、推理、智能体等领域的最新进展。毕竟,当一个最确定、最广阔的万亿级市场大门缓缓打开时,日赚6.5亿美元的业绩看似惊人,但在AI革命的大背景下,这只是一个开始。

本文系作者 极智GeeTech 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App