日赚6.5亿美元还不够，英伟达下一个引爆点在哪儿？-钛媒体官方网站

文 | 极智GeeTech

当“超预期”已经习以为常，市场亟需下一个情绪引爆点。

近日，英伟达发布2027财年第一季度财报。在AI基础设施和Blackwell系统需求持续强劲的推动下，英伟达再次交出一份“超预期”答卷。

营收816亿美元，同比增长85%，GAAP净利润583亿美元，同比增长211%，毛利率74.9%，继续稳定在74%到75%之间。折算下来，英伟达日均净赚约6.5亿美元，相当于每小时进账2700万美元。

黄仁勋在财报电话会上说，“AI工厂的建设正在以惊人的速度加速，这是人类历史上最大规模的基础设施扩张。”

但市场反应显示，对全球AI龙头而言，强劲增长已不再自动等于股价上涨。有观点认为，虽然此次业绩本身较为强劲，但由于市场此前对英伟达的预期已被推至极高水平，投资者更关注的是其增长幅度是否足够“超预期”，以支撑当前的高估值和前期巨大涨幅。

市场也开始追问：英伟达的增长天花板到底在哪儿？这个已经占据AI算力90%以上市场份额的巨头，还能找到新的增量空间吗？

华尔街寻找新叙事：CPU、推理、智能体

过往两年，资本市场的AI核心叙事，始终围绕大模型训练、高端GPU算力军备竞赛展开。

市场形成了根深蒂固的认知：AI等于GPU，算力越强，价值越高。在大模型野蛮生长的训练阶段，行业的核心需求是极致的浮点运算能力，是海量参数的堆叠训练，这恰好是GPU的绝对优势。

英伟达也凭借绝对的生态和硬件优势，成为这场浪潮的唯一核心。但进入2026年，顶级投行的研究报告与资金流向，都在释放一个清晰信号：纯粹的GPU训练红利已经见顶，AI产业正式迈入下半场，全新的增长叙事，已然聚焦CPU算力价值重估、AI推理商业化爆发、智能体AI规模化落地三大核心方向。

从疯狂烧钱、堆叠算力的模型训练时代，转向降本增效、落地变现的推理与智能体时代，AI的算力架构、价值分配、商业模型正在全面重构。过去靠GPU单一算力定义的AI市场，正在迎来算力共舞、场景落地、价值兑现的全新格局，而这也是当下华尔街资金疯狂布局的核心新叙事。

汇丰银行的Frank Lee此前写道，GPU动能已经成为“相对不那么有意义”的投资叙事，因为云公司AI资本开支正流向更多领域，包括内存、网络和服务器CPU。

英伟达试图给出新的增长路径。随着AI从训练转向推理，并进一步进入智能体AI阶段，CPU的重要性上升。黄仁勋在电话会上表示，未来可能会出现数十亿个AI智能体，推理硬件需求将随之增加。他称，“思考”发生在GPU上，而编排基本运行在CPU上。

英伟达CFO科莱特·克雷斯表示，Vera CPU为英伟达打开了一个全新的2000亿美元可服务市场。她称，公司今年对CPU收入已有接近200亿美元的可见度，这将为英伟达成为全球领先CPU供应商奠定基础。

从技术底层来看，CPU拥有GPU无法替代的三大核心优势，牢牢锁定了其在AI下半场的不可替代性。

首先是复杂逻辑处理能力，智能体的核心价值是自主执行复杂任务，海量的条件判断、循环调度、分支流程，都是CPU的传统优势领域，GPU并行计算的架构特性，使其在这类场景中效率极低、难以适配。

其次是系统级调度能力，智能体的工作流程涵盖多模型协作、外部工具调用、海量数据读写、跨平台系统联动，需要一个稳定高效的核心统筹全局，而CPU正是这套复杂体系的核心调度枢纽。

最后是低延迟响应能力，无论是金融交易、自动驾驶，还是企业实时办公场景，都需要毫秒级的响应速度，CPU的缓存架构与指令集优化，能够完美适配实时性要求极高的智能体应用场景。

底层技术优势的落地，直接打开了CPU市场的增量空间。摩根士丹利在最新研报中指出，随着AI智能体的爆发，AI基础设施正从以GPU为主，转向“CPU+内存+系统协同”架构。预计到2030年，全球服务器CPU整体市场规模将突破千亿级别，相较于2025年实现翻倍增长，年均复合增长率将保持在35%以上，成为AI算力赛道增速最快的细分领域。

如果说CPU重构了AI算力的底层架构，那么AI推理的规模化爆发，就是支撑这一轮产业叙事切换的核心商业基础。随着大模型技术趋于成熟，落地场景持续丰富，推理需求迎来指数级增长，彻底完成了从成本中心到盈利引擎的身份蜕变。

最直观的变化来自市场需求的爆发式增长。IDC预测，到2030年，全球活跃AI智能体将达22.16亿，年度Token消耗量将从2025年的0.0005 Peta Tokens飙升至15.2万 Peta Tokens，增长超3亿倍。这意味着，算力需求的“天花板”远未到来。

需求爆发的背后，是AI应用的全面渗透，企业级智能体应用大规模落地，超四成的企业数字化系统嵌入了任务型自主智能体。手机、汽车、智能家居等终端设备全面搭载轻量级推理模型，端侧智能普及提速；AI辅助编程、智能办公、智能决策等场景成为行业标配，全方位拉动推理算力需求井喷。

过往AI企业的成本核心集中在模型训练、高端GPU采购，而如今，推理环节的成本占比已经攀升至7成以上，成为企业AI商业化落地的核心成本支出。这意味着，AI行业的竞争逻辑已经改变，不再是“谁能训练更大的模型”，而是“谁能以更低成本、更高效率完成推理落地”，高效推理能力，成为企业实现AI盈利的核心关键。

商业模式的成熟，更是让推理市场彻底打开商业化空间。传统单一的算力租赁模式逐步升级，形成了多元化的盈利体系。基于Token消耗量的计费模式，精准匹配推理复杂度，成为AI服务商的主流选择；办公智能体、企业数字化智能体的订阅制服务持续普及，带来稳定的持续性收入；云端推理专属服务快速落地，为企业提供算力、优化、运维一体化的推理解决方案，推理正式成为AI行业最稳定、最可观的盈利赛道。

2026年被全球资本市场公认为“AI智能体商业化元年”。历经数年的技术迭代与概念验证，AI智能体彻底摆脱了玩具化、碎片化的标签，从实验室概念、资本市场热点，转变为能够自主完成复杂工作、替代人工流程的“数字员工”，成为AI产业下半场最核心的落地载体，也是华尔街新叙事的终极落脚点。

高盛行业分析显示，未来两年内，美国企业的智能体渗透率将突破半数，AI智能体将成为企业办公、生产、运营的标配工具。

技术的持续突破，加速了智能体的规模化落地。行业已经从早期的单智能体单点作业，进化为多智能体协同工作体系。标准化交互协议的普及，打通了不同平台、不同功能智能体的通信壁垒，实现了智能体之间的角色分工、自主协作、任务联动。

同时，具身智能技术持续成熟，搭载多维度传感器的物理智能体，能够适配工业复杂场景，自主完成巡检、操作、运维等高危复杂工作，让AI智能体彻底从虚拟数字场景，走进真实的物理产业场景，赋能工业数字化转型。

从算力平台到Token工厂

受益于智能体AI时代的爆发，英伟达瞄准2000亿美元全新市场的CPU战略，试图向华尔街证明其高增长的持续性与广阔的想象空间。

当前，AI已经不再是“锦上添花”，而是提高各行业和岗位生产力的必需品。这正在推动能源、芯片、基础设施、模型和应用等AI资本支出持续投入。公司预计，到2030年，AI基础设施支出有望达到每年3万亿至4万亿美元。

公司管理层在电话会上表示，AI基础设施需求正以前所未有的速度扩张，AI工厂建设正在加速。推动这一轮建设的因素主要有两个：一是从搜索、广告到推荐系统和内容理解，超大规模云厂商的核心工作负载正在从CPU转向GPU加速计算；二是AI原生产品和服务的采用正在迎来拐点，主流AI已经从一次性推理，走向逻辑推理能力，再到向智能体阶段。

投资者下一个聚焦点，是代号“Vera Rubin”的下一代AI架构能否在2026年下半年如期进入量产爬坡阶段。高盛在财报前的一份报告中维持英伟达“买入”评级，并明确将Vera Rubin量产时程列为推动估值重估的核心催化剂之一。市场对现有Blackwell架构的增长天花板已有了充分定价，真正的增量故事需要下一代产品来接棒。

作为英伟达推出的AI超级芯片平台，Vera Rubin以暗物质研究先驱天文学家薇拉·鲁宾命名。平台定位高性能计算（HPC）与大规模AI训练场景，意在填补现有H100系列与未来超大规模模型需求之间的算力缺口，进一步巩固英伟达在数据中心AI芯片领域的主导地位，首批客户锁定亚马逊AWS、微软Azure等北美头部云服务厂商。

当前，全球AI正加速迈入“千万亿Token时代”。今年3月，中国日均Token调用量已突破140万亿，全球年化推理用量超1千万亿Token，标志着AI从“交互工具”转向“持续运行的智能基础设施”。‌‌Vera Rubin平台的定位并非传统意义上的通用计算平台，而是要成为智能体AI时代的Token生产基础设施。

Vera Rubin平台由七款芯片组成，包括Vera CPU（英伟达已进军服务器CPU）、Rubin GPU（GPU王牌产品）、NVLink 6（第六代NVLink交换机芯片，芯片内部互联）、ConnectX-9 SuperNIC（超级网卡）、BlueField-4 DPU（存储芯片）、Spectrum-6（以太网交换机芯片，支持CPO技术）以及Groq 3 LPU（收编Groq后的首款芯片），成为Blackwell的跨代接力者。

值得一提的是，Rubin GPU提供的推理算力达到前一代Blackwell的5倍，而训练大型MoE模型所需GPU数量减少3/4，每token推理成本降至十分之一，这让token能够成为像水电一样的普惠基础设施。

在技术层面，Vera Rubin采用台积电的先进封装工艺（推测为CoWoS-Lite或更高版本），把8个计算核心和4组HBM3e内存集成在单一封装内，内存总容量达到192GB，带宽突破2TB/s，比H100的1.6TB/s提升了25%。它的定制化架构针对Transformer模型的注意力机制做了优化，支持FP8、FP16及BF16混合精度计算，单芯片FP8峰值算力可达512 TFLOPS，较H100的395 TFLOPS提升30%。同时，该芯片通过动态电压调节技术，将典型功耗控制在380W以内，能效比提升20%，符合数据中心绿色节能的趋势。

对客户而言，Vera Rubin能把大模型训练时间缩短30%以上，降低训练成本约25%，助力云厂商快速部署下一代AI服务。同时，它延续了英伟达的CUDA生态，现有AI框架如TensorFlow、PyTorch无需大幅修改就能适配，降低了客户的迁移成本。

解锁物理AI万亿级市场

相比AI算力基础设施，更具想象力的是物理AI市场——数十亿个自主机器人系统将在物理世界中运行，包括工业机器人、服务机器人、自动驾驶汽车、无人机等。

在本季度的财报中，英伟达不仅强调了“AI工厂”正在以惊人的速度扩张，更通过全新的财报框架，正式将“物理AI”（Physical AI）推向了产业舞台的中间。随着财报中“边缘计算”板块的独立披露，以及一系列针对自动驾驶与具身智能的重磅技术发布，英伟达正全力打通AI进入物理世界的“最后一公里”。

英伟达在财报中明确提到，发布了NVIDIA Alpamayo 1.5开放模型和NVIDIA Omniverse NuRec技术，以支持大规模自动驾驶系统的开发。这一动作直击自动驾驶行业真实路测数据“不可交互、难以复用”的痛点。通过神经渲染技术，英伟达正在将“死数据”转化为可交互的“活场景”，为L4级自动驾驶的量产落地提供了强大的仿真与数据闭环能力。

而在自动驾驶的赛道上，全球科技企业和车企正在加速突围，与英伟达的底层算力形成了紧密的产业共振。在GTC 2026大会上，英伟达宣布携手比亚迪、吉利、日产、五十铃等海内外头部车企，基于NVIDIA DRIVE Hyperion平台共同打造L4级自动驾驶汽车，并推出了面向AI驱动型车辆的统一安全架构NVIDIA Halos OS。

同时，英伟达扩大与Uber的合作，推出搭载全栈NVIDIA DRIVE AV软件的自动驾驶车队。小马智行、文远知行、蘑菇车联等自动驾驶企业围绕自动驾驶出租车（Robotaxi）、自动驾驶巴士（Robobus）持续全球落地。

针对具身智能，英伟达本季度推出了NVIDIA Isaac GR00T N模型及新的Isaac仿真框架，旨在为具身智能提供强大的物理AI算力底座。GR00T N采用类人类认知的“快思考+慢思考”双系统架构，将高级推理与低级运动控制分离。慢思考推理层基于视觉-语言模型 (VLM)，如 ‌Cosmos-Reason-2B‌，负责处理图像和语言指令，进行场景理解、任务分解和多步骤规划（例如将“组装零件”拆解为“抓取”、“对准”、“拼接”）。快思考动作层基于‌扩散 Transformer（DiT）‌或Flow Matching架构。接收推理层的高级令牌和机器人本体状态，通过去噪过程生成平滑、精确的连续动作向量，直接控制机器人关节。

随着NVIDIA IGX Thor平台的全面上市，英伟达正在加速让机器人具备更强的环境感知与交互能力，推动具身智能从实验室走向真实的工业与商业场景。NVIDIA IGX Thor是专为将实时物理AI直接部署于边缘端而打造，该平台将高速传感器处理、企业级可靠性和功能安全性整合到桌面级紧凑模组中，能够帮助开发者构建感知、推理和行动快速、安全、智能的智能系统。

值得关注的是，英伟达首次将“边缘计算”作为独立板块进行披露。财报明确指出，该板块涵盖了用于代理式AI和物理AI的数据处理设备，具体包括PC、游戏主机、工作站、AI-RAN基站、机器人以及汽车，直接印证了AI技术正在从虚拟的数字世界加速走向真实的物理世界。

对于投资者和行业从业者而言，固守旧的GPU叙事，已经无法适配当下的产业节奏。与其纠结于英伟达当前的高估值，不如关注它在CPU、推理、智能体等领域的最新进展。毕竟，当一个最确定、最广阔的万亿级市场大门缓缓打开时，日赚6.5亿美元的业绩看似惊人，但在AI革命的大背景下，这只是一个开始。