AI技术迭代速度加快,数据中心对高算力硬件的需求也水涨船高。作为AI模型训练与推理的核心组件,内存的带宽和容量正成为制约性能的关键因素。近期Nvidia CEO黄仁勋公开表示,公司下一代AI平台Vera Rubin已全面进入量产阶段,其核心内存供应商锁定了SK海力士、三星电子和美光科技这三家全球内存巨头。
Vera Rubin平台的核心技术亮点是采用第六代HBM4内存。据SK海力士披露的数据,这款内存单颗容量可达24GB,最高带宽1.6TB/s——相比上一代HBM3E的1.2TB/s提升约33%,功耗却降低了15%左右。高规格内存的应用直接推高了硬件成本,数据显示,一个Vera Rubin机架的部件成本比上一代产品高出435%,其中内存成本占比超过60%,这也反映出AI基础设施成本攀升的压力。
AI模型的参数规模不断扩大——比如GPT-4的参数就超过万亿——对内存带宽的需求呈指数级增长。HBM4的高带宽特性能有效降低数据传输延迟,提升计算效率,这正是Nvidia选择它作为核心内存的关键原因。供应链方面,为满足Nvidia的需求,SK海力士计划未来五年内将晶圆产能翻倍。目前该公司在HBM市场的份额超过50%,是全球最大的HBM供应商。不过,三家供应商的高度集中也带来了系统性风险——摩根士丹利分析师指出,如果其中任何一家出现产能问题或价格波动,都可能影响Vera Rubin的供应稳定性。
Vera Rubin的量产将进一步巩固Nvidia在AI硬件市场的领先地位,助力数据中心处理更复杂的AI任务,但成本上升也给下游运营商带来压力。美国大型数据中心运营商Equinix 2024年第一季度财报显示,其硬件采购成本同比上升28%,其中内存成本占比增长最快。
IDC 2024年5月发布的报告显示,2024年第一季度全球AI服务器出货量同比增长109.6%,其中配备HBM内存的服务器占比超过70%,可见市场对高带宽内存的需求仍在持续升温。在竞争对手方面,AMD近期推出的MI300X AI芯片采用HBM3E内存,容量达192GB,目标直指Vera Rubin;Intel的Gaudi3芯片则使用HBM3内存,虽然带宽稍低,但成本优势显著,目前已拿下谷歌云等客户的订单。这些竞争态势将推动AI硬件领域的技术迭代与成本优化,未来内存供应商与芯片厂商的合作会更紧密,供应链多元化也可能成为行业发展的方向。






快报