全球人工智能大模型的快速迭代,正推动AI芯片需求持续攀升。英伟达凭借H100等产品拿下超过80%的市场份额(据IDC 2023年Q4数据),稳稳占据行业主导地位。就在这样的格局下,AI领域的关键玩家谷歌近期向英特尔下了一笔逾300万颗AI芯片的订单——这不仅是英特尔史上最大的AI芯片单次采购之一,也让科技供应链的格局透出一丝潜在的变化。
谷歌这次下单的核心产品,是英特尔Habana Labs研发的Gaudi3芯片。这款芯片采用台积电5nm制程工艺,FP8精度下训练算力达896 TFLOPS,推理算力为1792 TFLOPS,比上一代Gaudi2提升了近两倍。和英伟达H100相比,Gaudi3的FP8训练算力略低(H100为989 TFLOPS),但根据英特尔公开数据,它每TFLOPS的成本比H100低约20%,有着明显的成本优势。
Gaudi3的技术设计主要围绕高效集群部署和框架兼容性展开。借助RoCE网络,它最多能实现256颗芯片的互联,单集群算力可达450 PFLOPS,足以支撑GPT-4级别的大模型训练。同时,这款芯片兼容TensorFlow、PyTorch等主流AI框架,能降低开发者的迁移成本;它还支持动态形状调整,可适配从图像识别到自然语言处理的多种AI任务。
对谷歌来说,这次采购的核心意义在于供应链的多元化,以此减少对英伟达的依赖——此前谷歌数据中心的AI任务主要靠H100芯片,但H100不仅供应紧张,单价还超过4万美元,而Gaudi3的成本优势能帮谷歌更好地控制AI研发投入。对英特尔而言,这张订单是它在AI芯片市场实现突破的重要信号:截至2023年Q4,英特尔在AI芯片市场的份额仅约5%,IDC预测这笔订单有望把它的份额提升到8%左右。
行业分析师普遍持谨慎态度。麦肯锡2024年4月发布的报告指出,英特尔需要解决三大核心挑战:首先是生态系统的完善——英伟达的CUDA平台已有超过400万开发者,而英特尔Habana SDK的用户还不到10万,这种生态差距可能会影响芯片的普及;其次是产能保障,300万颗Gaudi3芯片依赖台积电5nm产能,一旦遇到制程良率问题或供应链中断,很可能导致交付延迟;最后是性能差距,BenchmarkXPRT 2024年3月的测试数据显示,在GPT-3.5级模型训练中,Gaudi3的速度比H100慢约15%,性能仍需优化。
最近全球AI芯片市场的竞争节奏明显加快。AMD在2024年3月发布了MI300X芯片,其FP8推理算力达2300 TFLOPS,主打生成式AI推理场景,已经拿到微软、Meta等客户的订单;英伟达则在2024年4月推出H200芯片,采用HBM3e内存,带宽提升到1.1 TB/s,比H100高约33%,进一步巩固了高端市场的优势。国内方面,华为海思的昇腾910B芯片FP16算力达384 TFLOPS,已在国内数据中心广泛应用,让全球AI芯片市场的竞争格局变得更加多元。






快报