黄仁勋GTC 2025演讲速览:DeepSeek-R1推理吞吐量提高30倍,官宣下一代超级芯片Vera Rubin

钛媒体App 3月19日消息,在当地时间18日的英伟达GTC 2025大会主题演讲中,英伟达CEO黄仁勋再次身穿皮衣登场。演讲要点如下: 1. 发布开源推理软件Dynamo。在GPU数量相同的情况下,Dynamo可将NVIDIA Hopper™平台上运行Llama模型的AI 工厂性能和收益翻倍。在由GB200 NVL72机架组成的大型集群上运行DeepSeek-R1模型时,NVIDIA Dynamo的智能推理优化也可将每个GPU生成的token数量提高30倍以上。 2. 推出Blackwell Ultra芯片,其包括GB300 NVL72机架级解决方案和NVIDIA HGX B300 NVL16系统,推理性能是前一代的1.5倍,将在今年的下半年出货。 3. 官宣下一代AI超级芯片Vera Rubin,将在2026年下半年开始出货时接替Blackwell Ultra芯片。Vera CPU的内存是Grace的4.2倍,内存带宽是Grace的2.4倍。结合Vera的88个CPU内核,英伟达称该芯片的整体性能将是前一代产品的两倍。 4. 再下一代AI芯片架构命名Feynman,2028年登场。 5. 开源新的AI推理模型Llama Nemotron,基于Llama模型构建,与基础模型相比,模型精度提高多达20%;与其他开放推理模型相比,优化推理速度达到了5倍。 6. 英伟达Grace Blackwell解决方案已全面投产。Grace Blackwell系列包括多个产品,如GB200和B200,这些产品采用台积电4nm工艺制造,拥有高达2080亿个晶体管。黄仁勋还展示了使用Grace Blackwell的各厂商数据中心机架,可以看到包括联想、戴尔、微软亚马逊AWS、Meta、谷歌等。 7. 发布两款AI电脑,分别名为DGX Spark和DGX Station,都使用Blackwell架构的芯片,将于今年晚些时候从华硕、BOXX、戴尔、惠普、Lambda和美超微等厂商处推出。 8. 英伟达正与T-Mobile、MITRE、思科、ODC和Booz Allen Hamilton合作开发AI原生6G无线网络的硬件、软件和架构。 9. 英伟达、谷歌与迪士尼合作研发的机器人Blue亮相,该机器人配有英伟达最新的GR00T N1机器人通用基础模型。 10. 发布端到端自动驾驶汽车全栈综合安全系统NVIDIA Halos,并宣布正与通用汽车合作在新一代汽车、工厂和机器人中使用AI。 11. 美国四大公有云供应商(亚马逊微软、Alphabet Inc.旗下谷歌和甲骨文)去年购买了130万块英伟达老一代的Hopper AI芯片。2025年迄今,这一阵营已购买360万块Blackwell AI芯片。 12. 黄仁勋演讲提到AI发展的未来,称现在处于生成式AI(Generative AI)阶段,将迈向一个代理式AI(Agentic AI)时代,随后是物理AI(Physical AI)——机器人登场的时候。
US台积电
US英伟达
US微软
US甲骨文
US惠普
US迪士尼
US思科
US亚马逊

本文内容仅供参考,不构成投资建议,请谨慎对待。

评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
投资日历
更多