英伟达推出CUDA-Oxide 0.1实验性编译器，Rust语言正式进入GPU内核开发领域

2026.05.09 13:51

2026年5月7日，英伟达实验室发布开源项目CUDA-Oxide 0.1，这是一款Rust-to-CUDA编译器，支持开发者用Rust直接编写GPU SIMT内核并输出PTX中间代码。该项目通过自定义后端实现单源码编译与设备端抽象，旨在降低CUDA开发门槛，减少内存与并发错误，目前处于早期实验阶段。

2026年5月7日，英伟达实验室推出了实验性开源项目CUDA-Oxide 0.1——这是Rust语言首次被官方纳入CUDA GPU内核开发的范畴。作为全球领先的GPU制造商，英伟达推出这一项目，意在化解CUDA生态长期以来的几大痛点：开发门槛高、内存与并发错误频发。CUDA平台自2007年推出后，一直以C++为主要开发语言，但C++缺乏内存安全机制，在GPU的单指令多线程（SIMT）架构下，开发者很容易因手动内存管理和并发控制不当导致程序崩溃或性能下降，而Rust的所有权模型和类型系统恰好能有效规避这些问题。

CUDA-Oxide 0.1的核心能力在于直接将Rust代码编译为英伟达GPU兼容的PTX中间代码，无需额外依赖C++绑定或桥接层。项目采用自定义的rusc后端，实现了单源码编译模式：开发者能在同一文件里同时编写CPU端逻辑和GPU端内核代码，大大减少了上下文切换的成本。此外，CUDA-Oxide通过设备端抽象层简化了GPU资源管理，比如自动处理内存分配与释放、线程块调度等底层细节，让开发者更专注于算法逻辑而非硬件操作。

从技术层面看，CUDA-Oxide的工作流程分三步：先是rusc后端把Rust源代码解析成抽象语法树；接着，后端将语法树转换成PTX中间表示，这种表示能兼容英伟达所有现代GPU架构；最后，PTX代码经由英伟达的NVCC编译器进一步编译为机器码。这样的设计既保留了Rust的安全特性，又保证生成代码的性能和原生CUDA C++不相上下。英伟达实验室的测试数据显示，CUDA-Oxide生成的内核代码在矩阵乘法这类典型计算任务中，性能损失不到5%，内存错误率却下降了60%以上。

这个项目的发布对行业意义重大：一方面，它为熟悉Rust的开发者打开了GPU编程的入口，有望吸引更多人参与CUDA生态建设；另一方面，Rust的内存安全特性能明显提升CUDA应用的稳定性，特别是在自动驾驶、医疗影像处理这类对可靠性要求极高的领域。目前，CUDA-Oxide 0.1已在GitHub开源，英伟达实验室称会继续迭代优化，计划2027年推出首个稳定版本，同时支持异步编程、泛型等更多Rust特性。

行业趋势上，Rust在高性能计算领域的应用正快速扩张。麦肯锡2025年的报告显示，Rust在系统编程中的市场份额已从2020年的2%涨到15%，谷歌、微软等多家科技公司都在内部项目中使用Rust。竞争对手这边，AMD的ROCm平台目前主要支持C++和HIP语言，但业内人士预测，AMD可能在未来12个月内推出Rust编译器支持，以此应对英伟达的这一动作；Intel的oneAPI生态也在评估集成Rust的可能性，希望增强跨架构开发的灵活性。

作品声明：内容由AI生成