OpenAI GPT-5.5携Codex落地NVIDIA基础设施 加速知识工作自动化

2026.04.24 05:11
近期OpenAI与NVIDIA合作推出GPT-5.5模型及Codex工具,基于NVIDIA H100 GPU集群运行,NVIDIA已率先应用该组合提升内部效率。该模型支持128K tokens上下文,TensorRT-LLM优化使推理速度提升3倍,推动AI代理向企业级知识工作场景渗透。

近年来,AI代理技术正悄然重塑开发者的工作流程,从代码补全到错误调试,都显著提升了开发效率。近期OpenAI与NVIDIA的合作,更是将这项技术推向了新高度:OpenAI推出的GPT-5.5模型搭配Codex工具,已正式落地NVIDIA的基础设施,而NVIDIA也已率先将这一组合应用于内部业务流程。这一合作是在2024年第二季度的NVIDIA GTC全球开发者大会上宣布的,目标是突破AI代理在知识工作领域的瓶颈,解决复杂信息处理、跨领域问题求解等场景下的效率痛点。

GPT-5.5拥有万亿级参数规模,支持128K tokens的上下文窗口,能同时处理文本、代码、表格等多种类型的数据;配套的Codex工具则针对知识工作场景做了优化,可自动生成技术文档摘要、数据分析报告,以及复杂的代码模块。NVIDIA的H100 GPU集群为模型提供了核心算力支撑,其FP8高精度计算能力达到395 TFLOPS,再配合TensorRT-LLM推理优化框架,让Codex的推理速度提升了3倍,延迟降低40%,单卡并发用户数也比A100时代提高了2.5倍。

对NVIDIA自身来说,内部应用这一组合的成效相当显著:在芯片设计验证阶段,Codex自动生成测试代码,将原本2周的任务周期缩短到3天,效率提升了85%;而在技术文档处理方面,GPT-5.5能整合跨部门资料生成标准化报告,减少了60%的人工整理时间。从行业层面看,这次合作标志着AI代理正从单纯的开发者工具,向企业级知识工作解决方案跨越,为金融、法律、科研等领域的自动化转型提供了新的路径。

IDC最新报告显示,2024年全球AI基础设施市场规模预计将达到1470亿美元,同比增长28.5%,其中GPU加速计算的占比超过60%。在竞争对手方面,微软Azure近期推出了基于GPT-4o的企业级AI代理服务,整合了搭载H100的NDv5集群,并针对金融机构推出了智能风控工具;而Google DeepMind则在2024年2月发布了Gemini 1.5 Pro,支持100万tokens的上下文,运行在TPU v5e基础设施上,在长文档处理场景中与GPT-5.5形成了直接竞争。

作品声明:内容由AI生成

快报

更多

13:02

习近平:中俄关系进入更有作为、更快发展的新阶段

13:01

习近平同俄罗斯总统普京大范围会谈

13:00

上交所:5月20日盘中即时起至收市暂停中韩半导体ETF华泰柏瑞 (513310)交易业务

12:59

英伟达将在新加坡设立研究中心

12:55

印尼收紧大宗商品出口国家管控,将成立国企统筹核心资源出口销售

12:53

机构预测明晚国内成品油价格将上调

12:52

习近平同俄罗斯总统普京小范围会谈结束

12:51

智象未来超两千亿参数原生全模态大模型发布,完成新一轮亿级融资

12:34

金蝶发布企业AI操作系统“灵基”

12:33

一周六班,下月起海口至雅加达航线加密

12:32

国家发展改革委紧急安排5000万元中央预算内投资支持湖南省严重洪涝灾害灾后应急恢复

12:29

商务部:美方承诺解决或实质性推动解决中国部分农产品非关税壁垒和市场准入问题,中方恢复符合要求的美输华牛肉企业注册、恢复自美国相关州进口禽类产品

12:27

商务部:中美双方就推动解决双方部分农产品非关税壁垒和市场准入问题达成一系列积极共识,并原则同意将相关产品纳入对等降税框架安排

12:26

商务部:中国航空根据自身航空运输发展需要将按照商业化原则引进200架波音飞机,美方将为中方提供充足的发动机、零部件供应保障

12:25

商务部:中国政府依法依规对稀土等关键矿产实施出口管制,对合规、民用的许可申请予以审核

12:24

商务部:中美双方原则同意在贸易理事会项下讨论同等规模产品对等降税框架安排,规模各为300亿美元或更多

12:22

消息称苹果硬件团队第二轮重组,斯鲁吉加速产品开发

12:11

平头哥真武系列GPU已累计出货超56万片,未来两代真武V900、真武J900曝光

12:09

港股午评:科指拉升转涨,存储半导体强势,兆易创新再创历史新高

11:57

习近平谈中东局势