OpenAI工程师30天API调用耗资130万美元 测试AI辅助开发极限能力

2026.05.17 20:01
2026年5月16日,OpenAI员工彼得·施泰因贝格尔公开30天API调用数据:总调用760万次,消耗6030亿词元,费用130.5万美元,由OpenAI承担。测试使用约100个Codex实例及GPT-5.5模型,关闭极速模式成本可降至30万美元,旨在测试AI辅助开发极限,成果开源。

AI辅助开发如今已是科技行业提升效率的核心方向,各大巨头正不断投入资源探索其能力边界。2026年5月16日,OpenAI员工、OpenClaw项目创始人彼得·施泰因贝格尔对外公布了一组为期30天的API调用测试数据,随即引发行业广泛关注。这一测试由OpenAI全额出资,期间累计完成760万次API调用,消耗词元量达6030亿,总费用为130.5万美元。测试过程中部署了约100个Codex实例,主要用于支撑代码审核、漏洞检测、自动修复等AI开发相关任务,其中高频调用的模型是2026年4月23日刚发布的GPT-5.5版本。施泰因贝格尔团队的测试重点放在无预算约束下AI辅助开发的能力极限上,他们通过大规模API调用模拟企业级开发场景。数据显示,若关闭“极速模式”,测试成本可降至约30万美元,降幅达77%;这一结果也点出了模型优化与成本控制之间的平衡关系——极速模式虽能加快响应速度,却会大幅增加计算资源的消耗。这次测试的核心价值在于验证AI在复杂代码开发任务中的实际潜力,其开源的测试成果将为行业提供宝贵参考数据,助力企业优化AI辅助开发的成本结构。同时,测试数据也反映出当前大模型API的使用成本仍偏高,后续需要通过技术迭代进一步降低应用门槛。据彭博社近期监测,在竞争对手方面,Google DeepMind于2026年5月上旬发布了CodeLlama 3模型的企业级测试报告:在相同的代码审核任务中,其API调用成本约为OpenAI GPT-5.5的75%,但漏洞检测准确率比后者低2个百分点;国内百度文心一言团队也在同月推出了代码辅助工具的开源版本,支持Python、Java等12种主流编程语言的代码生成,截至5月20日,已有超1.2万名开发者参与社区测试,反馈整体良好。

作品声明:内容由AI生成