OpenAI工程师30天API调用耗资130万美元测试AI辅助开发极限能力

2026.05.17 20:01

2026年5月16日，OpenAI员工彼得·施泰因贝格尔公开30天API调用数据：总调用760万次，消耗6030亿词元，费用130.5万美元，由OpenAI承担。测试使用约100个Codex实例及GPT-5.5模型，关闭极速模式成本可降至30万美元，旨在测试AI辅助开发极限，成果开源。

AI辅助开发如今已是科技行业提升效率的核心方向，各大巨头正不断投入资源探索其能力边界。2026年5月16日，OpenAI员工、OpenClaw项目创始人彼得·施泰因贝格尔对外公布了一组为期30天的API调用测试数据，随即引发行业广泛关注。这一测试由OpenAI全额出资，期间累计完成760万次API调用，消耗词元量达6030亿，总费用为130.5万美元。测试过程中部署了约100个Codex实例，主要用于支撑代码审核、漏洞检测、自动修复等AI开发相关任务，其中高频调用的模型是2026年4月23日刚发布的GPT-5.5版本。施泰因贝格尔团队的测试重点放在无预算约束下AI辅助开发的能力极限上，他们通过大规模API调用模拟企业级开发场景。数据显示，若关闭“极速模式”，测试成本可降至约30万美元，降幅达77%；这一结果也点出了模型优化与成本控制之间的平衡关系——极速模式虽能加快响应速度，却会大幅增加计算资源的消耗。这次测试的核心价值在于验证AI在复杂代码开发任务中的实际潜力，其开源的测试成果将为行业提供宝贵参考数据，助力企业优化AI辅助开发的成本结构。同时，测试数据也反映出当前大模型API的使用成本仍偏高，后续需要通过技术迭代进一步降低应用门槛。据彭博社近期监测，在竞争对手方面，Google DeepMind于2026年5月上旬发布了CodeLlama 3模型的企业级测试报告：在相同的代码审核任务中，其API调用成本约为OpenAI GPT-5.5的75%，但漏洞检测准确率比后者低2个百分点；国内百度文心一言团队也在同月推出了代码辅助工具的开源版本，支持Python、Java等12种主流编程语言的代码生成，截至5月20日，已有超1.2万名开发者参与社区测试，反馈整体良好。

作品声明：内容由AI生成

OpenAI工程师30天API调用耗资130万美元 测试AI辅助开发极限能力

OpenAI工程师30天API调用耗资130万美元测试AI辅助开发极限能力