划掉workflows,写下loops:Steinberger、Warp和DeepMind的这场对话,戳破了AI编程的最大幻觉

2026.07.01 11:30
Peter Steinberger、Zach Lloyd和Paige Bailey在2026 AI Engineer World's Fair开幕夜的对话,通过划掉"workflows"、手写"loops"这个标志性动作,宣告了AI编程从预设流水线走向自反馈循环的范式转变。本文拆解三位嘉宾分别代表的执行层、基础设施层和智能层,剖析循环失败的四类原因,并梳理Anthropic、LangChain、OpenAI三股力量对"循环标准"的争夺。

2026年7月1日,旧金山Moscone West会展中心。

AI Engineer World's Fair开幕日刚刚结束,数千名AI工程师涌向周边场馆和酒会。在Warp主办的一场side event中,一张活动海报上的文案格外扎眼:“Apparently we didn't talk enough about workflows loops yet! See ya there!” Workflows这个词被一道横线划掉,旁边手写着loops。不是排版失误。这是一句宣言。

这场名为“Crafting Software Factories”的对话,请来了三位在AI编程领域最具标志性的人物:OpenClaw的创造者Peter Steinberger(两个月前刚被Sam Altman亲自官宣加入OpenAI),Warp的创始人和CEO Zach Lloyd,以及Google DeepMind的AI开发者关系负责人Paige Bailey。

三个人,三个不同的坐标。Steinberger代表的是AI智能体如何真正“做事”,他的OpenClaw在2026年初病毒式走红,谷歌搜索量一度超过Claude Code和Codex。Zach Lloyd代表的是AI编程的基础设施层,Warp从一款终端产品进化成智能体开发环境(ADE),被超过70万开发者使用,覆盖超过一半的Fortune 500企业。Paige Bailey代表的是模型层,她负责的Google DeepMind团队正在重新定义AI如何嵌入软件开发流程。

但三个人要聊的,是同一个话题:为什么“workflows”这个词已经配不上这个时代了?为什么“loops”才是答案?

这不是一场普通的圆桌。它很可能标志着一个关键拐点:AI编程正从“预设流水线”走向“自反馈循环”。而大多数开发者和公司,还在用上一个时代的思维方式理解AI编程。

为什么是“循环”,不是“工作流”

“Workflow”这个词,骨子里带着工业时代的流水线基因。输入到步骤A到步骤B到步骤C再到输出。每一步是预设的,次序是固定的,异常需要人工介入。

这个模式在传统软件开发中运转了几十年。CI/CD流水线、代码审查流程、部署管道,全部是线性预设的工作流。

但AI编程时代,这个模式崩溃了。

原因简单到令人不安:AI智能体的行为本质上是不可预测的。一个prompt下去,AI可能写10行代码,也可能写1000行。可能一次通过,也可能需要反复修正。预设的步骤序列无法应对这种不确定性。你无法为不可预测的行为预先画好流程图。

Steinberger本人就是最极端的案例。

2026年1月,他在The Pragmatic Engineer播客中披露了一个数字,震动了整个开发者社区:单月提交超过6600次代码。不是团队,他一个人。作为对比,大多数活跃开发者一个月的提交量在200到300次之间。

他的工作方式不是“写代码、提交、审查、合并”的流水线,而是“触发、执行、检查、反馈、修正”的循环。用他的话说:“从提交量看,你可能以为这是一家公司,但这只是一个家伙坐在家里找乐子。”

他在那期播客中说了一句被行业反复咀嚼的话:“我提交我不读的代码。”(I ship code I don't read.)这句话被很多人误解为“AI随便写写就能上线”。真正的含义恰恰相反:他构建的反馈循环足够可靠,让他敢于信任循环的输出。信任的不是AI,而是循环本身。

那么,什么是“循环”?

在AI智能体的语境下,一个循环包含四个阶段:感知(perceive)、决策(decide)、行动(act)、验证(verify)。验证结果反馈回感知阶段,驱动下一次迭代。直到满足终止条件,循环才结束。

这与工作流的本质区别在于:工作流是线性的,步骤之间没有回头路。循环是递归的,每个阶段的结果都可以反馈到起点。工作流预设了路径,而循环动态生成路径,智能体根据当前状态决定下一步做什么。

三位嘉宾的完整拼图

这场对话之所以值得关注,不是因为它会发布什么新产品,而是因为三位嘉宾恰好构成了“循环范式”的完整拼图。

Steinberger:循环的执行层

Steinberger是“一个人运营一家软件工厂”的活案例。他的OpenClaw是一个能自主执行任务的AI智能体,查航班、管理日历、写代码、跑测试,全部在循环中完成。2026年2月,Sam Altman亲自在X上官宣Steinberger加入OpenAI,“推动下一代个人智能体”。Altman的原话是:“他对非常智能的智能体相互交互、为人们做非常有用的事情的未来,有大量令人惊叹的想法。OpenClaw将作为一个开源项目存在于基金会中,OpenAI将继续支持它。”

这句话透露了关键信息:多智能体交互。多个智能体各自运行在自己的循环中,相互触发、相互验证。这不是一个人的单循环,而是一个由循环组成的网络。

Steinberger代表的是循环的执行层:智能体如何在循环中自主完成任务,如何跨循环协作,如何处理循环中的异常。

Zach Lloyd:循环的操作系统

Zach Lloyd领导的Warp团队,正在做的事情可以理解为“为循环时代重写基础设施”。

Warp从一个终端产品起家,但它的轨迹在2025到2026年发生了戏剧性转变。Zach Lloyd在2026年3月的Coding Agents Conference上说了一句激进的话:“在你的笔记本电脑上编码正在死亡。”理由很直接:一旦涉及多个智能体、长时间运行的任务和团队可见性,本地开发环境就不够用了。

2026年5月,Warp发布了Oz平台的重大更新,使其成为第一个多智能体控制平面。它可以在一个统一的界面中同时运行Claude Code、Codex和Warp Agent三个不同的智能体,并统一管理访问控制、治理策略和审计日志。这不是一个工作流引擎,这是一个循环管理系统。

Warp被超过70万开发者和超过一半的Fortune 500企业使用,背后有Sequoia、GV、Sam Altman和Marc Benioff的支持。这个数字说明了一个趋势:当循环的数量超过某个阈值,企业需要的不再是更好的IDE,而是运营软件工厂的基础设施。

Zach Lloyd代表的是循环的基础设施层:在什么环境中运行循环、如何监控循环的状态、如何管理循环的成本和风险。

Paige Bailey:循环的大脑

Paige Bailey的职业生涯横跨了AI开发者工具的几乎所有关键节点:微软的VS Code和Copilot,GitHub的Codespaces,现在是Google DeepMind的AI开发者关系负责人。她曾主导PaLM 2和Gemini的产品管理工作,对AI如何理解开发者的意图有第一手的经验。

在2026年的一次SXSW活动中,Bailey表达了一个被广泛引用的观点。她不再建议她的侄子和侄女把计算机科学作为唯一的职业选择。她认为批判性思维和解决问题的能力,在AI时代可能比编码技能更重要。生成式AI正在民主化软件开发,让开发者可以把精力从写代码的细节中解放出来,专注于创造性工作。

这句话放在“循环”的语境下,意义更加清晰。当循环承担了“写代码、测试、修正”的重复性劳动,开发者的角色从“编码者”变成了“循环的设计者”。开发者不再写每一行代码,而是设计一个系统,让AI在这个系统中通过循环迭代找到正确的答案。

Paige Bailey代表的是循环的智能层:模型如何理解循环的上下文、如何生成高质量的反馈、如何在不同循环之间保持一致性。

“软件工厂”不是比喻,是架构

“Software Factories”这个说法,在2026年有了全新的含义。

传统意义上的“软件工厂”指的是通过标准化流程提高生产效率,像工厂流水线一样。但“循环”范式下,“工厂”的含义完全不同。一条流水线是线性的,一座工厂是网络化的。工厂里有多条流水线并行运转,每条流水线内部有多个循环,循环之间互相通信、互相触发、互相验证。

这就是AI编程正在走向的方向。

Steinberger的OpenClaw展示了一个人如何运营一座“软件工厂”:数百个AI智能体并行工作,每个智能体运行在自己的循环中,有的负责代码生成,有的负责测试,有的负责调试,有的负责部署。Steinberger的角色不是“写代码的人”,而是工厂的运营者。他监控循环状态、调整循环参数、处理异常情况。

Zach Lloyd说得更直白。他在一次访谈中描述Warp内部的工作方式:“我们现在用Warp来构建Warp,很多开发都从prompt开始。”一个超过百万行Rust代码加自定义UI框架的项目,团队的核心工作方式已经变成了“写prompt、启动循环、检查输出、迭代”。

2026年初,Gergely Orosz在LinkedIn上分享了一个值得深思的观察:Steinberger不再使用pull request。他把PR改称为“prompt request”。这不仅仅是换了个幽默的叫法,它揭示了角色转变的本质。当代码由循环生成,代码审查的对象就不再是代码本身,而是触发循环的那个prompt。

循环的“死穴”

循环听起来很美,但实际落地时,大多数循环会失败。

根据2026年行业内的共识,循环失败有四个主要原因。

没有硬停止条件。循环没有明确的终止标准,要么无限运行烧光预算,要么在无关紧要的细节上过度优化。一个没有终止条件的循环,本质上是一个bug。

目标定义模糊。循环的目标不够具体,智能体无法判断什么时候算完成。一个写代码的循环如果没有明确的验收标准,它可能会永远优化下去。

上下文溢出。长时间运行的循环会积累过多上下文,导致模型迷失。Anthropic在构建其多智能体研究系统时发现,每个subagent需要独立的上下文窗口,否则单智能体在大范围搜索任务中效率极低。

成本失控。循环的每次迭代都消耗token,长时间运行的成本可能远超手动完成。Anthropic的研究团队坦诚地公布了这一点:其多智能体研究系统消耗的token量是单智能体的约15倍,但换来的是超过90%的性能提升。在大多数商业场景下,这种成本收益关系需要精心权衡。

这些问题的本质,是把循环当成工作流来管理。用线性的思维管理递归的系统。这正是“循环工程”(Loop Engineering)要解决的核心问题。

谁在定义“循环”的标准

2026年,围绕“循环”的范式竞争已经展开。

Anthropic发布了“构建有效AI智能体”的六种架构蓝图,定义了从单智能体到多智能体编排的多种循环模式。在内部研究中,Anthropic使用Claude Opus 4作为主导智能体、Claude Sonnet 4作为subagent的多智能体系统,在内部研究评测中比单智能体方案性能提升了90.2%。这是目前业界最有系统性的循环分类法。

LangChain的创始人Harrison Chase提出了“循环叠加”理论。复杂任务可以通过多个简单循环的嵌套组合来解决。其中的评估器-优化器模式(Evaluator-Optimizer)就是:一个智能体生成输出,另一个智能体评估质量并提供反馈,循环迭代直到输出合格。

而OpenAI通过Steinberger的加入,正在把OpenClaw的循环模型融入产品。Sam Altman提到的“多智能体交互”图景,暗示了OpenAI正在构建一个多智能体循环网络。个人智能体、代码智能体、数据智能体,各自运行在独立的循环中,通过某种协议相互通信。

这场关于“循环”的标准之争,本质上是一场关于AI编程“操作系统”的争夺。谁定义了循环的触发方式、循环间的通信协议、循环的终止条件和成本模型,谁就定义了AI编程的未来。

对于更广大的开发者和团队来说,这场竞争的结果将直接决定他们的日常开发方式。是用一个工作流引擎来编排AI,还是设计一个循环系统让AI自主迭代。

那一横划掉了什么

回到那场活动海报。Steinberger划掉“workflows”、写下“loops”的那一横,为什么值得整个行业停下来想一想?

因为“workflows”属于上一个时代。那个时代,软件是人工编写的,流程是预设的,异常是例外。而“loops”属于正在到来的时代。这个时代,软件是智能体生成的,流程是动态生成的,异常是常态。

从工作流到循环,不是一个术语的更替。它是一种编程哲学的诞生。不是你告诉AI每一步做什么,而是你设计一个机制,让AI自己找到正确的路径。你的工作不再是写代码,而是设计循环、监控循环、优化循环。

那个被划掉的词,划掉的是一个时代的思维方式。而手写的那个词,写的是下一个时代的入场券。

循环能不能收敛,取决于有没有好的终止条件和评估机制。就像这场对话能否真正改变行业的认知,取决于有多少人理解了“循环”和“工作流”之间那一道被划掉的横线,到底意味着什么。

作品声明:内容由AI生成