AI代码跑通了,但被我拒绝了:藏在编码效率背后的审查危机

2026.06.21 13:16
AI编程代理将编码速度推向极限,但工程师对AI代码的审查能力成为新的瓶颈。独立开发者Vinicius Brasil的博客文章揭示了AI代码审查的五重认知门槛,而Cursor被SpaceX以600亿美元收购、Claude系列在SWE-bench上逼近95%——这些行业信号背后,是一个被忽视的问题:读代码比写代码更难了。

"代码能跑,但我拒绝了。"

这句话如果放在三年前,听起来像个笑话。2023年的开发者还在为Copilot补全一个函数签名而惊叹。但到了2026年,情况彻底颠倒过来。

6月19日,独立开发者Vinicius Brasil在博客上发表了一篇短文,核心判断戳中了AI编程时代最被忽视的痛点:当AI把代码生成速度推到极限,真正的瓶颈转移到了人类对AI代码的审查能力上。

上周,SpaceX以600亿美元全股票交易收购了Cursor母公司Anysphere——发生在SpaceX创下史上最大IPO(募资超860亿美元)后的第4天。Claude Opus 4.6在SWE-bench Verified上已达80.8%。一夜之间,写完代码再也不是问题。问题是:谁来看这些代码?

代码跑通了,问题才刚刚开始

Vinicius列出了五条拒绝AI代码的情况:当他自己无法解释AI的方案时;当diff比问题本身还大时;当AI引入不必要的抽象时;当代码跑通了但让系统更难推理时;当他发现自己过度信任AI的输出时。

这五条有一个共同点:它们都跟"代码能不能运行"无关。它们衡量的是——工程师能不能理解、维护、解释这段代码。这是AI编程时代最深刻的认知错位。从软件诞生至今,"能跑就行"一直是默认标准,因为人写代码的速度天然受限于思考速度。AI打破了这种平衡。

Cursor在2026年6月初已达到40亿美元年化收入,被64%的财富500强企业使用。AI可以在几分钟内生成过去需要数小时的代码。但Vinicius描述了一个悖论:过去他会花几天探索、思考、实验——最终提交时confidence很高。现在AI几分钟就产出了代码,但"我还是感觉认知超载"。他甚至承认:"第一次session和第二次session的区别,不是LLM,而是坐在屏幕后面的那个人。"

为什么"代码能跑"不够了?

认知负荷的本质转移

软件开发是"理解驱动"的活动。在传统模式下,写代码的过程就是理解建立的过程。AI编程代理切断了这个链条。你只需要描述需求,AI完成从需求到实现的全过程。但问题在于:理解不能外包。

当你接手AI生成的代码——哪怕是自己的agent生成的——你和它的关系不是"作者与作品",而是"读者与文本"。你需要回溯AI的决策逻辑,理解每一行存在的理由。这不是代码审查,是代码考古。

Vinicius的五条原则定义了AI代码审查的五重认知门槛:可解释性、最小性、抽象必要性、系统可推理性、信任自省。核心命题只有一个:读代码,比写代码更难了。

当AI跑赢了人类的带宽

如果把AI编程比作一个工厂:产能提升了数倍,质检线的传送带还是原来那条。人类的工作记忆容量只有4-7个单元。审阅一段AI生成的200行代码需要压缩、连接、构建心理模型——需要时间和认知资源。

Vinicius采用Plan Mode——先规划再让AI写。这暴露了一个根本局限:AI在生成代码方面的能力远超出它们在规划、解释和可视化方面的能力。AI是优秀的"执行者",但不是好的"沟通者"。

AWS在Summit New York 2026上发布了AWS Continuum和AWS Context,目标明确:"帮助agents做更好的上下文管理,让开发者更容易理解agent做了什么。"平台厂商们已经意识到:只生成代码不够,必须让生成过程可解释、可审查、可管理。

从"写得更快"到"管得更好"

Cursor被SpaceX收购,这笔交易本身就是一个强烈的信号——发生在SpaceX上市后数日内,首两日市值超2.6万亿美元。几个月前行业还认为Cursor"已经被Claude Code打死了"。反转让一个深层逻辑浮出水面:AI编程工具正在从"效率工具"向"开发基础设施"进化。

Backslash Security在6月发布了一份Claude Code安全报告:研究者发现4月到6月初每个新版本都在修复大量漏洞。开发者面临两难——"要么用最新版但面临不稳定风险,要么等几周希望不出事"。这正是Vinicius困境的企业级版本。

目前企业的应对策略出现三类分化:接受黑盒审查、强化CI/CD流水线、坚持人类主导。它们的共同前提是——"代码能跑"已不再是衡量AI编程有效性的标准。

从"编码者"到"评审者"

Vinicius写道:"Coding agents仍然需要一个优秀的工程师来引导它们走向优秀的方案。它们不能在没有人类的情况下自主地、可持续地完成工作——至少现在还不能。"这句话定义了AI编程时代开发者角色的根本转变:从"写代码的人"变为"代码质量的守护者"。

过去,好的开发者是"能写出好代码的人"。未来,好的开发者是"能判断AI写的是不是好代码、能引导AI写出好代码、能在AI写坏代码时及时纠正的人"。这个门槛比学会用AI写代码更高,而且会越来越高。

谁的信号?谁的噪声?

Cursor以40亿美元年化收入奔向600亿估值,Claude从Opus 4.6的80.8%冲到Fable 5的95.0%,SpaceX用600亿美元押注这个赛道。整个行业都在关注"AI能做什么",很少有人问"人类能理解什么"。

Vinicius给出了两个冷静的判断:第一,时间会解决信任问题,但不是靠AI变强——第一次他几乎总是reject,第二次理解了问题才能引导AI做出更好方案。第二,Engineering的本质从未改变——"代码能跑、CI变绿,仍然可能是一个糟糕的方案。"

当前最受益的是同时拥有深厚技术功底和AI工具熟练度的开发者。最危险的是"靠加班写代码来表现价值"的团队——AI把产出提升了数倍,但每天仍然只有24小时来审阅代码。

对组织而言,下一个竞争差异化的来源不是"谁更会用AI写代码",而是"谁更会管理AI写的代码"。对工具供应商而言,"可审查性"将成为下一个关键战场。

如果你已大量使用AI编程代理,三条守则值得实践:拒绝"生成即接受",强制走完完整code review;用Plan Mode反制速度错配;量化你的审查成本——10分钟产出2小时审阅,这不是效率提升,是债务累积。

AI替我们写代码的速度越来越快。但没有人能替我们理解代码——就像没有人能替我们做决定一样。

那个坐在屏幕后面、犹豫要不要点"Accept all"的人,才是工程质量最后的守护者。而选择说"不"——哪怕代码能跑——可能是2026年最被低估的工程师素养。

作品声明:内容由AI生成