AI安全竞赛下半场:不是模型不够快,是修代码的人不够用了

2026.06.23 20:21
OpenAI发布GPT-5.5-Cyber安全专用模型,在CyberGym(85.6%)、ExploitGym(39.5%)和SEC-bench Pro(69.8%)三项基准测试中全面领先Anthropic Mythos 5。但真正值得关注的不是分数,而是两家公司同时承认的同一个判断:网络安全瓶颈已从『找不到漏洞』变成了『修不过来』。当530个高危漏洞中仅有75个被打上补丁,AI安全竞赛的下半场正式开启——比的不是谁能发现更多漏洞,而是谁能在漏洞被利用之前让代码不再脆弱。

85.6% 对 83.8%。这是 GPT-5.5-Cyber 和 Anthropic Mythos 5 在最新 CyberGym 基准测试上的得分差距。OpenAI 本周一宣布,其专为网络安全打造的 GPT-5.5-Cyber 模型在 CyberGym、ExploitGym(39.5%)和 SEC-bench Pro(69.8%)三项基准上均刷新纪录。在 ExploitGym 上,这款安全专用模型比通用版 GPT-5.5 高出超过 13 个百分点。

但比这份成绩单更值得追问的,是两家公司在同一时间窗口内喊出的同一个判断:网络安全的真正瓶颈,已经从「找不到漏洞」变成了「修不过来」。

Anthropic 在一个月前就发出了警告——Claude Mythos Preview 发现漏洞的速度已超过人类安全团队的处理能力。OpenAI 现在表达了完全一致的立场。当两大 AI 巨头在基准测试上针锋相对,却在底层判断上达成共识,这件事本身就是行业最大的信号。

从「找不到」到「找不完」:数字管窥质变

Anthropic 的 Project Glasswing 启动一个月后,Mythos Preview 在约 50 家合作伙伴的系统关键软件中发现了超过 10,000 个高危或严重级别漏洞。Cloudflare 一家标记了 2,000 个,其中 400 个被确认为高危。Mozilla 在 Firefox 150 中发现并修复了 271 个漏洞——是此前捕获量的十倍以上。在开源世界,Mythos Preview 扫描了 1,000 多个项目,发现 23,019 个潜在漏洞,其中 6,202 个被评估为高危或严重级别。第三方验证的 1,752 个高危发现中,90.6% 是真阳性。英国 AI 安全研究所的评估更为直接:Mythos Preview 是有史以来第一个完全通过其内部网络靶场全部模拟攻击阶段的 AI 模型。

OpenAI 这边同样惊人。Codex Security 自 3 月发布以来已扫描超过 3,000 万次代码提交,覆盖 3 万多个代码仓库。超过 50 万个发现被自动标记为已修复,另有 7 万个经人工审核确认。

这些数字指向同一个结论:AI 做漏洞发现的能力,已经超过了行业消化漏洞的速度。 这不是渐进式改进——这是质变。

「死亡漏斗」:530 个已报,75 个已修

Anthropic 在 Glasswing 的首次正式更新中,披露了一个令人不安的漏斗。截至 5 月 22 日,Mythos Preview 发现的 530 个已通报维护者的高危漏洞中,仅有 75 个被打上了补丁。另有 827 个已确认的漏洞仍在等待披露——因为维护者没有能力同时处理这么多。部分开源维护者甚至主动要求 Anthropic 放慢披露速度。

这不是孤立个案。Palo Alto Networks 在最新版本中发布的补丁量达到平时的五倍。微软在 Patch Tuesday 公告中承认,新补丁数量「将在相当一段时间内继续增长」。Oracle 也表示漏洞发现和修复速度比以往快了数倍——但缺口依然在扩大。平均修复一个高危漏洞需要两周时间,而 AI 发现漏洞的速度几乎不受约束。

Anthropic 的警告直白而冷酷:「具备类似网络安全技能的模型很快就会广泛可用。有些很可能已经可用。」

两条路线,同一个方向

面对同一个瓶颈,OpenAI 和 Anthropic 选择了截然不同的路径。

OpenAI:全链路平台化

新版 Codex Security 插件覆盖了从威胁建模、代码分析、攻击路径追踪到补丁生成和验证的完整闭环。通过 SARIF 文件和 CodeQL 查询,结果可直接输出到现有漏洞管理系统。批量模式下还可对存量发现进行分诊和自动补丁生成。OpenAI 强调每一步仍需要人工签字确认。

与此同时,OpenAI 启动了 Daybreak Cyber Partner Program,集结了超过 25 家安全厂商——Cisco、CrowdStrike、Cloudflare、Palo Alto Networks、IBM、Fortinet、Wiz、SentinelOne、Darktrace、Palantir,再到 Accenture、PwC、KPMG 等咨询巨头。在政府侧已与澳大利亚、加拿大、法国、德国、日本、韩国、欧盟 ENISA 以及英国建立合作。在美国,OpenAI 正落实最新 AI 安全行政令,计划与关键基础设施运营商直接协作。

针对开源生态,OpenAI 与 Trail of Bits、HackerOne 联合发起了 Patch the Planet。超过 30 个开源项目已加入,包括 cURL、Go、Python、Sigstore 和 pyca/cryptography。Trail of Bits 工程师在首批五天冲刺中全职投入 19 个项目,提交了 64 个 Pull Request、51 个 Issue,其中 37 个补丁已合并——不是空投漏洞报告,而是带着修复代码去的。

Anthropic:深度研究驱动的防御网络

Anthropic 走的是「深度研究+受控合作」路线。独立安全平台 XBOW 评价 Mythos 具备「前所未有的精确度」。6 月初,Anthropic 将 Glasswing 扩大到约 150 个组织、覆盖超过 15 个国家,同时推出 Claude Security 企业版公测。每一步都伴随严格的访问控制。

一个细节值得注意:在一家合作银行,Mythos Preview 帮助拦截了一笔超过 150 万美元的欺诈电汇——这是实时威胁干预,而非漏洞发现。

两条路线的共同特征是:都严格限制模型访问权限。 GPT-5.5-Cyber 只对经过验证的防御者开放。OpenAI 明确表示大多数用户应使用 GPT-5.5 配合 Trusted Access for Cyber 和 Codex Security。Anthropic 则通过 Constitutional Classifiers 在模型层面拦阻滥用请求。这种「能力越强,权限越紧」的悖论,就是 2026 年 AI 安全行业最鲜明的特征。

基准测试背后:谁在定义「更好」?

OpenAI 公布的基准数据值得审视:CyberGym 上 GPT-5.5-Cyber 85.6%,Mythos 5 83.8%;ExploitGym 上 GPT-5.5-Cyber 39.5%(通用版 25.95%);SEC-bench Pro 上 69.8%(通用版 63.1%)。Mythos 5 在 ExploitGym 上的精确数据尚未公布——这种信息不对称提醒我们,「全面领先」需要放在更完整的图景中审视。

但更根本的问题正在浮现:当 AI 发现漏洞的速度超过人类修补能力,基准测试中谁高 1.8 个百分点还有那么重要吗?

AI 安全的下半场:从「发现者」到「修复者」

转型对安全行业的冲击正在三个层面同步发生。

其一,安全工程师的角色正在被重新定义。 当 AI 能在几分钟内扫描整个代码库并生成带攻击路径分析的报告时,安全工程师的价值将转移到判断 AI 建议是否合理、在复杂上下文中做出权衡决策——从执行者变成审核者。

其二,「开发者安全」的门槛在急剧降低。 如果 Codex Security 让每个开发者身边都有一个安全工程师,安全将从「阶段性审计」变成「代码编写中的实时伴行」。问题不再是「上线前查过没有」,而是「写每一行代码时 AI 有没有拦下来」。

其三,开源维护者压力已逼近临界点。 Patch the Planet 能否规模化,将决定开源软件在 AI 时代的安全底座。Trail of Bits 带着补丁而非漏洞报告下场的做法,或许将成为新标准——维护者已没有余力再应付更多的「发现」了。

最后,一个更大的问题悬而未决:当防御者能用 AI 修漏洞,攻击者能用 AI 做什么? GPT-5.5-Cyber 在 ExploitGym 上的巨大跃升是一句无声的提醒。Anthropic 的 Nicholas Carlini 透露过:他们最初的目标不是做一款找漏洞的模型,而是一款会写代码的模型——安全能力只是副产品。这意味着任何达到前沿水平的模型都天然具备双重用途。

AI 安全竞赛的下半场已经开始了。上半场比的是谁能更快地发现漏洞;下半场比的,是谁能在漏洞被利用之前让代码不再脆弱。OpenAI 和 Anthropic 在基准测试上针锋相对,在合作伙伴名单上互不相让——但在面对这个核心命题时,他们说出了完全一样的话。

不是模型不够快了。是修代码的人不够用了。

作品声明:内容由AI生成