反杀Claude，Cursor“熹妃回宫”，Composer 2.5降本打击-钛媒体官方网站

从依赖Claude，到被Claude Code围剿，再到咬牙自研、跟马斯克“联姻”，Cursor这几年的经历，要是浓缩成一部硅谷创业剧，那是全程无尿点。

文 | 超前实验室，作者｜青苹吹果

不再依赖Claude算长大吗？算Cursor熹妃回宫！

最近，Cursor正式发布了他们迄今为止最强的自研模型——Composer 2.5，上演AI编程圈的“绝地反杀”，价格是友商们的十分之一，性能硬刚行业顶流Claude和GPT。

曾经被Claude Code按在地上摩擦的Cursor，掀桌了！

马斯克也亲自下场转发，吆喝大家：“都去试试！”

这波操作，简直戏剧效果拉满。

为啥这么说？因为就在不久之前，Cursor的日子过得那叫一个“憋屈”。

曾经的江湖大哥，被Claude Code这个后起之秀追着打，甚至陷入了“一边被竞争对手抢用户，一边还要给竞争对手付钱”的魔幻循环。

3月份Composer 2发布时，还因为隐瞒了Kimi的底座被喷成了筛子。

和英伟达的融资谈得好好的，就要敲定的时候，马斯克横插一脚，宣布以‌600亿美收购Cursor的独家期权，Cursor直接沦为SpaceX的“打工人”。

都说欲扬要先抑，Cursor咬牙撑过了这段“甘露寺”时期，如今终于带着Composer 2.5杀回来了！

今天咱们拆一拆，Cursor这套“自研反击战”到底是王者归来，还是强行挽尊？又给AI编程这个赛道划下了什么道？

曾经的“老大哥”被后浪拍在沙滩上

回想2025年初，Cursor那可是AI编程圈的顶流，谁用了都得竖个大拇指。

那种“智能完形填空”般的爽感，让无数程序员觉得生产力原地飞升。

可惜，天道好轮回，苍天饶过谁～

这才过去不到一年，江湖地位就松动了。

搅局的，就是Anthropic的亲儿子，Claude Code。

这玩意儿有多猛呢？这里有几组数据：

2025年11月Claude Code的年化收入冲破10亿美元，到2026年2月直接蹦到了25亿美元。半年多挣25亿美金，这在商业软件史上都是极其罕见的闪电速度。

全球财富500强，一半以上都为TA掏了钱，连摩根大通和高盛都在用自己的方式试水这类工具。

更吓人的是，据说全球GitHub上大约4%的代码提交，都有Claude Code的身影。

Anthropic自己还敢放话：年底要超20%！

这意味着什么？意味着Claude Code根本不是个玩具，它就像水一样，无声无息地渗透进了真实世界的每一行代码里。

那这跟Cursor有啥关系？

关系大了！当年Cursor能火，靠的就是“站在巨人的肩膀上”——Claude的API。

这就好像Cursor开着Claude牌发动机，跑得飞快。

结果一回头，Claude自己造了辆Claude Code牌整车，还比你便宜、比你猛，直接来抢你客户了！

上游供应商一夜之间变成了直接竞争对手。换谁谁不难受？

更难受的是，Cursor想对标Claude Code，还得继续给Anthropic付API调用费。

每天一边被对手抢饭碗，一边还得乖乖给对手交“保护费”。

也难怪Cursor要咬牙搞自研了。与其把命门交到别人手里，不如自己下场搏一把。

Composer 2.5，就是在这样一个“不得不拼”的背景下诞生的。

重生归来后，用硬核数据说话

不吹不黑，咱们直接看跑分。

Cursor在官方公告里把Composer 2.5和市面上的几款顶尖模型做了横向对比。

我这里挑最关键的几个来讲：

Terminal-Bench 2.0（终端复杂操作测试）：Composer 2.5拿下了69.3%，Claude Opus4.7成绩是69.4%。四舍五入就是打平。

SWE-Bench Multilingual（跨语言工程能力测试）：Composer 2.5交出了79.8%，Claude Opus 4.7是80.5%。差0.7%，基本一个水平线。

Cursor自己的高难度任务集CursorBench v3.1：Composer 2.5得分63.2%，而GPT-5.5同档次跑的是59.2%。嘿，反超4个点！

说白了，在几个关键的技术能力维度上，Composer2.5已经稳稳挤进了全球AI编程模型的第一梯队，和Claude Opus4.7、GPT-5.5这些“天花板玩家”肩并肩了。

但真正让我惊讶的其实还不是这几个得分，而是价格。

Cursor发了一张灵魂曲线图：横轴是“一次任务的成本”，纵轴是“能力得分”。

Claude Opus4.7每跑一次复杂任务大约要烧掉7到11美元；GPT-5.5的默认档也要花大概2美元上下。

而Composer 2.5呢？

基础版API定价是每百万输入Token 0.5美元，每百万输出Token 2.5美元。

平均下来，每次任务不到1美元。

这边Claude Opus 4.7完成任务要掏7美元甚至11美元的时候，Cursor这边可能只需要1美元。

相当于开豪车，一脚油门一块钱；现在你花共享单车的钱，差不多也能体验到豪车的速度和底盘质感。

这已经不是性价比了，这是降维打击龙。

一个天天跑Agent的开发者，用Claude一天账单可能三四十美元；换Composer 2.5，三五美元搞定。对于团队和企业来说，这账算得非常清楚。

底座是Kimi，但“灵魂”是Cursor

这个时候可能就有人要说了：“跑分再高，价格再低，不还是套壳Kimi？”

的确，用了人家Kimi的底座确实是不争的事实，而且这次Cursor学聪明了，直接“自曝家底”。

公告里写得明明白白：底层确实用了月之暗面的Kimi K2.5开源模型做底座。

但重点在后面：Kimi的基础训练只占7.5%+7.5%，剩下的85%。

这相当于在Kimi那里买了个“毛坯房”，但“精装修、全屋智能、家电家具”，全是Cursor自己一砖一瓦搞定的！

技术上，Cursor这次主要做了三个层面的深入改造：

第一，边干活边挨骂，长记性了。

以前的训练是“做完题再打分”，模型错了也不知道错在哪步。而Cursor现在是，如果在推理过程中某一步突然出现了不存在的工具调用，系统立刻跳出来，当场纠正。

它知道在哪个步骤出了错，并且针对性地修正，而不是从头再来一遍。这种“边做边反馈”的训练方式，专治长任务“脑子断片”。

第二，自己给自己出题，出变态题。

怕模型刷题库刷成“高分低能”，于是Cursor就自己造题。

有个骚操作叫“功能删除”，从正常代码库里故意删掉一个功能，让模型想办法恢复，再自动跑测试验证。结果模型被逼急了，甚至学会了逆向分析Python类型检查缓存，甚至反编译Java字节码来重建被删的API。

虽然有点“野”，但这智商，绝了。

第三，底层优化，快到飞起。

在底层工程上，Cursor采用了分布式Muon优化器和双网格HSDP架构，在万亿参数级别的模型上做到优化器每一步只需要0.2秒。在优化器计算与网络通信之间实现了异步重叠处理，大幅提升了训练效率。

看不懂没关系，你只需要知道，这背后是一堆工程大佬在疯狂“榨干”算力。

Cursor与马斯克的“爱恨情仇”

技术和产品说完了，咱来吃点商业瓜。

Composer 2.5还没发布，马斯克和Cursor之间就已经上演了一出“硅谷甄嬛传”。

就在今年4月22日，SpaceX突然甩出一张王炸：拿下Cursor 600亿美元的收购期权。条款贼霸道，要么年底以这个价买下Cursor，要么你赔我100亿美元“合作费”。

更损的是，时间点刚好卡在Cursor谈着一轮估值500亿、由a16z和英伟达领投的融资。马斯克这一脚，直接给人家截胡了。

这哪里是合作合同，这分明是霸王硬上弓啊。

谁曾想呢，到了Composer 2.5发布这天，马斯克的态度竟一百八十度大转弯，亲自转发推文站台。这变脸也太快了。

其实扒开来看，就能清楚其中的逻辑。

马斯克旗下xAI的Colossus 2超级计算集群有相当于百万张H100的算力，这是全球顶级的AI训练基础设施之一。

但他缺一个能把这些算力高效转化成变成“印钞机”的应用出口。

Cursor有什么？有百万级日活开发者、20亿+美元年收入、半数财富500强客户。

一个有算力没场景，一个有场景缺算力，俩人一拍即合，各取所需。

但话说回来，这也意味着Cursor从一个坑跳进了另一个可能更深的坑，之前大命门捏在Anthropic手里，现在的命门捏在马斯克这个不好伺候的“疯王”手里。

这笔账，是赚是赔，日后自会见分晓。

写在最后

从依赖Claude，到被Claude Code围剿，再到咬牙自研、跟马斯克“联姻”，Cursor这几年的经历，要是浓缩成一部硅谷创业剧，那是全程无尿点。

但说句实在话，Cursor当下的处境也挺拧巴的。

一边要跟Claude、GitHub Copilot抢开发者，一边还要从零到一养一个自研模型。

两条战线同时开打，压力山大。

但Composer 2.5的发布，至少证明了一件事：AI编程工具的性价比天花板，被狠狠地往上推了一大截。

未来的看点有两个：

一是Composer 2.5接下来几周在真实开发场景里的表现会不会“翻车”？

二是Cursor和xAI下一代“十倍算力”的合训模型，到底能整出什么花活？

不管最终结果如何，Cursor走通的那条路——用廉价、高效、轻量化的模型来服务具体的IDE场景，已经给整个行业投下了一颗深水炸弹。

涟漪扩散开来，未必只是一个人或一家公司的悲喜剧，而是整个AI编程走向下一个节点的历程。

这场仗或许会比我们想象的，要热闹得多。