文 | 超前实验室,作者|青苹吹果
不再依赖Claude算长大吗?算Cursor熹妃回宫!
最近,Cursor正式发布了他们迄今为止最强的自研模型——Composer 2.5,上演AI编程圈的“绝地反杀”,价格是友商们的十分之一,性能硬刚行业顶流Claude和GPT。
曾经被Claude Code按在地上摩擦的Cursor,掀桌了!
马斯克也亲自下场转发,吆喝大家:“都去试试!”
![]()
这波操作,简直戏剧效果拉满。
为啥这么说?因为就在不久之前,Cursor的日子过得那叫一个“憋屈”。
曾经的江湖大哥,被Claude Code这个后起之秀追着打,甚至陷入了“一边被竞争对手抢用户,一边还要给竞争对手付钱”的魔幻循环。
3月份Composer 2发布时,还因为隐瞒了Kimi的底座被喷成了筛子。
和英伟达的融资谈得好好的,就要敲定的时候,马斯克横插一脚,宣布以600亿美收购Cursor的独家期权,Cursor直接沦为SpaceX的“打工人”。
都说欲扬要先抑,Cursor咬牙撑过了这段“甘露寺”时期,如今终于带着Composer 2.5杀回来了!
今天咱们拆一拆,Cursor这套“自研反击战”到底是王者归来,还是强行挽尊?又给AI编程这个赛道划下了什么道?
曾经的“老大哥”被后浪拍在沙滩上
回想2025年初,Cursor那可是AI编程圈的顶流,谁用了都得竖个大拇指。
那种“智能完形填空”般的爽感,让无数程序员觉得生产力原地飞升。
可惜,天道好轮回,苍天饶过谁~
这才过去不到一年,江湖地位就松动了。
搅局的,就是Anthropic的亲儿子,Claude Code。
这玩意儿有多猛呢?这里有几组数据:
2025年11月Claude Code的年化收入冲破10亿美元,到2026年2月直接蹦到了25亿美元。半年多挣25亿美金,这在商业软件史上都是极其罕见的闪电速度。
全球财富500强,一半以上都为TA掏了钱,连摩根大通和高盛都在用自己的方式试水这类工具。
更吓人的是,据说全球GitHub上大约4%的代码提交,都有Claude Code的身影。
Anthropic自己还敢放话:年底要超20%!
这意味着什么?意味着Claude Code根本不是个玩具,它就像水一样,无声无息地渗透进了真实世界的每一行代码里。
那这跟Cursor有啥关系?
关系大了!当年Cursor能火,靠的就是“站在巨人的肩膀上”——Claude的API。
这就好像Cursor开着Claude牌发动机,跑得飞快。
结果一回头,Claude自己造了辆Claude Code牌整车,还比你便宜、比你猛,直接来抢你客户了!
上游供应商一夜之间变成了直接竞争对手。换谁谁不难受?
更难受的是,Cursor想对标Claude Code,还得继续给Anthropic付API调用费。
每天一边被对手抢饭碗,一边还得乖乖给对手交“保护费”。
也难怪Cursor要咬牙搞自研了。与其把命门交到别人手里,不如自己下场搏一把。
Composer 2.5,就是在这样一个“不得不拼”的背景下诞生的。
重生归来后,用硬核数据说话
不吹不黑,咱们直接看跑分。
Cursor在官方公告里把Composer 2.5和市面上的几款顶尖模型做了横向对比。
![]()
我这里挑最关键的几个来讲:
Terminal-Bench 2.0(终端复杂操作测试):Composer 2.5拿下了69.3%,Claude Opus4.7成绩是69.4%。四舍五入就是打平。
SWE-Bench Multilingual(跨语言工程能力测试):Composer 2.5交出了79.8%,Claude Opus 4.7是80.5%。差0.7%,基本一个水平线。
Cursor自己的高难度任务集CursorBench v3.1:Composer 2.5得分63.2%,而GPT-5.5同档次跑的是59.2%。嘿,反超4个点!
说白了,在几个关键的技术能力维度上,Composer2.5已经稳稳挤进了全球AI编程模型的第一梯队,和Claude Opus4.7、GPT-5.5这些“天花板玩家”肩并肩了。
但真正让我惊讶的其实还不是这几个得分,而是价格。
Cursor发了一张灵魂曲线图:横轴是“一次任务的成本”,纵轴是“能力得分”。
![]()
Claude Opus4.7每跑一次复杂任务大约要烧掉7到11美元;GPT-5.5的默认档也要花大概2美元上下。
而Composer 2.5呢?
基础版API定价是每百万输入Token 0.5美元,每百万输出Token 2.5美元。
平均下来,每次任务不到1美元。
这边Claude Opus 4.7完成任务要掏7美元甚至11美元的时候,Cursor这边可能只需要1美元。
相当于开豪车,一脚油门一块钱;现在你花共享单车的钱,差不多也能体验到豪车的速度和底盘质感。
这已经不是性价比了,这是降维打击龙。
一个天天跑Agent的开发者,用Claude一天账单可能三四十美元;换Composer 2.5,三五美元搞定。对于团队和企业来说,这账算得非常清楚。
底座是Kimi,但“灵魂”是Cursor
这个时候可能就有人要说了:“跑分再高,价格再低,不还是套壳Kimi?”
的确,用了人家Kimi的底座确实是不争的事实,而且这次Cursor学聪明了,直接“自曝家底”。
公告里写得明明白白:底层确实用了月之暗面的Kimi K2.5开源模型做底座。
但重点在后面:Kimi的基础训练只占7.5%+7.5%,剩下的85%。
这相当于在Kimi那里买了个“毛坯房”,但“精装修、全屋智能、家电家具”,全是Cursor自己一砖一瓦搞定的!
![]()
技术上,Cursor这次主要做了三个层面的深入改造:
第一,边干活边挨骂,长记性了。
以前的训练是“做完题再打分”,模型错了也不知道错在哪步。而Cursor现在是,如果在推理过程中某一步突然出现了不存在的工具调用,系统立刻跳出来,当场纠正。
它知道在哪个步骤出了错,并且针对性地修正,而不是从头再来一遍。这种“边做边反馈”的训练方式,专治长任务“脑子断片”。
![]()
第二,自己给自己出题,出变态题。
怕模型刷题库刷成“高分低能”,于是Cursor就自己造题。
有个骚操作叫“功能删除”,从正常代码库里故意删掉一个功能,让模型想办法恢复,再自动跑测试验证。结果模型被逼急了,甚至学会了逆向分析Python类型检查缓存,甚至反编译Java字节码来重建被删的API。
虽然有点“野”,但这智商,绝了。
![]()
第三,底层优化,快到飞起。
在底层工程上,Cursor采用了分布式Muon优化器和双网格HSDP架构,在万亿参数级别的模型上做到优化器每一步只需要0.2秒。在优化器计算与网络通信之间实现了异步重叠处理,大幅提升了训练效率。
看不懂没关系,你只需要知道,这背后是一堆工程大佬在疯狂“榨干”算力。
Cursor与马斯克的“爱恨情仇”
技术和产品说完了,咱来吃点商业瓜。
Composer 2.5还没发布,马斯克和Cursor之间就已经上演了一出“硅谷甄嬛传”。
就在今年4月22日,SpaceX突然甩出一张王炸:拿下Cursor 600亿美元的收购期权。条款贼霸道,要么年底以这个价买下Cursor,要么你赔我100亿美元“合作费”。
更损的是,时间点刚好卡在Cursor谈着一轮估值500亿、由a16z和英伟达领投的融资。马斯克这一脚,直接给人家截胡了。
这哪里是合作合同,这分明是霸王硬上弓啊。
谁曾想呢,到了Composer 2.5发布这天,马斯克的态度竟一百八十度大转弯,亲自转发推文站台。这变脸也太快了。
其实扒开来看,就能清楚其中的逻辑。
马斯克旗下xAI的Colossus 2超级计算集群有相当于百万张H100的算力,这是全球顶级的AI训练基础设施之一。
但他缺一个能把这些算力高效转化成变成“印钞机”的应用出口。
Cursor有什么?有百万级日活开发者、20亿+美元年收入、半数财富500强客户。
一个有算力没场景,一个有场景缺算力,俩人一拍即合,各取所需。
但话说回来,这也意味着Cursor从一个坑跳进了另一个可能更深的坑,之前大命门捏在Anthropic手里,现在的命门捏在马斯克这个不好伺候的“疯王”手里。
这笔账,是赚是赔,日后自会见分晓。
写在最后
从依赖Claude,到被Claude Code围剿,再到咬牙自研、跟马斯克“联姻”,Cursor这几年的经历,要是浓缩成一部硅谷创业剧,那是全程无尿点。
但说句实在话,Cursor当下的处境也挺拧巴的。
一边要跟Claude、GitHub Copilot抢开发者,一边还要从零到一养一个自研模型。
两条战线同时开打,压力山大。
但Composer 2.5的发布,至少证明了一件事:AI编程工具的性价比天花板,被狠狠地往上推了一大截。
未来的看点有两个:
一是Composer 2.5接下来几周在真实开发场景里的表现会不会“翻车”?
二是Cursor和xAI下一代“十倍算力”的合训模型,到底能整出什么花活?
不管最终结果如何,Cursor走通的那条路——用廉价、高效、轻量化的模型来服务具体的IDE场景,已经给整个行业投下了一颗深水炸弹。
涟漪扩散开来,未必只是一个人或一家公司的悲喜剧,而是整个AI编程走向下一个节点的历程。
这场仗或许会比我们想象的,要热闹得多。







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论