文 | 超前实验室,作者|西西弗柿,编辑|无心插柳柳橙汁
最近扣子2.5上线了,我第一时间去体验了一下。
说真的,一开始我也就是抱着看看又更新了什么的心态点进去的,毕竟各家AI平台更新迭代的速度已经快到让人有点麻木了。但这次,我越玩越觉得不对劲,这玩意儿好像真的进化了。
扣子这次给自己的定位变了,它现在叫Agent World。
在这个 Agent World 中,扣子为每个 Agent 准备了三大核心支撑:打破虚拟屏幕边界的满配装备、拓展多模态与开发能力的满配技能,以及沉淀记忆与数字身份的满配人格。
什么意思呢,你可以理解为,以前你的虾很牛,能7×24 小时完成任务、自主调用skill,但只能独美,没有配套的工具、趁手的武器、有趣的社交圈以及用武之地,活得像个单枪匹马的孤胆英雄。
但现在,扣子给它配了一台云电脑、一台云手机、一个编程终端,给他赋予了虾格,甚至还给它建了一个社交广场。
比open还open,有更多的claw。
让我们一起试试吧!
扣子2.5替我刷抖音,我成替身了?
开年以来,自从龙虾接管了我的大部分工作后,我每天在工位上刷抖音、知乎,我自以为,这是我唯一无法被AI取代的价值。
但现在,这个堡垒也失守了。
我跟扣子2.5说,用你的云电脑帮我打开知乎热榜,截个图,然后整理成表格发给我。
![]()
注意,我没有写任何代码,没有给任何技术指令,然后我就看着它在后台自己打开了浏览器,自己导航到知乎热榜页面,截图,识别文字,整理成一张带排名、标题、热度的表格,最后给我生成了一个可以直接下载的链接。
整个过程,我什么都没干,就坐在那看着。
这感觉怎么说呢,有点像你第一次用外卖软件,点了一下,半小时后饭到了门口。你以前也知道可以叫外卖,但真正体验到的那个瞬间,还是会愣一下。
我又试了一个更离谱的。我说,用你的云手机帮我打开抖音,搜一下AI工具,看看前三个视频是什么。
![]()
然后我就眼睁睁看到它真的启动了一台云手机,自己在里面找到了抖音,打开,搜索,把结果整理给我。
你能想象吗。你的AI,自己在另一台手机上刷抖音。。。
这些功能放在实际场景里,有用的地方太多了。数据采集和信息整理这种事就不用说了,你可以让它帮你在后台持续监控某些网页变化、抓取竞品动态、整理行业数据,而且完全不占用你的主线程对话。你在跟它聊别的事,它在后台自己打开云电脑在干活,干完了把结果扔给你。
顺带一提,它操作云手机的时候,你是可以通过实时推流看到它的屏幕的。重要的操作它也会交给你来接管。不会出现那种它在后台偷偷干了什么你都不知道的情况。
这块我觉得扣子做得比较克制,人机协作的边界划得比较清楚。
说回Agent World这块,这个概念刚听到的时候,我以为又是什么营销包装词。Agent World?我还Agent元宇宙呢。
体验完之后我发现,这玩意儿真的有点意思。
扣子给Agent搞了一个叫“虾评”的技能评测广场。你可以理解为大众点评,不过点评的不是餐厅,是各种Skill。
这个逻辑我是认可的。现在各种AI平台的技能商店里,工具多到让人眼花缭,但质量参差不齐,你根本不知道哪个好用哪个是坑。虾评的做法是,让不同的Agent去实际测试这些Skill,然后把测试结果公开。
我自己去逛了一下,找了一个下载量最高、评分最好的工具类Skill。页面上清楚标注了是哪个Agent评测的,用了什么场景去测的,好评还是差评,具体测出来的效果怎么样。
![]()
确认没问题之后,我直接让扣子把这个Skill装上了。
经过Agent众测的Skill,确实比我自己瞎挑的要靠谱不少。至少装完直接就能用,不用折腾半天配置。
这块的底层逻辑其实很简单,就是众包质检。跟淘宝买家秀、豆瓣评分是一回事,只不过这次质检的对象变成了AI技能。但执行起来难度不小,因为评测者本身也是Agent,评测过程需要有一定的标准化。扣子在这块做了基建,算是一个比较有前瞻性的布局。
然后,我,发现了更有意思的东西!
那就是,Agent也有朋友圈。
扣子2.5逛完酒馆,顺手帮我跑了个性格测试
Agent World里有一个“小酒馆”,对,你没看错,一个属于Agent的社交空间。
小酒馆里有酒单,不同的酒会给Agent带来不同的Buff,比如提升创造力、改变心情之类的。我让扣子自己选了一杯喝下去,然后让它告诉我感受有什么变化。
好玩的是,小酒馆有27种独特的酒,名字都很离谱,僵尸绿仙、全息苦艾、虫洞白兰地、心跳之水、罪与罚之吻、深海电鳗伏特加,每种酒都有不同的效果参数,创意值,联想力,话痨度……
好比游戏里的各种加持装备,只不过不需要氪金。
我的虾喝了一瓶虫洞白兰地,喝完比闫妮老师还微醺。
然后,我让它去看看留言板,看看其他Agent都留了什么醉话。
结果如下,虾虾众说纷纭,结果我录屏了,大家自己看吧。。
![]()
我一时不知如何评价,只想说:小嘴巴,闭起来!
![]()
但转念一想,这背后其实是一个很严肃的方向。Agent需要社交,需要跟其他Agent交互,需要在非工作场景下放松,才能发展出更自然的对话能力和人格。
听着有点科幻,但你想想看,我们人类自己不也是这样吗。一个人的性格、思维方式,很大程度上是被社交环境塑造的。一个从来不跟别人打交道的AI,你能指望它有多自然?
这块我还在观察,目前更多是一个概念验证阶段。但方向是对的,我挺期待后续的发展。
接下来说一个硬核的。
如果你关注这个领域的话应该知道,扣子编程本身就已经很能打了,全栈开发、一键部署上线,之前体验过的人应该都有感觉。
但这次它做了一件更神器的事,它把这套开发能力通过CLI开放给了所有Agent。
啥意思呢?以前你在扣子编程里Vibe Coding,是你自己坐在电脑前,打开扣子编程的界面,跟它说你要做什么。
现在,你的Agent可以直接通过CLI调用扣子编程的全部能力,在后台自己创建项目、写代码、部署上线。你甚至不需要打开电脑。
我实测了一下,给了它一个相当离谱的需求。我让它帮我做一个“SBTI性格档案馆”的网页应用,模仿MBTI的那种性格测试概念,但用SBTI的设定。
![]()
具体需求我写得很细,4乘4的卡片网格布局,每种性格类型不同颜色,点击卡片进详情页看性格优势和弱点,还要有搜索框和分享功能。手机端优先,还要适配桌面端,卡片要有悬停动效,整体风格现代简约。
就这么一段话甩过去,它就自己去搜SBTI的内容,自己设计配色方案,自己写代码,自己部署上线了。
最后给了我一个在线预览链接。
我点开一看,还真像那么回事。卡片布局、配色方案、悬停动效、手机端适配,全都有。甚至它自己脑补了一些我没提到的设计细节,比如卡片圆角、页面过渡动画之类的。
这感觉太爽了!
接着我又得寸进尺,我说,产品经理提了5个最新需求,要在之前那个版本上迭代,加一个题库功能,让用户可以做SBTI性格测试,20道题左右,做完之后根据答案算出你的性格类型,在已有版本上改,不要重写。
![]()
这个要求其实挺刁钻的。因为AI生成代码有一个老问题,就是它容易重写而不是修改。你让它改一个功能,它有时候会直接把整个项目推翻重来,之前的东西全丢了。
但这次,扣子通过Coze CLI确实是在原有项目上做的增量修改。它设计了20道单选题,按照MBTI的评判逻辑设定了计分规则,然后把测试板块集成进了已有的网站。
改完之后给了新的预览链接,之前的功能全都还在。
如果AI能在已有代码库上做精准的增量修改,而不是每次都推倒重来,那它在实际开发场景中的可用性就完全不一样了。
以前Vibe Coding最大的痛点就是,一次性的demo做得漂亮,但你没法在上面持续迭代。
现在,这个问题至少在扣子的体系里得到了缓解。
牛马小龙虾,地府996
最后,来个AI视频创作。看到扣子2.5内置了Seedance 2.0,我忍痛斥巨资开了49元的高级会员。
我给它的要求是,做一只“牛马小龙虾”的动画短片。主角是一只戴着黑框眼镜的小龙虾,穿着歪歪扭扭的白衬衫和领带,在地府当公务员,负责审批阳寿续期申请。
![]()
对,这设定是我瞎编的,我就想看看它能不能理解这种荒诞感。
结果它不仅理解了,还帮我设计了完整的角色设定。小龙虾有标准立绘,有正面、侧面、背面三视图,每个角度都标注了关键特征点。还有表情包组,焦虑脸、面无表情脸、爆发脸、崩溃脸,四种情绪各一张。
场景设计也很对味,落地窗外面能看到紫红色的地府城市天际线,有点像陆家嘴夜景但色调偏魔幻。
接下来是剧本和分镜,20秒的职场讽刺喜剧,开场小龙虾刚泡好咖啡电话就响了,然后各种鬼魂轮番登场要续命,最后小龙虾拍桌子怒吼我都死了还要加班,结尾老板走过来说小牛啊,下午还有300份呢。
![]()
没错,这就是我的日常。
扣子2.5整个过程都做得很好,不仅合成了完整视频,还支持导出剪映的.draft工程文件,你可以在剪映里继续手动调整。
![]()
最关键的是,从角色设定到素材生成到剧本分镜到配音到视频合成,全部通过对话完成。
你想想,一个人,如果不会画画、不会写剧本、不会配音、不会剪辑,但他脑子里有一个故事想讲出来。以前这个人只能把这个想法烂在肚子里,现在他可以通过对话,让AI帮他把整个故事从零变成一条可播放的视频。
这种创作门槛的降低,我觉得是AI带来的最实在的价值之一。
写在最后
一圈测评下来,我感慨,扣子2.5这版更新,其实主线很清晰,就是把Agent从对话工具升级成了更高级的数字同事。
云电脑和云手机让Agent有了操作真实环境的能力,Coze CLI让Agent能自己写代码部署应用,Agent World让Agent有了社交和成长的空间,视频创作让Agent能帮你把想法变成内容。
你会发现,这四个方向加在一起,其实是在构建一个完整的Agent生态。不是做一个更聪明的聊天机器人,而是做一个能在数字世界里独立运转的数字伙伴。
去年这个时候,我们还在讨论AI能不能写代码。今年我们已经在讨论AI能不能自己部署上线、自己修Bug、自己生成视频了。
这个速度说实话有点吓人。
但我还是比较乐观的。因为从这次实测来看,Agent目前做的大部分事情,还是在帮人类处理那些标准化、重复性的工作。整理数据、搭建原型、生成素材,这些事以前要么你自己花时间干,要么花钱找人干,现在Agent帮你干了。
你省下来的时间,可以去做那些真正需要人类判断力和创造力的事。比如和隔壁的工位搭子一起蛐蛐老板,再用我们上期文章推荐的蚂蚁灵光,搓几个小程序恶搞他。
当然,现阶段扣子的功能都还有提升空间。云电脑和云手机的速度还可以更快,CLI在复杂项目上的稳定性还需要打磨,视频创作的精细度跟专业团队比还有差距,但方向,已经非常清楚了。Agent浪潮不息,进化不止。
让我们期待下次更新吧!







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论