从B2B到A2A：Agent新基建，如何让“一人企业”做全球生意？-钛媒体官方网站

文 | 硅谷101

“龙虾热”正在退潮，但它带来的创新冲击还在持续——当它与行业know-how相结合，正在迸发出新的能量。

阿里国际站有着26年的B2B数据和经验积累，今年初，OpenClaw、Cowork这些工作范式被验证，让他们看到了打通B2B闭环的智能体，终于到了可以落地的临界点。

于是春节之后，“外贸版龙虾”Accio Work来了，海外用户只需要和这个Agent对话，它就能自主跑完从市场分析、选品设计、供应商筛选、商品发布和日常运营的全过程，把原本需要数周甚至数月的流程，压缩成几句对话。

以往复杂的专业知识壁垒正在被Agent攻破，生产力被重新定义。从数据上来看，Accio Work 40%的用户是Solopreneur（一人企业）。降低门槛的同时，生意越做越精明了，在AI的帮助下今年阿里国际站的EBITA（息税摊销前利润）增长了18%。

本期播客，我们与阿里国际站总裁张阔一起聊聊，他作为一名互联网巨头的掌舵人，在这一轮AI浪潮下，对新业务、新人才的思考与判断。他提出了一个非常有意思的判断方法：面对新模型，你的公司是兴奋、焦虑，还是毫无感觉？最后一种，才是最危险的。

以下是这次对话内容的精选：

01 AI吞噬SaaS？或者让它变得更好

泓君：GTC期间您也在硅谷，您来了以后，感觉硅谷跟国内AI的发展有什么不一样？

张阔：我觉得硅谷这边的生态和国内有比较大的差别。比如说在美国，除了所有创业可能都跟AI有关以外，AI底层的这些基础设施，大家也投入非常多。像TogetherAI、Fireworks，规模已经比较大了，它们的存在就是要帮助上面的应用更容易地获取模型，更低成本地做推理。再往上，就是做各种各样的构建型基础设施，比如语音转文字。有很多小公司，在某些垂直领域里能做得比别人快一步，永远在推土机前面几十米跑，但一直能保持一定的身位。我们也跟很多这种公司合作，比如Whisper Flow，它的语音转文字就转得非常好，无论是时效还是准确性。

现在硅谷有一些讨论，说AI能力上来之后，对SaaS可能有影响，我觉得这个也分两面看。对于SaaS这种商业模式，基于Token使用的计量方式，跟原来基于坐席的计量方式比起来，可能是一个更优的下一代商业模型的基础。也有非常多的SaaS公司，因为有AI的加持，让它的产品比原来更好用了。比如我们最近看了一家，帮助连锁超市做小时工招聘。原来蓝领跟文本交互，人家不乐意用，到场率很低。现在跟Agent交互，Agent跟他讲好所有事情，穿什么衣服、怎么报到、车停在哪儿、病假怎么算，到场率就更高了。所以不能一概而论。

泓君：Jensen Huang在GTC上，提到最多的一个词就是OpenClaw。上次我们俩吃饭也聊到，您觉得在这个时间点上，真正应该关注的是Anthropic的Cowork，而不只是OpenClaw，可以展开讲讲吗？

张阔：OpenClaw是最近比较现象级的应用，但它还不是一个开箱即用的产品，配置起来对技术有要求，门槛挡住了很多人。更重要的是，你到底能产生什么价值。如果留住的工作流非常有限，过一段时间你会看到退潮。Claude Cowork这个设计范式也非常吸引人注意。虽然还在研究预览版的早期，但能看到非常多下一代工作台或Agent平台的影子。它分层的开放架构、产品的设计体系，包括它跟Claude模型之间的匹配度都非常高。

泓君：是不是OpenClaw更适合2C，Cowork更适合2B？我觉得大家在用AI的时候，有两种思想一直在争论。我们到底应不应该把很多的工作分步骤来解决？比如我把AI运用到我的播客制作中，我需要有一个非常明确的流程，告诉它一、二、三你要做什么，且每一步的准确性都要达到，不能给我质量不能保证的产品。所以我在想这两个产品，它是不是对应不一样的工作范式？

张阔：OpenClaw开源和泛化的能力比较强，下面可以接多个模型、多个工具。但开放性过强，到底什么做得好，强化学习怎么设计，需要花比较长的时间去磨合。Claude Cowork的面向对象更清晰一些，就是知识工作者，开发人员、程序员、分析师、做研究的、做金融的、律师等等，需要跟邮件、Word、Excel以及互联网信息交互的那些人。

我觉得一次性处理完还是逐步来，可能不是核心的分野。因为最Agentic的工具，其实是所有工具的工具。不同的人用这个产品，最后会用出自己的样子。你会在每一个步骤上设计和校正它，看看这一步做得对不对。如果对的，就进到下一步；否则所有步骤缠在一起，最后结果就不可用了。假设做播客要18步，每一步误差10%，90%的18次方，基本不可用。所以你每一步都要去验证，把核心步骤的差错率降到最低。大家基于自己的专长，告诉这个Agent工具，你的输入和输出要符合你自己的成功标准。然后AI不断强化学习这个结果，最后产生一个你更能接受的工具。这个过程如果不是开放式的，AI很难衡量中间哪一步做错了。一旦它学会，接下来的推理和执行就很简单，单位Token产生的经济价值也会更大。

02 B2B走向A2A：生产力被重新定义

泓君：你们去年推了一个叫Accio的产品，用AI帮外贸2B厂家解决自己垂直领域的问题，今年很快也要升级了，你是怎么考虑迭代的？

张阔：我们当时做了一个推演，B2B的生意未来可能都会走向A2A（Agent to Agent）。我们现在有两个平行的业务系统：

一个是阿里巴巴.com，它的搜索、沟通、推荐、交易、物流等等，都在用AI快速重构。今天你去用，会觉得它也是一个AI原生的产品，非常多的交互是你跟AI去做，让AI帮你筛选信息、推进订单流程、做物流和支付条件的建议，最后帮助买家跟卖家快速完成交易。

另一条线是Accio，到今年3月份月活已经到1000万，增长速度非常快。它核心想解决的是采购的问题。从研究开始，到形成想法，再到产品设计，然后进入供应商筛选、沟通、交易、运输、售后。Accio希望把采购更大程度地自动化。基于Agentic的模式，从输入一个想法开始，到建立比较稳固的商业关系，时间缩短到原来的五分之一。原来用一个礼拜做的事，现在一天之内就可以完成。

因为原来有语言、时差的问题，原来买家跟卖家之间的设计，没有AI的帮助，可能是一个比较潦草的想法开始，然后卖家帮助你逐步地去完善设计。今天AI可以帮助你直接形成设计包，形成一个非常专业的设计文档，包括图片、文字、3D等等。这样的话，买家跟卖家的交互就可以非常高效、顺畅，也比较专业地去完成。

泓君：我再把这个问题稍微迁移到大模型领域一下，用你们的工具跟用ChatGPT、Gemini，有什么本质上的不一样？

张阔：对于我们自己的模型和工具，有四个方向的投入，是当下的模型可能做得不够好的。

第一个是信息的准确性。有些信息非常关键，比如商品价格。每天在阿里巴巴.com上都有上百万的沟通，对不同设计想法、技术细节的沟通，这些都会形成精确的输入和指导。它既基于我们26年的积累，也基于大量互联网工具的组合。这样信息可以90%或99%地接近事实，比大模型产生的幻觉要好很多。

第二个是强化学习的机制。在国际站有一个好处，它能形成闭环的反馈。最终你这个想法形成了交易还是没有？你是持续买还是试了几次失败了？这些都是可以回到平台里的信号。当越来越多人使用，整个产品会向对的方向发展。

第三个是安全和可靠性保障。2B的风险比较高，信息的完整性、每一步推理的严谨性都要有保障。因为推理周期很长，如果出错需要能向前回滚。

最后一个，我们下一个版本叫Accio Work。第一个版本Accio是基于浏览器的Agent系统，Accio Work装在桌面上，除了从设计到采购，它还能帮你完成日常操作，比如开店、卖商品、管理库存、接受客服反馈。因为有了Computer-Use和Browser-Use的能力（即Agent像人一样操作电脑、浏览器），我们可以帮海外买家完成从想法到采购结束，再进入到商品销售周期的全过程。这个上下文是无限长的，需要分层存储。有些内容要索引起来，有些信息需要的时候再去访问。

泓君：如果底层的大模型更新了，或者说模型的能力大规模地提升了，对你们来说是好事，还是说你需要马上切新模型？

张阔：我们期待的是，每当有一个新的SOTA模型出现，整个产品应该变得比以前更聪明，体验更好，这才是AI原生的产品。如果说出现新模型跟你没关系，那才是更大的问题。我们现在的模型就是基于SOTA的，千问是我们的基础底座，我们在上面做很多优化。在多模态、编程能力、Agent推理能力上做得好的模型，我们都尽量在最好的应用场景里利用起来。

03 Agent新基建，让“一人企业”做全球生意

泓君：你提到了Accio Work，它是一个工作流，可以帮大家管理在订单执行过程中的各种问题。现在从商家的角度来说，他们在执行过程中会遇到哪些问题？以前他们可能会用各种SaaS产品去处理这些问题。因为最近Cowork出来以后，SaaS的模式在被颠覆。我觉得正好这一个环节，我们可以从你的这个产品来展开，去聊一聊大家现在的观点跟实际企业在应用中有什么样的差距。

张阔：Accio Work如果跟原来的Accio比起来，第一个差别，我们希望把商家经营环节的闭环完整掉。原来我们帮他做了研究、设计、采购这些。之后就是他日常的商业操作环节，包括开店、经营、补货、客服、销售等等。这部分我们利用现在的泛化的AI能力，帮他开店、发布商品，在Shopify等平台上做经营。如果企业本身还有雇员，可能也有薪酬、财务、税务等要求，我们会接入硅谷做得好的Agent产品，最终给中小企业一个开箱即用的体验。

其次，基于Agentic这套体验，它跟原来的SaaS体验比起来，有可能做得更简化。而且对于每一个中小企业，它都有办法去定义自己的核心流程和逻辑。如果要听每个人的，你就要给每个人都重新定制一遍，这在原来SaaS的世界里很难做到，除非你有上百万、上千万美金的预算。但对于中小企业来说，今天你可以把你自己的成功标准输入给这个Agent产品，它就基于你的输入形成一个新的工作流，专门为你完成产品定义、发布、营销、做社媒的全过程，而且这个过程可以更加自动化。我们至少30%到40%的企业就是Solopreneur，也就是“一人企业”。我原来设计商品花一个礼拜，觉得值得，但后面还要花一个礼拜去做所有其他细节——发到多个店铺、在多个社交媒体发内容、回顾客反馈、管理库存、进货，这些事就很花时间了。我们觉得所有这些事情也可以基于Accio Work自动化掉，大部分工作只需要人做比较少的交互，就可以由AI通过多Agent方式协同完成。

泓君：你们的中小企业用户是什么样的画像？

张阔：阿里国际站的用户是分层的。一年采购几百万、上千万美金的也有，沃尔玛和亚马逊也在国际站采购。但最底层有非常多的个体经营者，再往上变成连锁商家，再往上才是头部的稳固企业。我们的商家也是一样，很多大客户就是从小伴随成长起来的。所有这些实体经济的中小企业者，就是我们核心面对的对象。他们打开OpenClaw或Claude Cowork，会感到有点难理解。核心还是我们希望做个开箱即用的产品，解决他们日常的关键问题，同时ROI在合理范围内。

泓君：Accio的商业模式是怎样的？

张阔：Accio分两部分。一部分是Token Base，我们自己的工具会消耗Token，三方合作伙伴比如税务、薪酬、财务这些子智能体也会消耗Token。另一类是基于市场平台（market place）的商业模式，因为本身也是供需关系的平台，广告，以及在服务中间产生的费用可以继续用在这个商业模式。

泓君：如果用户搜索跟采购都开始在AI软件里面去完成，那传统的市场平台广告会受到冲击吗？

张阔：展示广告肯定没什么意义了，大家更多是基于效果的广告。AI对阿里巴巴.com有两方面帮助。第一，它让搜索量变多了，因为AI更好地理解了你的意图，结果更好了，还有多模态的输入，语音或是图片，用户更愿意进来搜索和交互。第二，对广告本身也有帮助。能生产同一个商品的不止一个人，可能有10个、100个。我们告诉他这是一条广告，它匹配了你哪些标准，买家也有意愿去交流。我们自己看到，今年搜索和广告是我们增长比较快的两个轨道。

泓君：但像Accio这样的一个工具，整体来看，AI匹配的需求更精准了，广告位就减少了。

张阔：这个理解肯定是对的。在供需匹配过程中，可能原来给你1000个结果，现在只给你5个。这5个结果里如果要做广告，它必须是个更精准的结果，不能像原来一样不精准还硬塞广告。Google的财报也验证了这一点——过去大家担心AI概览会冲击广告，但事实上它既做到了用户停留时长和查询数变多，广告数也变高了。因为广告更精准，点的人更多，更多广告主愿意为这条付费。不像原来，大家搞一堆CPC（按点击付费），点完了用户意图跟广告匹配效率很差，对广告主也是一种浪费。

泓君：你觉得未来的商业模式会变成什么样？

张阔：至少互联网这个时代，商业模式大概就四到五种。有一些商业模式，它也会进入到AI这个时代里边。

首先，这件事的核心逻辑还是创造什么价值。比如我帮助你做了一个更好的设计，帮助你做了一个更好的对全世界的调查，这些价值用Token Base的方式衡量比较好，最终大家赢的标准是单位Token的智力密度更高，或者单位Token产生的价值更高。

第二个，比如拿阿里巴巴.com为例，尤其是效果的广告，从长期来讲，它可能也是一个存在的商业模式。因为供需匹配的过程里，有人愿意让利，要么商品上让利，要么用广告做更多展现，这个商业模式可能也会持续成立。

第三个就是基于平台侧的所有供应链的服务，比如担保交易，类似保险的服务，有争议时平台先补偿再去追责，抽成很少，可能一到两个点。它跟原来的商业模式也是一样的，只不过你把这个规模变大了。全世界30万亿美金的交易额，阿里国际站大概700亿，渗透率还非常少。让更多中小企业参与到全球交易里，提供更高效的服务，就能带来更多的增量价值。

所以有一些商业模式是现有世界自动延续到Agent世界的。当然也有一些Agent世界里边，它基于使用量的使用，可能比SaaS的基于坐席的使用，此时此刻就是领先的，这种模式可能未来就会持续超越。整体上来看就是，如何基于现在的新技术，让服务跟效率再优化一层。

泓君：你们做Accio，跟创业公司做，最核心的优势是什么？

张阔：阿里巴巴.com是阿里集团的第一块业务，大概做这件事情有26年左右的积累。平台侧每天有上百万、上千万的沟通、查询、交易，这些都是信号，能帮系统完成强化学习，而且能形成闭环。另外，我们背靠阿里集团，跟千问有比较多合作，能保持模型理解和使用的领先性。同时我们会注入数据到中期训练和后期训练里，让壁垒越来越大。

同时因为有更多的人用，其实这个Agentic产品也有数据飞轮。有更多的人用，它就会记住更多的工作流，更多的工具在什么情况下可以有更好的表现，产品就会进入下一个飞轮。

因为我们本身比较聚焦，我觉得跟现有的大部分AI产品面向的不是同一拨客户。我们客户可能更挑剔，预算更少，对ROI更敏感，这也推动我们更关注单位Token的智力密度和单位Token能产生的价值。

泓君：据我观察，像亚马逊，他们内部也在做类似的事情。你觉得未来，比如说亚马逊它也推出一个B2B的这种垂直领域的AI应用，会是你们的竞争对手吗？

张阔：对于我们今天想定位的这个产品，它想要解决的问题来讲，我觉得我们自己还是比较有信心。对于中小企业，从设计的产品到自己的日常操作的过程。当然如果说未来B2B会走向A2A，就是Agent to Agent，不光是买家Agent To卖家Agent，也包括用户自己，它的多个智能体可能也是一个协同的过程。最终可能胜出的一个方式就是，你在一些方向上做得非常好，同时又是一个高频的工具，那你成为一个Master Agent。同时这个企业还有很多其他的Agent需求，所以子智能体需求，这些Agents之间可以互相交流，可以去协同，共同帮助这个中小企业完成服务。

亚马逊的后台系统很复杂，Agent对它应该是一个比较好的垂直领域，它自己也有优势。但如果把它泛化到要经营多平台，帮助客户去做一个更广泛的产品设计，并且要让它利用全球供应链，我觉得这个方向来讲，我们肯定起步比较早，经验也会更多一些。

泓君：你自己评估Accio做得好不好，核心在抓哪些点？

张阔：本质问题不是消耗多少Token，而是产生多少价值。一个比较显性的指标是留存，用户持续用这个产品做更多设计、更多采购，就是好信号。另外，在每个垂直工具上，任务的完成度和用户的采纳度要高，并且能持续使用。从经济角度，单位Token的智力和性价比越来越高，这样客户能更好地以ROI的方式使用产品。唯一可能不是标准的就是一共用了多少Token，很可能大家努力的方向是多让你浪费点Token。核心还是把产品做得好用。

其实对于整个原来阿里巴巴.com，我们也是希望能让跨境B2B就像在线购物一样简单。你做在线购物，大家都知道是个什么体验。但是跨境B2B可能要细分有28个步骤，每个步骤可能跟2C比起来都要复杂很多。这大的28个步骤跟流程里边，我们逐步帮他去做数字化的过程。

泓君：简单来说，其实这个产业整个的产业链，包括你们沉淀的方法论，这些步骤已经非常完善了。你们是想把所有从开始到结尾的整个过程，闭环的流程，全部提供给这些商家。

04 AI时代，衡量团队的标准在改变

泓君：你们现在招聘会偏向什么样的人？

张阔：有些是比较好定义和量化的，比如模型训练、基础设施、算法。这些人进来之前，论文、研究或者开源社区的贡献就已经能说明很多问题。学历不是最关键的，面试就是打开论文，讨论原创的思想和贡献。另外就是对AI用得比较充分的年轻人，这个比较难量化。产品经理进来我们希望他设计的产品是面向未来6个月模型能力的，意味着他对未来6个月模型可能走向的方向和能力要有基础的预判，这样产品上线时能最好地利用当下能力，要求很高。

有些工种在慢慢融合。原来产品经理写需求文档，交互设计师画交互，技术人员做出来跟交互设计一模一样，这事就结束了。但做出来跟交互设计一模一样是不是好，很难讲。今天可能三个角色慢慢融合成两个或者一个，这个人就要对闭环的结果负责任，但效率更高了。

我相信现在工程师编程的模式跟原来有质的差别。前两天在一个硅谷创业公司，外面喧哗，CEO出去一看说Anthropic宕机了，波动了3个小时。那3个小时里，硅谷的工程师全不会写代码，也没人编程。现在大家是基于上下文给输入，模型生成代码，生成得越多你越看不懂，代码审查也很困难。突然这个工具不能用了，大家就恐慌。但这也说明，今天做工程的方式方法跟之前有很大差异。

泓君：你现在会要求你的团队用这些编程Agent吗？

张阔：我觉得不用要求，大家肯定都在用。我分享一些我们内部衡量的成功标准。第一个，你一定要给工程师设计一个Master Agent（主智能体），下面管理很多Sub Agent（子智能体），有写代码的、读文档的、做代码审查的、做检查的。要设置护栏，保证沙箱环境，不要写个代码内部用的就开放到外部去了。

第二个，我看到一个做量化的公司很有意思。几个研究员在Slack里聊，聊到一定程度艾特Agent说我们谈完了你看一下，然后去写代码。Agent进来读一下大家对模型怎么改变，写个文档MD，生成代码，提交，有人看可能有人不看，保证一定灰度不影响全局。

我们衡量AI成功与否有几个标准。我们团队每个季度有300个想法，这是我们跟踪了4年总结出来的，这300个想法里大概150个上线，还有150个做不过来。150个上线想法的里边可能有50个有效果。我们希望AI帮助，让实际上线产生商业价值和客户价值的想法数量变多。

另一个量化标准是，AI原生的产品从0到1，能不能快速规模化？阿里巴巴.com存在26年了，原来的指标有没有非线性增长？比如我们今年的EBITA（息税摊销前利润）增长到18%左右，跟去年比还是一个快速增长的过程。

还有两个感性的衡量方式——当新的模型框架出现，你的组织是兴奋还是焦虑？如果你感到兴奋，或者焦虑，这两个信号都是好的，说明你的产品跟模型有关、跟Agent框架有关。最差的是没有感觉。外边模型速度很快，像高速列车，你在边上开老爷车，开得再快也赶不上。除非你自己已经坐上高铁了，在高铁上有个相对速度，至少你跟全世界聪明人努力的方向是一样的。

所以这个事有一个基本要求，就是你的产品和组织要架构在AI Agent和最新的模型之上，这样每次新模型上来，你的所有产品都会变得更聪明。如果反过来，来了模型你适配不适配都无所谓，或者适配要花很长时间，那你就不是AI原生构建在模型上的产品。当然最好你是在兴奋这边，新模型来了，你的组织和业务更兴奋，因为原来解决不了的问题现在可以解决了。如果你很焦虑，说明你虽然在模型上，但你是个包装器（wrapper），来一次大的迭代你的价值就被挤没了。

泓君：最近让您最兴奋或者焦虑的一次模型更新是什么？

张阔：我现在一般都是兴奋居多。比如多模态，是一个比较大比较快的变化，比如Nano Banana，它产生商品的细节。原来我们要产生商品图片，买家从想法开始最后要生成设计包，扩散模型不精准，经常把尺寸搞错，比如一架很大的机器放在桌子上，或者一个不大的机器显得很大在厂房里。原来要花大量时间调提示，保证产出尽量满足预期。现在模型本身能力变强了，相对简单的上下文就可以让内容生成得非常逼真。

第二个，我们很早就在想要闭环。首先我们今天的模型已经拥有全世界的知识，其次，我们也有最好的全球的供应商的网络，包括所有线上的交易等信号，帮助我们去做判断——下一个大想法到底是什么？谁可以制造这个？就谁可能是你最好的供应商？

我们还希望去做你日常经营的过程，也就是80%是日常操作。在没有Computer-Use、没有Browser-Use、没有长程上下文Agent能力之前，做这件事很困难。当有了这些能力，我们在解这条问题的链条上的速度就变得非常快。这就是为什么我们春节就开始加班做Accio Work。因为发现OpenClaw和Claude Cowork证明了范式在这个环境下是成立的，能够再往前推进一步。我们在这个基础上可以快速推进产品，让它在用户群体里产生更广泛的应用。