从B2B到A2A:Agent新基建,如何让“一人企业”做全球生意?

AGI
对话阿里国际站总裁张阔

文 | 硅谷101

“龙虾热”正在退潮,但它带来的创新冲击还在持续——当它与行业know-how相结合,正在迸发出新的能量。

阿里国际站有着26年的B2B数据和经验积累,今年初,OpenClaw、Cowork这些工作范式被验证,让他们看到了打通B2B闭环的智能体,终于到了可以落地的临界点。

于是春节之后,“外贸版龙虾”Accio Work来了,海外用户只需要和这个Agent对话,它就能自主跑完从市场分析、选品设计、供应商筛选、商品发布和日常运营的全过程,把原本需要数周甚至数月的流程,压缩成几句对话。

以往复杂的专业知识壁垒正在被Agent攻破,生产力被重新定义。从数据上来看,Accio Work 40%的用户是Solopreneur(一人企业)。降低门槛的同时,生意越做越精明了,在AI的帮助下今年阿里国际站的EBITA(息税摊销前利润)增长了18%。

 

本期播客,我们与阿里国际站总裁张阔一起聊聊,他作为一名互联网巨头的掌舵人,在这一轮AI浪潮下,对新业务、新人才的思考与判断。他提出了一个非常有意思的判断方法:面对新模型,你的公司是兴奋、焦虑,还是毫无感觉?最后一种,才是最危险的。

以下是这次对话内容的精选:

01 AI吞噬SaaS?或者让它变得更好

泓君:GTC期间您也在硅谷,您来了以后,感觉硅谷跟国内AI的发展有什么不一样?

张阔:我觉得硅谷这边的生态和国内有比较大的差别。比如说在美国,除了所有创业可能都跟AI有关以外,AI底层的这些基础设施,大家也投入非常多。像TogetherAI、Fireworks,规模已经比较大了,它们的存在就是要帮助上面的应用更容易地获取模型,更低成本地做推理。再往上,就是做各种各样的构建型基础设施,比如语音转文字。有很多小公司,在某些垂直领域里能做得比别人快一步,永远在推土机前面几十米跑,但一直能保持一定的身位。我们也跟很多这种公司合作,比如Whisper Flow,它的语音转文字就转得非常好,无论是时效还是准确性。

现在硅谷有一些讨论,说AI能力上来之后,对SaaS可能有影响,我觉得这个也分两面看。对于SaaS这种商业模式,基于Token使用的计量方式,跟原来基于坐席的计量方式比起来,可能是一个更优的下一代商业模型的基础。也有非常多的SaaS公司,因为有AI的加持,让它的产品比原来更好用了。比如我们最近看了一家,帮助连锁超市做小时工招聘。原来蓝领跟文本交互,人家不乐意用,到场率很低。现在跟Agent交互,Agent跟他讲好所有事情,穿什么衣服、怎么报到、车停在哪儿、病假怎么算,到场率就更高了。所以不能一概而论。

泓君:Jensen Huang在GTC上,提到最多的一个词就是OpenClaw。上次我们俩吃饭也聊到,您觉得在这个时间点上,真正应该关注的是Anthropic的Cowork,而不只是OpenClaw,可以展开讲讲吗?

张阔:OpenClaw是最近比较现象级的应用,但它还不是一个开箱即用的产品,配置起来对技术有要求,门槛挡住了很多人。更重要的是,你到底能产生什么价值。如果留住的工作流非常有限,过一段时间你会看到退潮。Claude Cowork这个设计范式也非常吸引人注意。虽然还在研究预览版的早期,但能看到非常多下一代工作台或Agent平台的影子。它分层的开放架构、产品的设计体系,包括它跟Claude模型之间的匹配度都非常高。

泓君:是不是OpenClaw更适合2C,Cowork更适合2B?我觉得大家在用AI的时候,有两种思想一直在争论。我们到底应不应该把很多的工作分步骤来解决?比如我把AI运用到我的播客制作中,我需要有一个非常明确的流程,告诉它一、二、三你要做什么,且每一步的准确性都要达到,不能给我质量不能保证的产品。所以我在想这两个产品,它是不是对应不一样的工作范式?

张阔:OpenClaw开源和泛化的能力比较强,下面可以接多个模型、多个工具。但开放性过强,到底什么做得好,强化学习怎么设计,需要花比较长的时间去磨合。Claude Cowork的面向对象更清晰一些,就是知识工作者,开发人员、程序员、分析师、做研究的、做金融的、律师等等,需要跟邮件、Word、Excel以及互联网信息交互的那些人。

我觉得一次性处理完还是逐步来,可能不是核心的分野。因为最Agentic的工具,其实是所有工具的工具。不同的人用这个产品,最后会用出自己的样子。你会在每一个步骤上设计和校正它,看看这一步做得对不对。如果对的,就进到下一步;否则所有步骤缠在一起,最后结果就不可用了。假设做播客要18步,每一步误差10%,90%的18次方,基本不可用。所以你每一步都要去验证,把核心步骤的差错率降到最低。大家基于自己的专长,告诉这个Agent工具,你的输入和输出要符合你自己的成功标准。然后AI不断强化学习这个结果,最后产生一个你更能接受的工具。这个过程如果不是开放式的,AI很难衡量中间哪一步做错了。一旦它学会,接下来的推理和执行就很简单,单位Token产生的经济价值也会更大。

02 B2B走向A2A:生产力被重新定义

泓君:你们去年推了一个叫Accio的产品,用AI帮外贸2B厂家解决自己垂直领域的问题,今年很快也要升级了,你是怎么考虑迭代的?

张阔:我们当时做了一个推演,B2B的生意未来可能都会走向A2A(Agent to Agent)。我们现在有两个平行的业务系统:

一个是阿里巴巴.com,它的搜索、沟通、推荐、交易、物流等等,都在用AI快速重构。今天你去用,会觉得它也是一个AI原生的产品,非常多的交互是你跟AI去做,让AI帮你筛选信息、推进订单流程、做物流和支付条件的建议,最后帮助买家跟卖家快速完成交易。

另一条线是Accio,到今年3月份月活已经到1000万,增长速度非常快。它核心想解决的是采购的问题。从研究开始,到形成想法,再到产品设计,然后进入供应商筛选、沟通、交易、运输、售后。Accio希望把采购更大程度地自动化。基于Agentic的模式,从输入一个想法开始,到建立比较稳固的商业关系,时间缩短到原来的五分之一。原来用一个礼拜做的事,现在一天之内就可以完成。

因为原来有语言、时差的问题,原来买家跟卖家之间的设计,没有AI的帮助,可能是一个比较潦草的想法开始,然后卖家帮助你逐步地去完善设计。今天AI可以帮助你直接形成设计包,形成一个非常专业的设计文档,包括图片、文字、3D等等。这样的话,买家跟卖家的交互就可以非常高效、顺畅,也比较专业地去完成。

图片来源:Pixabay

泓君:我再把这个问题稍微迁移到大模型领域一下,用你们的工具跟用ChatGPT、Gemini,有什么本质上的不一样?

张阔:对于我们自己的模型和工具,有四个方向的投入,是当下的模型可能做得不够好的。

第一个是信息的准确性。有些信息非常关键,比如商品价格。每天在阿里巴巴.com上都有上百万的沟通,对不同设计想法、技术细节的沟通,这些都会形成精确的输入和指导。它既基于我们26年的积累,也基于大量互联网工具的组合。这样信息可以90%或99%地接近事实,比大模型产生的幻觉要好很多。

第二个是强化学习的机制。在国际站有一个好处,它能形成闭环的反馈。最终你这个想法形成了交易还是没有?你是持续买还是试了几次失败了?这些都是可以回到平台里的信号。当越来越多人使用,整个产品会向对的方向发展。

第三个是安全和可靠性保障。2B的风险比较高,信息的完整性、每一步推理的严谨性都要有保障。因为推理周期很长,如果出错需要能向前回滚。

最后一个,我们下一个版本叫Accio Work。第一个版本Accio是基于浏览器的Agent系统,Accio Work装在桌面上,除了从设计到采购,它还能帮你完成日常操作,比如开店、卖商品、管理库存、接受客服反馈。因为有了Computer-Use和Browser-Use的能力(即Agent像人一样操作电脑、浏览器),我们可以帮海外买家完成从想法到采购结束,再进入到商品销售周期的全过程。这个上下文是无限长的,需要分层存储。有些内容要索引起来,有些信息需要的时候再去访问。

泓君:如果底层的大模型更新了,或者说模型的能力大规模地提升了,对你们来说是好事,还是说你需要马上切新模型?

张阔:我们期待的是,每当有一个新的SOTA模型出现,整个产品应该变得比以前更聪明,体验更好,这才是AI原生的产品。如果说出现新模型跟你没关系,那才是更大的问题。我们现在的模型就是基于SOTA的,千问是我们的基础底座,我们在上面做很多优化。在多模态、编程能力、Agent推理能力上做得好的模型,我们都尽量在最好的应用场景里利用起来。

03 Agent新基建,让“一人企业”做全球生意

泓君:你提到了Accio Work,它是一个工作流,可以帮大家管理在订单执行过程中的各种问题。现在从商家的角度来说,他们在执行过程中会遇到哪些问题?以前他们可能会用各种SaaS产品去处理这些问题。因为最近Cowork出来以后,SaaS的模式在被颠覆。我觉得正好这一个环节,我们可以从你的这个产品来展开,去聊一聊大家现在的观点跟实际企业在应用中有什么样的差距。

张阔:Accio Work如果跟原来的Accio比起来,第一个差别,我们希望把商家经营环节的闭环完整掉。原来我们帮他做了研究、设计、采购这些。之后就是他日常的商业操作环节,包括开店、经营、补货、客服、销售等等。这部分我们利用现在的泛化的AI能力,帮他开店、发布商品,在Shopify等平台上做经营。如果企业本身还有雇员,可能也有薪酬、财务、税务等要求,我们会接入硅谷做得好的Agent产品,最终给中小企业一个开箱即用的体验。

其次,基于Agentic这套体验,它跟原来的SaaS体验比起来,有可能做得更简化。而且对于每一个中小企业,它都有办法去定义自己的核心流程和逻辑。如果要听每个人的,你就要给每个人都重新定制一遍,这在原来SaaS的世界里很难做到,除非你有上百万、上千万美金的预算。但对于中小企业来说,今天你可以把你自己的成功标准输入给这个Agent产品,它就基于你的输入形成一个新的工作流,专门为你完成产品定义、发布、营销、做社媒的全过程,而且这个过程可以更加自动化。我们至少30%到40%的企业就是Solopreneur,也就是“一人企业”。我原来设计商品花一个礼拜,觉得值得,但后面还要花一个礼拜去做所有其他细节——发到多个店铺、在多个社交媒体发内容、回顾客反馈、管理库存、进货,这些事就很花时间了。我们觉得所有这些事情也可以基于Accio Work自动化掉,大部分工作只需要人做比较少的交互,就可以由AI通过多Agent方式协同完成。

泓君:你们的中小企业用户是什么样的画像?

张阔:阿里国际站的用户是分层的。一年采购几百万、上千万美金的也有,沃尔玛和亚马逊也在国际站采购。但最底层有非常多的个体经营者,再往上变成连锁商家,再往上才是头部的稳固企业。我们的商家也是一样,很多大客户就是从小伴随成长起来的。所有这些实体经济的中小企业者,就是我们核心面对的对象。他们打开OpenClaw或Claude Cowork,会感到有点难理解。核心还是我们希望做个开箱即用的产品,解决他们日常的关键问题,同时ROI在合理范围内。

泓君:Accio的商业模式是怎样的?

张阔:Accio分两部分。一部分是Token Base,我们自己的工具会消耗Token,三方合作伙伴比如税务、薪酬、财务这些子智能体也会消耗Token。另一类是基于市场平台(market place)的商业模式,因为本身也是供需关系的平台,广告,以及在服务中间产生的费用可以继续用在这个商业模式。

泓君:如果用户搜索跟采购都开始在AI软件里面去完成,那传统的市场平台广告会受到冲击吗?

张阔:展示广告肯定没什么意义了,大家更多是基于效果的广告。AI对阿里巴巴.com有两方面帮助。第一,它让搜索量变多了,因为AI更好地理解了你的意图,结果更好了,还有多模态的输入,语音或是图片,用户更愿意进来搜索和交互。第二,对广告本身也有帮助。能生产同一个商品的不止一个人,可能有10个、100个。我们告诉他这是一条广告,它匹配了你哪些标准,买家也有意愿去交流。我们自己看到,今年搜索和广告是我们增长比较快的两个轨道。

泓君:但像Accio这样的一个工具,整体来看,AI匹配的需求更精准了,广告位就减少了。

张阔:这个理解肯定是对的。在供需匹配过程中,可能原来给你1000个结果,现在只给你5个。这5个结果里如果要做广告,它必须是个更精准的结果,不能像原来一样不精准还硬塞广告。Google的财报也验证了这一点——过去大家担心AI概览会冲击广告,但事实上它既做到了用户停留时长和查询数变多,广告数也变高了。因为广告更精准,点的人更多,更多广告主愿意为这条付费。不像原来,大家搞一堆CPC(按点击付费),点完了用户意图跟广告匹配效率很差,对广告主也是一种浪费。

泓君:你觉得未来的商业模式会变成什么样?

张阔:至少互联网这个时代,商业模式大概就四到五种。有一些商业模式,它也会进入到AI这个时代里边。

首先,这件事的核心逻辑还是创造什么价值。比如我帮助你做了一个更好的设计,帮助你做了一个更好的对全世界的调查,这些价值用Token Base的方式衡量比较好,最终大家赢的标准是单位Token的智力密度更高,或者单位Token产生的价值更高。

第二个,比如拿阿里巴巴.com为例,尤其是效果的广告,从长期来讲,它可能也是一个存在的商业模式。因为供需匹配的过程里,有人愿意让利,要么商品上让利,要么用广告做更多展现,这个商业模式可能也会持续成立。

第三个就是基于平台侧的所有供应链的服务,比如担保交易,类似保险的服务,有争议时平台先补偿再去追责,抽成很少,可能一到两个点。它跟原来的商业模式也是一样的,只不过你把这个规模变大了。全世界30万亿美金的交易额,阿里国际站大概700亿,渗透率还非常少。让更多中小企业参与到全球交易里,提供更高效的服务,就能带来更多的增量价值。

所以有一些商业模式是现有世界自动延续到Agent世界的。当然也有一些Agent世界里边,它基于使用量的使用,可能比SaaS的基于坐席的使用,此时此刻就是领先的,这种模式可能未来就会持续超越。整体上来看就是,如何基于现在的新技术,让服务跟效率再优化一层。

泓君:你们做Accio,跟创业公司做,最核心的优势是什么?

张阔:阿里巴巴.com是阿里集团的第一块业务,大概做这件事情有26年左右的积累。平台侧每天有上百万、上千万的沟通、查询、交易,这些都是信号,能帮系统完成强化学习,而且能形成闭环。另外,我们背靠阿里集团,跟千问有比较多合作,能保持模型理解和使用的领先性。同时我们会注入数据到中期训练和后期训练里,让壁垒越来越大。

同时因为有更多的人用,其实这个Agentic产品也有数据飞轮。有更多的人用,它就会记住更多的工作流,更多的工具在什么情况下可以有更好的表现,产品就会进入下一个飞轮。

因为我们本身比较聚焦,我觉得跟现有的大部分AI产品面向的不是同一拨客户。我们客户可能更挑剔,预算更少,对ROI更敏感,这也推动我们更关注单位Token的智力密度和单位Token能产生的价值。

泓君:据我观察,像亚马逊,他们内部也在做类似的事情。你觉得未来,比如说亚马逊它也推出一个B2B的这种垂直领域的AI应用,会是你们的竞争对手吗?

张阔:对于我们今天想定位的这个产品,它想要解决的问题来讲,我觉得我们自己还是比较有信心。对于中小企业,从设计的产品到自己的日常操作的过程。当然如果说未来B2B会走向A2A,就是Agent to Agent,不光是买家Agent To卖家Agent,也包括用户自己,它的多个智能体可能也是一个协同的过程。最终可能胜出的一个方式就是,你在一些方向上做得非常好,同时又是一个高频的工具,那你成为一个Master Agent。同时这个企业还有很多其他的Agent需求,所以子智能体需求,这些Agents之间可以互相交流,可以去协同,共同帮助这个中小企业完成服务。

亚马逊的后台系统很复杂,Agent对它应该是一个比较好的垂直领域,它自己也有优势。但如果把它泛化到要经营多平台,帮助客户去做一个更广泛的产品设计,并且要让它利用全球供应链,我觉得这个方向来讲,我们肯定起步比较早,经验也会更多一些。

泓君:你自己评估Accio做得好不好,核心在抓哪些点?

张阔:本质问题不是消耗多少Token,而是产生多少价值。一个比较显性的指标是留存,用户持续用这个产品做更多设计、更多采购,就是好信号。另外,在每个垂直工具上,任务的完成度和用户的采纳度要高,并且能持续使用。从经济角度,单位Token的智力和性价比越来越高,这样客户能更好地以ROI的方式使用产品。唯一可能不是标准的就是一共用了多少Token,很可能大家努力的方向是多让你浪费点Token。核心还是把产品做得好用。

其实对于整个原来阿里巴巴.com,我们也是希望能让跨境B2B就像在线购物一样简单。你做在线购物,大家都知道是个什么体验。但是跨境B2B可能要细分有28个步骤,每个步骤可能跟2C比起来都要复杂很多。这大的28个步骤跟流程里边,我们逐步帮他去做数字化的过程。

泓君:简单来说,其实这个产业整个的产业链,包括你们沉淀的方法论,这些步骤已经非常完善了。你们是想把所有从开始到结尾的整个过程,闭环的流程,全部提供给这些商家。

04 AI时代,衡量团队的标准在改变

泓君:你们现在招聘会偏向什么样的人?

张阔:有些是比较好定义和量化的,比如模型训练、基础设施、算法。这些人进来之前,论文、研究或者开源社区的贡献就已经能说明很多问题。学历不是最关键的,面试就是打开论文,讨论原创的思想和贡献。另外就是对AI用得比较充分的年轻人,这个比较难量化。产品经理进来我们希望他设计的产品是面向未来6个月模型能力的,意味着他对未来6个月模型可能走向的方向和能力要有基础的预判,这样产品上线时能最好地利用当下能力,要求很高。

有些工种在慢慢融合。原来产品经理写需求文档,交互设计师画交互,技术人员做出来跟交互设计一模一样,这事就结束了。但做出来跟交互设计一模一样是不是好,很难讲。今天可能三个角色慢慢融合成两个或者一个,这个人就要对闭环的结果负责任,但效率更高了。

我相信现在工程师编程的模式跟原来有质的差别。前两天在一个硅谷创业公司,外面喧哗,CEO出去一看说Anthropic宕机了,波动了3个小时。那3个小时里,硅谷的工程师全不会写代码,也没人编程。现在大家是基于上下文给输入,模型生成代码,生成得越多你越看不懂,代码审查也很困难。突然这个工具不能用了,大家就恐慌。但这也说明,今天做工程的方式方法跟之前有很大差异。

泓君:你现在会要求你的团队用这些编程Agent吗?

张阔:我觉得不用要求,大家肯定都在用。我分享一些我们内部衡量的成功标准。第一个,你一定要给工程师设计一个Master Agent(主智能体),下面管理很多Sub Agent(子智能体),有写代码的、读文档的、做代码审查的、做检查的。要设置护栏,保证沙箱环境,不要写个代码内部用的就开放到外部去了。

第二个,我看到一个做量化的公司很有意思。几个研究员在Slack里聊,聊到一定程度艾特Agent说我们谈完了你看一下,然后去写代码。Agent进来读一下大家对模型怎么改变,写个文档MD,生成代码,提交,有人看可能有人不看,保证一定灰度不影响全局。

我们衡量AI成功与否有几个标准。我们团队每个季度有300个想法,这是我们跟踪了4年总结出来的,这300个想法里大概150个上线,还有150个做不过来。150个上线想法的里边可能有50个有效果。我们希望AI帮助,让实际上线产生商业价值和客户价值的想法数量变多。

另一个量化标准是,AI原生的产品从0到1,能不能快速规模化?阿里巴巴.com存在26年了,原来的指标有没有非线性增长?比如我们今年的EBITA(息税摊销前利润)增长到18%左右,跟去年比还是一个快速增长的过程。

还有两个感性的衡量方式——当新的模型框架出现,你的组织是兴奋还是焦虑?如果你感到兴奋,或者焦虑,这两个信号都是好的,说明你的产品跟模型有关、跟Agent框架有关。最差的是没有感觉。外边模型速度很快,像高速列车,你在边上开老爷车,开得再快也赶不上。除非你自己已经坐上高铁了,在高铁上有个相对速度,至少你跟全世界聪明人努力的方向是一样的。

所以这个事有一个基本要求,就是你的产品和组织要架构在AI Agent和最新的模型之上,这样每次新模型上来,你的所有产品都会变得更聪明。如果反过来,来了模型你适配不适配都无所谓,或者适配要花很长时间,那你就不是AI原生构建在模型上的产品。当然最好你是在兴奋这边,新模型来了,你的组织和业务更兴奋,因为原来解决不了的问题现在可以解决了。如果你很焦虑,说明你虽然在模型上,但你是个包装器(wrapper),来一次大的迭代你的价值就被挤没了。

泓君:最近让您最兴奋或者焦虑的一次模型更新是什么?

张阔:我现在一般都是兴奋居多。比如多模态,是一个比较大比较快的变化,比如Nano Banana,它产生商品的细节。原来我们要产生商品图片,买家从想法开始最后要生成设计包,扩散模型不精准,经常把尺寸搞错,比如一架很大的机器放在桌子上,或者一个不大的机器显得很大在厂房里。原来要花大量时间调提示,保证产出尽量满足预期。现在模型本身能力变强了,相对简单的上下文就可以让内容生成得非常逼真。

第二个,我们很早就在想要闭环。首先我们今天的模型已经拥有全世界的知识,其次,我们也有最好的全球的供应商的网络,包括所有线上的交易等信号,帮助我们去做判断——下一个大想法到底是什么?谁可以制造这个?就谁可能是你最好的供应商?

我们还希望去做你日常经营的过程,也就是80%是日常操作。在没有Computer-Use、没有Browser-Use、没有长程上下文Agent能力之前,做这件事很困难。当有了这些能力,我们在解这条问题的链条上的速度就变得非常快。这就是为什么我们春节就开始加班做Accio Work。因为发现OpenClaw和Claude Cowork证明了范式在这个环境下是成立的,能够再往前推进一步。我们在这个基础上可以快速推进产品,让它在用户群体里产生更广泛的应用。

本文系作者 硅谷101 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App