千问接入淘宝、支付宝等App，阿里巴巴Agent行动开始了-钛媒体官方网站

这显然是阿里巴巴预谋已久的一次集团行动。

1月15日，千问App宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务，在全球首次实现点外卖、买东西、订机票等AI购物功能，并向所有用户开放测试。此次升级将上线超400项AI办事功能，让千问App成为全球首个能完成真实生活复杂任务的AI助手。

从产品层面看，千问是阿里巴巴最“年轻”的应用，要调用淘宝、支付宝、高德等App的能力，相当于阿里巴巴要将App的部分功能打碎，以原子化的方式为千问所用，这必然少不了集团的首肯和斡旋。发布会现场，阿里系App各业务负责人也来到现场表示支持。

千问C端事业群总裁吴嘉表示，“AI在拥有超强大脑之后，开始长出了能够触达真实世界的手和脚，在生活中实实在在地替用户‘干活’。千问是第一个真正能帮你办事的AI，我们的独特优势在于‘Qwen最强模型’与‘阿里最丰富生态’的结合。AI办事时代才刚刚开始，一些能力还在探索，我们将一步步迈进，将千问App打造为最强大的人类AI助手，真正让AI帮助到每一个人。”

千问能做什么？

千问想做Agent，路人皆知。

在Manus、豆包手机、智谱GLM等Agent形态产品先后推出的背景下，不同产品也走出了不同路径，各家都在用自己的资源禀赋和产品哲学去定义“AI 该如何进入真实世界”，千问的独特性在于阿里巴巴生态的贯通。

Manus代表的是通用型任务Agent，它没有什么历史资源和包袱，强调的是跨工具、跨流程的自动化执行能力，把复杂任务拆解为步骤，再通过模型调度工具完成闭环，更像一个“数字员工”，Meta收购Manus，看中的也是其想象空间。

豆包手机走的是AI原生终端路线，豆包没有把Agent看做一个App，而是嵌入到操作系统和硬件层面，让 AI 接管搜索、拍照、记录、导航、购物等行为，当然目前有一些安全法规等方面的限制。

智谱 GLM 更偏向能力底座 + Agent 平台的方向。它强调的是大模型能力的工程化、组件化，让 Agent 成为可以被企业和开发者自由组合的生产工具。与 Manus 的“成品型 Agent”不同，GLM 更像是在提供“造 Agent 的能力”。

千问的第一步是生态型 Agent + 真实业务闭环，它不是单纯做一个通用 Agent，也不是只做模型底座，而是把Agent直接嵌进一个已经极其成熟的商业与生活服务生态里，让 AI 从一开始就拥有“能办事”的能力。

在发布会上，吴嘉现场演示AI外卖功能，只需给千问App下达一句话指令，“帮我点40杯霸王茶姬的伯牙绝弦”，千问App迅速调用淘宝闪购下单，无需任何跳转即在端内完成AI支付。这一能力的背后，是千问与淘宝闪购、支付宝原生AI支付能力“AI付”的系统级打通。

就在四天前，谷歌刚刚宣布与沃尔玛等零售商的AI购物合作计划，但目前尚未上线。阿里领先于谷歌，成为全球首个实现多品类AI购物功能的科技公司。

阿里之所以能领先于谷歌推出AI购物，核心在于其独特的“模型+生态”垂直整合能力。与谷歌试图通过UCP协议连接外部零售商的“开放联盟”模式不同，千问App依托的是阿里内部庞大且深度的生态协同——底层是Qwn大模型，上层直接打通淘宝商品库、支付宝支付体系及本地生活服务体系。这种深度整合有效解决了AI Agent落地中最棘手的“决策信任”与“支付断点”难题。

千问，拆解阿里巴巴系App

Agent形态产品不甚新鲜，行业对此也基本祛魅，但矛盾点依然是日益泛滥的Agent和难以解决的真实问题，阿里巴巴也意识到了这些关键点，于阿里巴巴生态体系内，可以最大化做好协同，同时尽可能将体验做深。在做好阿里巴巴内部生态Agent的基础上，未来千问走向通用型Agent是顺理成章的事。

接入淘宝后，千问App可以真正帮助用户解决“买什么、怎么选、值不值得买”的难题。千问App不仅能根据用户的真实需求给出购物建议，更能基于淘宝庞大的商品数据库和评价体系，智能生成具体的商品推荐方案。用户只需一个指令，即可在千问App完成从消费决策到交易的闭环。

吴嘉表示，对于消费场景，互联网上的营销信息繁杂、噪音巨大。如何训练模型的理解分辨能力很关键。千问App不仅仅依靠世界知识，更能利用阿里巴巴独特的交易和服务数据来增强模型，从而保障AI购物功能保持客观和准确。

千问能“调得动”淘宝、支付宝、飞猪、高德这些 App，本质上是一整套系统工程。例如统一的能力接口层（API 化），阿里生态里每个 App 本来都是独立系统，要让千问能调用，第一步是把这些能力标准化成“机器能用”的接口，包括下单接口、查询接口、支付接口等。其中的工作量极大，相当于一次生态级的“AI 化改造”。

再如Agent 调度与工具编排系统，千问并不像豆包手机那样，直接“点”某个App，那样就无需做对应App的改造，千问是将用户一句话拆解成多个子任务，选择合适的工具并按顺序调用，输出结果馈给用户，其中涉及到任务编排引擎等能力。

这一系列“办事能力”的爆发，源于千问底层技术的突破：千问大模型Coding能力的大幅提升，使其能实时构建工具；全模态理解能力的突破，让千问能够看懂界面听懂声音同时读懂图文报表；最后是超长上下文的处理能力大幅提升复杂上下文的交付上限。

基于这些技术能力突破，千问 “任务助理”功能在App和Web端开始定向邀测。该功能具备类人化的多步骤规划能力，覆盖应用开发、Office办公、咨询调研及生活办事等核心场景，支持一键处理报表整理、研报撰写及小工具生成等复杂任务。测试结束后，该功能将面向用户免费开放。（本文作者 | 张帅，编辑 | 盖虹达）

千问接入淘宝、支付宝等App，阿里巴巴Agent行动开始了

千问能做什么？

千问，拆解阿里巴巴系App

敬原创，有钛度，得赞赏