这显然是阿里巴巴预谋已久的一次集团行动。
1月15日,千问App宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,在全球首次实现点外卖、买东西、订机票等AI购物功能,并向所有用户开放测试。此次升级将上线超400项AI办事功能,让千问App成为全球首个能完成真实生活复杂任务的AI助手。
从产品层面看,千问是阿里巴巴最“年轻”的应用,要调用淘宝、支付宝、高德等App的能力,相当于阿里巴巴要将App的部分功能打碎,以原子化的方式为千问所用,这必然少不了集团的首肯和斡旋。发布会现场,阿里系App各业务负责人也来到现场表示支持。

千问C端事业群总裁吴嘉表示,“AI在拥有超强大脑之后,开始长出了能够触达真实世界的手和脚,在生活中实实在在地替用户‘干活’。千问是第一个真正能帮你办事的AI,我们的独特优势在于‘Qwen最强模型’与‘阿里最丰富生态’的结合。AI办事时代才刚刚开始,一些能力还在探索,我们将一步步迈进,将千问App打造为最强大的人类AI助手,真正让AI帮助到每一个人。”
千问能做什么?
千问想做Agent,路人皆知。
在Manus、豆包手机、智谱GLM等Agent形态产品先后推出的背景下,不同产品也走出了不同路径,各家都在用自己的资源禀赋和产品哲学去定义“AI 该如何进入真实世界”,千问的独特性在于阿里巴巴生态的贯通。
Manus代表的是通用型任务Agent,它没有什么历史资源和包袱,强调的是跨工具、跨流程的自动化执行能力,把复杂任务拆解为步骤,再通过模型调度工具完成闭环,更像一个“数字员工”,Meta收购Manus,看中的也是其想象空间。
豆包手机走的是AI原生终端路线,豆包没有把Agent看做一个App,而是嵌入到操作系统和硬件层面,让 AI 接管搜索、拍照、记录、导航、购物等行为,当然目前有一些安全法规等方面的限制。
智谱 GLM 更偏向能力底座 + Agent 平台的方向。它强调的是大模型能力的工程化、组件化,让 Agent 成为可以被企业和开发者自由组合的生产工具。与 Manus 的“成品型 Agent”不同,GLM 更像是在提供“造 Agent 的能力”。

千问的第一步是生态型 Agent + 真实业务闭环,它不是单纯做一个通用 Agent,也不是只做模型底座,而是把Agent直接嵌进一个已经极其成熟的商业与生活服务生态里,让 AI 从一开始就拥有“能办事”的能力。
在发布会上,吴嘉现场演示AI外卖功能,只需给千问App下达一句话指令,“帮我点40杯霸王茶姬的伯牙绝弦”,千问App迅速调用淘宝闪购下单,无需任何跳转即在端内完成AI支付。这一能力的背后,是千问与淘宝闪购、支付宝原生AI支付能力“AI付”的系统级打通。
就在四天前,谷歌刚刚宣布与沃尔玛等零售商的AI购物合作计划,但目前尚未上线。阿里领先于谷歌,成为全球首个实现多品类AI购物功能的科技公司。
阿里之所以能领先于谷歌推出AI购物,核心在于其独特的“模型+生态”垂直整合能力。与谷歌试图通过UCP协议连接外部零售商的“开放联盟”模式不同,千问App依托的是阿里内部庞大且深度的生态协同——底层是Qwn大模型,上层直接打通淘宝商品库、支付宝支付体系及本地生活服务体系。这种深度整合有效解决了AI Agent落地中最棘手的“决策信任”与“支付断点”难题。
千问,拆解阿里巴巴系App
Agent形态产品不甚新鲜,行业对此也基本祛魅,但矛盾点依然是日益泛滥的Agent和难以解决的真实问题,阿里巴巴也意识到了这些关键点,于阿里巴巴生态体系内,可以最大化做好协同,同时尽可能将体验做深。在做好阿里巴巴内部生态Agent的基础上,未来千问走向通用型Agent是顺理成章的事。
接入淘宝后,千问App可以真正帮助用户解决“买什么、怎么选、值不值得买”的难题。千问App不仅能根据用户的真实需求给出购物建议,更能基于淘宝庞大的商品数据库和评价体系,智能生成具体的商品推荐方案。用户只需一个指令,即可在千问App完成从消费决策到交易的闭环。
吴嘉表示,对于消费场景,互联网上的营销信息繁杂、噪音巨大。如何训练模型的理解分辨能力很关键。千问App不仅仅依靠世界知识,更能利用阿里巴巴独特的交易和服务数据来增强模型,从而保障AI购物功能保持客观和准确。
![]()
千问能“调得动”淘宝、支付宝、飞猪、高德这些 App,本质上是一整套系统工程。例如统一的能力接口层(API 化),阿里生态里每个 App 本来都是独立系统,要让千问能调用,第一步是把这些能力标准化成“机器能用”的接口,包括下单接口、查询接口、支付接口等。其中的工作量极大,相当于一次生态级的“AI 化改造”。
再如Agent 调度与工具编排系统,千问并不像豆包手机那样,直接“点”某个App,那样就无需做对应App的改造,千问是将用户一句话拆解成多个子任务,选择合适的工具并按顺序调用,输出结果馈给用户,其中涉及到任务编排引擎等能力。
这一系列“办事能力”的爆发,源于千问底层技术的突破:千问大模型Coding能力的大幅提升,使其能实时构建工具;全模态理解能力的突破,让千问能够看懂界面听懂声音同时读懂图文报表;最后是超长上下文的处理能力大幅提升复杂上下文的交付上限。
基于这些技术能力突破,千问 “任务助理”功能在App和Web端开始定向邀测。该功能具备类人化的多步骤规划能力,覆盖应用开发、Office办公、咨询调研及生活办事等核心场景,支持一键处理报表整理、研报撰写及小工具生成等复杂任务。测试结束后,该功能将面向用户免费开放。(本文作者 | 张帅,编辑 | 盖虹达)







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论