谷歌放下围墙,Gemini Spark 接入 MCP 开放第三方生态

2026.07.01 09:16
谷歌Gemini Spark面向AI Ultra订阅用户推送两项重大功能更新:接入MCP协议支持第三方应用生态,并新增实时主题跟踪能力。此次升级意味着AI助手正从被动问答工具进化为主动介入全场景工作流的系统级智能体,而实现这一跃迁的关键在于——谷歌接纳了由竞争对手Anthropic发起的开源协议MCP,这标志着AI行业的竞争已从模型竞赛转向生态竞赛。

你的 AI 助手不再需要你打开任何 App。

7月1日,谷歌为 Gemini Spark 推送了两项关键更新:逐步接入 MCP(模型上下文协议)支持的第三方应用生态,并新增实时主题跟踪能力。Canva、Dropbox、Instacart、OpenTable、Zillow Rentals——用户只需一句话,Spark 就能替你在这些服务之间穿梭执行任务,从设计一张海报到订好今晚的餐厅。同时,Spark 与 Google Keep 和 Tasks 的协同也得到深化,零散的想法可以跨应用一键转为待办事项。

如果这只是又一轮功能更新,它不值得被大书特书。但这次升级背后的底层逻辑,指向一个更根本的判断——谷歌正在把 AI 助手从一个「对话工具」进化为 AI 时代的「应用入口」。而实现这一跃迁的关键技术,来自它最直接的竞争对手。

MCP:一个协议,缝合 AI 与世界的裂缝

这次更新的技术内核,是模型上下文协议(Model Context Protocol,简称 MCP)。

MCP 由 Anthropic 于2024年11月25日开源。它的设计哲学用一个类比就能说清:给 AI 世界造一个「USB-C 接口」。不管后面接的是数据库、API 还是第三方 SaaS 应用,只要双方都遵守 MCP 协议,插上就能用,不需要为每一个工具单独开发定制连接器。

这套架构极其简洁。MCP 采用客户端-服务端模型:AI 模型作为客户端,通过标准化的「通知-资源-工具调用」机制,与服务端(外部数据源和工具)完成交互。过去一个想让 AI 同时连接 Slack、Google Drive、GitHub 和内部数据库的公司,需要开发四套独立的集成方案。有了 MCP,只需要一套协议。

Anthropic 开源 MCP 时,没人预料到它会以这个速度横扫行业。到2026年3月25日,MCP SDK 月下载量突破9700万次——这是任何开发者工具都未曾达到的增长曲线。微软、谷歌、亚马逊、OpenAI 全部原生接入。2026年2月,谷歌与微软联合推动 WebMCP 成为 W3C 标准提案,让浏览器本身成为 AI Agent 的工具箱。Chrome 和 Edge 合计占据全球超七成的浏览器市场份额,这意味着 WebMCP 的落地几乎不可阻挡。

一个由竞争对手发起的开源协议,正在变成整个行业的共同语言。谷歌接纳 MCP,不是示弱,是务实。

从租车到雇司机:Spark 的底层基因

理解这次升级的真正分量,需要先看懂 Gemini Spark 到底是什么。

2026年5月的 Google I/O 大会上,谷歌发布了 Gemini Spark——一款 7×24 小时运行在云端虚拟机上的「永续 AI 代理」。它跑在当天同步发布的 Gemini 3.5 Flash 模型上——谷歌选 Flash 而非 Pro 来驱动 Spark,不是巧合,因为 Agent 场景对低延迟和高吞吐的需求远大于对极致推理深度的需求。Spark 背后的 Antigravity 2.0 架构包含了目标状态持久化、工具编排、崩溃恢复和安全约束等完整工程模块。

过去的 AI 助手本质上都是无状态的:你发一条消息,模型生成一个回复,会话结束。Spark 不是这样。它的目标状态不会因为你合上笔记本而消失,VM 崩溃了能从最近的 checkpoint 恢复执行。用工程的眼光看,这就是一个有状态的长时任务调度器。

简单类比:从「叫出租车」变成了「雇全职司机」。但 Spark 之前有一个致命短板——它再能干,也只能在谷歌自己的地盘上转。它能读 Gmail、查日历、编辑 Docs,但一旦你想让它帮你做一张 Canva 海报、在 OpenTable 上订位或者在 Zillow 上找出租房,它就无能为力。接入 MCP 后,Spark 的工具触角第一次伸出了谷歌生态的围墙。第三方服务不再需要为 Spark 定制集成,只需提供一个 MCP 端点,Spark 就能像调用自家工具一样调用它们。

实时跟踪:AI 从「等你问」到「主动报」

另一项更新的工程分量,不亚于第三方集成。

Gemini Spark 现在可以对体育赛事比分、金融股票行情、新闻社交媒体热点等动态事件进行实时监控。用户设定一个关注主题后,Spark 会在后台持续追踪相关信息的变化,并在有重大更新时主动推送——不再需要用户反复追问「现在怎么样了」。

表面上看,这是一个消息推送功能。但它的底层机制值得深挖。Gemini Spark 的架构从设计之初就内建了定时触发器(Cron 表达式)和持续运行能力,Antigravity 2.0 的 Manifest 文件可以声明诸如「每个工作日9点,检查昨天以来的所有 PR 并汇总结果发布到 Slack」这样的自治任务。实时跟踪功能不是 Spark 学会了新技能,而是这头「永续 Agent」的基因开始兑现。

这种能力的应用场景不止于信息监控。用户可以创建自定义的子代理,让不同的 Spark 实例并行处理不同的任务——一个盯着股市,一个追着赛事,一个轮询收件箱里的紧急邮件。每个子代理独立运行、互不干扰,共享的状态存储由 Antigravity Runtime 统一管理。

胜负手从模型转向生态

Gemini Spark 这次的升级,放在2026年 AI 助手的竞争版图里看,意义完全不同。

当前的价格体系已经高度趋同。ChatGPT Plus 和 Claude Pro 都是20美元/月,面向中度用户。高端方案中,ChatGPT 高端方案(100美元/月)和 Claude Max(100美元/月)直接对标 Google AI Ultra 5x(100美元/月,含 Spark 使用权)。往上还有 Ultra 20x(200美元/月),提供20倍算力额度和完整企业级 Agent 能力。功能上,OpenAI 有最成熟的 GPT 生态和 Codex 编程能力,Anthropic 以安全和长文本见长,谷歌则押注多模态和永续 Agent。

但进入2026年下半年,模型智能本身的边际差异正在缩小。GPT-5.4 强在推理,Gemini 3.5 Flash 强在多模态和速度,Claude Opus 4.6 强在长文本和安全——但对用户来说,这些差异远不如「谁能替我做完更多事」来得直接。企业采购 AI 的决策逻辑,正从「模型智商测试」转向工程化能力、业务穿透力和可量化的系统集成深度。

模型竞赛正在让位于生态竞赛。

Anthropic 是 MCP 的发起者,在工具集成上起步最早。OpenAI 推出 Operator 尝试通过浏览器自动化来破解第三方集成难题——Agent 截取屏幕截图、解析 HTML、像人类一样点击按钮,过程笨拙且脆弱。谷歌则拥有一个其他对手几乎无法复制的结构性优势:它掌控着用户的 Gmail、Calendar、Drive、Docs 等核心数字生活数据。Operator 需要像人一样「看屏幕操作」才能获取的信息,Spark 直接调 API 就能拿到。接入 MCP 之后,这个护城河的边界又向外延伸了一大圈。

100美元的月费,买的到底是什么

当然,这场生态盛宴并非没有代价。

Google AI Ultra 5x 订阅定价100美元/月,是 ChatGPT Plus 和 Claude Pro 的5倍。成本结构很清楚:一台持续运行在谷歌云上的虚拟机,加上每天数百次乃至上千次的模型推理。谷歌目前大概率是亏钱在推。

但它的商业逻辑同样清晰——习惯绑定。一旦用户习惯了24小时在线的 AI 管家——自动追踪你的股票、提醒你关注的球队赛果、在你逛街时顺手查好 OpenTable 的位子——想离开就难了。这像极了 iPhone 生态的锁定效应:不是硬件多好,而是你所有的数据、习惯和关系都在里面。

另一个风险藏在「低打扰与安全监督」的张力里。Agent 越智能、越自主,用户就越不关注它在做什么。但一旦它误判了一封促销邮件为「重要账单」并自动操作,或者错误地取消了一个日程安排,用户可能很久都不会察觉。Spark 的 Manifest 设置了硬性限制:每个目标最多调用50次工具,高风险操作必须等待用户确认。读取类操作自主执行,写入类操作先做再通知,发送邮件和金额交易必须确认。这套安全模型在理论上是审慎的,但在真实场景中能否经得起考验,是 Spark 必须回答的问题。

一个协议,正在重塑 AI 行业底层规则

把视线拉远,2024到2026年的 AI 行业有一条清晰的主线。

先是模型性能竞赛——参数规模、推理能力、上下文窗口,每个数字都像军备竞赛的里程牌。然后是价格战——20美元、100美元、200美元,各家的定价几乎精确咬合。进入2026年,竞赛进入了第三阶段:基础设施标准化。

MCP 解决了 AI「手不够长」的问题——工具怎么连。A2A(Agent-to-Agent)协议则在解决 AI 代理之间的协作问题——Agent 之间怎么分工、怎么交接。两者正在共同搭建 AI 时代的底层通信标准。加上 WebMCP 让浏览器本身成为 Agent 的入口,这三层协议体系正在把碎片化的 AI 世界一块块拼起来。

谷歌接纳 MCP 是这个进程中最具标志性的节点。它表明,即使是拥有最完整第一方生态的科技巨头,也意识到封闭策略在 AI 时代行不通。与其自建一个没人用的私有协议,不如拥抱一个已被行业广泛接受的开源标准。

这不是谷歌的妥协。这是谷歌对现实最清醒的回应。

当所有 AI 助手都能通过 MCP 调用同样的工具,当所有 AI 代理都能通过 A2A 相互协作——用户不会再问「哪个 AI 模型最强」,而会问「哪个 AI 能替我做完最多的事」。Gemini Spark 这次升级,正是在为那个问题准备自己的答案。

作品声明:内容由AI生成