Skip to main content

Gemini Spark 评测:谷歌 24/7 AI 智能体

作者: Jim Liu9 分钟阅读

Gemini Spark 是谷歌在 I/O 2026 发布的代理式 AI 助手。了解它的功能、何时向 Google AI Ultra 用户开放,以及与 Claude MCP 和 ChatGPT 的对比分析。

我在悉尼凌晨三点看完了 Google I/O 2026 直播,手里端着咖啡,本来以为又是一轮 Gemini 功能小更新。然后 Sundar Pichai 介绍了 Gemini Spark,我当场暂停视频开始记笔记。

这篇文章讲的是我们目前知道什么、还不知道什么,以及为了抢先用 Spark 去开通 Google AI Ultra 订阅是否值得。

TL;DR(快速版)

  • 是什么? Gemini Spark 是谷歌全新的 24/7 代理式 AI 助手,运行在谷歌云专属虚拟机上 — 不需要一直开着电脑
  • 什么时候能用? Google AI Ultra 订阅用户将在 5 月 19 日发布后"下周"获得访问权限;大规模普及时间未确定
  • 竞争对手是谁? Claude + MCP、ChatGPT Custom GPT、OpenHands — 但持久化虚拟机执行模式是真正的不同之处
  • 诚实说缺点: 目前还没公开,Google AI Ultra 约 249 美元/月,完全没有真实性能数据

我是谁,为什么这件事跟我有关

我在悉尼独立运营一批 AI 工具评测网站,包括 openaitoolshub.org。过去 18 个月,我几乎每天都在用各种代理式 AI 方案:Claude + MCP 跑本地工具、ChatGPT Custom GPT、AutoGen 多智能体流水线、OpenHands 处理代码任务。

我是在悉尼 Newtown 一家咖啡馆凌晨三点看的 I/O 2026 直播。我另一半觉得我有点疯。可能确实如此。但对一个把 AI 当主要生产力放大器的独立创业者来说,"需要人一直盯着"和"睡着也能跑任务"之间的差距,就是四十小时工作周和实际有个周末的差距。

我不是以消费者视角评估 Spark。我是以一个需要它覆盖月成本的独立创业者视角在看这件事。

⚖️ 真正的问题不是"Spark 够不够厉害",而是"Spark 能省出多少时间来 cover 约 249 美元/月?"

Gemini Spark 到底是什么

根据谷歌 I/O 2026 发布内容,Gemini Spark 被定义为集成在 Gemini 应用中的"24/7 代理式助手"。

谷歌确认的功能:

  • 持久化执行: Spark 运行在谷歌云专属虚拟机上。你提交一个任务,关掉电脑 — Spark 继续在后台运行
  • 跨应用推理: 它可以读取 Gmail、文档、表格和幻灯片完成任务。发布会演示了 Spark 读取项目邮件并从关联电子表格提取数据,自动起草给主管的进度汇报邮件 — 全程无需人工干预
  • MCP 兼容: Spark 通过模型上下文协议(MCP)接入外部服务,意味着它可以延伸到谷歌产品套件之外
  • 长周期任务: Sundar Pichai 将其称为"智能数字助手的下一次进化……以最少的人工干预承担长周期任务"

与之前 Gemini 功能的核心区别:以前的版本要求用户全程在线。Spark 设计为异步运行,任务完成后再回来汇报。

📊 参考背景:根据 Gartner 2026 年预测,到 2028 年超过 33% 的企业软件将包含代理式 AI 功能。Spark 是谷歌对这一趋势的回应,但首先针对个人用户。

⚠️ 我们还不知道什么

这里是我认为 95% 关于 Gemini Spark 的文章都没做好的地方:它们把发布会通稿当成产品评测在写。那根本不是评测。

以下是目前真正不清楚的地方:

定价细节: 谷歌确认 Spark 首先向 Google AI Ultra 订阅用户开放。但 Ultra 目前约 249 美元/月 — 这是加入 Spark 之前的价格。价格会调整吗?Spark 会是额外收费的功能吗?

MCP 服务器兼容性: "MCP 兼容"听起来很好,但具体支持哪些服务器?Claude 的 MCP 生态有数百个社区服务器。Spark 能直接用现有的 MCP 服务器,还是说谷歌只是把 MCP 当内部协议用?

频率限制和队列深度: 如果 Spark 在专属虚拟机上运行,同时提交五个长时任务会怎样?有队列吗?有超时限制吗?

隐私处理: Spark 需要访问你的邮件、文档和表格。什么数据会离开谷歌的基础设施?数据保留策略是什么?对于处理客户数据的独立创业者,这不是脚注,是核心问题。

任务边界的可靠性: 演示视频里任务衔接很流畅。但真实的代理式系统会在边界处出错 — 格式错误的 API 响应、指令歧义、多步推理错误。我们完全没有 Spark 在实际生产条件下的错误率数据。

我目前还没法测试 Spark — Ultra 订阅用户要到发布后下周才能用,而我现在不是 Ultra 用户。但等我拿到访问权限,这五个问题是我第一批要验证的。

🧭 Spark 与我实际用过的其他代理式 AI 对比

我没法拿 Spark 的真实表现和任何东西比较,因为它还不可用。我能做的是列出我在它可用时会用到的对比维度。

对比维度Gemini SparkClaude + MCPChatGPT Custom GPTOpenHandsAutoGen
持久化执行(不需要开着电脑)✅ 云端虚拟机❌ 本地 MCP 服务器,会话绑定❌ 需要活跃会话⚠️ 服务器托管选项⚠️ 需要运行中的基础设施
谷歌 Workspace 原生访问✅ Gmail/文档/表格/幻灯片🔧 通过 MCP 插件🔧 通过插件,不稳定❌ 非原生❌ 非原生
MCP 生态⚠️ 兼容性待定✅ 数百个社区服务器❌ 使用自己的插件系统✅ 支持 MCP🔧 自定义工具集成
我的使用经验❌ 尚未可用✅ 每天使用超 12 个月✅ 测试超 8 个月✅ 代码任务 4 个月以上✅ 批量任务 3 个月以上
独立创业者 ROI 信号未知 — 等待测试高,适合文档/代码任务中,GPT 表现不稳定高,适合开发工作中,配置成本偏高

我现在实际在用的工具组合:Claude + MCP 处理大多数长文档任务和代码审查;ChatGPT 在 GPT 商店有专用插件的场景下使用;OpenHands 承担代码的无人值守自主开发工作。

这三个工具没有一个能让我做到"提交任务,关电脑,明天检查结果"。Spark 承诺的就是这个。如果它真的做到,它会替代我现有工具组合里的一部分。

该等 Spark 还是用现在已有的工具?

取决于你的情况。

如果你已经是 Google AI Ultra 订阅用户: 下一两周就能拿到访问权限,值得立刻测试。你已经在付费了。

如果你是独立创业者,考虑为了 Spark 去开通 Ultra: 我现在不会这么做。249 美元/月就是 3000 美元/年。先等 30 天让其他用户测完。如果异步执行在真实工作负载下能稳定运行,ROI 计算才会变得合理。现在它只是一个可信度很高的发布公告,不是经过验证的产品。

如果你在用 Claude Pro 或 ChatGPT Plus,工作流以文档和代码为主: 未来几个月你现有的工具组合大概率够用。Claude 的 MCP 生态已经成熟。Spark 的 MCP 兼容性尚未验证。

最该认真考虑现在就加入 Ultra 等待列表的用户:瓶颈在"当前任务没跑完就没法开始下一个 AI 任务"的人。如果你是这种情况,Spark 的持久化虚拟机模型直接解决你的痛点。

我拿到访问权限后会怎么测试

我会坦诚说:我现在还没权限,也不打算假装有。以下是我拿到访问权限后的测试计划。

第 1 周 — 基础异步任务:

  • 提交一个"汇总[客户]本周所有邮件并起草进度更新"任务,隔夜检查
  • 验证 Spark 从表格和文档中提取数字时是否准确,有无幻觉
  • 测试:关掉电脑之后它真的还在跑,还是会卡住?

第 2 周 — MCP 集成压力测试:

  • 将 Spark 连接到我目前与 Claude 一起使用的 3 个 MCP 服务器(Obsidian 知识库、GitHub、Postgres 数据库)
  • 用 Spark 和 Claude + MCP 并行跑同一个任务
  • 测量:任务完成率、幻觉率、节省时间

第 3 周 — 真实工作负载:

  • 给 Spark 布置一个需要 3 小时的独立创业者任务:调研 5 个竞争对手 AI 工具,从它们的官网抓取定价,并整理成对比文档
  • 这是我目前每次要手工花 90 分钟的任务
  • 如果 Spark 在后台完成而我可以专注其他事,249 美元/月的账就容易算了

我会在 openaitoolshub.org 发布测试结果。

Gemini Spark 免费吗?

不免费。根据 I/O 2026 发布会内容,Gemini Spark 首先向 Google AI Ultra 订阅用户开放。目前的 Ultra 套餐约 249 美元/月,而且这还是 Spark 正式加入之前的价格。谷歌没有宣布针对 Spark 的免费层级或试用期。

Gemini Spark 什么时候可以用?

谷歌表示 Ultra 订阅用户将在 2026 年 5 月 19 日发布后"下周"获得访问权限,预计在 2026 年 5 月下旬。更广泛的普及计划尚未宣布。如果你想提前用上,目前唯一的路径是开通 Google AI Ultra。

Gemini Spark 与 ChatGPT Agent 的实际区别是什么?

最大的结构性差异是执行持久性。ChatGPT 的 Agent 功能(包括 Operator)需要活跃的会话 — 关掉浏览器任务就停了。Gemini Spark 运行在谷歌云虚拟机上,意味着你退出登录后它仍然在工作。另外,Spark 可以不需要额外插件直接访问 Gmail、文档、表格和幻灯片,而 ChatGPT 要接入相同功能需要依赖自己的插件生态。这些差异在实践中是否重要,完全取决于 Spark 的任务完成可靠性 — 这只有等真实用户大规模测试后才知道。


等 Spark 开放访问、我能跑真实测试之后,我会持续更新这篇文章。

如果你想了解我如何评测其他 AI 智能体和工具(包括我每天用了好几个月的产品),可以从 AI 智能体架构指南入手了解底层模型,或者看看我写的 Microsoft Agent 框架评测Mastra AI 评测,如果你现在就需要 Spark 的替代方案。


作者简介: Jim Liu,悉尼独立创业者,运营多个 AI 工具评测网站,包括 openaitoolshub.org。自 2023 年以来每天测试 AI 生产力工具,专注于代理式 AI 系统在独立创业者和小型团队中的实际表现。了解更多关于 Jim →