Google Interactions API 正式 GA:终结 AI 编排代码时代的前端新范式

m
marvis

Google Interactions API:重新定义 AI 应用的前端交互范式

2026年6月26日,Google 宣布 Interactions API 正式达到 GA(General Availability) 状态,成为与 Gemini 模型和 Agent 交互的主要接口。据 Google DeepMind 官方公告,该 API 自 2025 年 12 月公开测试以来,"已迅速成为开发者使用 Gemini 构建应用的首选方式"。此次 GA 版本锁定了稳定 Schema,并引入了 Managed Agents、后台执行和工具组合 三项核心能力。

从模型调用到交互会话的范式转变

Google 不再将模型调用视为交互的基本单元。在 Interactions API 中,基本单元是"交互"——一个服务端管理的、有状态的、可长期运行的会话。这种转变对前端开发者意义深远:

  • 消除编排代码:传统 AI 应用中,前端开发者需要编写大量胶水代码来串联模型调用、工具执行和状态管理。Interactions API 将这些编排逻辑下沉到服务端,前端只需一次 API 调用。
  • Managed Agents:一次调用即可启动带有 Linux 沙箱的托管 Agent,前端无需关心 Agent 的运行环境和生命周期管理。
  • 后台执行:Agent 可在后台持续运行,前端通过流式接口实时获取进度更新,极大简化了长时间任务的 UI 实现。

前端集成的最佳实践

Google DeepMind 的 Ali Çevik(Group Product Manager)和 Philipp Schmid(Developer Relations Engineer)在官方公告中指出,Interactions API 的设计目标是消除 "AI 协调差距"(AI Coordination Gap)——即模型、工具、Agent 和状态之间切换时产生的可靠性和成本惩罚。对于前端开发者而言,这意味着:

  • 使用统一的 /interactions 端点替代此前分散的多端点调用模式
  • 通过 Server-Sent Events(SSE) 实现流式 UI 更新,无需自行管理 WebSocket 或轮询
  • 服务端自动处理重试、超时和错误恢复,前端只需关注用户体验

与现有生态的对比

在 AI 编排领域,LangGraphAutoGen 是多供应商可移植性的代表方案。但 Google Interactions API 的优势在于其与 Gemini 模型的深度集成,以及服务端管理的零运维开销。对于已经深度使用 Gemini 的前端团队,Interactions API 可以大量减少自定义编排代码的编写和维护工作量。

核心建议:如果你的技术栈以 Gemini 为模型底座,Interactions API 是当前最优选;如果需要多模型供应商的可移植性,LangGraph 仍是更合适的选择。