Googleが5月19日、Gemini APIに「Managed Agents」を追加した。見た目は新しいAPI機能の発表だが、重要なのは、LLMエージェントに必要な実行環境そのものをクラウドサービス化し始めた点にある。単一のAPI呼び出しで、Antigravity agentを安全なクラウドサンドボックス上に起動し、推論、ツール利用、コード実行、ファイル操作、Web閲覧まで行わせる設計だ。カスタムエージェントはAGENTS.mdやSKILL.mdのようなMarkdownファイルで定義でき、Gemini APIではプレビューとして提供される。(blog.google)
これまで「エージェントを作る」とは、モデルを呼び出すだけでは済まなかった。実行用VM、ブラウザ、ファイルシステム、状態管理、権限、ログ、外部API接続、失敗時の復帰を個別に組み合わせる必要があった。GoogleのManaged Agentsは、その重たい周辺部を「エージェント・ランタイム」としてまとめて提供する。Googleは、各インタラクションが環境を作成または受け取り、後続呼び出しでファイルや状態を保持したまま再開できると説明している。つまり、これはFunction Callingの拡張というより、AIが作業する一時的な作業部屋をAPIで借りる仕組みに近い。(blog.google)
同時に発表されたGemini 3.5 Flashも、この文脈で見ると意味がはっきりする。Googleは3.5 Flashを「エージェントとコーディング向け」のモデルとして位置づけ、Terminal-Bench 2.1、MCP Atlas、CharXiv ReasoningなどのベンチマークでGemini 3.1 Proを上回ると主張している。また、出力トークン速度では他のフロンティアモデルより4倍速いとも説明している。ただし、これはGoogle自身の発表であり、現時点では独立した検証結果と切り分けて読むべきだ。(blog.google)
面白いのは、モデル性能の話がすぐに「複数サブエージェント」「長時間タスク」「コードベース移行」「文書処理」といった運用の話に接続されていることだ。GoogleはAntigravity 2.0、Antigravity CLI、SDK、Gemini APIのManaged Agentsを同時に並べ、開発者の作業面を一つのエージェント基盤に寄せている。Gemini CLIからAntigravity CLIへの移行告知でも、複数エージェントが連携して仕事を分割する現実に合わせ、単一のバックエンドに統合すると説明している。(blog.google)
ただし、この方向には明確な注意点もある。Googleのドキュメントでは、Managed AgentsはPublic Previewであり、機密性の高いワークフローでは出力と行動を確認するよう注意している。さらに、サンドボックスはOSレベルで隔離される一方、デフォルトでは外向きネットワークアクセスが無制限で、必要に応じて許可リストで制限する設計だ。認証情報についても、エージェントはアクセス可能な資格情報を使えるため、最小権限や短期トークンの利用が推奨されている。(ai.google.dev)
ここが今回の発表の核心だと思う。エージェントの価値は「賢い返答」ではなく、「どの環境で、どの権限で、どの状態を保持して、どこまで実行してよいか」に移りつつある。Managed Agentsは開発者の負担を下げる一方で、実行ループ、状態管理、サンドボックス、課金、監査の多くをGoogleの基盤に預けることになる。便利さは大きいが、ブラックボックス化とベンダーロックインも同時に進む。
今後の焦点は三つある。第一に、ログと再現性。エージェントが何を見て、どのツールを呼び、なぜその操作を選んだのかを後から追えるか。第二に、権限設計。ネットワーク、ファイル、外部API、決済、メール送信のような高リスク操作を、どれだけ細かく制御できるか。第三に、移植性。AGENTS.mdやSKILL.mdのような定義ファイルが、Google外のエージェント基盤とも相互運用できるのか。
生成AIの競争は、モデル単体の賢さから、モデルが実際に働く「作業環境」の競争へ移っている。今回のManaged Agentsは、その変化をかなり率直に示す発表だった。エージェント時代のAPIとは、もはやテキストを返す窓口ではなく、隔離された小さな作業場を起動するボタンになりつつある。