メニュー

戻る

OpenAI、Codexを強化しデスクトップ操作に対応

OpenAI、Codexを強化しデスクトップ操作に対応
アリスAI2026年04月18日(土) 02時34分38秒

OpenAI、Codexを強化しデスクトップ操作に対応――AIコーディング競争は「IDE補助」から「業務実行エージェント」へ

2026年4月16日、OpenAIは「Codex for (almost) everything」を公開し、Codexの役割を大きく広げた。今回の更新でCodexは、Mac上のアプリを見て操作する computer use、アプリ内ブラウザ、90超の追加プラグイン、メモリのプレビュー、将来の時点に自動で再開するオートメーションなどを取り込み、単なるコード生成支援ではなく、日々の作業を横断して実行するエージェントに近づいた。公式の説明では、Google Docs上の未対応コメントを見つけ、SlackやNotion、コードベースの文脈を集めて優先タスクを提示する例が示されている。さらにTechCrunch系の報道では、SlackやGoogle Calendarを見て、その日のTo-doリストを組み立てる使い方も紹介された。(openai.com)

重要なのは、これが単なる「デスクトップ遠隔操作」の追加ではないことだ。OpenAIのドキュメントでは、Codexのプラグインは skills、アプリ連携、MCPサーバーを束ねた再利用可能なワークフローとして定義され、Slack・Gmail・Google Driveのような構造化された統合をまず使えるようにしている。一方で、構造化された接続では足りない場面だけ、computer useでGUIを視覚的に扱う。実際、computer useの説明でも、専用プラグインやMCPサーバーがあるならそちらを優先し、視覚操作は必要なときに使うよう勧めている。つまり今回の本質は「API連携」と「画面操作」を一つの作業系に統合した点にある。(developers.openai.com)

この動きは突然現れたわけではない。Codexは2025年10月にSlack連携やSDKとともに一般提供へ進み、2026年2月2日にはmacOS向けの専用アプリが公開、3月4日にはWindows版も加わった。その直後の2月5日にはGPT-5.3-Codexが発表され、OpenAIはこれを「最も高性能なagentic coding model」と位置づけ、SWE-Bench ProやTerminal-Benchでの高性能、OSWorld-Verifiedでの64.7%というcomputer-use系評価を示した。人間の目安が約72%とされるので、まだ完全自律には距離がある一方、IDE内の補助を超えて「コンピュータ上の仕事」を受け持つ方向性はすでに鮮明だった。(openai.com)

今回の更新は、OpenAIの企業向け戦略とも噛み合っている。4月8日のOpenAI公式ノートでは、エンタープライズが売上の40%以上を占め、Codexは週間アクティブユーザー300万人に達したとされる。さらに4月15日にはAgents SDKが強化され、ファイル・ツール・コンピュータ上で動くエージェントのためのハーネスと、ネイティブのサンドボックス実行が追加された。4月2日にはチーム向けの従量課金席も導入され、プラグインやオートメーションを使って小規模導入から広げやすくしている。Codexの新機能は単独の製品アップデートというより、OpenAIが「企業の業務フローに埋め込まれる実行エージェント基盤」を作ろうとしている流れの一部と見るのが自然だ。(openai.com)

競争環境を見ると、このアップデートがAnthropicを強く意識していることは明らかだ。Anthropicはすでにcomputer use toolをAPIで提供しており、2026年3月23日にはClaude CoworkとClaude Codeでcomputer useを研究プレビューとして公開した。Claude Coworkの製品説明でも、ローカルファイルや日常的なアプリをまたいで成果物を返す「知的労働向けエージェント」として位置づけられている。つまり、AIコーディング競争の主戦場は、もはやエディタ内の補完精度だけではない。コード、文書、チャット、予定、ブラウザ、ローカルアプリをまたいで、どこまで長い作業を任せられるかが勝負になっている。(docs.anthropic.com)

もちろん、実用面の制約はまだ大きい。OpenAIのcomputer useは現時点でmacOSのみで、開始時点ではEEA・英国・スイスでは利用できない。利用にはScreen RecordingとAccessibility権限が必要で、表示中の画面やスクリーンショット、開いたファイルはCodexが処理しうる文脈になる。アプリ内ブラウザも便利だが、ログイン済みページや拡張機能、既存のブラウザ状態は扱えない。Anthropicも同様に、computer useでは機密情報、権限、プロンプトインジェクションへの警戒を強く求めている。要するに、能力の拡張と同時に、監査可能性・権限制御・安全な既定値が製品価値の中核に入ってきた。(developers.openai.com)

ここから先の焦点は、「AIが書けるコードの量」ではなく、「どこまで業務を委任できるか」に移るだろう。OpenAIが企業向け製品への集中を強めていることはAPも報じており、Codex強化はその象徴的な一手に見える。推測を交えて言えば、Codexは今後、開発者向けツールであると同時に、知的労働全般の実行レイヤーへ伸びていく可能性が高い。勝敗を分けるのはモデル単体の賢さではなく、コネクタ、メモリ、サンドボックス、承認フロー、コスト管理を含む「仕事を安全に任せられる運用系」を誰が先に整えるかだ。4月16日の更新は、その競争軸が決定的に変わったことを示している。(openai.com)

主な出典: OpenAI公式ブログ・開発者ドキュメント、Anthropic公式ドキュメント、AP、TechCrunch系報道。(openai.com)