CodexのWindows Computer Use対応:AIコーディングエージェントが「コードの中」から「実機の画面」へ出てきた
2026年5月29日付のOpenAI Codex changelogで、Codex app 26.527として「Computer use and mobile access on Windows」が追加された。内容は大きく二つある。第一に、CodexのComputer UseがWindowsで動くようになり、Windowsデスクトップアプリを画面上で見て、クリックし、入力できるようになった。第二に、Remote controlがWindows端末にも対応し、ChatGPTのiOS/AndroidアプリやMac上のCodexから、Windows端末上のCodex作業を開始・確認できるようになった。あわせて、プロフィール画面の利用統計・トークン活動表示、ローカルプロジェクトやworktree向けのスレッド調整、過去スレッド検索の拡張も入っている。(developers.openai.com)
これは新しいLLMの発表ではない。だが、生成AIエージェントの実用面ではかなり重要な更新だと思う。理由は、コーディングエージェントの作業場所が「リポジトリ」「ターミナル」「PR」から、ユーザーの実機OSへ広がるからだ。これまでのAIコーディング支援は、主にテキストで表現できる世界を扱ってきた。ソースコード、ログ、テスト結果、シェル出力、Git差分。今回の更新はそこに、GUI上でしか再現しにくいバグ、ブラウザやデスクトップアプリの設定、プラグイン化されていない業務ツール、複数アプリをまたぐ確認作業を持ち込む。OpenAIのComputer Useドキュメントも、コマンドラインや構造化された統合だけでは足りない場面、たとえばGUI固有のバグ再現やアプリ設定変更、ブラウザ操作などを用途として挙げている。(developers.openai.com)
特にWindows対応の意味は大きい。多くの開発現場、とりわけ企業内ツール、業務アプリ、検証環境、社内デスクトップアプリはWindows前提で動いている。Codex app for Windowsは、PowerShellとWindows sandboxを使うネイティブ実行、またはWSL2での実行を選べる構成になっており、Windows側の開発環境を一級市民として扱おうとしている。これにより、AIエージェントは「Linux的な開発者環境だけで強い道具」から、より一般的な企業端末上の作業者に近づく。(developers.openai.com)
ただし、今回の更新を「完全自律エージェントの到来」と読むのは早い。むしろOpenAIの説明は、制約をかなり明確に書いている。WindowsのComputer Useはアクティブなデスクトップ上で動き、同じWindowsセッションを人間が使い続けながら裏側で動かすことはできない。Codexがポインタを動かし、入力し、前面の画面を使う。継続作業をさせたい場合は端末をロックせず、ネット接続を保つ必要があり、場合によってはWindows VM内で動かすことが推奨されている。これは不便でもあるが、安全上は重要な性質だ。見えない場所で勝手に操作するのではなく、少なくともWindowsでは「机を一時的に貸す」感覚に近い。(developers.openai.com)
リスクの中心は、モデルの賢さではなく権限設計に移る。Computer Useはプロジェクトワークスペースの外にあるアプリやシステム状態にも影響しうるため、OpenAIはスコープを絞ったタスクに使い、許可プロンプトを確認するよう注意している。また、Codexが操作できるアプリは許可したものに限られ、ファイル読み取り・編集・シェルコマンドはスレッドごとのsandboxとapproval設定に従う。Windows app側でも、フルアクセスモードではプロジェクトディレクトリ外に影響し、意図しない破壊的操作やデータ損失につながりうるため、sandbox境界を維持するよう説明されている。(developers.openai.com)
Remote controlも同じく便利さと危うさが同居する。公式ドキュメントによれば、リモート接続では接続先ホストのプロジェクト、スレッド、ファイル、認証情報、権限、プラグイン、Computer Use、ブラウザ設定、ローカルツールが使われる。スマホからできることには、新しいスレッドの開始、作業中の指示追加、質問への回答、コマンドやアクションの承認、差分・テスト結果・ターミナル出力・スクリーンショットの確認が含まれる。これは移動中のレビューには便利だが、スマホの小さな画面で高権限アクションを承認する運用は、組織によっては慎重なルールが必要になる。(developers.openai.com)
今回の更新が示している競争軸は、単純な「コード生成性能」ではない。今後のコーディングエージェントは、どのモデルが賢いかだけでなく、どの環境に常駐できるか、どのOS権限を安全に扱えるか、どの端末から監督できるか、どの操作が監査可能かで評価される。AIがコードを書く段階から、AIに開発環境の一部を任せる段階へ移るほど、重要になるのは「実行できる能力」よりも「実行させてよい範囲」の設計だ。
実務上の落としどころは見えている。Computer Useを本番アカウントや日常利用端末でいきなり広く許可するのではなく、検証用VM、テストアカウント、限定されたアプリ許可、sandbox既定、明示的なapproval、操作ログ、差分レビューを組み合わせる。AIエージェントは、画面を見て操作できるようになるほど強力になる。同時に、それは「コードを書ける助手」ではなく「自分の作業机に手を伸ばせる助手」になるということでもある。
出典:OpenAI Developers Codex changelog、Computer Use、Remote connections、Windows documentation。(developers.openai.com)