メニュー

戻る

xAI、Grok 4.3とImagine Agent Modeを発表

xAI、Grok 4.3とImagine Agent Modeを発表
アリスAI2026年05月03日(日) 01時03分28秒

xAI、Grok 4.3とImagine Agent Modeを同時に押し出す理由

2026年5月初旬、xAIはAPI向けの主力モデルとしてGrok 4.3を前面に出し、あわせて創作向けの「Imagine Agent Mode」をβ投入した。今回のポイントは、単に新しいLLMを出したというだけではない。xAIの公式ドキュメントでは、一般的なテキスト用途は「Grok 4.3を使うべき」と案内される一方、画像・動画側は別立てのImagine APIとして整理されている。つまりxAIは、推論・検索・コード実行を担う言語モデルと、映像・画像を担う生成基盤を、「エージェント」という共通の使い方で束ね始めたと見るのが自然だ。 (docs.x.ai)

Grok 4.3の見どころは、価格、速度、そしてツール実行の三点にある。OpenRouterの掲載情報では、Grok 4.3は2026年4月30日公開、100万トークン文脈、入力100万トークンあたり1.25ドル、出力100万トークンあたり2.50ドルという価格設定で、推論は常時オンだという。xAI公式 docs も、4.3を「最も知的で最も速いモデル」と位置づけ、Web検索、X検索、コード実行、コレクション検索などのサーバーサイドツール群を用意している。さらに公式料金表では、Web検索・X検索・コード実行は各1000回あたり5ドル、コレクション検索は1000回あたり2.50ドルで、推論トークンは通常の出力トークンと同じ扱いで課金される。安いのは“素のトークン”であって、エージェント実行全体には別のコスト構造があるわけだ。 (openrouter.ai)

性能面では、Grok 4.3は「最上位独走」というより、「価格性能比の最適化」が色濃い。Artificial Analysisでは、xAI内でのGrok 4.3のIntelligence Indexは53で首位、出力速度も約193トークン/秒で最速とされる。GDPval-AAでも1498 Eloを記録している。他方で、直前のxAI公式ドキュメントではGrok 4.20が200万トークン文脈を掲げていた。OpenRouter掲載の100万トークンという数字が正しければ、4.3は最大文脈の拡大より、速度とコスト、そして実運用しやすさに軸足を移した改訂版だと読める。これは“より大きいモデル”ではなく、“より回しやすい主力モデル”への設計変更である可能性が高い。 (artificialanalysis.ai)

この設計変更が効いてくるのは、AIを「答える道具」ではなく「動く道具」として使う場面だ。xAIのツール関連ドキュメントは、Grokがテキスト生成の外側で、検索し、Pythonを実行し、アップロード文書を横断し、さらには外部MCPツールにも接続できることを前提に組まれている。しかも料金も、トークン消費とツール呼び出しの二層構造になっている。ここから見えるのは、xAIが売っているものが単なるモデルの賢さではなく、「モデル+実行環境+検索基盤」をまとめたエージェント実行基盤だということだ。Grok 4.3は、その基盤の採算性を改善するための中核アップデートと捉えると分かりやすい。 (docs.x.ai)

一方のImagine Agent Modeは、創作ワークフローをチャットから“制作空間”へ押し広げる試みとして興味深い。The Decoderによれば、このモードはGrok Web上のβ機能で、単発のプロンプト生成ではなく、エージェントが計画し、生成し、編集し、修正していくオープンなワークスペースとして動く。用途としては、1分動画、マンガセット、商品ストーリー制作などが想定され、利用には有料アカウントが必要とされる。ここで重要なのは、xAIが2026年1月28日に公式発表したGrok Imagine APIを、すでに「end-to-end creative workflows」のための統合基盤として説明していた点だ。今回のAgent Modeは、突然生えた新機能というより、すでに存在していた画像・動画生成基盤を、エージェントUIで使いやすく包み直したものと考えたほうが実態に近い。 (the-decoder.com)

では、この発表は市場に何をもたらすのか。第一に、価格競争の圧力は確実に強まる。The Decoderが引用するArtificial Analysisの整理でも、Grok 4.3は前世代より安く、コスト対性能で有利な位置に入っている一方、絶対性能ではOpenAIやAnthropicの最上位群にまだ及ばない。つまりxAIは「一番賢い」よりも、「十分に強く、かなり安く、しかも速い」を前面に出してきた。第二に、クリエイティブ領域では、テキスト・画像・動画をまたぐ制作の中心が“単発生成”から“反復型エージェント”へ移る流れを後押しする。もっとも、動画生成は公式 docs でもコンテンツポリシー審査の対象とされており、創作支援の拡大はそのまま安全性・権利処理・品質管理の課題も押し上げる。 (the-decoder.com)

総じて見ると、Grok 4.3は“Grok 4の後継大型発表”というより、xAIが本気で普及させたい実戦モデルの顔つきに近い。常時推論、ネイティブなツール実行、低めの基礎単価、そして創作側ではImagine Agent Modeという制作ワークスペース。これらはばらばらの機能追加ではなく、「調べる・考える・実行する・作る」を一つのエージェント体験に収束させる布石としてつながっている。Grok 4が“存在感を示すモデル”だったとすれば、Grok 4.3は“実際に回すためのモデル”だ。そしてImagine Agent Modeは、その発想を文章生成の外にまで広げる、xAIの次の一手だと言える。 (docs.x.ai)

主な出典: xAI Docs、xAI「Grok Imagine API」発表、Artificial Analysis、OpenRouter、The Decoder。 (docs.x.ai)