OpenAI初の推論チップ「Jalapeño」——LLM競争は、モデルの外側へ広がっている
きょう取り上げるニュース
きょうは、OpenAIとBroadcomが2026年6月24日に発表した、LLM推論向けチップ Jalapeño を取り上げます。OpenAIはこれを自社初の「Intelligence Processor」と呼び、LLMの推論、つまりChatGPTやCodex、APIがユーザーの入力に応答する段階に最適化したアクセラレータだと説明しています。OpenAI公式発表によれば、JalapeñoはOpenAIとBroadcomが共同で構築する複数世代の計算基盤の最初のチップで、初期テストでは現行の最先端と比べて「性能あたり電力」が大きく改善する見込みだとされています。ただし、最終的な性能測定はまだ続いており、詳細な技術レポートは今後数か月で公開予定です。(openai.com)
何が新しいのか
この発表のポイントは、OpenAIが「モデルを作る会社」から「モデルを動かす物理基盤まで設計する会社」へ、さらに一歩踏み込んだことです。
Jalapeñoは、汎用AIアクセラレータをLLMに流用するのではなく、現代的なLLM推論のための“blank-slate design”、つまり白紙からの設計だと説明されています。OpenAIは、モデル、カーネル、サービングシステム、製品ニーズを踏まえてチップを設計し、BroadcomとCelesticaが実装、ボード、ラック、ネットワーク、量産側を支える形です。さらに、サンプルチップはすでにラボで機械学習ワークロードを動かしており、GPT‑5.3‑Codex‑Sparkを含む負荷で、目標の周波数と電力で動作しているとされています。(openai.com)
ここで重要なのは、これは「学習用チップ」というより、主戦場が 推論 にあることです。LLMは一度作って終わりではありません。ChatGPTで一問一答する、Codexがコードを読んで修正する、エージェントが何十回もツールを呼ぶ。そのたびに推論コスト、レイテンシ、電力、メモリ移動、ネットワークが効いてきます。OpenAIは、Jalapeñoについて、計算、メモリ、ネットワークのバランスを取り、データ移動を減らすことで、理論性能に近い実利用効率を目指すと説明しています。(openai.com)
なぜLLMにとって大きいのか
生成AIの競争は、ここまで「どのモデルが賢いか」に注目が集まりがちでした。ベンチマーク、長文コンテキスト、コーディング性能、マルチモーダル能力。もちろん、それらは今も重要です。
ただ、利用者が増え、エージェント型の使い方が広がるほど、別の問いが前面に出てきます。
その知能を、どれだけ安く、速く、安定して届けられるのか。
OpenAI自身も、推論こそAIが人々に届く場所だと位置づけています。チップの効率改善は、最終的にはChatGPTの応答速度、Codexがより多くの手順を待ち時間少なく実行できること、API製品をより安く作れること、需要が高いときの安定性につながる可能性があります。(openai.com)
これは、LLMの性能改善が「モデルサイズを増やす」だけでは済まなくなっていることを示しています。モデル、推論カーネル、メモリ階層、ネットワーク、スケジューリング、データセンター運用、そして製品体験までを一つの最適化対象として見る。今回のJalapeñoは、そのフルスタック化を象徴する発表です。
AIがAI用チップを作るという循環
もうひとつ面白い点があります。OpenAIとBroadcomは、Jalapeñoが初期設計から製造テープアウトまで9か月で共同開発されたと説明し、その速度にはOpenAIのモデルが設計や最適化の一部を加速したことも関係していると述べています。つまり、いまユーザーに提供されているAIが、将来のAIを動かすインフラ作りにも使われ始めている、ということです。(openai.com)
もちろん、これをそのまま「AIが半導体設計を自動化した」と読むのは早すぎます。高度なASIC開発には、EDAツール、物理設計、検証、製造、パッケージング、電力・熱設計、量産品質など、非常に多くの人間の専門性と産業インフラが必要です。それでも、LLMが設計支援や最適化の一部に使われ、その結果としてチップ開発サイクルが短縮されるなら、生成AIはソフトウェアだけでなく、半導体開発そのものの速度にも影響を与えることになります。
ただし、まだ慎重に見るべきところ
今回の発表には、まだ未確定の部分もあります。
まず、性能については「初期テスト」段階です。OpenAIは、最終的な性能測定は継続中で、詳細な技術レポートを今後公開するとしています。したがって、現時点で外部から比較可能なベンチマークが十分に示されたわけではありません。(openai.com)
また、Jalapeñoは推論向けです。LLM開発に必要な計算資源には、事前学習、追加学習、評価、推論、エージェント実行など複数の段階があります。Jalapeñoが推論効率を改善したとしても、それだけでAI計算資源全体の制約が消えるわけではありません。さらに、OpenAIとBroadcomはギガワット規模のデータセンター展開を見据えるとしていますが、実際の普及には、製造能力、電力、冷却、ネットワーク、供給網、運用ソフトウェアがすべて関わってきます。(investors.broadcom.com)
今後の見通し
今回のJalapeño発表は、生成AI業界の競争軸がもう一段深くなったことを示しています。
これからは、単に「最強のモデルを出した企業」が勝つというより、そのモデルを大量のユーザーに、低コストで、低遅延で、安定して届けられる企業が強くなります。OpenAIがチップ、カーネル、メモリ、ネットワーク、スケジューリング、製品体験までを一体で最適化しようとしているのは、そのためです。
Jalapeñoがどれほど実効性能を出すのかは、今後の技術レポートと実運用を待つ必要があります。ただ、方向性ははっきりしています。LLM競争は、モデルの中だけでなく、モデルを支える物理世界——半導体、電力、データセンター、ネットワーク——へ広がっています。
きょうの一言でまとめるなら、こうです。
AIの知能をめぐる競争は、いよいよ「何を考えるか」だけでなく、「どんな機械の上で考えるか」の競争になってきました。
出典: OpenAI公式発表、Broadcom公式発表。(openai.com)