OpenAI、ChatGPTの既定モデルをGPT-5.5 Instantへ――「速い日常モデル」はどこまで信頼性を上げたのか
OpenAIは2026年5月5日、ChatGPTの既定モデルをGPT-5.5 Instantへ更新すると発表した。位置づけとしては、長時間考える「Thinking」系ではなく、日常的な質問・文章作成・調査・学習・相談にすばやく応答する“普段使い”のモデルである。今回の変更により、GPT-5.5 InstantはGPT-5.3 Instantを置き換え、ChatGPTの全ユーザーへ順次展開される。APIでも chat-latest として提供される予定で、有料ユーザーは移行期間としてGPT-5.3 Instantを3か月間、設定から利用できる。(openai.com)
今回の発表で最も目を引くのは、OpenAIが示した事実性の改善だ。社内評価では、医療・法律・金融など正確性が特に重要な高リスク領域のプロンプトにおいて、GPT-5.5 InstantはGPT-5.3 Instantよりも「幻覚を含む主張」を52.5%削減した。また、過去にユーザーが事実誤りとして報告した難しい会話でも、不正確な主張を37.3%減らしたとされる。OpenAIのシステムカードは、この評価が「生産環境での平均的な幻覚率」ではなく、意図的に難しい事実性重視のプロンプト群での比較である点を明記している。つまり、数字は実利用全体の誤回答率そのものではないが、モデル改善の方向を示す重要な指標と読むべきだ。(openai.com)
GPT-5.5 Instantの改善は、単に「間違いにくくなった」だけではない。OpenAIは、画像アップロードの分析、STEM系の質問、必要に応じてウェブ検索を使う判断など、日常タスク全般での能力向上を挙げている。発表内の例では、数式の誤りをいったん見落としかけても、検算を通じて誤りの原因に戻り、正しい解へ修正する挙動が示されている。これは、回答を即断するのではなく、出力中に整合性を点検する能力が強化されたことを示す例といえる。(openai.com)
もう一つの大きな焦点は、個人化と記憶の透明性である。GPT-5.5 Instantは、過去のチャット、ファイル、接続済みのGmailなどを、必要な場合により効果的に使い、ユーザーが同じ前提を繰り返し説明しなくても、文脈に合った提案を返しやすくなる。OpenAIは同時に「memory sources」も導入し、回答が個人化された場合に、保存されたメモリや過去チャットなど、どの文脈が使われたかを確認・削除・修正できるようにすると説明している。ただし、表示されるソースは回答形成に影響した全要素を完全に列挙するものではなく、関連度の高い一部にとどまる場合がある。(openai.com)
この変更は、ChatGPTが「単発の質問に答える道具」から「継続的な作業環境」へ近づいていることを示している。たとえば、以前相談した旅行計画、進行中の資料作成、好みの文体、頻繁に使うデータソースなどを踏まえた応答は便利だ。一方で、個人化が強くなるほど、ユーザーには「なぜその答えになったのか」「どの記憶が使われたのか」を確認する権利が重要になる。memory sourcesは、その利便性と説明可能性のバランスを取るための機能と位置づけられる。(openai.com)
安全性の面では、評価は一様に「すべて改善」とは言い切れない。GPT-5.5 Instantのシステムカードによれば、禁止コンテンツの難問ベンチマークでは多くのカテゴリでGPT-5.3 Instantと概ね同等だが、ゴア表現や禁止される性的コンテンツでは統計的に有意な低下が示され、性的コンテンツについては追加のシステムレベル緩和策を適用するとしている。また、脱獄プロンプト評価ではGPT-5.3 Instantからの後退を「暫定的・方向的な結果」とし、プロンプトインジェクション評価では先行モデルと同等と説明されている。(deploymentsafety.openai.com)
特に注目すべきは、GPT-5.5 InstantがOpenAIのPreparedness Framework上、Instantモデルとして初めて生物・化学領域およびサイバーセキュリティ領域でHigh Capabilityとして扱われる点である。OpenAIは、これに応じて生物・化学およびサイバー関連の安全対策を適用したと説明している。ただし、サイバー評価はGPT-5.5 Instantを実運用時より高い推論努力で走らせた場合の能力も見ており、実際の展開では低い推論努力で運用され、GPT-5.5 Thinkingよりは低能力だとも明記されている。(deploymentsafety.openai.com)
医療関連の評価では、HealthBench、HealthBench Hard、HealthBench ProfessionalでGPT-5.3 Instantを上回った。OpenAIは、長い回答がベンチマーク上有利になりやすい問題を考慮し、応答長で補正したスコアも報告している。この点は重要だ。AI評価では「詳しく書いたから高得点」に見えることがあるが、実利用では簡潔さや判断材料の明確さも価値になる。GPT-5.5 Instantが「より短く、直接的で、不要なフォローアップを減らす」方向を掲げているのは、単なる性能競争ではなく、日常利用での摩擦を減らす設計思想の表れでもある。(deploymentsafety.openai.com)
展開面では、強化された個人化はまずPlusとProのWeb版に展開され、モバイル対応が続く。さらにFree、Go、Business、Enterpriseにも今後数週間で拡大する計画とされる。memory sourcesはChatGPTの消費者向けプラン全体でWebから展開され、モバイルにも順次提供される。リリースノートでも、GPT-5.5 InstantがChatGPTの新しい既定モデルとして展開され、精度、明瞭さ、簡潔さ、画像理解、STEM、検索判断を改善すると整理されている。(openai.com)
今後の見どころは三つある。第一に、OpenAIが示した社内評価の改善が、実利用の長い会話や専門的相談でどこまで体感されるか。第二に、個人化が便利さを増す一方で、記憶ソース表示や削除・修正機能がユーザーの信頼をどこまで支えられるか。第三に、高能力化したInstantモデルに対し、安全対策が運用後も十分に更新され続けるかである。GPT-5.5 Instantは、派手な「最強モデル」の発表というより、何億人規模の日常的な接点を少しずつ正確に、短く、文脈に合うものへ近づける更新だ。その小さな改善の積み重ねこそ、ChatGPTという製品の実質的な変化を形づくっている。
主な出典: OpenAI公式発表「GPT-5.5 Instant」、GPT-5.5 Instant System Card、ChatGPT Release Notes、OpenAI Help Centerを中心に参照した。(openai.com)