Appleの第3世代Foundation Modelsを読む:AIは「アプリ」ではなくOSの層になる
2026年6月8日、Appleは第3世代のApple Foundation Modelsを発表した。単なるSiri刷新ではなく、Apple Intelligence全体を支えるモデル群、クラウド実行基盤、開発者APIをまとめて更新した発表として見るべきだ。中心にあるのは、Googleと共同で構築した5つの基盤モデルで、オンデバイスからPrivate Cloud Computeまでをまたいで動作する。(machinelearning.apple.com)
今回のモデル構成はかなり明確だ。オンデバイス側には、3Bパラメータの密なモデルであるAFM 3 Coreと、20Bパラメータながらリクエストに応じて1〜4Bだけを活性化する疎なAFM 3 Core Advancedがある。後者は音声表現や高精度ディクテーションなどを想定したネイティブ・マルチモーダルモデルで、Apple silicon上で動くことを前提に設計されている。クラウド側にはAFM 3 Cloud、画像生成・編集向けのADM 3 Cloud、そしてエージェント的ツール利用や複雑推論向けのAFM 3 Cloud Proが置かれる。(machinelearning.apple.com)
技術的に面白いのは、Appleが「巨大モデルを端末に載せる」問題を、単純な小型化ではなくメモリ階層の設計として扱っている点だ。AFM 3 Core Advancedは全重みをDRAMに置かず、NANDに保持し、プロンプト単位で必要な専門家重みを選びDRAMへ読み込む。標準的なMoEのようにトークンごとに頻繁に重みを入れ替えるのではなく、初期処理で固定セットを選び、生成中に周期的に再選択する。これは「端末上のLLM」を、モデルサイズだけでなくストレージ、帯域、レイテンシを含めたシステム問題として解いている。(machinelearning.apple.com)
もう一つの大きな転換は、Private Cloud Computeの拡張だ。AppleはこれまでPCCをApple siliconと自社データセンター中心の「プライベートなクラウドAI推論」として説明してきたが、今回はGoogle Cloud上のNVIDIA GPUにも広げる。Appleによれば、AFM 3 Cloud Proのような高負荷タスクでは、GoogleとNVIDIAと協力してPCCをGoogle Cloudへ拡張し、Apple端末はAppleが暗号学的に承認したPCCソフトウェアだけを信頼する。さらに、ハードウェア台帳、複数の信頼の根、バイナリ公開、研究者向け検証アクセスなども説明されている。(security.apple.com)
これは重要な緊張を含んでいる。AppleのAI戦略は「できるだけ端末で、必要なときだけプライベートクラウドへ」という物語で強みを持ってきた。しかし高度な推論、画像生成、エージェント的ツール利用を実用化しようとすると、Apple siliconだけではなくGoogle CloudやNVIDIA GPUの計算資源も必要になる。つまり今回の発表は、Appleがプライバシー路線を捨てたという話ではなく、プライバシー保証を保ったまま、信頼境界を外部クラウドへ拡張しようとしている発表だと読める。
開発者向けの変化も大きい。Foundation Models frameworkは、Apple Foundation Modelsだけでなく、ClaudeやGeminiのようなクラウドモデル、Language Model protocolに準拠する任意のプロバイダも扱えるようになる。画像を含むマルチモーダルプロンプト、OCRやバーコードリーダーのようなVisionツール呼び出し、会話中にモデル・ツール・指示を切り替えるDynamic Profilesも説明されている。一定条件を満たす小規模アプリ開発者は、PCC上の次世代Apple Foundation ModelsをクラウドAPI費用なしで使えるともされている。(developer.apple.com)
ここから見えるAppleの狙いは、チャットボット市場で正面からOpenAIやAnthropicと競うことではない。むしろ、AIをOSの「配線」にすることだ。App Intentsのスキーマを通じてアプリの内容や操作をSiri AI、Spotlight、Shortcutsに接続し、View Annotationsで画面上の対象を会話的に参照できるようにする。ユーザーから見ると、モデル名を選ぶ体験ではなく、「今見ているもの」「使っているアプリ」「端末内の文脈」にAIが自然に入ってくる体験になる。(developer.apple.com)
ただし、評価は慎重に見る必要がある。Appleは第3世代モデルが2025年の自社モデルより改善したとし、AFM 3 CoreやAFM 3 Cloudについて人間評価の選好率、応答満足度、指示追従、画像理解、音声合成、ディクテーションでの改善を示している。一方で、現時点の発表は主にApple内部の比較であり、外部ベンチマークや詳細な技術レポートは「今年後半」とされている。したがって、これは「公開比較で最強のモデルが出た」というニュースではなく、「AppleがOS統合型AIのための第3世代基盤を示した」というニュースだ。(machinelearning.apple.com)
今後の焦点は三つある。第一に、PCC on Google CloudがAppleの説明通り検証可能な透明性を保てるか。第二に、開発者がApp IntentsとFoundation Models frameworkを使い、実際にアプリ体験を作り替えるか。第三に、Siri AIが「賢いデモ」ではなく、日常の失敗しにくい操作インターフェースになれるか。
今回の発表の本質は、AIモデルの性能競争そのものよりも、モデルをどこで実行し、どの権限でアプリに触らせ、どの範囲までユーザー文脈を扱わせるかという設計にある。生成AIの次の競争軸は、単体モデルの賢さだけではなく、OS・クラウド・アプリ・プライバシーを束ねた「実行環境」の設計へ移っている。Appleの第3世代Foundation Modelsは、その移行をかなりはっきり示した発表だった。
出典:Apple Machine Learning Research、Apple Security Research、Apple Developer。(machinelearning.apple.com)