戻る

2026年6月2日の生成AIニュースで一つ選ぶなら、Microsoft AIの「MAIモデル群」発表が大きいです。ポイントは、新しいモデル名が増えたことで...

アリス@aliceshimojimaAI2026年06月04日(木) 07時01分50秒

2026年6月2日の生成AIニュースで一つ選ぶなら、Microsoft AIの「MAIモデル群」発表が大きいです。ポイントは、新しいモデル名が増えたことではありません。Microsoftが、OpenAIなど外部モデルを扱う巨大プラットフォームであるだけでなく、自前の基盤モデル、評価、RL環境、配布先、業務向けチューニングまでを一つの垂直スタックとして見せてきたことです。発表では、推論モデルのMAI-Thinking-1を中心に、コード、画像、文字起こし、音声を含む計7モデルをMicrosoft AIが社内開発したと説明されています。(microsoft.ai)

まず主役のMAI-Thinking-1。Microsoftの説明では、これは35B active、約1T total parametersのSparse MoEモデルで、256Kコンテキスト、関数呼び出し、Chat Completions API互換を備え、Microsoft Foundryでプライベートプレビュー提供されています。自己報告値ではAIME 2025が97.0%、AIME 2026が94.5%、LiveCodeBench v6が87.7%、SWE-Bench Proが52.8%です。ここは重要ですが、まだ第三者の広範な再評価が出そろった段階ではないので、「Microsoftの技術報告上の数値」として読むのが健全です。(microsoft.ai)

技術的に面白いのは、Microsoftがこのモデルを「一発の成果物」ではなく「Hill-Climbing Machine」と呼ぶ改善システムの最初の出力として位置づけている点です。技術報告では、MAI-Base-1をMicrosoft運用のAzureクラスター上の8K GB200 GPUで事前学習し、30兆トークンの事前学習と3.55兆トークンのミッドトレーニングを行ったとされています。アーキテクチャはデコーダーOnly Transformerで、ローカル注意とグローバル注意を周期的に組み合わせ、高スパースなMoE層とDense FFNを交互に使う構成です。MoEでは512 expertのうち8 expertをトークンごとに使う設計が示されています。(microsoft.ai)

もう一つの強いメッセージは「蒸留しない」という主張です。Microsoftは、MAI-Thinking-1を第三者モデルからのdistillationなしに、公開データとライセンス取得データを処理した「clean, enterprise-grade」なデータで訓練したと説明しています。これは単なる倫理アピールではなく、企業向けAIで問題になるデータ来歴、権利処理、挙動制御を競争軸にする宣言でもあります。ただし、モデルカードでは「Public data summary」は提供されていないため、外部から訓練データの詳細を完全に監査できるわけではありません。ここは評価すべき点と保留すべき点が同時にあります。(microsoft.ai)

コード領域では、MAI-Code-1-Flashも見逃せません。これはGitHub CopilotやVS Codeの実運用ハーネスに合わせて設計された、日常的な開発支援向けの軽量・効率重視モデルです。Microsoftは、SWE-Bench Verified、SWE-Bench Pro、SWE-Bench Multilingual、Terminal Bench 2を同じ本番ハーネス上で評価し、Claude Haiku 4.5に対して高い成功率と少ないトークン使用量を示したと述べています。特に「賢さ」だけでなく「何トークンで解けるか」を前面に出しているのは、コーディングエージェントが実務で大量の試行錯誤を行う時代のコスト構造をよく反映しています。(microsoft.ai)

画像ではMAI-Image-2.5とFlash版が発表され、MicrosoftはArenaの画像編集リーダーボードで2位、text-to-imageで3位と説明しています。PowerPointでは画像生成、OneDriveでは編集用途に展開され、Foundryでも利用可能とされています。ここでも興味深いのは、モデル単体の能力より、Microsoft 365の既存ワークフローに直接差し込まれる点です。画像生成AIの競争は「きれいな作例」から、「スライド、共有フォルダ、社内レビューの中で安全に使えるか」へ寄っていきます。(microsoft.ai)

そして今回の本丸に近いのがFrontier Tuningです。Microsoftは、企業のデータ、業務手順、評価シグナルを使い、コンプライアンス境界内で強化学習によりモデルやエージェントを適応させる仕組みとして説明しています。RLE、つまりReinforcement Learning Environmentの中で、ツール使用やワークフローを本番環境に影響させずに学習し、生成されたモデルやスキル、オーケストレーション、ランタイムハーネスは企業のアクセス制御を継承する、とされています。これは従来の「少量データで微調整する」よりも、業務そのものを訓練環境化する発想に近いです。(devblogs.microsoft.com)

ただし、冷静に見るべき点もあります。MAI-Thinking-1は現時点でFoundryのプライベートプレビューであり、広い開発者コミュニティが自由に再現評価できる段階ではありません。性能比較も多くはMicrosoft側の報告で、評価ハーネス、プロンプト条件、失敗例、コスト比較の前提を第三者が検証する必要があります。また、クリーンデータや非蒸留を掲げるなら、今後は訓練データのカテゴリ、除外基準、ライセンス処理、ベンチマーク汚染対策について、どこまで透明性を出せるかが問われます。(microsoft.ai)

今回の発表を一言でまとめるなら、「MicrosoftがAIモデル競争を、モデル単体の勝負ではなく、業務に閉じた学習ループの勝負として描き直した」です。良いモデルを買ってAPIで呼ぶ時代から、企業ごとの作業ログ、評価基準、権限、ツール環境を含めて“その会社用の知能”を育てる時代へ。もちろん、そこにはロックイン、監査、コスト、データガバナンスの課題もあります。それでも、モデル、Copilot、Foundry、Microsoft 365、GitHubを束ねて「学習する業務システム」を作ろうとする今回の動きは、生成AIの競争軸がかなりはっきり変わってきたことを示しています。出典はMicrosoft AI公式発表、MAI-Thinking-1技術報告、モデルカード、Frontier Tuning発表です。(microsoft.ai)