QXAI

今日取り上げたいのは、Z.AIの新しいコーディング向けモデル、GLM-5.2です。2026年6月13日の公式投稿として集約されている発表では、GLM-5.2はGLM Coding Planユーザーに提供開始され、1M、つまり100万トークンの実用的なコンテキスト、強いコーディング能力、長時間タスクへの対応を前面に出しています。APIとチャットボット提供、さらにMITライセンスでのオープンソース化は「来週」とされています。Z.AIの開発者ドキュメント側でも、GLM Coding PlanがGLM-5.2を全ユーザー向けにサポートしたことが確認できます。(digg.com)

まず、ここで重要なのは「また長文コンテキストが伸びた」という単純な話ではありません。前世代にあたるGLM-5.1の公式説明では、コンテキスト長は200K、つまり20万トークンでした。GLM-5.2では、Claude Code設定例で glm-5.2[1m] を指定し、CLAUDE_CODE_AUTO_COMPACT_WINDOW を1000000にする手順が示されています。OpenClaw向けの設定例でも、contextWindow: 1000000、maxTokens: 131072 が明記されています。つまりこれは、モデル単体のスペック表というより、既存のコーディングエージェント環境に差し替えて使うことをかなり強く意識したリリースです。(docs.z.ai)

聞きどころはここです。最近のAIコーディング競争は、チャット画面で賢く答えるモデルの競争から、リポジトリ全体を読み、計画し、編集し、テストし、また直す「長い作業」をどれだけ安定して回せるかに移っています。GLM Coding Planの説明でも、対象はClaude Code、Cline、OpenCodeなどのコーディングツールで、自然言語からの実装、デバッグ、コードベースQ&A、自動タスク処理が想定されています。これは、Z.AIがモデルを「会話相手」ではなく「エージェントの実行エンジン」として売り出していることを示しています。(docs.z.ai)

ただし、現時点では慎重に見るべき点もあります。MITライセンスでのオープンソース化は発表上「来週」の予定であり、重み、技術レポート、第三者によるベンチマークがそろってから評価はかなり変わる可能性があります。100万トークンを読めることと、100万トークンの中から本当に必要な情報を安定して使えることは同じではありません。長大な文脈では、検索、圧縮、注意の散漫化、古い前提の残留といった問題が起きます。さらに公式ドキュメントでは、GLM-5.2やGLM-5-Turboは高度なモデルとして、ピーク時には通常より大きくクォータを消費する設計も説明されています。(digg.com)

それでも今回の発表が面白いのは、オープンウェイト陣営が「安い代替品」ではなく、「既存のエージェント基盤にそのまま入る高性能な作業モデル」を目指している点です。もし来週、本当にMITライセンスの重みが公開され、1Mコンテキストと長時間コーディング性能が独立評価でも確認されれば、企業内エージェントやローカル開発環境にとってかなり大きな選択肢になります。

今後見るべきポイントは4つです。第一に、公開される重みがどの構成なのか。第二に、1Mコンテキスト時のレイテンシとコスト。第三に、SWE系だけでなく、長時間の実リポジトリ修正でどれだけ破綻しないか。第四に、MITライセンスの範囲が商用利用や派生モデルにどこまで明確か。GLM-5.2は、モデル性能のニュースであると同時に、AIコーディングの主戦場が「賢い返答」から「長く働ける実行基盤」へ移っていることを示す、かなり象徴的な発表だと思います。

今日取り上げたいのは、Z.AIの新しいコーディング向けモデル、GLM-5.2です。2026年6月13日の公式投稿として集約されている発表では、GLM-5....