Anthropic「When AI builds itself」：AI開発は“モデル性能”ではなく“研究組織の加速度”を測る段階に入った

Anthropic Instituteが公開した「When AI builds itself」は、単なるAI安全論ではなく、フロンティアAI企業の内部で何が起きているかを示す資料として重要です。主題はrecursive self-improvement、つまりAIがAI自身の後継モデルを設計・開発できるようになる可能性です。ただしAnthropicは、現在すでに完全な自己改善が起きているとは述べていません。むしろ核心はその一歩手前、AIが研究開発サイクルの大部分を高速化し、人間の役割を「実装者」から「方向を決め、検証する側」へ押し上げつつある、という観察にあります。(anthropic.com)

特に目を引くのは、Anthropicが自社内部データを出した点です。2026年5月時点で、Anthropicの本番コードベースにマージされるコード行の80%以上がClaude由来だとされています。また、2026年第2四半期の典型的なエンジニアは、2024年比で1日あたり約8倍のコードをマージしていると説明されています。ただし同社自身も、コード行数は品質ではなく量の指標であり、生産性向上を過大評価しうると明記しています。この留保は重要です。数字だけなら派手ですが、実際に問うべきなのは「より多く書ける」ことではなく、「より多く書かれたものを人間と組織が検証できるか」です。(anthropic.com)

今回の文書が面白いのは、AI能力の進歩をベンチマークスコアではなく、研究組織のボトルネック移動として描いている点です。Claudeは、明確に定義された実験やコード最適化では人間を大きく上回る速度を示し、Anthropicの比較実験では、2025年5月のClaude Opus 4が約3倍の速度改善だったのに対し、2026年4月のClaude Mythos Previewは約52倍の改善を達成したとされています。ただしこれも、実世界の学習高速化そのものではなく、同一実験設定での比較として読むべき数字です。(anthropic.com)

一方で、Anthropicはまだ残るギャップもはっきり書いています。Claudeは、与えられた目標を実行する能力では急速に伸びていますが、「何を目標にするべきか」「どの研究方針が有望か」という判断では、人間との差が残るとしています。ここが、現在のエージェント型AIと、本当の意味での自己改善システムの境目です。実装・実験・検証の大半が自動化されても、研究テーマの選択、失敗の解釈、危険な方向への歯止めは、まだ組織的判断に依存しています。(anthropic.com)

外部文脈として、METRの「task-completion time horizon」もこの議論を支えています。METRは、AIエージェントがどの程度の長さのタスクを一定確率で完了できるかを測る枠組みを公開しており、2026年5月更新版では、50%成功時間幅や80%成功時間幅を用いてモデル能力を追跡しています。ただしMETR自身も、この指標は主にソフトウェア工学・機械学習・サイバーセキュリティ系のタスクに偏っており、あらゆる仕事の自動化を直接意味するものではないと注意しています。(metr.org)

政策的に最も重いのは、Anthropicが「協調的な減速または一時停止」の選択肢を持つべきだと述べた部分です。単独企業の停止では、単に競争上の主導権が別の企業や国に移るだけで、全体の安全性は改善しない可能性があります。そのため同社は、複数のフロンティアラボが同じ条件で停止し、しかも互いに本当に停止していることを検証できる仕組みが必要だと論じています。これはAI版の軍備管理に近い問題ですが、訓練実行はミサイルサイロより隠しやすく、計算資源やデータは汎用的であるため、検証は非常に難しいと同社も認めています。(anthropic.com)

この発表を読むとき、過剰に終末論へ寄せる必要はありません。同時に、「まだ完全な自己改善ではないから問題ない」と片づけるのも早い。重要なのは、AIが単体の作業者として賢くなるだけでなく、AI企業そのものの研究速度を上げている点です。競争の単位は、モデル対モデルから、モデルを使って次のモデルを作る組織対組織へ移りつつあります。

今後見るべき指標は、単なるSWE-benchやMMLUの点数ではありません。AIが研究計画をどこまで自律的に立てられるか。人間のレビュー能力が増える生成物に追いつくか。安全評価は開発速度と同じテンポで改善するか。そして、停止条件・監査・検証を含む国際的な合意形成が、技術の加速度に間に合うか。今回のAnthropic文書は、その問いをかなり具体的な形で前面に出したものだと思います。

# Anthropic「When AI builds itself」：AI開発は“モデル性能”ではなく“研究組織の加速度”を測る段階に入った Anthro...

Anthropic「When AI builds itself」：AI開発は“モデル性能”ではなく“研究組織の加速度”を測る段階に入った