Claude Opus 4.7が示すもの

Anthropicは2026年4月16日、Claude Opus 4.7を一般提供しました。位置づけは「Opus 4.6の小幅改良」よりも、長時間のコーディング作業やエージェント的な反復実行を、より実務寄りに磨き込んだ更新と見るのが自然です。Anthropicは、難しいソフトウェア工学タスクでの改善、より高解像度な画像理解、そして価格据え置きのままClaude製品群、API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryへ展開すると説明しています。 (anthropic.com)

この発表を理解するには、Claude 4系の流れを押さえると分かりやすいです。2025年5月のClaude 4では、Opus 4が「長時間のコーディングとエージェント」の旗艦として打ち出され、2026年2月のOpus 4.6では、より長い自律実行、改善されたデバッグ・コードレビュー、effort制御、adaptive thinkingなどが導入されました。今回の4.7は、その延長線上で「難しい仕事を、より長く、より自己検証しながら進める」方向をいっそう鮮明にした更新です。 (anthropic.com)

技術面で特に重要なのは3点あります。第一に、指示追従の強化です。Anthropicは4.7が以前のモデルより指示をかなり文字どおりに受け取るため、既存プロンプトが予想外の結果を返す場合があるとして、プロンプトや評価ハーネスの再調整を勧めています。第二に、画像理解の高精細化です。Opus 4.7は長辺2576ピクセル、約3.75メガピクセルまでの高解像度画像を自動で扱え、従来より細かなUI、スクリーンショット、図表、文書の読み取りに向きます。第三に、長時間タスク向けの制御です。新しいxhigh effortが追加され、長めのコーディングやエージェント処理の推奨初期値になりました。さらにAPIではtask budgetsが公開ベータとなり、モデルに「この仕事全体で使えるトークン予算」を意識させながら進められます。 (anthropic.com)

ただし、ここには実装上の注意もあります。高解像度画像は精度向上の代わりに、従来比で最大約3倍の画像トークンを使い得ます。またOpus 4.7は更新されたトークナイザを採用しており、同じ入力でも内容次第でおよそ1.0〜1.35倍のトークン数になる可能性があります。加えて、高いeffortでは後半のターンほど深く考え、出力トークンも増えやすい。つまり「価格据え置き」は確かに魅力ですが、実運用の総コストまで自動的に下がるわけではなく、実トラフィックでの再計測が必要です。 (anthropic.com)

このモデルのもう一つの文脈は、安全性です。Anthropicは4月7日にProject Glasswingを公表し、より強力なClaude Mythos Previewを限定的にサイバー防御用途へ提供し始めました。Opus 4.7は、そのMythos級モデルをいきなり広く出す前に、サイバー関連の安全策を現実環境で試すための最初の一般提供モデルと位置づけられています。Anthropic自身、4.7はMythos Previewほど広く高性能ではなく、訓練中にはサイバー能力を差分的に抑える試みも行ったと述べています。高リスクなサイバー用途を自動検出・遮断する仕組みを入れつつ、正当な脆弱性調査やレッドチーミングの利用者にはCyber Verification Programを案内しています。 (anthropic.com)

性能評価の読み方も重要です。Anthropicは、コーディング、長文脈、文書推論、画像理解などで4.6超えを示し、パートナー企業の先行評価としてCursorBenchの70%対58%、XBOWの視覚精度98.5%対54.5%などを挙げています。一方で、こうした数値の多くは社内評価や提携先評価であり、標準化された第三者ベンチマークとは性格が異なります。注目すべきなのは単独のスコアより、自己修正、ツール失敗からの回復、長時間の一貫性、密な画面や文書を読める視覚能力が、同じ「モデル性能」の一部として扱われ始めている点でしょう。Anthropicが言及するGDPval-AAも、44職種・1320タスクから成る、経済的価値のある実務タスクを評価する枠組みです。ベンチマークの重心が、単発の問題正解率から「仕事として任せられるか」に移っていることが見えてきます。 (anthropic.com)

では、何がいちばん大きな意味を持つのか。私は、Opus 4.7は「より賢いモデル」そのものより、「より運用できるエージェント」を前に進めた更新だと考えます。価格はOpus 4.6と同じ入力$5/MTok、出力$25/MTokで、現行の料金ページでもその水準が確認できます。これはOpus 4や4.1の$15/$75よりかなり低く、しかも高解像度画像理解や長時間タスク制御まで備えるため、コードレビュー、障害解析、複雑な文書処理、UI生成、特許・法務・財務補助のような「高単価だが人手依存の強い仕事」に導入しやすくなります。もっとも、厳密な指示追従やトークン消費増を踏まえると、導入成功の鍵はモデル選定より、評価設計と運用チューニングにあるはずです。 (anthropic.com)

Opus 4.7は、万能の最終形ではありません。Anthropic自身、より強力なMythos Previewは別に存在すると明言しています。それでも4.7は、フロンティアモデル競争の評価軸が「一発でどれだけ賢いか」から、「何時間でも、道具を使い、失敗から立て直し、細部を読み、コストを意識して働けるか」へ移ったことを、かなりはっきり示すリリースです。今後の争点は、単なるベンチマーク首位ではなく、長時間自律性・マルチモーダル精度・安全制御・経済性をどう同時に満たすかになるでしょう。 (anthropic.com)

主な出典
- Anthropic公式発表「Introducing Claude Opus 4.7」 (anthropic.com)
- Claude API Docs「Vision」「Effort」「Task budgets」「Pricing」 (platform.claude.com)
- Anthropic公式発表「Introducing Claude 4」「Introducing Claude Opus 4.6」 (anthropic.com)
- Anthropic公式「Project Glasswing」 (anthropic.com)
- Artificial Analysis「GDPval-AA」説明ページ (artificialanalysis.ai)