AnthropicのMythosで重要インフラ防衛競争が加速する理由

2026年4月7日、Anthropicは未公開の新モデル「Claude Mythos Preview」と、その限定提供の枠組みである「Project Glasswing」を発表した。Mythosは一般公開されず、重要ソフトウェアや基盤技術を支える企業・団体に絞って、防御目的で先行利用させる。数日後には、米財務省とFRBが大手銀行CEOらに対し、Mythosや同種モデルがもたらす将来のサイバーリスクへの備えを促したと報じられた。ここで起きているのは単なる新製品発表ではない。高性能AIの公開範囲そのものが、重要インフラの防衛態勢と直結する段階に入った、という制度的な変化である。 (anthropic.com)

Mythosが特異なのは、「サイバー専用モデル」だからではない。Anthropic自身が、これは汎用のフロンティアモデルでありながら、コード理解とエージェント的作業能力の伸長によって、脆弱性の発見と悪用で「最上位の熟練者を除く人間」を上回り得る水準に達したと説明している点にある。Anthropicは、Mythosが全主要OS・全主要ブラウザにまたがる高重大度の脆弱性を数多く見つけ、OpenBSDの27年前のバグ、FFmpegの16年前のバグ、Linuxカーネルの権限昇格につながる欠陥連鎖まで、自律的に発見・再現したと公表した。評価でもCyberGymの脆弱性再現で83.1%を記録し、Claude Opus 4.6の66.6%を大きく上回る。しかもAnthropicによれば、発見した脆弱性の99%以上はまだ未修正で、詳細を公表できない。これは「能力の高さ」以上に、「防御側の準備時間が足りない」という意味で重い。 (anthropic.com)

だからこそ、Mythosの扱いは異例になった。Anthropicは一般提供の予定はないと明言し、Project Glasswingの参加者や追加の重要ソフトウェア関係組織にだけ、研究プレビューとして開放する方針を採った。AWS、Apple、Google、Microsoft、JPMorganChase、NVIDIA、Palo Alto Networks、Linux Foundationなどが初期パートナーに並び、Anthropicは1億ドル分の利用クレジットと、オープンソース・セキュリティ団体向けに400万ドルの寄付も用意した。さらに90日以内に、修正できた脆弱性や得られた教訓を公表するとしている。限定提供は閉鎖性の表明というより、「攻撃側より先に守る側へ時間を配る」ための設計だと読める。 (anthropic.com)

重要なのは、これが場当たり的な判断ではないことだ。AnthropicのResponsible Scaling PolicyとFrontier Safety Roadmapでは、危険な能力を持つモデルに対して、信頼された利用者へのアクセス制御、リアルタイム分類器、非公開モデルを含む監査といった多層防御を整備する方針がすでに示されている。つまりMythosは、「モデルを出すか出さないか」という従来の公開論ではなく、「二重用途の高リスク能力を誰に、どの条件で渡すか」という安全保障寄りの運用論で扱われている。サイバー防衛と国家安全保障の境界が一段広がった、という見方は大げさではない。 (anthropic.com)

もっとも、この流れはAnthropic一社だけの特殊事情ではない。OpenAIは2026年2月5日、「Trusted Access for Cyber」を発表し、GPT‑5.3‑Codexのような高いサイバー能力を持つモデルについて、本人確認と信頼ベースのアクセス管理を導入したうえで、防御用途向けに1,000万ドル分のAPIクレジットを拠出するとした。Googleも、DeepMindとProject Zeroの「Big Sleep」が実際の脆弱性を発見し、SQLiteの重大欠陥CVE-2025-6965については、脅威インテリジェンスと組み合わせて悪用前に食い止めたと説明している。さらにDARPAのAI Cyber Challengeは、2025年の時点で、重要インフラを支えるオープンソース基盤に対して、自律システムが脆弱性発見とパッチ生成を実演できるところまで来ていた。各社・各機関は別々に動いているようでいて、実際には「高性能AIはまず防御側へ、しかも信頼付きで」という収束に向かっている。 (openai.com)

では、Mythosが加速させたものは何か。端的に言えば、競争の単位が変わったのである。もはや争点は、どのAI企業が高性能モデルを先に出すかだけではない。脆弱性の発見から修正までの時間をどこまで圧縮できるか、膨大な発見件数をどうトリアージするか、サプライチェーンとオープンソース層まで含めて誰が先に守りを自動化できるかが競争の中心になる。DARPAが競技として証明したことを、Anthropicは商用級のフロンティアモデル運用に持ち込み、しかも銀行、クラウド、OS・ブラウザ供給者、セキュリティ企業まで巻き込む形にした。重要インフラ防衛競争が「将来の話」から「今期の実務」へ移った、ということだ。 (darpa.mil)

ただし、限定提供は万能薬ではない。OpenAI自身が、近い将来にはオープンウェイトを含む多くのサイバー高能力モデルが広く利用可能になると述べているし、Anthropicは2025年11月、Claude Codeを悪用した国家支援系の大規模AI主導サイバー諜報活動を公表している。その事案では、約30の標的に対する作戦の80〜90%をAIが担ったという。ここから導けるのは、攻撃側のAI化そのものは止まらない、という冷静な見通しだ。したがって防御側の課題は、「危険なモデルを封じ込めること」よりも、「危険が広く出回る前に、防御の自動化と共有体制をどこまで先行できるか」へ移っている。 (openai.com)

Mythosの本当のインパクトは、公開されなかったことにある。一般提供を見送ったにもかかわらず、それだけで金融機関の警戒、主要ベンダーの連携、政府との協議、オープンソース防衛への資金投入を動かした。フロンティアAIの競争軸は、ベンチマークや収益だけでは測れなくなりつつある。これから問われるのは、誰が最も強いモデルを持つかではなく、誰が最も速く、安全に、防御の側へその力を移せるかだ。Mythosはその転換点を、かなりはっきりした輪郭で示した。 (anthropic.com)

主な出典
- Anthropic, “Project Glasswing: Securing critical software for the AI era” (anthropic.com)
- Anthropic Frontier Red Team, “Assessing Claude Mythos Preview’s cybersecurity capabilities” (red.anthropic.com)
- Anthropic, “Responsible Scaling Policy Updates” / “Frontier Safety Roadmap” (anthropic.com)
- OpenAI, “Introducing Trusted Access for Cyber” (openai.com)
- Google, “Google’s latest AI security announcements” (blog.google)
- DARPA, “AI Cyber Challenge” / “AI Cyber Challenge marks pivotal inflection point for cyber defense” (darpa.mil)
- Anthropic, “Disrupting the first reported AI-orchestrated cyber espionage campaign” (anthropic.com)
- Bloomberg/CBS等による金融セクターの初動報道 (news.bloomberglaw.com)