ホワイトハウスはなぜAnthropicの「危険なAI」と向き合うのか
2026年4月17日、ホワイトハウスのスージー・ワイルズ首席補佐官はAnthropicのダリオ・アモデイCEOと会談し、高度なサイバー能力を持つ新モデル「Mythos」をめぐって協議した。会談後、ホワイトハウス側は「生産的かつ建設的」だったと説明し、Anthropic側も、サイバーセキュリティ、米国のAI主導権、AI安全性について政府と連携する可能性を話し合ったと述べている。Axiosによれば財務長官スコット・ベッセントも同席しており、これは単なる企業面談ではなく、国家安全保障と経済政策の接点としてMythosが扱われ始めたことを示す。(apnews.com)
Mythosが注目される理由は、性能の高さそのものより、「何を速めてしまうのか」にある。Anthropicは4月7日にMythos Previewを一般公開せず、Project Glasswingという限定的な防御目的プログラムでのみ提供すると発表した。対象はAWS、Apple、Google、Microsoft、Linux Foundation、JPMorganChase、Palo Alto Networksなどの中核インフラ運営・保守に関わる組織で、さらに40超の重要ソフトウェア関連組織にもアクセスを広げている。Anthropicは1億ドル分の利用クレジットを投じ、90日以内に学習内容や修正済み脆弱性のうち公開可能なものを報告するとしている。(anthropic.com)
Anthropicの説明では、Mythos Previewは「これまでで最もサイバー能力の高いモデル」で、最小限の人間の介入でも、オープンソース・クローズドソース双方でゼロデイ脆弱性を自律的に見つけ、場合によっては実用的な概念実証エクスプロイトまで作成できるという。技術ブログでは、主要OSや主要ブラウザで脆弱性を発見・悪用できたとし、数千件規模の高・重大脆弱性を責任ある開示手続きに回していると説明する。人手検証でも、198件のレビュー済み報告のうち89%で重大度評価が完全一致、98%で1段階以内に収まったとされる。ここで重要なのは「AIがハッキングする」という刺激的な見出しより、脆弱性探索と悪用準備のコストと時間が急縮小する点だ。守る側のパッチ適用や開示調整の速度が、攻撃側の自動化に追いつけなくなる可能性がある。(www-cdn.anthropic.com)
もっとも、現時点での証拠はすべて同じ方向を向いているわけではない。Anthropicの主張の多くは自社評価に基づくが、英国AI Security Institute(AISI)の独立評価も、Mythos Previewが従来モデルより一段進んだことを示した。AISIは、専門家向けCTFで73%の成功率を確認し、32段階から成る企業ネットワーク攻撃シミュレーションを初めて端から端まで解いたモデルだと報告している。他方で、AISIは、これは「小規模で脆弱、かつ防御の弱い企業システム」を自律攻撃できることを示すにとどまり、十分に防御された実環境を突破できるとまでは言えないとも明記した。運用技術(OT)寄りの別レンジは攻略できなかった。つまりMythosは、万能の“攻撃AI”として理解するより、弱い地点を高速に見抜く能力が閾値を越え始めたモデルと捉えるほうが正確だ。(aisi.gov.uk)
このモデルを政府がどう扱うかが難しいのは、米政府の政策目標そのものが二重だからだ。トランプ政権のAI行動計画は、AIで米国の優位を維持し、国家安全保障と経済競争力を強化することを前面に掲げる。3月公表のサイバー戦略も、連邦ネットワーク防衛のためにAI駆動のサイバー防御ソリューションを採用し、政府が最良の技術を使えるよう調達障壁を取り除くとしている。だが同時に、OMBのM-25-21メモは、重要インフラの安全機能、政府施設のセキュリティ、サイバー侵入、現実世界での攻撃・能動防御などに関わるAI利用を「high-impact」とみなし、事前テスト、影響評価、リスク緩和計画、不適合時の停止まで求めている。Mythosはまさに、導入を急ぎたい領域でありながら、最も厳格な統制が必要な類型にも当てはまる。(whitehouse.gov)
この会談がより興味深いのは、直前までAnthropicと政権の関係が険悪だったからでもある。APによれば、対立の発端は国防総省との契約協議で、Anthropicは自社モデルが完全自律兵器や米国民監視に使われない保証を求めたのに対し、国防総省側は「合法的な用途」なら制限を受けないことを要求した。政権はAnthropic製品の政府利用停止や「供給網リスク」指定に動いたが、3月には連邦地裁判事がその執行を差し止めた。にもかかわらずホワイトハウスが改めて対話に乗り出したのは、Mythosの能力が対立を棚上げしてでも把握すべき対象になったからだろう。Reuters系報道では、OMBが各省庁向けにガードレール付きの“修正版”Mythos提供を検討しているとも伝えられているが、時期も用途もまだ未確定だ。(apnews.com)
Anthropic自身の文書も、この局面の本質をよく表している。Mythos Previewは、同社の評価では整合性面で最も良好なモデルである一方、能力の幅が広がったぶん、これまで公開した中で最大のアラインメント関連リスクを持つ可能性があるという。限定公開は、その矛盾を解くための暫定策だ。モデルが“悪意を持つ”から危険なのではなく、高度な一般能力がサイバー領域で攻撃にも防御にも効いてしまうから危険なのである。だから焦点は、モデルそのものを禁止することではなく、誰に、どの監視下で、どの目的に、どの速度で開くかへ移る。(www-cdn.anthropic.com)
今後の争点は三つある。第一に、政府がMythos級モデルを“例外的な兵器”として扱うのか、それとも近い将来に業界全体へ拡散する新標準の先行事例として扱うのか。Anthropicのジャック・クラークは、同種の能力を持つモデルが他社から数カ月単位で現れる可能性を示唆している。第二に、評価と導入の制度設計だ。AISIもNCSCも、こうした能力は攻撃にも防御にも使えるデュアルユースであり、だからこそ防御側の準備を急ぐべきだとしている。第三に、国家安全保障と企業の安全原則が衝突したときのルールづくりである。今回の会談は、Mythos導入の可否そのものより、フロンティアAIを政府がどう“統治しながら使うか”の試金石として見るべきだろう。チャットボットの時代から、デジタル基盤そのものを点検し、時に突き崩せるAIの時代へ――その境目に、ホワイトハウスとAnthropicの協議は位置している。(apnews.com)
主な出典
Anthropic公式(Project Glasswing、Mythos技術評価、Responsible Scaling Policy、Frontier Safety Roadmap) (anthropic.com)
ホワイトハウス・OMB公式文書(AI Action Plan、Cyber Strategy、M-25-21) (whitehouse.gov)
AP、Axios、Reuters系報道 (apnews.com)
英国AI Security Institute評価 (aisi.gov.uk)