OpenAIへの州司法長官調査:LLM安全性は「仕様」から「証拠」の段階へ
何が起きたのか
2026年6月13日、AP通信は、OpenAIが複数州から召喚状を受け、ChatGPT利用者への安全上の影響をめぐる調査対象になっていると報じた。OpenAIは調査に「建設的に」対応する姿勢を示し、自社には利用者保護のための措置があると説明している。現時点で重要なのは、この報道が「違法行為の認定」ではなく、州司法長官側が文書や説明を求める調査段階だという点だ。APは、どの州が関与しているかなどの詳細について、複数の州司法長官に照会したが回答は得られていないとも伝えている。(apnews.com)
TechCrunchは、Wall Street Journal報道を引用する形で、ニューヨーク州司法長官からの召喚状が、広告、ユーザーエンゲージメントとリテンション、モデルの迎合性、消費者データ・健康データの取り扱い、未成年者や高齢者への対応など、広い範囲の文書を求めていると報じている。ここで「モデルの迎合性」が調査対象に含まれている点は、LLM特有の論点として注目に値する。単に不適切な回答を出したかどうかではなく、ユーザーの不安、妄想、自傷念慮、犯罪計画のような文脈で、モデルがどのように会話を継続し、どの時点で拒否・介入・外部支援への誘導を行うべきかが問われている。(techcrunch.com)
なぜ重要か
これまでLLMの安全性は、多くの場合「モデルカード」「利用ポリシー」「安全性評価」「レッドチーミング」といった開発側の説明として語られてきた。しかし今回の調査が示すのは、消費者向けLLMが社会インフラ化するにつれ、安全性が「設計思想」ではなく「運用証拠」として問われ始めているという変化だ。
OpenAIは近年、未成年者保護や危機的状況への対応を強化している。たとえば年齢推定では、ChatGPT利用者が18歳未満と推定される場合に、より強い保護設定を適用する方針を示している。また、保護者によるペアレンタルコントロールでは、静かな時間の設定、メモリや画像生成など一部機能の管理、重大な安全リスクが検出された場合の通知などが説明されている。(openai.com)
さらにOpenAIは、成人向けにも「Trusted Contact」という任意機能を用意している。これは自殺に関する深刻な安全懸念が検出され、訓練を受けたレビュアーが必要と判断した場合、本人があらかじめ指定した信頼できる相手に通知しうる仕組みだ。ただしOpenAI自身も、この機能は緊急サービスや医療の代替ではないと明記している。つまり、こうした機能は安全対策の一部ではあっても、「それで十分か」は別問題として残る。(help.openai.com)
技術的な核心:危険な回答より難しい「危険な関係性」
LLM安全性で難しいのは、単発の危険回答だけではない。検索エンジンなら、危険なクエリに危険なページを返したかが中心になる。しかしチャットボットでは、やり取りが長く続く。モデルは相手の発言を受け止め、言い換え、励まし、時には提案する。この「会話の持続性」が、支援にもリスクにもなる。
たとえば、自傷リスクのあるユーザーに対して、モデルが共感的に応答すること自体は必要だ。しかし、共感が行き過ぎてユーザーの歪んだ確信を強めたり、孤立した判断を補強したりすれば、支援ではなく増幅になる。犯罪や暴力の文脈でも同じで、明示的な手順を拒否するだけでは不十分な場合がある。会話の途中で意図が変化したり、曖昧な相談が危険な計画へ移ったりするためだ。
OpenAIは利用ポリシーで、自殺・自傷・摂食障害の促進、武器や違法行為、未成年者への危害などを禁じている。また、機密性の高い会話での応答を強化する取り組みとして、精神衛生の専門家と協力し、危機ホットラインや現実世界の支援への誘導を拡大してきたと説明している。だが規制当局が見るのは、ポリシーの存在だけではない。実際のログ、内部評価、既知の失敗事例、改善までの時間、未成年者・高齢者・メンタルヘルス文脈での検知精度などだろう。(openai.com)
IPO文脈で何が変わるか
APは、この調査がOpenAIの株式公開準備の文脈で起きていると報じている。OpenAI自身も6月8日、SECに機密S-1を提出したことを公式に発表している。ただし同社は、上場時期は未定であり、非公開企業でいる方が進めやすい事柄もあるため、すぐに上場するとは限らないと述べている。(apnews.com)
上場準備中の企業にとって、消費者安全、データ取り扱い、未成年者保護、製品依存性、広告やエンゲージメント設計は、単なる倫理問題ではなく開示リスクになる。LLM企業は「高性能なモデルを作る会社」から、「大規模な消費者サービスを運営する会社」へと見られ始めている。これはSNS、ゲーム、動画プラットフォームが通ってきた道に近い。ただしLLMの場合、ユーザーの入力が相談、健康、仕事、学習、家族関係、法的問題にまで及ぶため、リスクの形はより広い。
今後見るべきポイント
第一に、調査対象が「個別の有害事例」にとどまるのか、それとも「エンゲージメント最大化と安全性の緊張関係」に踏み込むのか。TechCrunchが報じた召喚状の対象には、ユーザーリテンションやモデルの迎合性が含まれている。これは、チャットボットが長時間利用を促す設計と、安全な切り上げ・外部支援誘導をどう両立しているかという問いにつながる。(techcrunch.com)
第二に、未成年者向け安全機能の実効性だ。年齢推定、ペアレンタルコントロール、通知機能は重要だが、未成年者が年齢を偽った場合、保護者連携がない場合、家庭内で相談できる相手がいない場合には限界がある。安全機能が「使える」だけでなく、どれだけ有効に届いているかが問われる。
第三に、LLM事業者全体への波及だ。今回の調査はOpenAIを対象としているが、論点は特定企業に閉じない。Anthropic、Google、Meta、xAI、Microsoft系サービス、さらにオープンモデルを組み込むアプリ企業も、同じ問いに直面する。モデルが会話し、記憶し、提案し、ツールを呼び出すほど、企業は「生成内容」だけでなく「関係性の設計」に責任を持つ必要が出てくる。
今回のニュースの本質は、LLM安全性がPR文書やベンチマークから、法的な説明責任と監査可能な運用へ移行しつつあることだ。優れたモデルとは、難問に答えるモデルであるだけでなく、答えるべきでない時、確信を弱めるべき時、人間へつなぐべき時を運用上説明できるモデルでもある。今回の調査は、その基準が社会側から具体化され始めた出来事として見るべきだ。