今日取り上げたいのは、OpenAIが2026年6月17日に公開した、少し未来感のある研究です。テーマは「AI化学者」。OpenAIとMolecule.oneは、GPT‑5.4をMariaという実験室連携型の化学AIに接続し、医薬品化学で使われる難しい反応条件の改善に取り組ませました。ポイントは、AIがただ論文を要約したのではなく、研究提案を出し、実験計画を作り、実験データを読み、次の実験を提案するところまで研究ループに入ったことです。OpenAIはこれを「完全自律」ではなく「near-autonomous」、つまり人間が要所で判断する準自律型の研究として説明しています。(openai.com)
対象になったのは、Chan–Lam couplingという反応です。ざっくり言うと、薬の候補物質によく出てくる炭素–窒素結合を作るための反応です。ただし、今回扱った一次スルホンアミドとボロン酸の組み合わせは、従来収率が低く、ボロン酸が分解してしまう副反応も問題でした。GPT‑5.4が有望な案として浮かび上がらせたのが、TEMPOという穏やかな酸化剤、あるいは添加剤の利用です。論文では、TEMPOが単に強く酸化するのではなく、望ましいC–N結合形成を助けつつ、酸化的脱ホウ素化を抑えている可能性が示されています。(cdn.openai.com)
結果は控えめに見えて、化学としてはかなり興味深いものです。Maria Labでは2回の高スループット実験キャンペーンで合計10,080反応を実行し、最適化条件では平均推定収率が16.6%から25.2%へ上昇しました。また、30%を超える収率を示した反応の割合は15.6%から37.5%へ増えています。さらに、人間の化学者が代表的な14組の基質ペアをベンチスケールで再現したところ、11組で収率向上が確認され、多くは2倍超の改善でした。(openai.com)
ここで面白いのは、「AIが正解を一発で当てた」という話ではないことです。むしろ重要なのは、モデル、専用エージェント、自動実験設備、人間の専門家が一つの研究ワークフローを作った点です。GPT‑5.4は仮説を出し、Mariaがそれを実験に落とし込み、大量の実験結果を返し、モデルが次の試行を考える。これは、LLMの評価軸が「知識を答えられるか」から「現実世界の測定と失敗を含むループを回せるか」へ移っていることを示しています。(openai.com)
ただし、過大評価は禁物です。OpenAI自身も、これはAIが化学研究を完全に自律実行できる証明ではないと明記しています。人間は研究方針の設計、提案の選別、実験計画の修正、ラボ作業、最終検証に関与しています。また、今回の結果が他の反応、他の基質、製造条件にそのまま一般化するかは未確定です。独立した研究室による再現、反応機構の解明、より広い基質範囲での検証が次の焦点になります。(openai.com)
もう一つ大事なのは安全面です。化学AIは創薬や材料開発に役立つ一方、悪用リスクもあります。OpenAIは今回の研究対象を、既知の医薬品化学上の正当な課題に限定し、毒物・化学兵器・有害化合物設計は扱っていないと説明しています。また、モデル側の安全評価、人間による提案選別、物理実験設備への人間の管理を重ねたとしています。科学AIが強くなるほど、「できること」だけでなく「何を実験させるか」を管理する設計が重要になります。(openai.com)
今回の発表を一言でまとめるなら、AI研究支援が「文章の中」から「実験の現場」に一歩進んだ、ということです。まだ初期的な成果で、再現性と汎用性の検証はこれからです。それでも、モデルが仮説生成、実験設計、データ解釈、次の実験提案まで関わり、人間が検証可能な化学的知見に到達した点は重要です。生成AIの次のフロンティアは、より賢いチャットだけではなく、測定できる世界の中で、仮説を試し、失敗から学ぶシステムなのかもしれません。