Claudeを「化学者」に近づけるAnthropicのNMR評価:AI for Scienceは、専門ソフトの置き換えではなく“表現間翻訳”へ
2026年6月5日、Anthropicが「Making Claude a chemist」を公開した。内容は派手な新モデル発表ではなく、Claude Opus 4.7が化学者の日常業務の一つであるNMRスペクトル解析をどこまで支援できるかを検証した技術報告だ。対象は、構造式からNMRピークを予測する「forward prediction」と、NMR/HRMSデータから構造を推定する「inverse prediction」。比較対象には、化学者が広く使うChemDraw 25.0.2とMestReNova 17.0.0が置かれている。(anthropic.com)
この発表で面白いのは、Claudeを「化学知識を答えるチャットボット」としてではなく、化学の複数表現を行き来する作業者として評価している点だ。化学者は、手描きの構造式、SMILES、論文中の図、実験手順、NMRスペクトル、質量分析データを絶えず変換しながら考える。Anthropicの問題設定は、この変換コストそのものをAIに担わせられるか、というものに近い。(anthropic.com)
実験では、ChemRxivの合成化学プレプリントから選んだ20化合物を使い、構造式から¹H/¹³C NMRの化学シフトなどを予測した。Claude側はOpus 4.7、Opus 4.6、Sonnet 4.6を各化合物3回ずつ走らせ、専用ソフトは決定的出力として1回評価している。¹H NMRではOpus 4.7が平均絶対誤差0.079 ppmで最良、¹³C NMRではOpus 4.7が1.37 ppm、MestReNovaが1.48 ppmでほぼ同等と報告された。(anthropic.com)
さらに興味深いのは、Jカップリングやピーク分裂パターンでもClaudeが強かった点だ。白書によれば、Claude各モデルはJ値で平均誤差およそ0.5 Hz、±0.5 Hz以内の割合が80〜84%だったのに対し、ChemDrawとMestReNovaは平均誤差1.9〜2.0 Hz、±0.5 Hz以内が26〜35%だった。これは「専用ソフトよりLLMが常に優れている」という意味ではないが、特定のスペクトル解釈タスクでは、汎用モデルが既存ツールと同じ土俵に乗り始めていることを示している。(www-cdn.anthropic.com)
より大きな論点は逆問題だ。AnthropicはOpus 4.7に15件の構造決定問題を与え、HRMSと1D NMRから最大3候補のSMILESを返させた。単純な8件では、式とスペクトルだけで全試行正解。複雑な7件では、出発物質のSMILESを追加すると、4件で3回中3回、残り3件で3回中2回正しい構造に到達したとされる。ChemDrawはそもそもこの候補生成を担うツールではなく、MestReNovaも既知構造への割り当て支援が中心なので、ここはLLMの「推論インターフェース」としての性格が出ている。(anthropic.com)
ただし、数字の読み方にはかなり注意が必要だ。評価規模はforwardで20化合物、inverseで15化合物に限られる。足場となる化学骨格も一部に限定され、2D NMR、立体化学、複雑な天然物、広い溶媒条件は対象外だ。Anthropic自身も、結果は「精密なランキング」ではなく「示唆的」と読むべきだと明記している。(anthropic.com)
それでも、この発表はAI for Scienceの方向性をよく表している。AIが突然、実験化学者を置き換えるという話ではない。むしろ、専門家がすでに持っている判断力の手前にある、退屈で密度の高い変換作業をどれだけ減らせるかが焦点になっている。NMRのピークを読み、候補構造を並べ、既存ソフトの出力と照合し、怪しい化合物だけを人間が深く見る。そうした「確認と絞り込み」の層にLLMが入る余地が見えてきた。
実務で重要になるのは、Claude単体の正答率よりも運用設計だと思う。化学構造の誤同定は、時間の浪費だけでなく、後続実験や特許・論文記述にも影響する。したがって、AI出力は最終判断ではなく、元スペクトル、候補SMILES、専用ソフト予測、人間の注釈と一緒に保存されるべきだ。今後の化学AIは、チャット画面で正解を言うモデルというより、実験ノート、分析装置、文献DB、構造描画ソフトをつなぐ監査可能な作業環境として発展していく可能性が高い。
今回の発表を一言で言えば、Claudeが「化学を知っている」ことの証明というより、化学者の仕事に現れる複数の表現を、実用的な精度で行き来し始めたことの報告だ。AI for Scienceの本丸は、知識量の競争だけではなく、専門家が日々扱う表現形式のあいだに橋を架けることに移りつつある。