Claude Science公開：AI研究支援は「チャット」から「再現できる作業環境」へ

今日のポイント

今日は、Anthropicが2026年6月30日に発表した Claude Science を取り上げます。これは新しい基盤モデルではありません。Claudeを、研究者が日々使っている論文検索、PythonやR、Jupyter的な分析環境、HPCクラスタ、科学データベース、可視化ツールにつなげるための、研究向けワークベンチです。ベータ版としてmacOSとLinuxで提供され、Pro、Max、Team、Enterpriseプランのユーザーが対象になっています。(anthropic.com)

何が新しいのか

今回のポイントは、「AIが論文を要約します」ではありません。もう少し踏み込んで、研究作業そのものを、履歴つきで進める環境を作ろうとしているところです。

研究では、答えが出ることよりも、「その答えがどう作られたか」がとても大切です。どのデータを読み、どのコードを走らせ、どの環境で図を作り、どの会話を経てその結論に至ったのか。Claude Scienceは、図表やノートブックに、生成に使われたコード、実行環境、説明、会話履歴を結びつける設計になっています。つまり、後から見直したときに「このグラフ、何でこうなったんだっけ」と迷子になりにくいのです。(anthropic.com)

研究者向けエージェントとしての設計

Claude Scienceには、汎用の調整役エージェントがあり、ゲノミクス、シングルセル解析、プロテオミクス、構造生物学、ケモインフォマティクスなどに向けた60以上のスキルやコネクタが用意されています。さらに、NVIDIAのBioNeMo Agent Toolkitを通じて、Evo 2、Boltz-2、OpenFold3といった生命科学向けモデルやライブラリにも接続できる、と説明されています。(anthropic.com)

ここで大事なのは、Claudeが「全部を自分で知っている」必要がない、という考え方です。専門データベースを調べる。既存の解析パイプラインを走らせる。HPCやModalのような計算資源にジョブを投げる。結果を読み、図を直し、引用や数値の根拠をレビューする。つまり、LLMは知識そのものというより、研究道具をつなぐ操作レイヤーになってきています。(anthropic.com)

期待できることと、注意すべきこと

Anthropicは、ベータ利用例として、シングルセルRNA-seq解析、CRISPRスクリーン設計、タンパク質構造予測、ケモインフォマティクスなどを挙げています。Allen Instituteの事例では、約20個のカスタムスキルを使った複数エージェントのレビュー作成テンプレートを構築し、数千本の論文から主張や定量的な発見を整理する流れが紹介されています。UCSFの研究者によるグリオーマ関連解析では、従来より大幅に短い時間で包括的な解析を進め、結果を独立に検証したとされています。(anthropic.com)

ただし、ここは慎重に見たいところです。Claude Scienceのドキュメントは、レビュアー機能が誤りを減らす一方で、完全にはなくせないこと、研究・出版・下流判断に使う前には検証が必要であること、臨床・診断用途を意図していないことを明記しています。さらに、ベータ版のため、組織監査ログにはまだClaude Scienceのイベントが書き込まれず、Compliance APIでローカルデータをエクスポート・削除できないなど、管理面にも未対応部分があります。(claude.com)

何が変わりそうか

今回の発表は、AI研究支援の競争軸が「賢いチャットボット」から「信頼できる作業環境」へ移り始めていることを示しています。

科学の現場では、速さだけでは足りません。むしろ、速くなったぶん、誤った解析や根拠の薄い引用が混ざるリスクも増えます。だからこそ、実行履歴、コード、データの所在、レビュー、再現性を最初から組み込む設計が重要になります。

Claude Scienceが本当に価値を出せるかどうかは、「すごい結果を出したか」ではなく、研究室のチームが数か月後にその結果を読み返し、再実行し、批判し、修正できるかで決まると思います。AIが研究者の代わりに結論を出すのではなく、研究者がより確かに考えるための足場になる。今日のニュースで見えてきたのは、その方向へのかなり具体的な一歩です。