Google、MedGemma 1.5技術報告を公開――医療AIは「単一モデルで多様な臨床データを読む」段階へ
Googleが2026年4月6日にarXivで公開した「MedGemma 1.5 Technical Report」は、医療向けオープンウェイト基盤モデルの到達点を、かなり具体的に示す文書だ。対象は4Bのマルチモーダルモデルで、CTやMRIの3Dボリューム、病理のWSI(whole slide image)、胸部X線の時系列比較、検査報告書、EHRまでを、ひとつの構成で扱う方向へ進めている。抽象的に言えば「医療は多様なデータの寄せ集めである」という前提を、そのままモデル設計に持ち込んだ報告である。(arxiv.org)
背景を押さえると、この更新の意味が見えやすい。MedGemmaは2025年5月にGemma 3ベースの医療向けモデル群として登場し、同年7月には初代MedGemmaの技術報告と、視覚エンコーダのMedSigLIP、27B系の拡張が公開された。今回の1.5は、その流れの上で4Bモデルを実用寄りに磨き直したものだ。Google自身も、これは完成品の臨床システムではなく、開発者が自分の用途に合わせて調整・検証するための出発点だと位置づけている。(developers.google.com)
技術的には、MedGemma 1.5はGemma 3由来のデコーダ専用Transformerを土台に、医療データで追加学習したSigLIP系の画像エンコーダを組み合わせた構成を取る。Gemma 3自体が少なくとも128Kトークンの長い文脈とマルチモーダル入力を備えており、MedGemma 1.5はその上で医療画像・医療文書に最適化されている。報告の要旨では、こうした拡張を支える要素として「新しい学習データ」「long-context 3D volume slicing」「whole-slide pathology sampling」が挙げられている。要するに、3D画像を単なる2D断面の寄せ集めとしてではなく、長い文脈の中で複数スライスとして読むこと、そして巨大な病理スライドを複数パッチとして扱うことが、今回の核心にある。(arxiv.org)
性能面では、3D対応の伸びが最も目を引く。公開モデルカードでは、CTの内部評価で58.2→61.1、MRIで51.3→64.7と改善している。論文要旨はCTで+3ポイント、MRIで+11ポイントの絶対改善と要約しているが、GoogleのブログやモデルカードではMRIが約13〜14ポイント相当にも読めるため、丸め方や評価条件の違いがある可能性が高い。ただ、MRIで二桁ポイントの改善が示されていること自体は一貫している。胸部X線の解剖学的ローカライゼーションでも、Chest ImaGenomeのIoUが3.1から38.0へ大きく伸び、時系列の胸部X線評価MS-CXR-Tでも61.1から65.7へ改善した。WSIについても、公開表ではWSI-PathのROUGEが2.2から49.4へ大きく伸びており、要旨でも病理WSIで大幅改善が報告されている。(developers.google.com)
興味深いのは、画像だけでなくテキスト側も強化されている点だ。MedQAは64.4→69.1、EHRQAは67.6→89.6へ上がり、検査報告書の構造化抽出でも、内部PDF-to-JSON評価でEHR Dataset 2が78→91、Dataset 3が50→71、Dataset 4が25→64と大きく改善している。ここから見えるのは、MedGemma 1.5が「画像を読めるLLM」ではなく、「画像・記録・検査文書を横断して扱う医療向け基盤」へ寄っていることだ。医療現場では、画像だけで診断が完結する場面はむしろ少ない。画像、所見、既往、検査値が一続きで読めることに、今回の更新の本質がある。(developers.google.com)
このモデルの価値は、性能だけではない。Googleは1.5の4B版を「オフラインでも動かせる程度に小さい、計算効率のよい出発点」と説明しており、研究用・商用の双方で無償利用可能としている。一方で、モデルカードはかなり明確で、MedGemmaの出力は臨床診断、治療方針、患者管理に直接使うことを意図しておらず、独立した検証と臨床的照合が必要だとしている。医療AIではこの但し書きが本質で、公開基盤モデルの意義は「そのまま使える診断機械」ではなく、各施設・各用途に合わせた検証可能な土台を下げることにある。(research.google)
周辺の動きも含めると、MedGemma 1.5は単発の論文公開では終わっていない。GoogleはMedASRと組み合わせた音声→医療推論の流れを提示し、2025年12月にはDICOMweb対応のサーバーサイド処理やFHIRナビゲーションのデモも公開した。さらに、2026年3月に結果が出たKaggleのMedGemma Impact Challengeには850超のチームが参加している。つまりGoogleは、モデル単体の精度競争というより、「医療データの標準形式と接続できる、拡張可能な開発基盤」としてMedGemmaを育てようとしている。(research.google)
総じて、MedGemma 1.5技術報告の価値は、「医療向け4Bモデルが3D画像、WSI、EHR、検査報告を単一系で扱う」という設計思想を、ベンチマーク上の改善とともに提示したことにある。巨大モデルで何でも解く方向ではなく、比較的小さなオープンウェイト基盤を、医療特有のデータ形式へ丁寧に拡張していく。その現実的な路線が、この報告にはよく表れている。今後の焦点は、外部検証の蓄積、施設ごとの追加学習、DICOM/FHIRのような実運用系との接続、そして安全評価の透明化だろう。MedGemma 1.5は、医療AIの「万能化」を約束するものではない。むしろ、医療AIを実際のワークフローへ近づけるための、地味だが重要な一歩として読むのが適切だ。(arxiv.org)
主な出典
- MedGemma 1.5 Technical Report(arXiv, 2026年4月6日公開) (arxiv.org)
- MedGemma 1.5 model card(Google for Developers) (developers.google.com)
- Next generation medical image interpretation with MedGemma 1.5 and medical speech to text with MedASR(Google Research Blog, 2026年1月13日) (research.google)
- MedGemma Technical Report / Gemma 3 Technical Report(背景資料) (arxiv.org)