SAPのDremio買収合意が意味するもの――Agentic AI時代の「データの文脈」を押さえにいく一手
SAPは2026年5月4日、データレイクハウス企業Dremioの買収に合意したと発表した。取引条件は非公開で、規制当局の承認などを前提に、2026年第3四半期の完了を見込む。重要なのは、これは「買収完了」ではなく「買収合意」の段階だという点だ。SAPの説明では、DremioはSAP Business Data Cloudの中でSAPデータと非SAPデータを統合し、分析やAIワークロード、特にAgentic AIを動かすための基盤を強化する役割を担う。(news.sap.com)
今回の買収は、単独のデータ基盤強化というより、SAPが進める「アプリケーション、データ、AIエージェント」を一体化する戦略の一部として見ると分かりやすい。SAPは2025年2月にSAP Business Data Cloudを発表し、Databricks技術を組み込んだデータエンジニアリング、機械学習、AIワークロードの基盤を打ち出していた。この時点でSAPは、S/4HANAやAribaなどの業務データを「ビジネス文脈とセマンティクスを保持したデータプロダクト」として扱い、JouleエージェントやSAP Knowledge Graphに接続する構想を示していた。(news.sap.com)
Dremioが加わることで、その構想は「Icebergネイティブなオープンレイクハウス」へ踏み込む。Apache Icebergは、大規模分析データセット向けのオープンテーブル形式で、スキーマ進化、隠れパーティショニング、タイムトラベル、楽観的同時実行制御などを備える。要するに、クラウドストレージ上のParquetなどのファイル群を、複数の処理エンジンから一貫した“テーブル”として扱うための土台だ。SAPはDremioによってBusiness Data CloudをIcebergネイティブ化し、データ移動や形式変換を抑えながらSAP/非SAPデータを共存させると説明している。(iceberg.apache.org)
もう一つの焦点はカタログである。SAPはDremioを通じて、Apache PolarisとIceberg REST Catalog APIを基盤にしたオープンカタログを提供するとしている。Apache PolarisはIcebergテーブル向けのカタログ実装で、REST互換の複数クエリエンジンから、集中管理された安全な読み書きアクセスを可能にする。SAPはこのカタログをBusiness Data Cloudの発見・セマンティック層として位置づけ、意味、関係、アクセス権、データリネージを統一し、SAP Knowledge Graphの基盤にするとしている。(polaris.incubator.apache.org)
Dremio自身の技術も、Agentic AI向けに再定義されている。Dremio Cloudは、レイク、ウェアハウス、データベースをまたいでデータを統合し、AIエージェントやアプリケーションがガバナンスされたデータにアクセスできるフルマネージドなレイクハウスと説明されている。AI Semantic Layerは業務エンティティ、指標、関係の共通定義を提供し、曖昧さやハルシネーションを減らす狙いを持つ。また、Autonomous Reflectionsはクエリパターンに応じて高速化用の構造を自動作成・削除する仕組みで、Dremioは運用負荷の低減も訴求している。(docs.dremio.com)
この買収の意味は、LLMそのものの性能競争から一歩ずれている。企業AIで難しいのは、モデルに「正しい業務文脈」を渡すことだ。たとえば「顧客」「請求」「サプライヤーリスク」といった概念は、ERP、CRM、調達、会計、外部データで定義がずれやすい。AIエージェントが自律的に分析し、判断し、業務アクションまで進めるなら、どのデータを見たのか、どの権限で取得したのか、どの定義を使ったのかを追跡できなければならない。DremioのIceberg、Polaris、セマンティック層は、この「文脈付きで説明可能なデータアクセス」を担う部品といえる。
SAPの直近の買収群も同じ方向を向く。2026年3月にはReltioの買収合意を発表し、マスターデータ管理、データクレンジング、エンティティ解決をBusiness Data Cloudの中核機能にすると説明した。さらにDremioと同じ2026年5月4日には、構造化データ向けのTabular Foundation Modelを手がけるPrior Labsの買収合意も発表している。Reltioが「信頼できるマスターデータ」、Dremioが「オープンな分析・カタログ基盤」、Prior Labsが「表形式データを理解する予測AI」を担うと考えると、SAPはAgentic AIの前提条件を垂直にそろえようとしている。(news.sap.com)
一方で、課題もある。第一に、Dremio買収はまだ規制承認前であり、実際の製品統合や価格体系、既存Dremio顧客への影響は今後の発表を待つ必要がある。第二に、SAP Business Data CloudにはDatabricksとの深い連携がすでにあるため、Dremioがどの領域を補完し、どこで重なるのかは実装レベルで見極める必要がある。第三に、SAPはApache Iceberg、Apache Polaris、Apache Arrowへの継続投資を表明しているが、オープン標準を掲げるほど、特定ベンダーの囲い込みに見えない運用とガバナンスが求められる。(news.sap.com)
総じて、今回の買収合意は「SAPがAI企業になる」という単純な話ではない。むしろ、AIエージェントが企業業務で使えるための地味だが決定的な層――データ形式、カタログ、セマンティクス、権限、リネージ、マスターデータ品質――を押さえる動きである。LLMが文章を生成するだけなら、データ基盤の粗さはある程度見過ごされる。しかし、AIが発注を提案し、与信を判断し、サプライチェーンを再計画するなら、基盤の曖昧さはそのまま業務リスクになる。SAPによるDremio買収合意の本質は、Agentic AIの競争が「モデルの賢さ」から「企業データをどれだけ文脈化し、統制し、即時に使えるか」へ移っていることを示す点にある。