OpenAI内部モデルがエルデシュの単位距離予想を反証——「AIが数学を解いた」の中身を慎重に読む
2026年5月20日、OpenAIは、同社の内部汎用推論モデルが離散幾何の古典問題「平面単位距離問題」に関するエルデシュ予想を反証したと発表した。問題自体は非常に短く言える。平面上に$n$個の点を置いたとき、距離がちょうど1になる点のペアは最大で何個作れるか。エルデシュは1946年以降、この最大数はほぼ線形、より正確には$n^{1+o(1)}$を超えないだろうと予想してきた。OpenAIが公開した証明は、無限に多くの$n$について少なくとも$n^{1+\delta}$個の単位距離ペアを持つ点配置を構成し、この予想を否定するものだ。(openai.com)
まず重要なのは、これは「モデルが計算で巨大な例を見つけた」という話ではない点だ。公開された証明は、代数的整数論、とくに無限類体塔、Golod–Shafarevich理論、完全分解する素数、CM体、Minkowski埋め込みといった道具を使う。大まかには、ガウス整数を使ったエルデシュの古典的な格子構成を、高次の数体へ持ち上げる。そこで各複素埋め込みで絶対値1になる代数的数を大量に作り、それを高次元の格子上の「単位移動」として使い、最後に平面へ射影して単位距離の多い点集合を得る。見た目は幾何の問題だが、反例のエンジンはかなり深い数論にある。(cdn.openai.com)
今回の新しさは、結論だけでなく発見プロセスにもある。OpenAIによれば、この証明は数学専用に訓練されたシステムや、この問題向けの探索スキャフォールドではなく、新しい汎用推論モデルから出たものだという。証明PDFの「AI Use」欄では、モデルにAIが書いた問題文を与え、その出力をAI採点パイプラインが高信頼と判断し、その後にOpenAI内部の研究者と外部数学者が検証・整理した、という流れが説明されている。つまり、最終的に人間が読める形の論文は人間編集を経ているが、中核的な解法の生成は自動で行われた、という主張である。(openai.com)
この点は、過大評価も過小評価も避けたい。外部数学者による companion remarks には、Noga Alon、Thomas Bloom、W. T. Gowers、Daniel Litt、Will Sawin、Arul Shankar、Jacob Tsimerman、Victor Wang、Melanie Matchett Wood らの名前が並び、AI生成証明を「人間が咀嚼し、簡略化し、検証した版」として提示している。これは単なる企業ブログ上の自己申告よりは重い。ただし、現時点で見えているのは公開PDFと専門家コメントであり、通常の査読付きジャーナル掲載とは別の段階にある。数学では「正しいかどうか」が最終的に共同体の精査で決まるため、今後さらに独立した読解、簡約、派生結果が出てくるかが重要になる。(cdn.openai.com)
技術的に面白いのは、モデルが「予想を証明する」方向ではなく「反例を探す」方向へ進んだらしい点だ。companion remarks では、多くの人間研究者がこの予想を真だと見ていたため、反例構成に長く賭ける動機が弱かった可能性が指摘されている。ここに、LLM型の研究支援の一つの性格が見える。モデルは必ずしも人間より深く理解しているから勝つのではなく、人間なら「たぶん無理」と切り捨てる経路を、広い技術語彙と長い試行で掘り続けることがある。今回の事例では、その探索が「高次の数体を使って元の格子構成を一般化する」という、後から見れば自然だが事前にはかなり遠い橋を架けた。(cdn.openai.com)
一方で、これをそのまま「AIが数学者を不要にした」と読むのは粗い。今回の公開物自体が、モデル出力、AI採点、人間研究者による検証、外部数学者による簡略化と文脈化、という多段階の共同作業になっている。Thomas Bloomは、人間が証明を議論し、咀嚼し、改善し、帰結を探る役割は依然として重要だと述べている。むしろ今回見えてきたのは、数学研究のワークフローが「人間が発想し、機械が補助する」から、「機械が候補を出し、人間が意味・正しさ・射程を確定する」へ広がる可能性だ。(cdn.openai.com)
生成AI・LLM分野にとっての含意は大きい。これまで数学能力は、競技数学ベンチマークや定理証明支援の文脈で語られがちだった。しかし今回の主張が持つ意味は、ベンチマークの点数ではなく、未解決問題に対して新しい構成を出し、それが専門家の検証に耐えたという点にある。もちろん、モデル名、再現性、必要な推論計算量、失敗試行の数、探索の一般化可能性はまだ十分に見えていない。それでも、LLMが「既知知識の要約器」から「研究仮説の生成器」へ移る境界線を示す事例として、今後しばらく参照されるだろう。(openai.com)
今回の本質は、AIが一つの難問を解いたことだけではない。人間の数学文化では、どの道を有望と感じ、どの道を捨てるかという直観が研究の速度を決める。LLMはその直観を共有しないため、時に非効率で、時に危うく、しかし時に人間が避けた場所へ踏み込む。単位距離問題の反証は、その「ずれ」が初めて大きな数学的価値を持った例として読める。次に問われるのは、これが孤立した成功なのか、それとも研究の発見過程そのものを変える反復可能な型なのかだ。