AI对人类智力高地的攻陷速度,已经远远超出了所有人的想象。就在近期科技圈接连爆出重磅突破,OpenAI刚攻克一道尘封80年的埃尔德什数学难题,谷歌DeepMind便紧随其后,凭借全新的AlphaProof Nexus智能体框架,一口气拿下9道悬置数十年的埃尔德什开放问题。这些困住全球顶尖数学家数十年的难题,最终被AI以极低的算力成本批量破解。留给人类数学家攻坚的顶级悬赏难题,已经越来越少,纯数学研究的时代格局正在被彻底改写。

熟悉数学领域的人都清楚,埃尔德什提出的各类开放问题,是全球数论、组合几何领域的顶级难题,每一道都耗费了几代数学家的心血,却始终难以找到完整解法。而这次谷歌AlphaProof Nexus的突破,绝非简单的奥数解题,而是实打实的前沿学术突破,含金量拉满。除了9道核心埃尔德什难题,这套AI框架还顺带证明了OEIS整数序列百科中的44个开放猜想,攻克一道搁置15年的代数几何难题,甚至优化了凸优化领域沿用多年的理论边界,多领域同步实现突破,展现出极强的通用数学推理能力。更颠覆认知的是,AI破解每道顶级难题的算力成本仅几百美元,且全套证明代码已开源至GitHub,向全球公开成果。

在本次攻克的9道难题中,三道代表性问题最能体现AI的解题巧思,每一道都破解了困扰人类数十年的思维困局。1970年提出的埃尔德什12号问题,悬置时长长达56年,核心是寻找一个特殊的无限整数集合,既要满足任意三个数中,不存在一个数能整除另外两数之和,又要保证集合数字分布足够密集,不能刻意稀疏取数。人类数学家数十年仅取得局部进展,无法形成完整解法,而AI另辟蹊径,借助中国剩余定理拆分整体难题,搭配三项等差数列回避集匹配约束,成功拼接出完整的无限解集,完美破解这一难题。

1996年提出的125号问题,困扰学界30年,核心是判断两类特殊进制数字集合的求和新集合,是否具备正自然数密度。人类始终无法界定其稀疏程度,AI则通过证明log₄与log₃为无理数,依托3的幂次与4的幂次可高精度逼近的特性,构建稀疏化归纳论证,层层衰减集合密度,最终精准证明该集合密度归零,用纯数论思路破解了组合几何难题。而1992年的846号平面几何难题,卡了人类34年,核心是存在局部正常、整体不可拆分的无限平面点集,AI创新性地将几何问题转化为图论与逻辑问题,通过二次多项式编码坐标、结合无穷Ramsey定理,顺利完成完整证明。

本次突破最让人意外的,是AlphaProof Nexus的底层工作逻辑。这套由Gemini 3.1 Pro驱动的框架,搭建了四级智能体体系,通过大模型生成证明步骤、Lean编译器逐行核验、报错反馈迭代修改的闭环模式完成解题。原本团队预设融合进化算法、强化学习工具的高阶智能体效果最佳,可最终测试结果颠覆预期——最简单、仅靠大模型+编译器纠错循环的基础智能体,就能独立破解全部9道难题,只是算力成本略高。这直接证明,Gemini大模型的逻辑推理能力,搭配专业校验工具的精准纠错,已经足以挑战人类顶级数学难题,复杂的多工具组合架构并非刚需,为未来AI数学研究指明了轻量化新方向。

菲尔兹奖得主陶哲轩曾精准预判,当前AI攻克埃尔德什难题的成功率仅1%-2%,而本次谷歌团队测试353道开放难题,成功破解9道,成功率恰好匹配这一数据,印证了AI数学推理能力的稳定性与专业性。不同于人类数学家需要数年、数十年深耕钻研,AI依靠高效迭代循环和极低算力成本,实现了顶级数学难题的批量突破,效率差距堪称降维打击。值得一提的是,该项目20人作者团队中,包含2016年AlphaGo核心研究员Aja Huang,从围棋博弈到顶级数学推理,这支团队持续刷新着AI的智力上限。

从AlphaGo颠覆围棋领域,到如今AI批量破解人类百年数学难题,人工智能早已摆脱“人工智障”的标签,不再只会执行基础指令,而是具备了独立科研、突破未知领域的能力。但这并不意味着人类数学家会被取代,而是数学研究范式迎来彻底革新。过去依赖人类天赋、漫长试错的纯数学探索,如今有了AI高效算力与逻辑推理的加持。AI正在成为人类顶尖科研的最强辅助,替人类扫清未知领域的壁垒,推动数学乃至整个基础科学,迈入全新的快速发展阶段。