摘要:人类数学家与AlphaEvolve携手,一周内两次刷新18年未破的数学纪录!展现AI与人类协作的惊人潜力。AI如侦察兵广度扫描,人类专家深度优化,双引擎驱动下,科学前沿正在加速推进!
编辑:犀牛
【新智元导读】人类数学家与AlphaEvolve携手,一周内两次刷新18年未破的数学纪录!展现AI与人类协作的惊人潜力。AI如侦察兵广度扫描,人类专家深度优化,双引擎驱动下,科学前沿正在加速推进!
AI正在与人类协作加速推进科学前沿。
一周之内,一项18年的数学纪录连续两次被刷新!
先是在5月14日,DeepMind的AlphaEvolve(陶哲轩有参与)发布白皮书,宣布在50多个公开难题上刷新纪录,其中就包括将和差集的θ从1.14465提升到1.1584。
接着,在5月22号,人类数学家Robert Gerbicz又在AlphaEvolve的研究基础上,把θ推进到了1.173050!
在数学上,这是相当大的进步。
论文地址:https://arxiv.org/abs/2505.16105
陶哲轩发帖由衷的感叹道:「人类与AI不同方法的互补,正是数学快速前进的原因。」
这一次,AI的「广度扫描」与人类的「深度打磨」像双引擎一样同时驱动,给数学研究带来了久违的加速度。
和差集问题究竟是什么?
让我们先来了解一下这个让数学家们痴迷的问题。
简单来说,它关乎整数集合的「和集」(A+B,集合中所有元素两两相加得到的集合)与「差集」(A-B,集合中所有元素两两相减得到的集合)之间的大小关系。
想象你有两个装满了数字的袋子,我们叫它们袋子A和袋子B。
和集(A+B),就是你从袋子A里拿一个数,再从袋子B里拿一个数,把这两个数加起来,所有可能的加和结果,就组成了这个「和集」。
类似的,差集(A-B),就是从袋子A里拿一个数,从袋子B里拿一个数,用第一个数减去第二个数,所有可能的相减结果,就组成了「差集」。
比如A={1, 2},B={3, 4},那么A+B={1+3, 1+4, 2+3, 2+4}={4, 5, 5, 6}={4, 5, 6}(集合里元素不重复),A-B={1-3, 1-4, 2-3, 2-4}={-2, -3, -1, -2}={-1, -2, -3}。
那么,数学家们在琢磨什么呢?
他们想找到一种特别的袋子A和袋子B(里面的数字要选得很巧),使得和集里不同结果的数量相对较少,但同时,差集里不同结果的数量却非常非常多。
这个「非常非常多」到底能有多大,就用上面提到的那个神秘的指数θ来衡量。
2007年,Gyarmati、Hennecart和Ruzsa通过构造一个包含约30,000个元素的集合U,确立了θ=1.14465的下界。
这一结果在当时是加法组合学领域的重大进展,但数学家们知道,θ的上界为4/3,意味着仍有很大的改进空间。
AlphaEvolve通过无约束搜索,找到一个包含54,265个元素的集合U,将θ的下界提升至1.1584。
这一进步展示了AI在数学研究中的潜力:通过快速扫描大量可能性,AI能够发现人类可能忽略的构造。
这一次Gerbicz的新进展并非打败了AlphaEvolve,而是站在它提供的新基准上,用经典思路配超大参数(超过10^43546个元素)再进一步。
AlphaEvolve的「广角镜」
AlphaEvolve之所以能在和差集问题上取得突破,得益于其强大的通用算法设计能力。
它的核心机制,是将谷歌Gemini解决创造性问题的能力和能验证答案的自动评估器相结合,然后用进化框架来优化最有潜力的想法。
论文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf
它用48次标量乘法,搞定4x4复数矩阵乘法,改进了1969年Strassen最优算法。
AlphaEvolve不仅仅是矩阵乘法屠龙刀,还是个跨界狂魔。
为了测试AlphaEvolve的极限,DeepMind将其投入了数学分析、几何、组合学和数论中的50多个开放问题。
陶哲轩亲自出题参与到项目中。
在短短几小时内,AlphaEvolve完成了大多数问题的设置,展现出惊艳的灵活性。
更令人震撼的是,它在大约75%情况下,重新发现了最先进的解决方案;在20%情况下,改进了已知的最佳解决方案,并在相应的开放问题上取得了进展。
以困扰数学家300多年「亲吻数」难题为例,AlphaEvolve在11维空间中,发现了593个外球的配置,刷新了该问题的下限。
几何学中,数学空间的亲吻数被定义为一种空间排布下非重叠单位球体的最大数量。其中,所有的单位球体都与一个中心单位球体相切
AlphaEvolve并非DeepMind首次用AI做数学:AlphaGeometry 2解决了84%的IMO几何难题,胜过人类金牌选手。FunSearch则在组合数论难题上找到新构造,被Science评论为「新工具箱」。
这不是零和博弈
Gerbicz的突破正是陶哲轩所说的「互补」范例——Gerbicz与AlphaEvolve之间并不是一种零和游戏。
「将此简化为赢家和输家的零和游戏是很诱人的,但我认为,不同的方法在这里能够相互补充,共同推动数学进步,这非常棒。」陶哲轩写道。
像AlphaEvolve这样的AI工具,其优势更在于广度而非深度。
AI能凭借其强大的计算和模式识别能力,快速给出直觉性的判断和有潜力的方向。
它可以像一个孜孜不倦的「侦察兵」,快速扫描广阔的战场(问题的可能性空间),找出那些可能存在宝藏(可以改进的地方)的区域。
当AI标出「可疑区域」后,人类专家(或许也需要计算机的辅助进行精细计算)便可以集中火力,进行深度挖掘。
这实际上揭示了一种「AI+人类」双引擎驱动数学乃至科学进步的新范式。
在探索未知的前沿,单打独斗的时代或许正在过去,AI与人类智慧的协同,将是未来的主旋律。
正如一句老话所说:「如果你想走得快,就一个人走;如果你想走得远,就一起走。」
在AI的加持下,科学研究将会走得更远。
来源:新智元一点号