首次!GPT-5以“定理贡献者”登论文,学界吵翻了

B站影视 韩国电影 2025-09-20 01:52 1

摘要:2025年9月初,arXiv平台上挂了篇数学论文,直接在学界搅起了大浪,GPT-5居然被写进研究成果里,还成了“定理贡献者”。

2025年9月初,arXiv平台上挂了篇数学论文,直接在学界搅起了大浪,GPT-5居然被写进研究成果里,还成了“定理贡献者”。

这可不是AI帮着算个简单公式、查点文献,是大型语言模型头一回以这种身份出现在论文正文,说它是个小里程碑,一点不夸张。

要聊这事,得先说说“第四矩定理”。

这定理是Nualart和Peccati提出来的,专门判断一类随机变量会不会收敛到正态分布,在数学研究里算基础款,但棘手程度可不低。

它有个致命问题,只能告诉你“会不会收敛”,至于“收敛得有多快”,压根给不出准数。

老实讲,这个缺口卡了不少应用的脖子,没有速度界限,好多实际场景根本没法用这个定理。

研究者干脆把这个难题丢给了GPT-5,问题很直接:在Malliavin–Stein框架下,能不能把“定性收敛”改成“定量收敛”,给个明确的速度标准?

本来想觉得AI未必能啃下这块硬骨头,毕竟这是之前没人解决的活,结果GPT-5还真拿出了答案,它推导出新结论,说只要第四矩慢慢逼近高斯分布的数值,收敛速度就能被清晰描述出来。

这个结果不光是补了缺口,更让定理“活”了。

像高维随机场分析、金融里的极值风险评估,还有物理中的随机过程模拟,以前只能含糊说“会收敛”,现在有了速度界限,这些应用才算真正能落地。

而且研究者没给GPT-5“修修改改”,直接把它的推导放进论文,这待遇以前AI可没有。

不过我觉得,这也说明AI在数学领域的角色真变了,从“打下手的”往“合作者”靠了,但要说它能单干,现在还差得远。

外界一听说GPT-5写进论文,不少人都喊“AI能独立解数学难题了”,但事实哪有这么简单。

GPT-5一开始确实写出了定理陈述,看着逻辑挺顺,可到了关键的Cov(Y²,Z²)推导环节,直接用错了公式。

这要是没人发现,整个证明就全毁了。

研究者先是问它:“你能检查下Cov(Y²,Z²)的公式,给点细节不?”GPT-5乖乖给了解释,结果还是错的。

无奈之下,研究者直接点破:“你说的(p+q)!‖u⊗̃v‖²=p!q!‖u‖²‖v‖²,这是错的。”

直到这时候,GPT-5才承认之前的推理有问题,调整思路后才弄对,最后还按要求整理成了完整论文。

论文作者说跟GPT-5合作像带个聪明但毛躁的实习生,这话太贴切了。

它能快速给方向、生成证明,但必须有人盯着,指出错误让它改。

就像8月20号微软研究员SébastienBubeck在X上发的,说GPT-5Pro几分钟就把凸优化领域的经典界限从1/L提到了1.5/L,外界都惊了,觉得AI能“加速整个领域”。

但优化专家ErnestRyu泼了冷水,说这其实是用了专家都熟的Nesterov定理,有经验的研究者几小时也能出同样结果。

搞不清为啥外界总盯着“几分钟”这个速度,内行看的是有没有真创新,很显然,这次GPT-5只是快速用了现有工具,没到“突破”的份上。

GPT-5写进论文,看着像给科研加了速,但研究者结尾提的担忧,我觉得特别实在。

他们发现GPT-5最擅长的是把已有的工具拼起来出结果,技术上没毛病,可缺了真正的原创性。

要是以后这种“拼图式研究”越来越多,文献里全是“正确但平庸”的成果,那些真正有突破性的工作反而难被看到,这对学术圈可不是好事。

更让人揪心的是博士生培养。

按以前的节奏,博士生得靠反复读文献、自己尝试、不断犯错,才能慢慢练出研究直觉。

但现在AI能随时生成技术正确的推导,要是学生过度依赖,那些重要的试错环节就被跳过了,最后可能连基本的逻辑梳理、错误修正能力都没了。

OpenAI研究员NoamBrown也提醒过这事,不是没道理。

说实话,我觉得高校现在得琢磨琢磨,怎么在用AI提效率的同时,不让博士生丢了该练的本事,总不能让AI把学术能力的“根”给断了吧?

现在GPT-5已经实实在在出现在数学论文里,能生成定理、推导证明,还能在教授引导下走完研究流程。

但问题也摆在那:“正确但平庸”的成果多了怎么办?博士生的试错环节没了怎么办?其实答案很简单,AI就是个工具,关键看怎么用。

以后人类研究者的核心,应该是提出真问题、构建新理论、引着研究走,这些是AI现在还做不到的。

毕竟,真正推动知识进步的,永远是人类的原创思想,不是AI拼出来的公式。

来源:墨史浅吟

相关推荐