摘要:9月初,arXiv上一篇论文直接在学界投下一个重磅炸弹,GPT-5这个AI模型,竟以定理贡献者的身份,实实在在写进了数学论文的正文里。
9月初,arXiv上一篇论文直接在学界投下一个重磅炸弹,GPT-5这个AI模型,竟以定理贡献者的身份,实实在在写进了数学论文的正文里。
它的名字不是躲在辅助工具的脚注里,而是凭自己推导出的全新结论,被原封不动地收进了核心推导部分。
要知道,数学这地界从来是人类智慧的绝对自留地,可现在,AI的笔迹真真切切出现在了定理推导里。
外界在得知消息后立马炸锅,吵着AI要取代数学家了、学术圈要变天了,但真正的内行却没那么激动,他们的冷静,比这场AI写论文的热闹本身,藏着更值得琢磨的答案。
这次GPT-5啃下的硬骨头,是数学里的第四矩定理这定理是Nualart和Peccati搞出来的,用途很实在,判断一类随机变量会不会收敛到正态分布,
但它有个卡了多年的缺口,只敢说会收敛,却算不出收敛有多快,就像告诉你火车会到终点,却不说要几小时,对实际应用来说等于白说。
研究团队干脆把这个难题抛给了GPT-5,在Malliavin–Stein框架下,能不能给第四矩定理加个速度表?
没想到GPT-5真给出了答案,它推导出一个全新结论,只要第四矩逐渐逼近高斯分布的数值,收敛速度就能被清晰刻画。
这可不是小突破,对搞应用数学的人来说,收敛速度是定理落地的关键。
比如分析金融数据的极值风险、模拟物理里的随机过程,以前只能笼统用会收敛凑活,现在有了定量边界,模型才算真的能用。
更关键的是,整个推导过程没掺水,不是研究者拿着AI的碎片思路自己润色,而是直接把GPT-5的推导搬进论文,这是大型语言模型第一次以贡献者身份,站上数学研究的核心舞台。
外界一听说GPT-5写论文,立马喊AI要取代数学家了,但扒开细节才发现,这压根不是AI的solo秀,而是教授+AI的组合拳。
GPT-5一开始确实亮眼,上来就抛出了定理陈述,逻辑看着挺顺,可研究者一较真就发现,在AI给出的定理中,关键环节里推导竟然用了错公式!
研究者见状赶紧追问,让AI再检查下这个公式,给他讲讲细节,没想到GPT-5乖乖补了过程,结果还是错的。
直到研究者直接向GPT-5指出错误,GPT-5才认错,调转思路重新推导,来来回回纠错了好几次,它才拿出正确结果,还按要求整理成了论文格式。
论文作者后来打趣称,跟GPT-5合作,就像带个聪明但毛躁的实习生,虽然方向给得快,证明写得顺,但必须有人盯着擦屁股。
除了这件事,一位研究员的经历更能说明问题,他让GPT-5解凸优化的公开问题,几分钟就把经典收敛速度上限从1/L提到了1.5/L!
在外人看来是颠覆性突破,但优化专家却泼了冷水,他认为GPT-5就是用了Nesterov定理这个老工具,有经验的研究者几小时也能搞定。
说白了,GPT-5是快枪手,但不是开创者,它能把人类已知的工具快速拼出新结果,却还没学会从零到一的原创。
归根结底,GPT-5进论文这事儿,最让人揪心的不是AI抢饭碗,而是它可能把科研变成流水线作业。
研究团队在论文结尾称,GPT-5最擅长的是拼接现有工具,技术上挑不出错,但没什么原创性,用白话来讲,AI就像是用现成的积木拼模型,再精致也是组装,不是设计新积木。
要是未来学界全是这种正确但平庸的成果,真正有突破性的工作可能会被淹没,就像书架上堆满了流水线小说,经典著作反而难找了。
更要命的是博士生的成长,以前学做研究,得自己啃文献、试错、改推导,慢慢磨出科研直觉,可现在AI能直接给出正确推导,这些最关键的摸爬环节就被跳过了。
OpenAI研究员早就提醒过,过度依赖AI,学生可能会丢了最基本的科研技能。
这不是杞人忧天,就像学画画总用描红,永远练不出构图能力,总靠AI给推导,怎么可能养出发现新问题的敏感?
GPT-5写进数学论文,与其说是AI要取代人类,不如说是给学界抛了个大问题。
它确实让科研变快了,以前可能耗半年的推导,现在几天就能出框架,以前卡很久的技术细节,现在AI能快速补全,但快不等于好,效率不等于深度。
数学界的老炮们心里门儿清,AI能拼出收敛速度,却想不出第四矩定理本身,能优化1/L的界限,却创造不出Nesterov定理这样的新工具。
像是提出没人想过的问题、开辟没人走的方向、创造没人用过的工具这些事情,最终还得靠人类,AI只是把执行环节提速,却替代不了思考环节的灵魂。
未来几年,AI在学术里的角色只会越来越重,但它终究是实习生,不是导师,是工具,不是主人。
而人类研究者要做的,或许是放下被取代的焦虑,学会当那个盯细节的教授提问题的领航员。
毕竟,AI能写出定理,却写不出定理背后的为什么,能完成推导,却完不成推导之前的感想。
来源:暮时史分