摘要:8月9日,OpenAI的IMO金牌核心团队成员Alexander Wei、Noam Brown与Sheryl Hsu在红杉Training Data播客中分享了他们如何在短短两个月内让AI达到IMO金牌水平。
8月9日,OpenAI的IMO金牌核心团队成员Alexander Wei、Noam Brown与Sheryl Hsu在红杉Training Data播客中分享了他们如何在短短两个月内让AI达到IMO金牌水平。
团队透露,尽管OpenAI内部对模型能否获胜存在争议,甚至有研究员曾想以2:1的赔率打赌模型不会赢,但最终他们成功了。为了验证AI的解题能力,他们聘请了外部的IMO奖牌获得者对AI生成的证明进行评分,每份证明由三位奖牌获得者审核,最终一致认为AI有能力获得IMO金牌。
此次突破的关键在于AI推理时间的显著延长,从几秒扩展到几小时,使模型能够更深入地思考复杂问题。此外,新模型还展现出自我意识,主动承认无法解答第六题,减少了“幻觉”问题,提高了AI的可靠性。
团队还介绍了他们的独特方法:使用多智能体系统,让多个AI“助手”分工协作,从而在短时间内解决复杂问题。这种方法不仅适用于数学竞赛,还将在未来扩展到其他领域,如物理奥林匹克竞赛等。
尽管AI在IMO中取得了突破,但距离解决千禧难题等更复杂的数学问题仍有很长的路要走。团队表示,他们将继续努力,让AI不仅能够解题,还能提出新的数学问题。
来源:三言科技Pro