震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩

B站影视 欧美电影 2025-09-18 06:34 3

摘要:在阿塞拜疆巴库举行的 2025年国际大学生程序设计竞赛(ICPC)全球总决赛中上,来自 100 多个国家的 139 支大学队伍在五小时内角逐解决 12 个算法问题,最终圣彼得堡国立大学凭借解决 11 个算法问题夺得人类冠军。在相同约束条件下的并行 AI 赛道上

在阿塞拜疆巴库举行的 2025年国际大学生程序设计竞赛(ICPC)全球总决赛中上,来自 100 多个国家的 139 支大学队伍在五小时内角逐解决 12 个算法问题,最终圣彼得堡国立大学凭借解决 11 个算法问题夺得人类冠军。在相同约束条件下的并行 AI 赛道上,谷歌的 Gemini 2.5 Deep Think 模型解决了 10 个问题,获得了与金牌相当的成绩。

最震撼的是OpenAI 的内部推理模型获得了 12 /12的满分,超越了所有人类队伍,拿下第一

值得注意的是OpenAI和谷歌的模型都解决了所有人类参赛队伍都没有解决的问题c。OpenAI的内部推理模型在经过9次尝试后解决了最难的问题,其余问题都是一次解决

OpenAI:获满分成绩,超越人类冠军

OpenAI的推理系统在本次竞赛中取得了12题全解的完美成绩,该成绩超过了所有人类参赛队伍

成绩与排名:解决了全部12个问题。如果参与人类排名,该成绩将位列第一。本届最优秀的人类队伍解决了11个问题

比赛条件:AI参加了官方的现场AI赛道,与人类选手共享5小时的比赛时限,并接收完全相同的PDF格式题目。系统自主选择并提交答案,无人工干预

解题详情:在12个问题中,11个为一次性提交正确。最难的一个问题在第9次提交后成功解决

技术构成:参赛系统由多个通用模型组成,包括GPT-5和一个实验性推理模型。其中,GPT-5解决了11题,实验性推理模型解决了最难的第12题,并负责最终提交决策。所有模型均未针对ICPC进行专门训练

Google DeepMind:获金牌级表现

谷歌DeepMind的Gemini 2.5 Deep Think系统在竞赛中解决了10个问题,达到了金牌级别

成绩与排名:解决了12个问题中的10个。该成绩达到了金牌分数线(前四名队伍获金牌),如果参与排名,将位列第二

比赛条件:AI在一个远程在线环境中比赛,遵循ICPC规则,比人类选手晚10分钟开始

关键亮点:独立解决了“Problem C”,这个问题在本次比赛中没有任何一支人类大学队伍能够解决。Gemini在比赛开始后半小时内完成了该题

解题效率:在比赛开始45分钟内解决了8个问题,三小时内完成了全部10个问题

人类队伍排名:

1.第一名:圣彼得堡国立大学 (St. Petersburg State University)

* 解题数:11

* 总罚时:1478

2.第二名:东京大学 (The University of Tokyo)

* 解题数:10

* 总罚时:1116

3.第三名:北京交通大学 (Beijing Jiaotong University)

* 解题数:10

* 总罚时:1425

4.第四名:清华大学 (Tsinghua University)

* 解题数:9

* 总罚时:865

5.第五名:北京大学 (Peking University)

* 解题数:9

* 总罚时:887

6.第六名:哈佛大学 (Harvard University)

* 解题数:9

* 总罚时:995

7.第七名:萨格勒布大学 (University of Zagreb)

* 解题数:9

* 总罚时:1075

8.第八名:麻省理工学院 (Massachusetts Institute of Technology)

* 解题数:9

* 总罚时:1123

9.第九名:中国科学技术大学 (University of Science and Technology of China)

* 解题数:9

* 总罚时:1128

10.第十名:首尔大学 (Seoul National University)

* 解题数:9

* 总罚时:1133

至此,OpenAI在 IOI 中获得第 6 名,在 AtCoder 竞赛中获得第 2 名ICPC2025上取得了满分,2026年人类的编程能力可能会永远落后于AI,不单单是个人coding能力还包括软件工程能力

来源:新浪财经

相关推荐