OpenAI o3编程能力跻身人类前200

B站影视 2024-12-21 13:28 2

摘要:事件背景:在"双12"直播活动最后一天,OpenAl正式推出了其备受瞩目的下一代模型o3,o3-mini也一同亮相。o3主要成绩:编程能力在顶尖程序员竞赛CodeForces上,o3的分数超过2700,目前人类中只有不到200人能达到这个分数。

OpenAl o3的编程能力跻身人类全球前200。

事件背景:在"双12"直播活动最后一天,OpenAl正式推出了其备受瞩目的下一代模型o3,o3-mini也一同亮相。o3主要成绩:编程能力在顶尖程序员竞赛CodeForces上,o3的分数超过2700,目前人类中只有不到200人能达到这个分数。

在直播活动中,o3-mini也展示了其强大的编程能力。北大校友任泓宇仅用38秒就让o3-mini给自己写了一个UI,并通过API调用"自己",还成功运行了评估脚本。

AGI测试在为AGI准备的测试ARC-AGI上,o3的分数从32%跃升到了75.7%、87.5%。

数学测试在EpochAlFrontier Math测试中,o3的分数从之前的SOTA2分提升到25分,而人类专业数学家解决其中一道题目可能得花好几个小时甚至好几天的时间。

来源:激情总在~~~午夜后一点号

相关推荐