benchmark

GPT-5发布引热议:博士级AI表现究竟如何?

然而,发布会上的一个小插曲却让这场盛宴略显尴尬。在展示Benchmark时,一张图表意外地将52.8的成绩显示得比69.1还要高,这一明显的失误迅速引发了网友的热议。网友们纷纷质疑,为何在全球直播的重要场合,会出现如此低级的错误。甚至有人调侃道,这博士水平的A

编程 openai 博士 benchmark aime 2025-08-08 20:00  3