摘要:GPT-5的发布在全球范围内引起了巨大的轰动,引发了广泛的试玩和讨论。拥有50万粉丝的YouTube博主Matthew Berman也不甘落后,发布了一段25分钟的视频,展示了GPT-5在数十个应用场景中的出色表现。
GPT-5的发布在全球范围内引起了巨大的轰动,引发了广泛的试玩和讨论。拥有50万粉丝的YouTube博主Matthew Berman也不甘落后,发布了一段25分钟的视频,展示了GPT-5在数十个应用场景中的出色表现。
在Berman的视频中,GPT-5被用来生成魔方生成器,不仅能够生成任意阶数的魔方,还能进行打乱和复原操作。更令人惊叹的是,他还利用GPT-5创造了一个网页版的乐高积木模拟器,让用户在浏览器中就能体验到搭建积木的乐趣。
还有其他博主通过GPT-5成功克隆出了太空模拟器、冥想应用,甚至是多邻国和Windows 95等经典应用,展示了GPT-5在跨领域应用中的巨大潜力。
GPT-5的表现确实令人瞩目,它在多个大模型竞技场中登顶,刷新了多个榜单记录。特别是在发布会上的学法语游戏演示,甚至让多邻国的股价出现了波动。然而,并非所有人都对GPT-5持完全肯定的态度。
特斯拉CEO埃隆·马斯克就是其中的一位质疑者,他拿出了ARC-AGI的成绩单,表示GPT-5在某些方面不如Grok 4。马斯克和OpenAI之间的恩怨由来已久,但GPT-5确实也存在一些细节问题,让部分网友感到不满。
例如,在GPT-5的发布会直播中,OpenAI展示的一张图表上出现了“52>69=30”的明显错误,引发了网友的广泛吐槽和调侃。有网友甚至用GPT-3修复了这张图表,以此来讽刺OpenAI的失误。
尽管存在这些争议,但不可否认的是,GPT-5在多个任务中的表现确实令人印象深刻。Berman在他的视频中展示了GPT-5在魔方求解、网页版Word和Excel复刻、生命游戏3D版等多个任务中的出色表现,充分证明了其强大的跨领域应用能力。
除了Berman的视频,还有其他博主和用户不断揭开GPT-5的新功能和成绩。例如,GPT-5在长文本处理能力上相比之前的版本有了大幅提升,并且在SimpleBench数据集上的表现已经超过了人类平均水平,这是大模型中的首次突破。
GPT-5还在用户自行投票的大模型竞技场上获得了总分和各个单项的第一名,尽管有Reddit网友指出,在单独对战中,GPT-5在某些情况下并不如Gemini-2.5-Pro表现优秀。但总体来说,GPT-5的表现仍然令人瞩目,它正在逐步改变我们对人工智能的认知和应用方式。
来源:ITBear科技资讯