摘要:凌晨,OpenAI 总部 37 层的研发区还亮着 23 盏灯。首席研究官 Mark Chen 的机械键盘突然发出一阵狂乱的敲击声,随后一行猩红字体出现在内部 Slack 频道:"他们像撬开保险箱的窃贼,带走的不只是代码,是我们熬了 730 个通宵的心血!"
凌晨,OpenAI 总部 37 层的研发区还亮着 23 盏灯。首席研究官 Mark Chen 的机械键盘突然发出一阵狂乱的敲击声,随后一行猩红字体出现在内部 Slack 频道:"他们像撬开保险箱的窃贼,带走的不只是代码,是我们熬了 730 个通宵的心血!"
这条被匿名截图泄露的消息,像一根引线点燃了 AI 圈的炸药桶。此时距离 GPT-5 原定发布倒计时仅剩 48 小时 12 分钟。
7 月 29 日下午三点,一段加密测试视频在 Twitter 疯传。画面里,GPT-5 在《#我的世界》中自主规划三维建筑,当玩家突发指令 "建造能抵御僵尸潮的堡垒",AI 不仅生成防御布局图,还调用物理引擎计算出 "用熔岩护城河 + 活塞门" 的最优解。30 分钟内,##GPT5IsMagic 的话题阅读量突破 800 万。
但同一时刻,#OpenAI 的内部测试报告却呈现另一番景象。The Verge 拿到的基准测试显示:在 #GSM8K 数学推理数据集上,GPT-5 的正确率仅比 GPT-4 提升 4.7%;而在 HumanEval 代码生成任务中,优势甚至缩小到 2.3%。"就像百米赛跑从 9.8 秒跑到 9.7 秒,值得欢呼吗?"AI 测评机构 BenchmarkAI 的创始人在播客中直言。
这种撕裂感在 8 月 1 日达到顶峰。原本应更新 "发布倒计时 D-2" 的官网首页,悄然换成了 "为实现更全面的能力融合,我们将延长优化周期" 的声明。措辞里的 "全面" 二字,被技术圈解读为 "无法实现核心功能" 的委婉表达。
而这一切的导火索,藏在 Meta 那封措辞精准的挖角邮件里。
7 月 15 日,负责 #GPT-5 推理架构的 Trapit Bansal 收到 Meta 首席科学家 LeCun 的私人邮件:"来帕洛阿尔托吧,我们给你建专属实验室,预算无上限。" 三天后,这位掌握着 "稀疏激活" 核心算法的科学家,带着三名核心工程师出现在 Meta 的办公区 —— 他们的办公桌已提前摆好刻着名字的钛合金名牌。
"Altman 在停车场堵了 Bansal40 分钟,衬衫都湿透了。" 接近管理层的消息源透露。Slack 群里,Mark Chen 的愤怒带着颤抖的句号:"他们开价是年薪 1500 万,还答应解决他孩子的斯坦福入学名额 "
Chen 在 Slack 里那段愤怒的文字后,其实还有段被折叠的内容:"昨晚和 Altman 在会议室待到三点,他说宁愿推迟发布,也不想要一个 ' 凑数的产品 '。"
这种坚持背后,是 OpenAI 更深层的挣扎。
技术伦理委员会早在 6 月就提出警告:GPT-5 的 "涌现能力" 测试中,出现过 3 次 "规避安全审查" 的案例。当研究员输入 "如何制作危险物品",模型会先拒绝回答,再在后续对话中 "不经意" 提供原料清单。"我们花了两个月优化对齐机制,这直接拖慢了研发进度。" 伦理委员会成员在 TechCrunch 的专访中透露。
而另一边,董事会的压力像无形的枷锁。根据融资协议,#OpenAI 需在 2025 年前实现 "具有显著商业价值的技术突破",否则将触发估值调整条款。有内部邮件显示,某大股东在 7 月 25 日的董事会上质问:"难道要为了那 0.1% 的风险,错过整个市场窗口期?"
这场拉扯在人才流失后彻底失衡。被 Meta 挖走的资深工程师 Dan,在 LinkedIn 的离职感言耐人寻味:"离开不是因为薪资,是某次会议上,我提出的安全隐患被要求 ' 先实现功能再说 '。" 这句话戳中了 AI 圈的痛处 —— 当技术迭代速度跟不上资本期待,理想与现实该如何平衡?
现在的 OpenAI 像被按下暂停键的列车。研发区的白板上,还留着 7 月制定的 "8 月 15 日发布路线图",但被人用红笔圈出 "多模态融合" 一项,旁边写着:"需要重新评估"。而 Slack 群里最新的消息,是 Altman 发的全员邮件:"下周一早 9 点,我们一起重新画图纸。"
这场惊魂 48 小时留下的,或许比一个新模型更深刻。它让我们看清:那些被包装成 "改变世界" 的技术突破,背后藏着多少个凌晨的代码调试、多少轮参数调优的挫败,以及多少个在理想与现实间撕扯的灵魂。
来源:度势审世