摘要:在硅谷一间素净的会议室里,山姆·奥特曼(Sam Altman)的语调平静,却传递着一种风暴中心的沉稳。他不再是那个在Y Combinator指点江山的“创业导师”,而是驾驭着人类历史上最复杂、也最具争议的科技巨轮——OpenAI的船长。一位是塑造了硅谷“规模化
在硅谷一间素净的会议室里,山姆·奥特曼(Sam Altman)的语调平静,却传递着一种风暴中心的沉稳。他不再是那个在Y Combinator指点江山的“创业导师”,而是驾驭着人类历史上最复杂、也最具争议的科技巨轮——OpenAI的船长。一位是塑造了硅谷“规模化”创业范式的幕后推手;一位是如今亲身站在AGI(通用人工智能)浪潮之巅,直面未知与荣光的探索者。从“投资人”到“经营者”的身份转变,让他对创新、组织与未来,有了全然不同的体悟。
这场对话,更像是一次内省式的复盘。它从一个令人意外的坦白开始——“我曾以为我们撞上了一次大运,可能再也不会有这样的好运了。”这种对“奇迹”的敬畏与不安,贯穿了整场谈话。奥特曼分享了他对垂直整合战略的“幡然醒悟”,对CEO角色的切身体会,以及对AI终极价值的深刻思考。他不再仅仅谈论代码与模型,而是深入探讨技术与社会的“共同进化”、AI作为“科学家”的未来,以及AGI到来时,世界可能呈现的“连续而非爆炸式”的变革图景。
这不只是一次关于OpenAI的战略解读,更是一堂关于如何在指数级变化时代,领导一家“使命驱动型”公司的公开课。奥特曼的思考,为我们呈现了一种在巨大的不确定性中,依然保持谦逊、勇于修正、并坚定前行的领导力范式。
深度学习是一个不断赠予的奇迹
提问者:山姆,欢迎。从ChatGPT发布至今,世界发生了翻天覆地的变化。回望这段旅程,最让你感到意外,或者说更新了你世界观的是什么?
奥特曼:是新发现的总量。我曾一度以为,我们只是偶然 stumble on(撞上)了一个巨大的秘密——这些针对语言模型的规模法则(scaling laws)。那感觉像是一次不可思议的胜利,我当时心想,“我们可能再也不会有这样的好运了。”
但深度学习就像一个不断赠予的奇迹(a miracle that keeps on giving)。我们持续不断地找到一个又一个突破。当我们取得推理模型的突破时,我同样觉得这样的好运不会再有第二次。这项技术能如此出色地工作,本身就显得那么不可思议。
但或许,这就是当你发现重大科学突破时的真实感受。如果它真的足够重大,它就足够基础,并且会持续不断地带来新的东西。如果你回到ChatGPT刚发布时的GPT-3.5时代,你会简直不敢相信当初居然有人会用那样的东西。而今天,我们模型的能力已经远远超出了大多数人的认知。这种进步的速度,是我未曾预料到的。
我过去一直反对垂直整合,现在看我错了
提问者:OpenAI的业务版图越来越庞大,从研究、产品到超大规模的基础设施,甚至有硬件的传闻。这是否意味着你们的战略正在从一个纯粹的研究机构,转向一个更复杂的“垂直整合”模式?
奥特曼:这是一个非常好的问题。我过去一直反对垂直整合,但现在我认为我当时完全错了。
在理论上,你总希望经济是高效的,每个公司只做一件事。但OpenAI的经历告诉我们:为了实现我们的使命,我们必须做比我们想象中更多的事情。研究让我们能创造出伟大的产品,而基础设施让我们能进行前沿的研究。这是一个紧密相连的垂直堆栈(vertical stack)。
你看计算行业的历史,总是在垂直整合与非整合之间摇摆。但科技史上最不可思议的产品——iPhone,就是垂直整合的典范。为了给用户提供最终的那个神奇体验,你必须控制从芯片到软件的每一个环节。
我们现在也面临同样的情况。我们决定在基础设施上进行一次非常激进的押注,我对我们未来的研究路线图从未如此充满信心。为了将这些模型的能力真正释放出来,从最底层的电子到最上层的模型分发,中间的每一个环节我们都必须深度参与。所以,是的,我们正在走向更深度的整合,并且你会看到我们与更多伙伴进行合作。
从投资人到CEO:从好感觉转向坏感觉真的很难
提问者:你刚才的回答,听起来更像一个“经营者”,而不是你过去的“投资人”角色。你曾是YC的掌门人,可以说是最顶级的投资人之一。从投资到亲自运营一家如此庞大复杂的公司,这种转变给你带来了什么?
奥特曼:我非常震惊于这两个角色的巨大差异。坦白说,我当时并没有太多运营经验,我天生不是一个经营者。我曾经是以一个“投资人建议一家公司”的心态在工作。现在,我才真正理解运营一家公司到底意味着什么。
做一个好的投资人,你需要在很多宏观问题上显得很聪明,你可以在鸡尾酒会上谈论你投的公司,每个人都觉得你洞察一切。那是一种很好的感觉(a good feeling)。但成为CEO常常伴随着糟糕的感觉(bad feelings)。
你要处理组织动力学、冲突解决,还有那些由人性深处的心理因素催生出的奇怪的办公室政治……这些具体而微的工作,占据了你大量的心力。从一个总是“好感觉”的角色,转向一个常常是“坏感觉”的角色,真的非常难。但这种转变也让我对商业的理解变得无比深刻。你必须亲身在战壕里,才能体会到每一个决策背后的所有连锁反应,而不只是看到纸面上的“分发渠道和资金”。
AI最大的变革,是成为“AI科学家”
提问者:我们聊了很多组织和战略。回到技术本身,如果让你预测未来几年,模型能力会给我们带来最激动人心的突破是什么?
奥特曼:你触及到了我最兴奋的一点,那就是——“AI科学家”。
这听起来很疯狂,但我们正在认真地讨论这件事。我们都记得图灵测试,它曾被视为AI领域最重要的圣杯,感觉遥不可及。然后ChatGPT出现了,这个里程碑就这么“飞驰而过”(wooshing by)。世界惊叹了一两个星期,然后大家就接受了“好吧,电脑现在能做这个了”的现实。
我认为同样的故事即将在科学领域重演。现在我们已经能在Twitter上看到一些零星的例子:AI做出了一个新的数学发现,或者在我的物理、生物研究中帮了一点小忙。这一切都将走得更远。
我坚信,在两年内,模型将能承担更大块的科学工作,做出重要的发现。这将是一个疯狂的改变,会对世界产生重大影响。从一阶导数的角度看,科学进步是让世界随着时间变得更好的根本原因。如果我们能拥有更多、更快的科学进步,那将是一个巨大的改变。这是积极的改变,但人们谈论得还不够多。
社会与技术必须共同进化,你不能在终点抛出一个颠覆性的东西
提问者:这引出了一个有趣的问题。像Sora这样的产品,它并非直接服务于“AI科学家”这个宏大目标,甚至有人质疑它占用了宝贵的计算资源。你们推出它的战略考量是什么?
奥特曼:我坚信,社会与技术必须共同进化(co-evolve)。你不能在终点线突然抛出一个颠覆性的东西,那行不通。它必须是一个持续的、来回往复的过程。
Sora的发布,首先是为了让社会提前“品尝”到未来的味道。视频比文本具有更强的情感共鸣。很快,世界将不得不应对可以深度伪造(deep fake)任何人的视频模型。让世界提前理解这项技术将走向何方,这非常重要。
当然,它也对我们的AGI研究有帮助。但更重要的是,不能所有事情都只是为了让人们无情地高效(ruthlessly efficient)。在一路前行的过程中,总得有一些乐趣、喜悦和惊喜。Sora就是这样的存在。我们不会把大部分算力都投入其中,但在绝对意义上,这依然是一笔巨大的投入。
我没想到AI和能源,最终是同一件事
提问者:你提到了巨大的算力投入,这自然联系到了一个非常物理、非常现实的问题:能源。我记得你曾说过,你职业生涯最关心的两件事是AI和能源。
奥特曼:是的,但我没有料到它们最终会是同一件事。这是两个我独立产生的兴趣,最后却汇合了。
这并非过度简化,但如果你回顾历史,提升人类生活质量最具影响力的手段,就是更便宜的能源。而现在,AI的发展,让我们需要所有可能来源的全部能源。
短期来看,我认为美国新增的基载电力将主要来自天然气。但长期来看,我相信两个主导能源将是太阳能加储能,以及核能——包括先进的小型模块化反应堆(SMRs)和核聚变。如果核能的成本能够相对于其他能源实现压倒性的经济优势,我预计政治压力会推动监管机构快速行动。当一项技术能带来如此巨大的成本优势时,世界的迁移速度会非常快。
AGI的到来不会是大爆炸,而是一个连续的过程
提问者:最后一个问题。关于AGI,很多人抱有恐惧,担心一个“奇点”式的爆炸性时刻。但从你今天的谈话来看,你似乎有不同的看法。
奥特曼:是的,我认为AGI的到来,不会是一个“大爆炸”(big bang)。它将是一个连续的(continuous)过程。
回顾过去,我们一次次发现,人类和社会的适应能力远比我们想象的要强得多。AGI会到来,世界也会因此发生天翻地覆的变化,但这种变化可能不会像我们想象中那样,以一种突兀、断裂的方式发生。社会将学得比我们预期的更快。
当然,我仍然认为未来会出现一些非常奇怪甚至可怕的时刻。任何强大的技术,从火到电,都会带来风险。我们作为一个社会,会围绕它建立起护栏。但我希望监管的重心,能真正聚焦于那些能力远超人类的“前沿模型”,而不是扼杀那些能力稍弱、但能带来无限美好的模型所能做的 wonderful stuff(美妙之事)。这是一个连续的、需要我们共同摸索前进的过程。
来源:有钱人的枯燥Life
