摘要:过去,AI 生成 3D 内容,大多只能应付单个物体,像是一个杯子、一张椅子,或者一只猫。想让它生成一个完整、连贯、可探索的 3D 世界?几乎是天方夜谭。但现在,这道坎被李飞飞和她的团队迈过去了。
过去,AI 生成 3D 内容,大多只能应付单个物体,像是一个杯子、一张椅子,或者一只猫。想让它生成一个完整、连贯、可探索的 3D 世界?几乎是天方夜谭。但现在,这道坎被李飞飞和她的团队迈过去了。
2025 年 9 月 16 日,李飞飞创办的 World Labs 发布了最新的 3D AI 模型 —— Marble,意味着生成式 AI 正式从“画个苹果”进化到了“创造一个世界”。而这背后,不仅是技术的飞跃,更是 AI 空间智能的深度突破。
传统的 3D AI 模型,擅长的是单一物体建模。你给它一张猫的照片,它能重建一个 3D 猫模型;你给它几个角度的杯子,它也能拼一个还不错的立体版本。
但问题是,它们无法生成一个可以自由走动、视角无缝切换的完整空间。换句话说,就是“有物体没世界”。
这正是 Marble 的突破点。用户只需要给出一张图片或一句文字提示,Marble 就能生成一个风格统一、几何完整、空间连贯的 3D 世界,而且这个世界可以持续存在、无限探索,不会崩塌、不变形、不乱套。
比如,有用户用两张旅行照片加上一张风格照,生成了一个既可缩放也可步入的立体世界,甚至还能在画面角落里发现照片中没有注意到的“小彩蛋”。
Marble 的另一大亮点,是它对“风格”和“几何”的双重掌控力。
一方面,它生成的 3D 世界在几何结构上非常完整。地毯的纹理、墙面的凹凸、光影的折射都栩栩如生。用户不需要高配电脑或专业建模工具,只要打开浏览器,就能“走进”这个 AI 构建的空间。
另一方面,它对风格的表达也更自由。你可以生成一个童话般的奇幻房间,也可以做出一个极简工业风的空间,甚至还能来一间色彩炸裂的卡通风办公室。每种风格都能在 Marble 中严格遵循,风格一致性远超同类模型。
这一点,尤其对设计师、游戏开发者、电影制片人来说,意义重大。因为他们终于可以不依赖繁琐的建模和渲染流程,直接用 AI 快速生成丰富的创意空间。
很多人知道李飞飞是计算机视觉领域的大牛,但她这次创业的目标,并不只是做个炫酷的 3D 工具,而是更宏大的“空间智能”。
她曾在博文中写道:“语言智能让我们沟通,而空间智能是理解世界、与世界互动的基础。”她认为,AI 的未来不只是能说会写,更应该能“看见”空间、理解物理世界,并在其中自由行动。
这正是 Marble 的意义所在 —— 它不仅生成了 3D 世界,更是一个空间理解和交互的起点。
为此,World Labs 还开发了渲染工具 Spark,可以将 Marble 生成的世界导出为高斯分布图,并无缝集成到 Three.js 等 Web 开发框架中,实现跨平台的 3D 体验。从 VR 头显到手机浏览器,用户都能流畅体验这个 AI 生成的世界。
Marble 的正式亮相,其实只是一个开始。李飞飞创办的 World Labs,由她和三位顶级计算机视觉专家联合创立,团队背景堪称豪华:NeRF(神经辐射场)提出者、本地实时风格迁移之父、可微渲染技术的首创者,全都在列。
短短三个月,公司估值已破 10 亿美元,获得 A16Z、Radical Ventures 等顶级 VC 投资,连 OpenAI 创始成员、图灵奖得主杰弗里·辛顿都在投资人名单上。
而李飞飞本人也给公司定下了清晰的方向:打造具备空间智能的 AI,让 AI 不只是会“说话”,还能看世界、建世界、理解世界。
过去几年,我们看过 AI 画画、写诗、生成视频,现在终于迎来了真正意义上的 3D 世界建模。而 Marble 的出现,并不只是让你“看见”一个世界,而是让你“拥有”一个世界。
这项技术的意义,不是某一个 VR 项目或某一款游戏的迭代,而是为人类和 AI 协作构建虚拟空间打下了地基。
对普通人来说,它意味着人人都能用 AI 创造自己的世界。对开发者来说,它意味着更低成本、更高效率的空间建模工具。而对整个 AI 行业而言,它意味着——
来源:老闫侃史视频