VAST宋亚宸:AI正在将3D“创世权”交到每个人手中

B站影视 港台电影 2025-09-27 17:25 1

摘要:9月27日,2025网易未来大会在杭州举行,主题为“以智能·见未来”。本次大会由网易公司主办,杭州市经济和信息化局(杭州市数字经济局)、杭州市商务局、杭州高新技术产业开发区管委会指导。

9月27日,2025网易未来大会在杭州举行,主题为“以智能·见未来”。本次大会由网易公司主办,杭州市经济和信息化局(杭州市数字经济局)、杭州市商务局、杭州高新技术产业开发区管委会指导。

本届大会将作为“第四届全球数字贸易博览会”的组成部分之一,聚焦人工智能各领域的发展,探索未来趋势。大会将由中国工程院院士潘云鹤等院士领衔,汇聚具身智能领域泰斗、顶尖AI创业先锋、知名投资人及产业翘楚。与会嘉宾将共同探讨大模型、具身智能、AI Agent等前沿技术突破与商业落地,在思想碰撞中捕捉全新的时代机遇。

在大会中,VAST创始人兼CEO宋亚宸先生进行了题目为《世界正在进入3D新时代》主题演讲。宋亚宸先生的演讲系统阐述了VAST公司在AI 3D大模型领域的成果、应用场景及未来愿景。

宋亚宸先生提到,AI 3D技术的应用主要有三大板块:内容行业(如游戏、影视)、工业设计(如鞋服、家居、3D打印)以及展示展陈(如电商、文旅)。VAST目前拥有全球最大的AI 3D大模型,4000万个3D原生数据库,实现了从几何生成、材质贴图到骨骼绑定、动作生成等全流程AI化。VAST的Tripo Studio工作台产品实现了端到端的3D内容创作,通过语义自动分拆、低模生成、拓扑优化和万物骨骼绑定等创新功能,将原本需要上百人合作、耗时数月的3D内容生产流程,缩短至仅需十分钟即可完成。这一技术不仅大幅降低了专业建模师的工作负担,也使普通用户能够轻松创作3D内容,打破了3D创作的门槛限制。

宋亚宸先生特别提到了与网易的多个合作案例,包括为《燕云十六声》开发“万物太极”功能实现实时场景生成,可以直接在一个世界中实现言出法随、心想事成,你走着走着遇到了一条河,过不去了可以生成桥,你可以改变地形,可以创作自己想要创作的房子,甚至生成非常阴森的海绵宝宝或是叮当猫去吓别人。在《蛋仔派对》中的文字/图片生成建筑与道具的功能,极大降低了UGC内容的创作门槛,还可以制作各种关卡,邀请别人来攻克和竞速,也可以搭建自己的小家,激活了用户创造力。

宋亚宸先生展望未来,认为随着AI 3D技术的普及,继文字、图片、视频平台之后,未来必将出现以3D交互内容为核心的UGC平台,使每个人都能成为“超级创作者”,真正释放创新潜能。(天牛)

以下是宋亚宸先生的演讲实录:

宋亚宸:各位嘉宾、领导,下午好。

感谢网易新闻的邀请,也感谢大家今天下午这么热的天气还来听我们说几句。

首先我们公司叫VAST,是一家做AI 3D大模型的公司,AI 3D已经做了两年多,第一年的时候可能还没有说要解释AI 3D大模型做什么,可能现场的大家已经逐渐了解,可以用文字和图片直接生成一个可用的3D模型。今天主要跟大家讲讲它的哪些地方已经实际的应用起来,这是和以前非常大的不同,首先在全球范围内已经有超过500万专业的建模师在使用我们的AI 3D大模型,并且服务于4万多家企业客户,其中有700多家都是行业里领头的龙头企业,生成的模型数量都已经快一个亿了,这已经是非常成熟一个行业应用。

大家在什么地方用?首先我们看到在主持人提到的内容行业,比如游戏、动画、短剧、影视、CG这些内容创作行业。

第二大块,工业设计,像鞋服、家居、首饰玩具、手办、香薰蜡烛、文具灯具、3D打印等柔性化生产场景。

第三大块,偏展示展陈,比如我们在电商去展示产品,包括在教育、文旅、文博,以及广告等场景。

当然,除了现有的行业,我们能给它提供新质生产力以外,有很多新型行业,3D都是最基础的设施,比如具身智能的仿真模拟,郭总提到在模型的训练当中也需要3D的数据。AI+游戏,需要3D的美术资产生成,以及元宇宙XR,以及最近很火的空间智能以及视觉大模型,最终AI 3D大模型逐渐走向成熟,可以让每个人都有能力零门槛、零成本去实时创作一个可交互的3D内容,未来有3D抖音都可以让大家在上面消费3D可交互内容。

关于技术,这个技术在三年之前刚刚被人类发明出来,每3到5个月就有快速提升,在上个月我们刚刚发布了Tripo3.0,目前200多亿参数,也是目前全世界最大的AI 3D大模型。

除了本身的几何生成之外,包括贴图、材质、PBR、低模生成、拓扑结构的优化、骨骼的自动绑定、动作的生成以及语义的自动分拆、部件补全,编辑再组合的能力,3D是一个非常长,非常复杂的管线,在管线当中我们做了一整套的AI 3D搭建。

目前的3D大模型在全世界都是领先的,首先是我们在全世界有最大的3D原生数据库,可以理解为3D建模师一点一点手做出来的3D模型大概有4000万个,这是目前最大的人类去积累的数据库。第二,我们拥有一个非常清华原生的人才密集的团队,发布的顶会论文超过50多篇,同时我们还做了很多开源项目,包括全世界最大的3D生成的算法框架 Three Studio,图生3D的鼻祖Wonder3D,以及与stability AI一起开源的TripoSR,一共20多个开源项目,共3万点赞。

这个产品Three Studio(AI原生的工作台),替代之前所有非常冗余和复杂的工作流,让创作者可以在工作台上端到端地创作3D内容,这是我们相信的一件事,未来每一个拥有专业能力的垂类大人群都会拥有一个属于自己的智能体(工作台)。

这个工作台上,我们做了一系列的3D新功能定义和发明,比如我们发明了语义的自动分拆,一个3D的模型生成出来不再是一坨,而是一个个部件,做工业设计就知道可以自动生成爆炸图,对每一个部件进行编辑再进行重新组合。

我们做3D打印的时候可以自动分拆成不同的部件,然后将它打印出来了以后再重新组合起来,这就是一个非常简单的应用。

我们自己研发了一套自回归路线做的低模生成,以前要几百万、几千万面的3D模型,现在生成出来只需要几千面,甚至几百面,在一些实时的渲染管线当中性能要求非常低,可以直接去被使用。同时拓扑结构与布线变得非常合理,这样能更好地做二次编辑。我们还做了万物的骨骼绑定,以前生成一个3D模型只是静态的,而现在的3D模型可交互,可以动,不只是人,猫、狗、龙、鸟、八爪鱼和蜘蛛都可以让它动起来,变得交互。目前全世界范围内,只有我们有这个能力和功能。

最终我们认为,原有一整套非常复杂的需要上百个人合作,需要做几个月才能做出来的3D内容,未来只需要用一个人做十分钟就可以做完。

我们也与网易的游戏美术中台深入合作,帮助网易游戏去节省创作的成本,并且缩短制作周期,让整个的3D内容生产流程变得更加低成本和简洁。我们不光可以在现有的3D游戏管线当中做降本增效,让整个内容变得更加便宜,让它变得更加快速地制作,同时还降低了创作的门槛。我们与网易的LOFTER社区进行合作,LOFTER社区有大量的OC和IP二创的玩家,在座的有不少自己也喜欢玩。在这里,他将自己设计的各种IP和OC,自己创作出来的一些角色可以直接地变成冰箱贴、钥匙扣和手办,无论打印出来还是变成赛博的手办放在那里,未来每个人都可以做属于自己的周边。

3D生成就降低了大众去创作的门槛,无论你是一个小学生,还是一个老年人,不管你有没有任何的专业知识,都不需要知道什么是拓扑结构,什么是PBR,你只需要一点点小创意,就可以拥有自己的一整套的IP和手办。

刚刚是偏实体,我们还在虚拟的世界与网易进一步合作,今年年初的时候网易推出了《燕云十六声》,那也是一个最新的3A级别的开放世界游戏,非常成功,我们在这里与网易合作做了一个新的功能是“万物太极”,可以直接地在一个世界中实现言出法随、心想事成,你走着走着遇到了一条河,过不去了可以生成桥,你可以爬过桥走过去,你可以改变地形,可以创作自己想要创作的房子,当然更多的人是拿来搞怪,生成非常阴森的海绵宝宝或是叮当猫去吓别人。

最近我们与网易一起在做的蛋仔派对的3D生成,有很多辛勤的工匠蛋们,大家在创作各种3D世界去供其他的蛋仔派对的玩家去玩,已经有超过5000万的工匠蛋在做这样的事情。其中很大的卡点是建模是非常高门槛的事情,怎样创作自由度很高,同时又低门槛,可以快速建模,这一直是很大的难题。这个月我们刚刚与蛋仔派对合作上线了一个新功能,可以用文字和图片去生成自己想要的建筑或是道具,或是一个角色,就可以将它放在蛋仔派对的世界内。

有很多用户已经开始将这个功能玩起来了,生成一些自己喜欢的角色,包括喜欢的一些道具,然后能快速地用文字和图片就直接来实现出来,创作出一个新的地图,供其他的玩家一起去玩。当然,这里边还可以制作各种关卡,一起去设计这些关卡,邀请别人来攻克和竞速,也可以搭建自己的小家,这都是自由度非常高的玩法。越来越多的新游戏的玩法和UGC交互,会成为未来主流的AIGC场景。

我们刚刚讲了很多实际落地的场景,其中大部分是我们与网易一起合作得到的场景,总结一下,最开始我们提到与网易的游戏美术中台去服务一些专业的用户,这些人原来就是专业的建模师,他们从八大美院毕业,有很多创意和美术制作经验,但他们必须得花很多时间在用手一点一点做模型上,很难展现去发挥自己完全的创意。有了AI 3D以后可以花更少的时间去一点一点地在模型布线和UV贴图上,可以有更多的时间去发挥自己的创意,去展现他们自己本身真正的审美,这是第一步,全世界人群也就是千万级别。

第二步,我们服务于一些ACG、OC圈,包括IP二创的有一点点美术专业能力的人群,他们本来是没有建模能力的,但有一定的美术设计能力,我们希望通过AI 3D的能力将他们本身平面的设计或是文字的想法直接3D法,无论直接3D打印出来一些手办,还是IP周边,还是将它变成一部动画甚至是游戏,都可以服务于这些业余的3D创作者。

当然,无论在《蛋仔派对》还是《燕云十六声》,我们去服务广大的所有创作爱好者,这些人可能完全没有所谓的创业能力,他们只是点子大王,他们知道在蛋仔派对当中怎样去做一个有趣的地图,怎样设计一个好玩的关卡,怎样让好友在这里竞速跑酷,这是我们去服务的数亿级的创作者,当然最终会出现一个平台去承载和分发大量的UGC内容,给我们的终端3D内容消费者,所以我们在这里大胆地预测,从文字的推特、微博,再到图片的小红书,再到视频的抖音、快手,Tiktok,我们认为3D未来有可能会出现一个属于自己的UGC内容平台,它就像微博、推特、小红书、抖音一样,你可以在这里零门槛、零成本,实时地去创造3D可交互内容,创作出来的内容可以让大众都去消费,都去玩,这件事我们见过它发生了一次又一次,都是从艺术,一开始是文学名著到视频好莱坞拍的电影,到出现了一个大众级别的创作工具,在3D的角度,就是A 3D大模型。

有了这样大众级别的创作工具,就有机会去降低用户创作的门槛和成本,让更多人参与到创作当中,刚才我们与网易的很多案例大家也看到了,能让更多人参与到创作当中,生产关系就会发生变化,我相信有一天未来每一个人都能成为超级创作者。

感谢大家的时间,谢谢!

来源:新浪财经

相关推荐