对话群核科技黄晓煌:拿着锤子找钉子的“杭州六小龙”,终于等来了“空间智能”的黎明

B站影视 电影资讯 2025-03-31 10:15 1

摘要:当我们在圣何塞见到黄晓煌,他刚刚从GTC会场赶来。在这场大会上,他和团队开源了新的空间智能模型SpatialLM,与黄仁勋见面握手,和合作伙伴开会,去大学招聘,还在自家展台上亲自接待各路人马。

硅星人(骆轶航、王兆洋)黄晓煌 群核科技联合创始人、董事长兼总裁

黄晓煌很忙。

当我们在圣何塞见到黄晓煌,他刚刚从GTC会场赶来。在这场大会上,他和团队开源了新的空间智能模型SpatialLM,与黄仁勋见面握手,和合作伙伴开会,去大学招聘,还在自家展台上亲自接待各路人马。

在群核科技因为“杭州六小龙”而爆火前,他基本很少露面。此前人们不知“群核”,只识“酷家乐”——全球最大空间设计平台公司。作为群核科技联合创始人和总裁的黄晓煌更像一个技术痴迷者,他在凌晨读论文,自己写代码复现,邀请硅谷的研究者加入群核的AI研究院,推着公司技术部门开源数据集和模型,与硅谷的诸多公司在AI上低调商业化合作,保持着与这里一线AI研究者的密切互动交流。

在创业的第14年,当他跟你聊天,你看到的好像还是多年前那个从英伟达离开的年轻人。

2010年,黄晓煌被英伟达点名拉进CUDA团队。不过他却只待了一年多的时间。当时行业对于GPU依然迟疑,但黄晓煌却认为黄仁勋对GPU的信仰仍然不够极致——他认为英伟达当时就应该把GPU做成云服务。

于是他选择回国创业。后来的故事,被大家熟悉的是以酷家乐为主角的那个版本。但另一条主线里,酷家乐背后的群核科技,一直在沿着黄晓煌最初创业的思路曲折前进——把GPU变成最通用的计算方式。

这种落差在群核科技因“杭州六小龙”而声名鹊起,开启港交所上市之路后被放大。一方面,前沿的“空间智能”成了这家公司的新标签,开源的SpatialLM大模型在最新的HuggingFace趋势榜上,很快被推到了第二的位置,仅次于“杭州六小龙”的另一家DeepSeek。另一方面,“家装公司”的旧标签仍会被一些人提起,但颜色正在褪去。

最近,我们有机会和黄晓煌在硅谷做了一次深度的交流,这也是了解这家公司前世今生的机会。

以下为对话实录:

小宇宙收听➡️

群核诞生:为了追求比黄仁勋更极致的GPU通用技术

“老黄在上面,用画笔画公司增长的第二曲线,‘S curve’,下面员工就喊:‘Stupid Curve’!(愚蠢曲线)”

硅星人:我们从“群核科技”这个名字说起,“群核”的英文名是“ManyCore”,顾名思义就是很多“核”,实际上就是很多个GPU,也就是GPU集群。今天GPU集群是什么大家都很清楚了。但是这个名字是不是今天起的,而是2011年起的——那一年你创立了这家公司。这个名字当时有什么来历?

黄晓煌:其实”many core” 是我在伊利诺伊大学香槟分校读博士学位时候的研究方向。这是英伟达(NVIDIA)当时提出的架构,多核的计算架构。当时英伟达主要是要跟英特尔竞争。英特尔当时的单核处理器遇到了瓶颈,那未来是走“多核”还是走这种”群核”的路线?英特尔提出的是“多核”,也就是“multi core”,而英伟达提出了“群核”,many core。名字好像差不多,但是实际上这两种的架构会差很多。

多核,就比如说你的电脑,单核、两核、四核,八核,大家都是这么过来的。八核。英特尔的那套其实是对旧体系的修修补补,但核真的多了就不管用了。你会发现你的笔记本电脑使用效率很低,即便是20核,你同时用两个软件已经不错了,一边听歌一边打字,对吧?英伟达当时就觉得这个方法不scalable(不可扩展)。如果解决这个问题,就是一个任务跑在所有核上,而且是几个GPU一起来完成一个任务。这就要改变它的计算模型。改变计算模型图形处理器(GPU)的计算模型其实是最合适的,所英伟达推出了群核GPU的概念。用一个CUDA架构,把一群核的处理器计算资源都给调动起来,而不是像英特尔那样修修补补的。

群核科技创始人合照,从左到右依次为朱皓、黄晓煌、 陈航

这个肯定是听起来是神奇,但它当时的难点在于:整个计算体系方法论都是英特尔定的,群核GPU,而且通过CUDA这么一个框架,等于重新建一个体系,这是很难的,但也很牛。

硅星人:确实挺牛的。所以多核是multi-cores。一个核运转一个任务,多核运转多个任务。群核是 many cores,其实是一个任务跑在多个核上,以实现性能和效率的最大化。在10多年前英伟达搞GPU群核的难点是,英特尔是当时计算行业话语的主导者,而英伟达当时是个小公司。所以CUDA 从一开始的角色,就是为了一个程序能够跑在多个处理器上,提供一套全新的架构算法?

黄晓煌:CUDA是一个编程框架。原来英特尔定义的编译器,没办法编译一个软件能够充分调用GPU的性能。所以英伟达要在这里突围。它就是要有一套新的编译器,编程语言能充分的调用GPU的所有的核一起提供计算,这是最难的,这个框架就是CUDA。过去的编程框架都是英特尔做的,他是绝对不会为英伟达做优化的,只会为自己的芯片做优化,然后上面还搭了一层东西。当时要推一个新的编程框架非常困难,CUDA就是这个很难推广的框架。

硅星人:你看,今天的芯片算力提供者挑战CUDA架构有多难,当年英伟达用CUDA挑战英特尔就有多难。前两天英伟达GTC,我看英特尔刚刚退休的 CEO 基辛格(Pat Gelsinger)也来了,还是挺感慨。因为当年英特尔的“多核”战略,就是他当在那会儿当英特尔CTO的时候做的,但基辛格本人是有过GPU的想法的。只不过现在GPU和CUDA架构成了计算的主流。

黄晓煌:嗨,理论上当时英特尔要做英伟达这套群核的东西,完全是可以的。就是那个Pat(指的是英特尔当时的CTO,2021年到2025年初担任CEO的帕特 基辛格)要是不被英特尔董事会给弄走的话,专注做群核,这就是英特尔的未来。但是英特尔公司大,战线很长,内部搞来搞去的。我记得当时那个Pat搞了一个叫什么Larrabee的GPU芯片。当时在英伟达我觉得天都快塌下来了,这个我们怎么搞?但是没想到后面英特尔自宫了一把啊。

硅星人:自宫了,前任CEO 欧德宁(Paul Otellini)退休了,不让Pat 做 CEO,提拔了一个搞芯片制造的CEO,Pat 就走了去VMware 做CEO了。所以2021年,Pat回英特尔做CEO,你看他又把GPU优先捡起来了。

黄晓煌:对啊,但是来不及了。那时候已经错过了最佳时期了。他肯定也有董事会的压力。你会觉得英特尔的董事会没有一个懂技术的。你想想,10多年前,你会觉得非移动的芯片有用吗?那个年代肯定是all in mobile 啊,谁在乎GPU 啊?

硅星人:英特尔那会儿内部占上风的X86架构的移动芯片,但资本市场的反馈不错。我问过当时英特尔的CEO 欧德宁,你们接下来最大的不确定性和挑战是什么?他说是华尔街的预期,因为当时英特尔股价很好。华尔街永远期待它能拿出符合他们预期的更好的东西。结果前两天老黄(英伟达创始人兼CEO 黄仁勋)在GTC演讲的时候也抱怨这一点,说无论现在英伟达推出什么,都不太容易满足资本市场预期。我就很感慨。

黄晓煌:其实我们做企业的也有这种感慨。资本市场的耐心就是:一天就是早晨起来股市跌了,他们就恨不得把你祖宗十八代都骂一句。创业者可能在一级市场里还好一些。二级市场投资人就非常短视的。这个对于一个做底层创新,或者做大事儿的CEO是很难的,除非你自己是创始人,反正别人不能拿你怎么样,那扛得住。绝大部分后面就像英特尔这样的职业经理人了,人家看你不爽就可以把你fire掉。所以这种职业经理人你在华尔街的压力下,你什么都做不了。

但当初英伟达就还好,创始人自己就是CEO。我记得我在英伟达工作的时候,不光华尔街骂英伟达,我们听老黄开季度的all hands meeting(全体员工会)。老黄在上面,用画笔画公司增长的第二曲线,“S curve”,下面员工就喊:“Stupid Curve“!(愚蠢曲线)。当时很多人都觉得“Nvidia is like a stupid”,我当时作为小白,我也觉得我在的这公司,市场也就这么大。

“我当时我就没想明白英伟达干嘛不去做云计算啊?”

硅星人:但当时你在UIUC(伊利诺伊大学香槟分校)读博士学位,拿的还是英伟达的奖学金,这是什么原因?是因为给的钱多么?

黄晓煌:其实是因为我当时找的导师正好跟英伟达在合作。英伟达总共给了100万美金,所以也是阴错阳差。反正我当时作为中国学生能上到UIUC这种名校,计算机全美前五。我本来就是读这个的,那有这个奖学金也挺好的。2007年,研究CUDA的算法和框架,这是个新东西,我也没觉得有什么问题。

硅星人:当时有人用CUDA开发吗?

黄晓煌:很少。所以说英伟达为什么要赞助学生来写框架?就是学生再不用的话,那就真没人用了!所以就让我们写用CUDA的论文,因为我们发论文,都提到了CUDA。就是先得把学术界给拱起来,大概是这么一个路径。我读到第三年的时候发现,只要你用CUDA改写一下C++,就能发篇论文。这就成了你当时发论文的一个捷径,因为新。

硅星人:其实是“水”论文的一个捷径,但你读到第三年,直接拿了个硕士学位。就放弃拿博士学位了。

黄晓煌:我就去了英伟达。我先是在英伟达的实习,后来他们要我去,那会儿团队的人也很少,应届生我估计都不太愿意去,招不到人。因为我拿了他们的奖学金,拿人钱财,他们直接就给我导师发信:说很需要我去英伟达,那就去干一两年呗,不想干了再回去读书呗。我两年就拿到硕士学位了,然后博士学位项目 gap了 一年,可以回去。但是超过一年没回去,那就算了。

硅星人:所以你在英伟达其实全职了多久?就是你也在台下觉得当时英伟达的增长曲线是stupid curve的时候?

黄晓煌:全职工作一年多。

硅星人:然后你就选择我就创业了?当时其实你有两个分叉,一个是回学校继续读博,一个就是回中国创业。对,然后你选择了博士学位回国创业。为什么?那个时候回去的人确实很多倒是。

黄晓煌:怎么说呢?当你工作过,你真的很难再静下心来回忆学术界。其实我在学校里干的事情跟工作的时候干的事情差不多,都是开发框架,发论文。学校其实还不如工作的时候,工作的时候各种GPU和设备都随便用,学校里面很紧缺,而且工资还高。那不如留在英伟达继续干。

硅星人:其实也是在英伟达进行学术生涯的延续,但是有了更多的资源和钱。

黄晓煌:对,只不过没那个学位。

硅星人:可是如果是今天你第一次做AI创业,在中国,硕士学位可能就不够。有的VC是拿着学校和学位去看该投多少钱的。

黄晓煌:是有可能的,当时是够的。如果你要自己创业,你管那个学位干嘛?VC看这个纯看学位的啥都不懂,学问你不会看吗?那还要他VC干嘛?

硅星人:我们还是说回来你创业的事儿吧,2011年,你创办了群核,这个名字来自英伟达当时提出来的未来计算架构方向。你在英伟达的实习和工作经历,以及你在那里学到的东西,还是非常影响你创业最初始的一些想法的。

黄晓煌:是的,我当时工作的时候,对Jensen(黄仁勋)他这个愿景,也就是把GPU用来做通用计算的愿景,我是非常buy in的。我本身在研究这个方向,我觉得毫无疑问这就是未来。但是我当时我就没想明白英伟达干嘛不去做云计算啊?天天做那个移动,我觉得不太现实,我觉得做就应该去做云计算。

我当时跟我的manager聊过,你不是愿景就是要做这种超算么?我就不太认可这种在本地做高性能计算。所以我创业就做服务器,做云,然后我发现做到服务器芯片老烧,我才知道不好。英伟达不做不是因为它不愿意做,而是GPU这个东西那个年代,放在服务器就是跑不起来,温度110摄氏度,我多放几张卡,温度就是几百度,超过几分钟就烧了。

硅星人:所以当时的问题是,GPU这玩意儿放在云上才能实现高性能计算,但是老烧。

黄晓煌:当时的GPU工艺没办法跑在云上。我其实创业前两年我也很痛苦,我要做GPU上云,结果我的卡全都烧了。我们当时还专门写了一个算法来测温度,我记得是直到2014年,英伟达买了一家公司,推出了一个动态调频技术,解决了温度过高的问题。我原来的做法效率很低,你得把它停下来,然后让它降温,利用率就大幅下降。英伟达后来的做法就是温度过高,那把主频降下来,然后就保持着一定的温度,后面的技术越来越好了。所以你看,英伟达的股票也是那之后开始大涨的,它解决了GPU上云的关键。

当GPU遇上酷家乐:拿着GPU锤子找到了赚钱的钉子

“我们用GPU做家装实景渲染,上台演示,东西都没做出来,上台讲概念,demo了一下产品原型,下面那一堆人刷卡买。”

硅星人:所以你头两三年,基本就是在跟技术瓶颈天人交战。

黄晓煌:对,以前做纯软件的时候,都没意识到这个问题。服务器什么都是你们自己搭好了。然后烧了反正有人换卡。虽然我自己也没解决问题,但英伟达解决了对吧?

硅星人:这个技术瓶颈不是你解决的。所以我很好奇创业前两年,投资人怎么看你?先不说后来酷家乐的家装业务,它火之后融资不成问题。你们最早期的时候,投资人看的是什么?你最早是线性资本的王淮Harry 投的,他是硅谷回来的人,他为什么投你?

黄晓煌:我原来在硅谷就跟他认识,一起做浙大硅谷校友会的volunteer(志愿者)。我们一开始融资还挺折腾的。最早拿了一个硅谷的term sheet,我然后上飞机回国前一天,被毁约了。后来我碰见Harry,他说你出来创业了。我说你要不投我?他说他当时跟着一个大佬一起做基金。投不投最终要那个大佬拍板。

硅星人:可是Harry后来也用线性的基金跟投了。

黄晓煌:那是后面的事情,IDG投的时候跟投了。

硅星人:当初你啥商业模式也没有,就是有GPU集群,然后又要做GPU上云。2009年亚马逊才开始做云业务,2013年进的中国。你那会儿做云,大家也不会把GPU跟云联系起来,非常不被讨论的一个方向。然后你就开始拿着GPU集群的锤子,去找商业模式的钉子了。然后很幸运地找到了“酷家乐”这颗钉子。可是为什么就酷家乐这颗钉子,最后被GPU的锤子给钉在墙里边去了?

黄晓煌:当时找了各种各样方向。有的方向压根就找不到任何的用户,有的方向有用户,但他们都想白嫖,比如说用GPU做影视后期处理对吧?那就是做项目尾款给的很慢,这个我们不需要取。这都是很困难的,找应用场景很困难。做酷家乐是碰到运气比较好,赶上中国房地产爆发。我们用GPU做家装实景渲染,上台演示,东西都没做出来,上台讲概念,demo了一下产品原型,下面那一堆人刷卡买。

硅星人:都是家装设计公司现场刷卡?

黄晓煌:对,其实它们根本就不想用,它们就是想买了,给消费者搂一眼,帮助拉客,就是因为觉得效果很炫酷。3D然后十秒钟生成,整个家装效果很炫酷。但家装公司他们自己其实不用,反正就觉得东西挺好,5万块,很便宜。

硅星人:买回去玩呗,可它们能刷多少个5万呢?

黄晓煌:挺多,搞一次活动,刷了一百多万。2011年底,我把东西收好,把东西寄回国,把公司注册好,就到春节了。然后2012年在融资,融资也不太顺利。见了30多个投资人,没有一个愿意投的。一开始我们拿自己的钱,2012年基本用自己的钱。王淮那笔钱是2012年底给的,demo 是2013年做出来的。

硅星人:然后英伟达动态调频解决GPU上云的规模化问题也解决了。我能感受到一个明显的落差。就是你GPU做通用计算,以及GPU上云,哪怕是硅谷大厂当时也是刚刚做。你自己按照这个愿景做,发现到处都碰钉子。投资人也好像不太懂你说这的这些技术。然后然后你去找客户,发现哪怕第一波客户也不是因为你的技术愿景买单的,但它们确实给了你实打实的第一波收入。这创业的前三年你犹豫过么?

黄晓煌:创业的前三年。其实我心态变化很大。我离职创业的时候还有点傲气,觉得英伟达这个管理层太弱了。我都看得出来GPU得上云,你怎么就不懂呢?我跟manager说了,他不愿意做。那我创业,然后创业过程中在现实面前一遍一遍被毒打。然后我发现,英伟达肯定(GPU上云)是有规划的,只是我不懂而已。原来Jensen每个季度all-hands,讲华尔街的压力,second curve什么的,我还不太理解讲这个东西干嘛呢?下面还在起哄“stupid curve”什么的。后面你自己创业,发现GPU的概念那个年代根本没人认可,投资人不会投你的。

王淮投我那是因为纯粹是朋友,我后面融资是编了另外一个故事,就是IDG投的时候。当时美国的Houzz正好很火,它是美国当时最有名的一个家装平台,其实是家装图片社区,但它的图片都是靠人去拍的。然后我们就编了一个段子:Houzz 不是要靠人去拍照片吗?我不用人拍,我就用GPU渲染。我就跟投资人你说别管我们用什么方法,反正就是我不用能拍,我也能做出这个家装社区来。这个故事很快就融到A轮B轮,都是这么讲的。

“其实对我来说,家装我也从来不关心行业本身,只不过你把技术用在什么行业而已。反正我做我的事儿。”

硅星人:我第一次听说酷家乐是在2015年,也是你们的投资人赫斯特资本(赫斯特是一个出版集团)的人讲的。

黄晓煌:对,它(赫斯特)当时有一个家具的杂志。我说我这个都不用拍照。美国人工贵,我这个不用拍照就有效果啊,他们觉得太好了。但如果你讲的故事是GPU集群什么的,直接给你一巴掌就让你走了。跟他们讲GPU,多半都不知道是啥玩意儿,贼费劲了,知道了绝对不会投。就跟他们讲个这是自动版的Houzz,不用拍照版的Houzz。

硅星人:2011年到2014年,不是所有人融钱都困难。那个阶段做LBS(基于地理位置服务)还有O2O(线上到线下服务)的都能融到钱。

黄晓煌:我这个也没有 to O (指做线下),就是一个社区。融来那些钱,弄了几个产品经理,你们去做社区。我其实还是在研究GPU。

硅星人:反正我觉得国内那会儿能融到钱的一个是本土特别接地气的创业者,另一种是硅谷回去带着光环,但一下子就能把地气接上的那种。但你好像都不是,你某种意义上是科学家,是工程架构师,是研究驱动的创业者,这在当时是不吃香的,基本融不到钱。那酷家乐起来之后,C轮D轮的投资人是不是开始相信GPU的故事了?

黄晓煌:那会儿酷家乐第一轮的增长已经飞起来了,看的是酷家乐数据。C轮开始就是internal round,我们不讲是内部股东逼的,反正那会儿的增长非常快了,基本上融的钱都不够做流动资金了。就当时也赚钱的其实也挺多的。

硅星人:那你觉得那几年酷家乐能涨得快的原因是?

黄晓煌:我以前分析得很多,其实我们做的事儿也不稀缺,其实就是房地产泡沫带来的一个巨大的跃进。

硅星人:时代红利,房地产多了,房价高了,装修也跟着多了。

黄晓煌:对,当然也跟我们产品做有关系,因为那时候竞争是很激烈的。非常多做类似产品的公司,我们其实是只是其中一家。我们产品力是做的最好的。很明显那个渲染得效果速度。但是那个时候如果效果差一点,但公关的能力强,都能活着。后面整个市场下行之后,我们的数据是最好的。用了我们的都会继续用。其他的很多就不行,房地产市场掉下来之后就挂掉了。

硅星人:等于酷家乐就是科研人员用GPU上云的架构和算法,创业搞了家装。这跟用人工智能和机器学习搞量化收割股民,其实挺像的啊。

黄晓煌:没有,我当时跟合伙人是分工的,社区和网站什么都他在搞,我还是带着团队在GPU渲染什么的。GPU 渲染其实跟Diffusion Models是一脉相承。

硅星人:陈航那边更多在搞业务。

黄晓煌:对,他在搞那个业务,我就还在搞技术。其实对我来说,家装我也从来不关心那个行业本身,只不过你把技术用在什么行业而已。对吧?。

硅星人:一开始不好融钱,后来用中国版自动生成3D渲染版的Houzz这个概念,再后来酷家乐的数据很好,这些事儿对你本身究竟是个什么样的创业者,其实啥影响都没有?

黄晓煌:反正我做我的事儿。

硅星人:那到了现在,我们开始押注空间智能(Spatial Intelligence),黄仁勋说这个是物理世界的AI(Physical AI)。它需要物理世界的强大的数据集和基于物理世界规律的基座模型。但是反过来去想,如果当时没有选家装这个带到,我们能不能在2018年就公布InteriorNet 这个物理世界的数据集?今天能不能有这么真实的物理世界的镜像数据?如果当时没有酷家乐,今天有没有可能也能走到空间智能这一步?

黄晓煌:这个也没法假设的。英伟达的方法论,也是拿着锤子找的钉子做出的CUDA。然后天天再看,这个核磁共振能不能用扩大加速一下,渲染能不能加速一下,都在找这种应用。其实家装这个行业在2017年底到2018年已经爆掉了,已经不增长了。我们3D渲染加速的第二波增长其实靠的是这个工业软件,就是“全屋定制”。它是做工业化的装修。我们2017年到2018年开始做全屋定制工业软件,因为家装行业当时已经有问题了。我们用全屋定制的工业软件把增长的接力棒给接上了之后,这基本上是我们后来做空间智能的基础了。

硅星人:因为全屋定制掌握了一个更复杂的广阔的场景里的数据。

黄晓煌:做家装效果不需要物理正确,效果正确就行了。全屋定制需要的是物理正确。家装就是一个渲染软件,效果看起来行就可以了。你做工业软件,每一个细节都得对,这个时候是给空间智能奠定了一些基础。

大量物理正确的3D数据和空间认知数据提供仿真支持

硅星人:我一直以为“全屋定制”是建材行业的和搞商业楼宇的人搞出来的概念。

黄晓煌:是他们搞出来的,最终实现就是我们的实现。

硅星人:因为全屋定制需要物理真实和物理正确。那我们往前回溯一下,在酷家乐业务的井喷期,你在公司里面组建了一个实验室吧?

黄晓煌:2015年建的实验室,主要做渲染的。

硅星人:你们后来刚开始做物理正确的全屋定制,基本在同时也就是2018年,你们推出了一个3D的物理场景数据集,叫InteriorNet,这个名字是故意学李飞飞搞的ImageNet么?

黄晓煌:那就是啊。

硅星人:你在UIUC读博的时候,正好ImageNet正在办视觉识别的竞赛。

黄晓煌:对,因为李飞飞当时就在UIUC当教授,她组织的比赛,线上的,我就玩了一下,就是没获奖。

硅星人:AlexNet 的框架就是这个比赛里出来的,总之你们InteriorNet名字对ImageNet致敬了一下。

黄晓煌:山寨了一下(笑)。天天在干装修,不如再干点有意思的事情。那一年因为正好是国内“装修贷”爆掉了,各种装修公司都不太行。加上房地产泡沫,我们前十的装修客户倒了9家。 我当时就在想:这个全都倒闭了,我们怎么办呢?这时候就面临着转型问题。转型的一个试点是往计算机视觉的AI转,还不是大模型,而是小模型。另一个就是全屋定制的工业软件转,好几个方向都在尝试。InteriorNet发出来学术界有了一些水花,但业务当时是全屋定制做的比较好,很快收入就挑起了大梁。

硅星人:当时全屋定制工业软件能不能完全弥补家装丢掉的收入?

黄晓煌:那肯定,又带给我们带来了一波新的增长。

硅星人:这个增长一直到哪年?

黄晓煌:到疫情差不多,增长到了商业地产爆掉,到2021年底。从2018年到2021年,全屋定制从零占到公司50%多的收入。

硅星人:这会儿你们的故事是啥?工业4.0?

黄晓煌:工业软件后面其实跑的是数字孪生。

硅星人:这事儿就很有意思,这两天黄仁勋在GTC 上发布了英伟达Omiverse,他讲的就是数字孪生用于工业制造。

黄晓煌:对。反正英伟达的方法论,就是不断地拿着锤子找钉子。你用GPU集群,随着算力的不断提升,能做的事儿也是在不断的变化。从最早只能做渲染,再把GPU的AI计算,就是小模型的计算用在工业领域,都是一步一步的发展。英伟达很多时候都是不断地忽悠或者怂恿客户,说我们觉得这些领域可行,也是一个摸索的过程。就像我们当时做家装的idea,就是来自第一届的GTC老黄的keynote demo(开场演讲演示)了。他说我这个GPU能干这个,把128颗显卡连了起来,跑了一个demo,就是实时的家装渲染。

“黄仁勋keynote讲的东西都是很前沿的。说白了,他说的东西,你要今年就做出来卖,那你就死定了。”

硅星人:拿着锤子找着钉子了,老黄给的这颗钉子。你想如果是今天的老黄给了这么一个方向,国内恨不得马上有50个团队出来做。

黄晓煌:我们当时这个方向都上百个团队在做。这个idea是简单的,但是你要把它做极致。你们可能有细节问题解决清楚,能够真正被人用起来,这个是真正挑战的。

硅星人:也挺有意思。你们创业有点像是跟老黄的平行时空,与英伟达在一开始交错了之后,其实就一直在纠缠在一起。

黄晓煌:因为每年我都看他的keynote,他keynote讲的东西都是很前沿的。说白了,他说的东西,你要今年就做出来卖,那你就死定了。

硅星人:英伟达的那套方法论,你比较熟悉,就是他拿锤子找钉子。但其实本质是因为你有锤子,这个锤子是足够通用,坚持GPU通用计算。你一直坚持到现在。。

黄晓煌:这个其实也不叫坚持,别的你也不会,你有什么办法呢?这个有一定的运气成分。说白了,这个过程里,如果英特尔的几个创始人还年轻气盛,那肯定是他们都要弄一个小团队干干,绝对不会像现在这样。这里面有各种因缘巧合。英伟达正好碰上了一个老去的竞争对手,所以它就胜出了。

硅星人:其实英伟达作为一家公司也不年轻了,32年了。昨天在见媒体的时候,黄仁勋说自己是全世界唯一一个做了这么长时间CEO的人,直到现在。

黄晓煌:这个很关键,太重要了。要是没有这个因素,我觉得英伟达活不到到现在。

硅星人:英伟达抓住了GPU释放价值所有的环节。英伟达用GPU在工业智能上做了一些事情。但它在人工智能这一波被广泛应用之前的场景,一个是“挖矿“,一个是游戏。然后如果没有这个大的银行用场景,其实,它后边在人工智能这块的作用,可能也没法这么最大化。

黄晓煌:对,它如果不是挖矿赚到钱的话,后面的技术问题也解决不了。

硅星人:有钱很重要。梁老板(DeepSeek创始人梁文锋)有钱,所以他能够做技术理想主义者。

空间智能第一股背后:和字节们抢人,和股东们博弈,“六小龙”之后一切豁然开朗

“(ChatGPT出来后)我其实就焦虑了,那段时间就天天闭关,在那儿看论文,自己做测试这些开源代码。这种焦虑感到了2023年底才消失。”

硅星人:2022年11月30日是这个世界的一个分水岭——通用人工智能的应用被推到了世界面前。那个时候你在做什么?

黄晓煌:我其实2021年就组建了一个前沿技术研究院。我刚才说看到Diffusion Model的论文发出来了,我当时就挖了一个教授回来带前沿技术研究院,就在做这个SpatialLM(空间大模型)的大模型。

SpatialLM 基于视频重建的3D结构化场景

本来想,这玩意儿没有个五年,做不出什么能用的东西出来,然后就组了一个团队,慢腾腾的地做。我记得我们负责人回来说,给他多搞点GPU呗,我说GPU都被挖矿的搞走了,你要不就别搭那么大的机器了,省点钱。后面我靠2022年怎么一下子就这么火。

我后面也反思:我看到了这个趋势,但是没看到它能发展得这么快。但是也没问题,大家都预测不了。ChatGPT刚出来的时候我有点手忙脚乱,因为我觉得这东西三五年才能够可用,怎么才一年就这样子了?感觉这个世界变化了,简直匪夷所思的。后面我其实就焦虑了,我自己那段时间就天天闭关,在那儿看论文,自己做测试这些开源代码什么的。这种焦虑感到了2023年底才消失。

硅星人:为什么2023年底焦虑感就消失了呢?Sora 也是 2024年才出来的啊?

黄晓煌:那会儿开始,不会每天有都新的东西出来。但2022年底那段时间,每周都有新的各种东西出来,你发现你看代码和看论文都来不及,什么都做不了,就光焦虑。

硅星人:那你们锁定空间智能模型的思路也是2023年底那时候成型的?

黄晓煌:对,因为我们也不想去做什么大语言模型,我就没有梁文峰那个勇气。这不是我本身没勇气,我还是偏做图像3D相关的,语言我也没什么兴趣,我就直接pass了,然后跟Diffusion Model,跟三维相关这些模型,我就一直在研究,这是我们的重点。

这时候就是买卡和找人,但问题是招不到人,你这公司名不见经传的,而做这种行业的都要最顶尖的人。

“跟字节在抢人,我说我们公司好啊,你来做大模型,对方看了一眼:我来干嘛?让我当CTO啊?”

硅星人:你们是有名气的,但名气不在AI模型这个领域。

黄晓煌:对啊,人家一看,一个家装公司,我做AI的人去那儿干嘛?这些人选择有很多,你比如说清华或者北大最顶尖的那些学生哪儿都能去,你钱又给不了多少。为什么来你这里?招人非常困难,所以就进度很慢。最近就好多了。现在简历很多,都是非常特别优秀的人。

硅星人:所以招人困难的这个状况是基本上到了这俩月才解决的吗?是有了“杭州六小龙”这个说法之后才解决的吗?

黄晓煌:你说的是(笑)。

硅星人:这么惨啊。所以你们是跟谁抢人?是跟生数科技和爱诗科技它们抢人吗?

黄晓煌:不是,都是跟字节这种的在抢人,人家要去北京上海,干嘛来你杭州啊?甚至我面了一个清华刚毕业的大学生,我说我们公司好啊,你来咱们公司做这个大模型。他看了一眼:我来干嘛?让我当CTO啊?。

硅星人:清华的博士吗?

黄晓煌:不是,本科生。

硅星人:那Sora 和别的视频模型出来。对你们也没有什么特别直接的影响?

黄晓煌:你肯定着急。但是我们原来的团队就是做这种行业里的应用,招了大量有行业经验的人,技术本身不是顶级的。

硅星人:行业技术跟通用前沿技术两个路径不同。

黄晓煌:对,然后公司2000人,你要换血怎么弄?这换不了,你的薪酬体系都摆在这里,行业经验越多工资越高。然后突然你一个清华毕业的顶级人,小年轻,你拿的是人家15年工作经验的人的工资,那公司里边就炸了。后来我面临的就是这个问题,你要换血换方向,要从传统的赛道切换到AI赛道,技术上、方向上都想的很清楚,还要把人搞进来。

“我不是特别想做那种看起来有门槛,但只是针对菜鸡有门槛,巨头能把你灭了的事儿,这就算了。”

硅星人:我们再多讲讲空间智能。你说过,群核在做的是物理世界的模拟器。把物理世界做成一个数字镜像,你讲过这里面的一个最核心的东西,就是“是物理正确”。我们应该怎么去理解“物理正确”的门槛?物理正确的门槛是不是只有群核有?

黄晓煌:“物理正确”我本身觉得没有什么门槛,但你要做成一个ecosystem(生态系统),这个是有门槛的。说白了,大家的体系都不太一样。或者这么说,你的体系里是米为单位的,它的体系里是mile为单位的。所以你要做成行业标准,但它真正有门槛的地方在于数据,还有模型,以及你的相关的工具的矩阵。这些会形成网络效应。

硅星人:你们手里应该是有全世界最丰富的物理世界数据,复杂的物理世界数据。我看最近Google发的论文,也提到用了你们的物理世界数据,因为它数据上可能是有门槛的。

黄晓煌:是有门槛,但在模型训练上,我们现在都是跟世界最一流的公司在合作,你要说门槛,对他们来说没什么门槛。要说对于一般的公司来说,肯定有门槛。就看你怎么定义。我们公司的创业理念是:你要么就做一个行业老大,不管它市场大小,起码能守得住。我不是特别想做那种看起来有门槛,但只是针对菜鸡有门槛,巨头能把你灭了的事儿,这就算了。所以模型训练这部分我们我们自己会做,但我们从来不会把这个作为一个核心。核心还是空间智能的数据和工具链。

硅星人:工具链通过开源打造?

黄晓煌:开源的部分我也想通了,这东西可能就大佬巨头投很多钱能做出来。那我就觉得没有必要,其他公司反正也没有这么多资源来做这个东西,那我反正就开源了。反正就是大家在这基础上做,相当于起步高一些,可能还有合作机会。不然你第一步就把大家劝退了,以后就没得玩了。

硅星人:群核最近发布的SpatialLM 模型,还有SpatialVerse 空间智能平台,把它们开源出来,跟一些世界顶级的公司在一起搞空间智能训练。基于群核的数据集和模型。这个过程中接入了很多国内的机器人公司,都跟群核合作训练模型,名字有可以说的吗?

黄晓煌:招股书上写了智元,其实基本都合作了。很多他们愿意说的我们就说。

“六小龙之后,听不到这样的PUA了。”

硅星人:家装给你们创造了第一波非常丰厚的现金流,后来工业软件的现金流盖过了家装。那接下来空间智能的模型和数据集,能不能创造像之前这两波业务这样的现金流?

黄晓煌:我觉得长期肯定可以。

硅星人:多长?

黄晓煌:多长我不知道。但如果看到短期一年两年的赚很多钱,那除了去抢银行对吧?没有这么确定性的东西。我觉得创业做到目前阶段,我也看了创业路上无数的同行的人,就是到了一定阶段还其实挺看运气的。包括我自己,经历了房地产崩盘的这一步,我复盘了很多次,我都复盘不出来会崩成这个样子。但是我有一个心得:这些赛道都有风险,但是做自己感兴趣的。房地产这个赛道,我原来做的时候确实我自己没什么太大的兴趣,但是我知道我能做好,但我不必去做。可是一旦市场崩了之后,我突然觉得为什么我不能提早发现这个房地产市场会崩?要会知道崩,我绝对不做。但是机器人这个赛道……

硅星人:崩了你也不后悔。

黄晓煌:对,你也不后悔,就是崩就崩了,不后悔,只在乎曾经拥有。

硅星人:机器人这个赛道且崩不了呢。

黄晓煌:所以机器人这个赛道我们本来2017、18年就开始做了,一直坚持到现在,投资人天天逼着我们把这个业务砍了。耗算力,天天逼着我们砍。

硅星人:对,你们SpatialVerse(空间智能平台)是就是那个时候出来的。

黄晓煌:确实是。感兴趣的我就做呗,那会儿确实是内部砍了很多项目,就这个没被砍。投资人在PUA我们说机器人估值低,赶紧砍。

硅星人:那你是从什么时候开始听不到这样的PUA的?

黄晓煌:“六小龙”出来之后,六小龙之前还刚被投资人骂了个狗血。

硅星人:等于你从牛夫人变成小甜甜,就是一个春节的事儿。可去年10月和11月的时候机器人融资很热啊。

黄晓煌: 就不看好机器人赛道,你为什么要做这个呢?

硅星人:空间智能、物理AI 和世界模型,几个词经常被混用,我很兴趣未来我们面对新一类的投资人,无论是一级市场还是二级市场的,我们该怎么去向他们讲什么是空间智能?李飞飞在一个场合给克林顿解释什么是空间智能,她也没讲清楚。如果是你给类似克林顿这样角色的人讲,你该怎么解释?

黄晓煌:学术界是大概有明确定义的,确实很抽象。对但我觉得对大众讲,就是给机器人和智能设备用的AI,你可以这么解释,当然这是比较科普式的,给机器人和智能设备用的AI。

硅星人:给机器人和智能设备用的DeepSeek。

黄晓煌:对你可以这么讲,它内部也会有一个大语言模型,做常识性的判断。这个语言模型是用来理解意图的。物理世界主要就是给设备用的AI。这么弄就比较好理解。

硅星人:最后一个问题,中国和美国做空间智能,谁更能出成果?

黄晓煌:我觉得空间智能本身是跟数字世界的桥梁。物理世界肯定中国牛X,数字世界就美国目前肯定还是牛X一些,综合起来谁更牛X还不知道,得看各方面因素。

硅星人:是不是因为我们今天在硅谷,你才这么讲。

黄晓煌:在中国也会这么讲。这是一个事实。因为一个DeepSeek出来,中国就什么全方位超越美国,这不现实。很多新的模型还是美国这边发的。硅谷这边肯定是学术科研更厉害,中国更多是工程效率。所以我觉得既然空间智能是两者之间的桥梁,肯定是希望中美之间好好过,对吧?大家吵个架,还是坐下来一起过。那你要征服得话,那谁输谁赢,这确实是一个未知数。对,就一边擅长硬件,一边擅长软件,这不好说。

点个“爱心”,再走吧

来源:硅星人

相关推荐