摘要:此前会上,黄仁勋发布了英伟达最新的AI硬件和软件套件,包括即将推出的GB300系统、桌面级DGX Spark AI工作站,以及一项强大的新互连技术NVLink Fusion,该技术现已向其他芯片制造商开放。
近期,Computex 2025 主题演讲结束时,美国播客Stratechery与英伟达首席执行官黄仁勋进行面对面交流。
此前会上,黄仁勋发布了英伟达最新的AI硬件和软件套件,包括即将推出的GB300系统、桌面级DGX Spark AI工作站,以及一项强大的新互连技术NVLink Fusion,该技术现已向其他芯片制造商开放。
在硬件方面,搭载RTX 5060 GPU的全新MSI笔记本电脑最快将于5月上市。而对于市场最为关注GB超级芯片(Grace Blackwell Ultra Superchip),黄仁勋说该芯片已全面投入生产,并于2月开始交付。此外,英伟达将于今年第三季度推出GB300硬件系统。据他介绍,GB300配备了升级版Blackwell芯片,其推理性能提升了1.5倍,HBM内存容量增加了1.5倍,网络连接能力翻倍,整体性能都得到加强。
此外,英伟达宣布推出NV Link Fusion,该技术将帮助构建人工智能基础设施,而不仅仅是单一、特定的超级芯片。据介绍,它将能够整合所有公司的定制CPU和需求,“直接融入生态系统”,从而整合英伟达GPU。客户可以选择将自己的CPU与英伟达的AI芯片一起使用,或者将英伟达的CPU与其他供应商的AI加速器一起使用。
此外,他还在演讲中对DeepSeek表示赞赏。他认为,DeepSeek-R1对人们理解AI和推理有巨大的影响,对行业和世界作出了巨大贡献。
黄仁勋试图让世界了解GPU计算的潜力。如今,随着这种潜力逐渐显现,黄仁勋和英伟达在继续推动计算技术发展的同时,也面临着一系列全新的问题。
本次采访首先探讨了一些新挑战:我们讨论了上周与沙特阿拉伯和阿联酋达成的协议、美国对华 H2O销售禁令,以及美国的芯片管控方式为何会危及美国(以及英伟达)的长期控制权。黄仁勋还阐述了人工智能将在不久的将来推动 GDP 增长,甚至可能减少贸易逆差的原因。
主持人:Jensen Huang,欢迎回到 Stratechery
黄仁勋(JH):很高兴见到你,本。
主持人:很高兴能与您见面,我们之前的谈话都是通过Zoom进行的,您刚刚宣布将在我家附近建造一座新大楼,这令人兴奋。之前我们交谈时,我感觉您想让全世界了解GPU的未来。我们最初开始交谈时,恰逢ChatGPT(ChatGPT,一种通用计算技术)问世之前,而现在,当您宣布业绩时,整个市场都岌岌可危。现在,我认为我们正处于一个平静期,我不是在问业绩,而是被推到那个位置,被推到世界中心,感觉如何?
JH:嗯,你问了我一个我现在无法给出有趣答案的问题。答案是,我对此没有任何感觉,但我确实意识到了这一点:我们正在重塑英伟达,这始终是我们办公室工作的核心。我们正努力重塑英伟达,以便能够领先一步,引领行业发展方向,并致力于解决难题,为行业做出贡献。但如今,非常重要的是,我们不仅创建了一个计算平台,还重塑了我们的公司,我们更像是一家数据中心规模的公司,我们提供的技术首次实现了完全集成,可以协同工作,但又进行了拆分,以便整个生态系统能够协同工作。
但我在主题演讲中提到的非常重要的一点是,我们第一次制造计算机,不仅仅是为了科技行业,而是为了一个叫做人工智能的新行业。人工智能一部分是技术,一部分也是劳动力,而且正如我们所知,它能够增强劳动力。随着我们进入机器人领域,这一点将会非常非常清晰。这项叫做人工智能的新技术实际上是一个全新的行业,整个行业将由工厂驱动,而工厂将需要大量的计算机。人们正在逐渐接受这样一个事实:我们即将进入一个由计算驱动的未来,人们称之为数据中心,但实际上它们是人工智能工厂,规模可能会非常大。
主持人:我注意到你提到萨蒂亚·纳德拉在微软财报电话会议上报告了他们处理的代币数量,我记得那是上个季度。这是你本季度最喜欢的财报数据吗?我马上就注意到了,这是一个非常棒的指标。
JH:实际上,实际生成的代币数量远比这个数字高得多。这还只是微软为第三方生成的部分,但他们自己的消耗量要高得多,而且还不包括 OpenAI,所以你可以想象它到底有多大。
主持人:据我了解,相对于报道的数字,这是一个非常非常大的数字。我必须要问一下,中东每年这个时候的情况怎么样?
JH:很热,但不潮湿。
主持人:这是一种干热,对吗?
JH:是的,就是干热。我其实挺喜欢的,因为楼里很冷,我走到外面晒晒太阳,感觉真的很棒。不过夜晚也太美妙了。夜晚真是太棒了。在外面吃饭,喝杯茶,真是太棒了。
主持人:我当然也想问一下英伟达与沙特阿拉伯和阿联酋宣布的人工智能协议。从您的角度来看,为什么这些协议如此重要?为什么您参与其中如此重要?
JH:嗯,因为他们邀请我去,我们在那里宣布了两个相当雄心勃勃的人工智能基础设施建设项目,一个在沙特阿拉伯,一个在阿布扎比。两国领导人都非常重视本国参与人工智能革命的重要性,认识到他们拥有非凡的机遇,他们能源充足,但劳动力短缺,而国家潜力受限于劳动力数量和人口数量。因此,他们首次可以从能源转型到数字劳动力、机器人劳动力、代理和机器人。他们高度关注这一点,并且对此非常清晰。
沙特阿拉伯的殿下对此非常清晰,对这项技术充满热情,甚至非常了解。阿布扎比的谢赫·塔赫农也对此充满热情,极具前瞻性,深刻理解这项技术的影响及其给他们带来的机遇。因此,我很高兴能与他们合作。
我们帮助在沙特阿拉伯成立了一家名为 HUMAIN 的新公司,他们希望在世界舞台上建立这些人工智能工厂,接待国际公司,例如也在那里的 OpenAI 等公司,因此这是一项非常大的举措。
主持人:这是一个巨大的转变。其中很重要的一点是, AI 传播规则的倒退。我认为这些规则对那些国家尤其严厉,数量受到限制,必须由美国公司控制,在某些方面还受到美国制造的限制。我认为,与你之前的做法相反,英伟达强烈反对这些规则。从你的角度来看,我觉得你在某种程度上必须成长起来。金泰在他的书中说过,英伟达就像一辆围绕你打造的F1赛车,你是驾驶员。你是否从未想过这些政府事务,所以英伟达也从未真正考虑过这些政府事务?然后,突然之间,你成了世界上最重要的公司,你必须非常非常快地了解这些事情?
JH:嗯,不是我不想,也不是我必须这么做。在英伟达的大部分发展历程中,我们都在致力于技术研发、公司建设、行业发展和竞争。
主持人:是的,在一个纯粹竞争的行业中。
JH:每一天,每时每刻。构建我们的供应链,构建我们的生态系统。注意,我刚才描述了一系列规模巨大、范围广泛、本身就很困难的事情,而扩散规则突然出台,我想我们当时就说过,但现在每个人都明白了,它完全是错误的,对美国来说完全是错误的。如果扩散规则的目标是确保美国必须处于领先地位,那么它原本的制定方式恰恰会导致我们失去领先地位。
人工智能不仅仅是被称为模型的软件层,而是一个全栈的东西,这就是为什么每个人都在谈论英伟达的系统、基础设施、工厂等等。人工智能是全栈的。如果美国想在人工智能领域领先,就必须从芯片层、工厂层、基础设施层、模型层以及应用层全面领先开始——人工智能就是所有这些。
你不能直接说:“我们去写个扩散规则,牺牲其他所有层级来保护其中一层”,这太荒谬了。我们限制美国人工智能技术的想法,恰恰发生在国际竞争对手赶上来的时候,而我们几乎已经预见到了这一点。
主持人:您所说的国际竞争对手是指其他公司吗?
JH:中国做得太棒了,全球 50% 的人工智能研究人员都是中国人,你无法阻止他们,也无法阻止他们推进人工智能的发展。说实话,DeepSeek 是一款非常出色的作品。如果对他们的评价低于这个水平,那将是对我信心的严重缺乏,我实在无法容忍。
主持人:我们是否通过对它们施加限制,特别是在内存管理和带宽方面,来促使这项工作变得更好?
JH:每个人都喜欢竞争。公司需要竞争来激励自己,国家也需要竞争,毫无疑问,我们会激励他们。然而,我完全预料到中国会在这条路上的每一步都给予支持。华为是一家强大的公司,一家世界级的科技公司。中国的研究人员,人工智能科学家,都是世界级的。他们不是中国的人工智能研究人员,而是世界级的人工智能研究人员。你在Anthropic、OpenAI或DeepMind的展厅里走来走去,你会发现那里有很多人工智能研究人员,而且他们都来自中国。这当然合情合理,而且他们非常杰出,所以他们做出非凡的工作对我来说并不意外。
人工智能传播限制其他国家获取美国技术的想法完全是错误的,其使命应该是在为时已晚之前加速全球采用美国技术。如果目标是让美国引领世界,那么人工智能传播恰恰适得其反。
我认为人工智能的传播也忽略了人工智能堆栈如何运作的核心理念。人工智能堆栈就像一个计算平台,它本身就是一个平台。你的平台越大、功能越强大,安装基数就越大,就会有越多的开发者在其上运行和开发。当更多的开发者在其上进行开发时,它会使结果(以及在你的计算平台上运行的应用程序)变得更好。因此,你的销售量会更高,你的计算平台也会被更多人采用,从而扩大你的安装基数,从而增加使用它来开发人工智能模型的开发者,这又会增加——对于任何计算平台来说,这种正反馈系统的作用都不容小觑,这也是英伟达如今取得成功的原因。
认为美国不参与中国市场的竞争(50%的开发者都在中国)的想法,从计算基础设施和计算架构的角度来看,完全没有道理。我们应该给予美国公司在中国竞争的机会,抵消贸易逆差,为美国人民创造税收,创造和雇佣更多就业机会。
主持人:可以说我们已经完成了一半了吗?因为我们从海湾协议和人工智能扩散规则开始,当然,我认为你可以从民族国家竞争的角度来看,这些国家……
JH:这两个想法是相辅相成的,我的意思是:如果我们不在中国竞争,而是允许中国生态系统建立一个丰富的生态系统,因为我们不在那里竞争,并且开发出新的平台,而且它们不是美国的,在世界传播人工智能技术的时候,他们的领导力和技术将会传播到世界各地。
主持人:这就是我的观点,从你的角度来看,我们已经成功了一半。至少我们没有被其他国家切断。
JH:没错。
主持人:但我们应该全力以赴,让 Nvidia 重返中国。
JH:是的,但我认为,实际上,不进入中国市场已经完成了90%的目标。实际上,不是50/50,而是90%。
主持人:因此我们完成了 10%。
JH:是的,没错。确实如此。
主持人:郑重声明,我同意你的观点。我的观点是,这种试图限制芯片单元数量,然后又给他们提供他们想要的所有芯片制造设备的尝试,恰恰是本末倒置——追踪芯片比追踪芯片制造设备要困难得多。华盛顿特区的一些人提出的理论之一是:“芯片制造公司或半导体设备制造公司在华盛顿待了很多年,他们非常擅长游说,而英伟达却不在这里,所以他们处于劣势。” 你觉得这种说法正确吗?你是说华盛顿的人很难理解这种观点吗?
JH:过去几年,我们非常努力地在华盛顿特区建立业务。我们只有少数几个人,大多数我们这种规模的公司都有几百人,而我们只有少数几个。我们这群人非常优秀,他们讲述着我们的故事。他们不仅帮助人们解释、理解芯片的工作原理,还帮助人们理解生态系统的工作原理、人工智能生态系统的工作原理,以及这些政策可能带来的一些意想不到的后果。
我们希望美国胜利。每个公司都应该希望自己的国家胜利,每个国家也都应该希望自己的公司胜利。这种感觉并不可怕,反而是好事。而且,人们热爱胜利本身也是一件好事。竞争是好事,渴望伟大也是好事。当某个国家渴望伟大时,我们不应该嫉妒他们。当某个公司渴望伟大时,我也不会嫉妒他们。这促使我们所有人超越自我,做得比我们本应做的更好,所以我喜欢观察那些渴望伟大的人。
毫无疑问,中国渴望伟大,这真是太好了!他们绝对不应该期待更低的目标。我认识的世界各地的人工智能研究人员和科学家,他们之所以能取得今天的成就,是因为他们都渴望伟大,而且他们也确实伟大。我认为,某种程度上来说——
主持人:要想获胜,你必须把另一个人放下来。
JH:没错,我觉得这说不通。我们应该加快速度。英伟达之所以能走到今天,之所以能占据今天的地位,完全是因为没有任何人支持我们走到今天,所以我们只能继续努力。我认为,正如你所说,我们阻碍别人前进,反而会激励他们更加伟大,因为他们都是很棒的人。
主持人:我同意。作为一个美国人,我对此深感沮丧。我觉得我们应该通过超越创新、加快步伐来赢得胜利,而那种认为通过拉起梯子、切断联系、给每个人施加官僚主义的繁文缛节、试图追踪一切就能取胜的想法在我看来非常非常不美国化,令人沮丧。
JH:是的。总之,我认为总统确实明白这一点,他希望美国获胜。
主持人:嗯,我有个问题,因为这个政府之前就切断了H20芯片的供应,突然就说“不行”,现在又在做这笔交易。批评人士会说:“哦,这有可能会让中国打开局面,XYZ”。这确实感觉像是政府换届了,也许他们会说这事儿还是老样子。但我想,过去六周里,中美之间也经历了很多转变。
您是否感觉到,人们可能已经真正意识到,这个世界是如此紧密相连,一端发生的事也会在另一端发生,或许很难再将世界分割开来,实用主义将会回归。我们该如何应对?您对此持乐观态度,还是在做最坏的打算?
JH:总统对他想要实现的目标有自己的愿景,我支持他,相信他,我相信他会为美国创造伟大的成果,他会以尊重的态度,带着竞争的意愿,同时也寻求合作的机会。我感受到了,也看到了这一切。当然,我不在白宫,也不知道他们具体是什么感受,但这就是我的感觉。
首先,对H20的禁令,这是我们对Hopper所能做的极限,我们已经削减了,已经没有什么可以削减的了。我们已经注销了——我想是55亿美元——历史上没有任何一家公司注销过这么多的库存,所以对英伟达H20的额外禁令令人深感痛苦。它的成本非常高昂,我不仅损失了55亿美元,我们还注销了55亿美元,放弃了150亿美元的销售额,可能还有——具体是多少?——30亿美元的税收。中国市场每年大约有500亿美元,而且不是5000万美元,而是500亿美元。500亿美元就像波音,不是一架飞机,而是整个公司。放弃这些,才能带来随之而来的利润,随之而来的规模,以及随之而来的生态系统建设——
主持人:从长远来看,这才是对 CUDA 的真正威胁——
JH:没错。
主持人:中国建立了替代方案。
JH:没错。如果有人以为只要一步棋就能禁止中国参与H20项目,就能切断中国发展人工智能的能力,那他绝对是无知的。
主持人:关于电力方面,我稍后会谈到一个角度,但这会更有趣。我们先把政府方面的事情放在一边,以后再回过头来再说。第三个关于金融市场和政府的问题,在今天的主题演讲中,您一开始就说:“我们是一家基础设施公司,需要五年路线图。”您顺便提到,您创立英伟达时最初估计的总市场价值(TAM)是3亿美元。您是什么时候真正预见到“我们要做基础设施”的?——再次回顾我们之前的对话,我的感觉是您只是想让人们看到这种可能性。您看到了GPU计算的可能性,但它的规模,是否让您有点震惊?
JH:如果你仔细看我的主题演讲,你会发现,我几乎一直在谈论今天正在发生的事情,这些事情我大约五年前就说过了。五年前我谈论这些事情的时候,措辞还没有那么清晰,使用的词汇也没有那么精确,但我们的目标始终如一。
主持人:所以基本上现在当您在每次主题演讲结束时谈论很多关于机器人技术的内容时,这就是我们真正应该关注的五年预览。
JH:是的。事实上,我已经谈论这个话题大约三年了。
主持人:是的,几年后。
JH:我想这几年后就会发生。
对于这个行业来说,相当深刻和意义深远的事情是,在过去的 60 年里,我们一直从事 IT 行业,这是一种技术和工具,是人们使用的技术和工具——这是我们第一次离开 IT 预算,我们销售的产品进入 IT 预算,我们即将离开 IT 预算,进入制造或运营支出预算。
制造预算是因为我们制造机器人,或者因为机器人系统被用于制造产品,而运营成本则是因为数字化员工。全球运营成本和资本支出是多少?加起来50万亿美元?这是一个巨大的数字。IT行业大约是1万亿美元,而由于人工智能,我们即将把我们所有人带入一个大约50万亿美元的行业。
当然,我的第一个希望,而且我认为它确实会这样发生:尽管工作岗位会发生变化,一些工作岗位会消失,但大量的工作岗位将会被创造出来。机器人系统(其代理是实体机器人)很有可能会扩大全球GDP。其原因是我们劳动力短缺,所以每个人都有工作。如果你环顾美国,你会发现失业率处于历史最低水平,这是因为我们的劳动力不足。餐馆很难招到合适的员工,许多工厂显然也很难招到合适的员工。我认为,人们会毫不犹豫地以每年10万美元的价格雇佣一个机器人,这是因为它提高了他们创造更多收入的能力。所以我认为,未来五到十年,我们很可能会经历GDP的增长,以及一个全新的、由这些现在人们能够理解的象征性制造系统组成的产业。
主持人:我觉得今天的主题演讲还有一个有趣的地方,就是我在来之前就为这次采访做了准备,当时我心想:“嗯,这有点像GTC的翻版”,但实际上我觉得两者截然不同。这是我的解读,如果正确的话,请务必告诉我。感觉GTC是针对超大规模企业,而今天的演讲是针对企业IT的,就像两个不同的市场。
JH:是的。
主持人:就目标而言,我的理解正确吗?
JH:企业 IT 或代理和机器人,以及企业 IT 的代理和制造业的机器人,其原因非常明确,这就是生态系统的开始。
主持人:我们来看看你的GTC主题演讲吧,那是我最喜欢的主题演讲之一,我看了你所有的演讲,而且看了好几年。你阐述数据中心的局限性,以及为什么选择英伟达作为解决方案,这其中体现了Jensen教授的精髓,我把这解读成一种反ASIC的理念。你展示了路线图,就像在说“努力跟上这个速度”。然后,你介绍了延迟与带宽的帕累托曲线,由于GPU是可编程的,你可以在这条曲线上使用相同的GPU,当然,超大规模计算厂商才是制造ASIC的厂商。
主持人:我对您在那里的演讲的理解正确吗?
JH:我认为这些教导是正确的,但我这么做的原因并非完全如此。我只是想帮助人们理解如何构建一个新的数据中心。我们一直在思考这个问题,所以挑战就在这里。数据中心的能源是有限的。100兆瓦就是100兆瓦,250兆瓦就是250兆瓦。所以,如果是工厂,你的基本工作就是确保每瓦的总吞吐量达到最高,因为总吞吐量是以代币计算的,这取决于它是便宜的代币,也就是免费使用的代币,还是有人可能会支付的高质量代币,比如说,每月一千美元,一万美元。
主持人:嗯,你刚才提到了价值 10 万美元的人工智能助手。
JH:没错。我会雇佣一个年薪10万美元的AI代理吗?我绝对会。因为我们整天雇佣的人员都比这贵得多,如果我能用10万美元的价格为一个年薪50万美元的人提供AI服务,那简直太不可思议了,所以我当然会雇佣他。
工厂生成的代币质量参差不齐。你需要一些免费使用的代币,一些高质量的代币,这样你就跨越了帕累托。你不可能设计一个只擅长一种功能的芯片或系统,因为这种功能不会被充分利用。所以现在的问题是,如何创建一个系统,让它同时在某些时候可以用于免费代币生成,一部分用于免费代币生成,一部分用于高质量代币生成?
如果架构过于碎片化,工作负载的来回迁移就会很困难。所以我认为,如果人们仔细思考这个问题,会发现如果你设计的系统在高令牌率下表现非常出色,那么它的整体吞吐量自然会很低。如果你设计的系统吞吐量非常高,它的交互性往往很低,每用户每秒的令牌数也很低,所以很容易贴近 X 轴,也很容易贴近 Y 轴,很难填满那个区域。这就是我们在 Blackwell 架构、FP4 和 NVLink 72 的基础上进行的所有创新,包括 HBM 内存与其容量之间的平衡、浮点数与内存容量和带宽之间的平衡,以及非常重要的 Dynamo 分解式流媒体服务生态系统和硬件系统。
主持人:我想问你关于Dynamo 的问题,今天没有提到,但我认为非常有趣。
JH:非常重要。
主持人:给我介绍一下,我认为你称之为数据中心的操作系统。
JH:我的想法基本上是,推理工作负载,也就是 Transformer,有不同的阶段,不同的阶段可以根据用户、模型以及模型的上下文以不同的方式使用。因此,我们将大型语言模型的处理分解为预填充阶段,也就是上下文处理阶段,思考一下你要问我的问题。这与我对 Ben 的记忆有关,也与你喜欢做的那种深度对话式播客有关。如果我开始深入探讨行业和技术,我并不会感到不自在。
主持人:是的,您现在没有在晚间新闻或类似节目中播放声音片段。
JH:没错。我觉得我可以倾身向前,因为你们都能理解,我不会觉得自己在对着墙说话,所以我很自在地谈论这些事情。
好吧,当人工智能进入聊天机器人时,聊天机器人需要掌握一些上下文,因此聊天机器人具有记忆,它们处理上下文,甚至可能需要阅读一两个 PDF,所以这被称为预填充部分,预填充部分非常依赖浮点。
接下来是解码部分。解码部分是关于生成想法,它通过推理来解释你将要说的内容,预测下一个标记,因此,一系列思维基本上会产生更多的标记,这些标记会被反馈到上下文中,上下文又会产生更多的标记,所以它需要一步步推理问题,也许它需要去读取一些东西。现代版本的人工智能,这种代理型人工智能,推理型人工智能,浮点数和带宽——解码需要大量带宽——在所有情况下都很高,但实际可能更高。
主持人:它因人而异。
JH:没错,这取决于具体情况。
主持人:在解码阶段不需要很高的浮点精度。
JH:没错。比如说,单次操作,而且它本身就拥有强大的键值缓存,所以不需要太多浮点数。但是,当你加载上下文时,就需要大量的浮点数。Dynamo 会分解所有处理,并将其分散到数据中心,智能地计量工作负载和处理器的负载,这确实很复杂。
主持人:如果整个数据中心是一个 GPU,那么您谈论的就是以这种方式处理它的软件层。
JH:没错,它本质上是一个人工智能工厂的操作系统。
主持人:当您思考这些思维模型、这些推理模型时,展望未来 — — 就像您说的,您有很好的预测 — — 您是否认为这些模型主要用于代理工作流程,而它们的缺点是您只能坐在那里等待它们,或者您可能正在设置一堆并行行动的代理,这样效果很好,或者它们实际上最终在生成训练数据以获得更好的一次性结果方面最为重要,这就是人们更频繁互动的方式?
JH:我认为这取决于成本。我预测推理模型很可能只是基准模型,因为我们的处理速度会非常快。基本上,当你打开 Grace Blackwell 时,速度会快 40 倍,假设下一次点击速度再快 40 倍,模型会越来越好。所以,我认为从现在到五年后,代理模型的速度可能会提高 10 万倍,这非常合理。
主持人:这就是计算的历史。
JH:没错。所以它只是思考了一堆东西,你只是没看到而已。它现在思维敏捷,即使慢思考也很快。
主持人:那是什么书?《思考,快与慢》,现在把它用在人工智能上。我猜它一秒钟就能读完,所以可能达不到目的。
JH:没错。
主持人:回到正题,您在谈论这个问题以及每瓦性能时,有没有提到,这真的是以美国为中心的吗?毕竟,我们很难建设电力,而电力是主要制约因素。您看看这些海湾国家,由于各种原因,电力更容易获得,也更容易建设。而您去中国,您猜怎么着?如果电力不是主要制约因素,Nvidia 能帮您解决很多问题。这是 GTC 在美国举办的原因吗?这是向美国传递的信息吗?
JH:哦,我可没这么想过。我认为无论发生什么,你的工厂规模总是会有一定的,即使你的国家拥有更多的能源,你的数据中心却没有,所以我认为每瓦性能始终很重要。
主持人:它总是很重要,但重要程度可能会有所不同。
JH:没错,是的。但另一方面,如果你正在为此做规划,你可能会说:“好吧,我有一个架构,性能功耗比只有一半,所以也许我只需要两倍的土地和两倍的功耗,然后从一开始就开始构建它。” 然而,当你把所有这些因素放在一起时,问题就来了。
记住,即使是基础设施本身和电力输送,比如说1千兆瓦,我们做个简单的数学题。假设其中300亿美元可能是外壳、电力、土地、运营,总共300亿美元。假设计算、网络等等,全部用于存储,500亿美元,好吗?好吧,如果你需要建造两倍数量的设施,你只需将300美元乘以2,就是600亿美元,所以你必须获得一些非常便宜的计算来弥补。这就是为什么我一直觉得,在人工智能工厂的世界里,数学计算表明,如果一个架构不那么好,有时取决于它有多差,即使是免费的也不够便宜。
主持人:如果这是你唯一的选择,你就会努力实现它。
JH:没错。
主持人:好吧,让我们对比一下今天的情况。你今天说过几次,“我喜欢你从我这里买所有东西,但我也乐意你从我这里买任何东西”。有趣的是,在我完全理解之前,这感觉像是企业主题演讲,这又是我的话,不是你的,有一种务实的感觉,我觉得“他现在听起来像个企业CEO,他们非常务实”。当然,如果你购买整个产品栈,效果会更好。有趣的是,如果你谈论的是建立一个完整的人工智能工厂,用你的话来说,当然使用所有英伟达的产品可以最大化你的回报,但也有很多客户只是购买一些零碎的东西,这些客户,也许你希望他们购买整个产品,但如果他们从你这里购买任何东西,他们可能会永远从你这里购买。所以,从战略上讲,这似乎是一个非常有用的基础。
JH:服务客户是明智之举。看看英伟达的市场营销方式,你会发现我们一直以完全集成的方式构建产品,因为软件需要以某种方式与硬件集成,但我们在设计过程中非常严谨,可以将软件与硬件分离,这样你就可以决定不使用我们的软件,完全可以不用。看看我们设计系统的方式,你会发现我们实际上已经以非常严谨的方式对系统进行了分解,如果你想替换其中的一部分,完全可以做到。目前,Grace Blackwell 正在集成,并在全球不同的云平台中运行,它们都基于我们的标准,但又略有不同,而我们却能够融入其中。
我认为这是英伟达商业模式的真正挑战,这与英伟达想要成为一家计算平台公司的想法息息相关。最重要的是,如果英伟达的某个堆栈,如果是我们的计算堆栈,那就太好了。如果我们的网络堆栈(我对它深有体会,并且和我的计算堆栈一样重视)被采用,那也太棒了。如果我的网络堆栈被采用,那也太棒了。如果两个堆栈都被采用,那就太棒了。
主持人:嗯,我的意思是,很多人,你们的 NVLink Fusion,你们可以只用 NVLink,你们可以把它和你的 ASIC 集成在一起——这与我对 GTC 消息的解读完全相反——但我也能理解这种观点。我的意思是,谁是客户?
JH:我仍然坚信,Nvidia 正在构建一个整体上更好的系统,我依然坚信这一点。如果我不相信,那么显然我们肯定做错了什么,我们必须让自己相信这一点。因此,我完全相信 Nvidia 是全球规模最大的加速计算公司,我们是全球规模最大的人工智能计算公司。36,000 到 38,000 名员工组成的团队,没有哪个地方比我们更团结地完成这项工作,所以,接受一个 14 人的小团队能比我们做得更好的想法,会让人非常痛苦,因此我们努力做得更好。
主持人:然而,您也相信规模,而让您销售的所有产品实现规模化的一个好方法就是按照客户的需求进行销售。
JH:没错,完全正确。没错。我当然有偏好,但我们希望确保能够以每位顾客的喜好为他们提供服务。
游戏走向何方主持人:顺着这个思路,也许还有一点相关:我问了一个朋友关于这次采访的事,他说他儿子坚持让我问这个问题。有些游戏界人士觉得,正如你今天提到的,主题演讲只有10%的内容是关于GeForce的,但这对我们来说仍然很重要。这是在说“这对我们来说仍然很重要,因为这一切都在扩展,而且我们正在制造GPU?”,还是我应该怎么跟我朋友的儿子讲关于英伟达和游戏的事情?
JH:瞧,我希望我说过,如果没有 GeForce,RTX PRO就不可能实现;如果没有 GeForce,Omniverse 就不可能实现;如果没有 GeForce,我们在这些视频中看到的像素就不可能实现;如果没有 GeForce,机器人就不可能出现;如果没有 GeForce, Newton 也不可能诞生。所以,GeForce 本身并没有深入参与 GTC 活动,因为 GTC 更侧重于高性能计算、企业级计算、人工智能等等。我们为游戏开发者等举办了单独的会议,所以每次参加 GTC 时,我总会遇到一群人,我总是对他们的产品发布会不那么重视感到有点不好意思,但这群人的目标受众并不合适,但他们也知道 GeForce 在我们所做的每一件事中都扮演着不可或缺的角色。
主持人:我的意思是,游戏玩家是否还没有完全意识到 GeForce 不仅仅是图形渲染引擎?
JH:(笑)是啊,没错。没错。我今天就说了,我们只渲染了十分之一的像素,这数字太惊人了。假设我给你一个拼图,给你十分之一的碎片,剩下的十块我甚至不会给你,你必须自己拼凑。
主持人:我还有一个建议,想让你把游戏和其他东西连接起来。你刚才说你很严谨地把所有东西分开,并且能够把游戏和软件管理的这些东西分开。这听起来有点像Windows上的驱动程序问题,说实话,这只是你的一项核心技能。
JH:是的,驱动程序太低级了,它包含的东西太多了,寄存器也太多了,而驱动程序抽象实际上是一场革命,微软在其中发挥了非常大的作用。如果没有驱动程序这个概念,Windows 就不会有现在的样子,它创建了一个 API 的抽象,而底层硬件可能会发生相当大的变化。
我们的驱动程序现在是开源的,但坦白说,我没看到很多人为它做出贡献,原因是一旦我开发出新的GPU,他们在上一个驱动程序中所做的所有工作就等于白费了。所以,如果没有像英伟达这样庞大的工程师团队,这很难做到。但如果我们针对每个驱动程序以及与其相关的驱动程序对每个GPU进行优化,那么就会有一个很棒的隔离层、一个抽象层,无论是CUDA还是DirectX,人们都可以在此基础上进行构建。
主持人:瞧,这就是我回答我朋友儿子的问题。我本来想问你关于政府的事情,你也对你的观点进行了精彩而充满激情的辩护,但当我问到游戏驱动时,你真的非常兴奋,眼睛都亮了。
JH:哦,是吗?
主持人:所以我认为一切都还好。
JH:哦,太好了。是的,我其实很喜欢 GeForce。
主持人:就是这样,所以面对面交流感觉很好。黄仁勋,非常感谢。
来源:科技新鲜汇Tech