摘要:CES是消费电子主场,此次英伟达也是以消费级显卡GeForce RTX 50系列打头阵,同时公布了巨型芯片Grace Blackwell NVLink72、小型超级计算机Project DIGITS、世界基础模型平台Cosmos等。
在CES 2025主题演讲中,英伟达大秀了一系列AI新品。
CES是消费电子主场,此次英伟达也是以消费级显卡GeForce RTX 50系列打头阵,同时公布了巨型芯片Grace Blackwell NVLink72、小型超级计算机Project DIGITS、世界基础模型平台Cosmos等。
虽然是消费端产品居多,但是技术新词也不少。美西时间1月7日,CES开幕当天,黄仁勋接受了21世纪经济报道等媒体的采访,对前一日发布的新品进一步解读,也谈到了AI的新趋势。
当黄仁勋踏进采访间,他率先拿起的是Project DIGITS,爱不释手地说这很“cute”,并表示大家可以使用这台AI超级计算机。
采访中,黄仁勋也对DIGITS再释义,DIGITS是“deep learning GPU intelligence training system”(深度学习GPU智能训练系统)的缩写。他坦言这款产品更适合科学家、开发者等使用,但是他认为DIGITS潜力巨大,因为“人工智能可以开启一个新篇章,它把世界上的计算机抛在后面。”
有意思的是,纵观英伟达过去的发展历史,其实他最早就是希望作为一家to C的公司,比如之前做游戏主机。但现实却相反,他选择了做算力的提供方。现在,通过DIGITS这样的“电脑主机”,又开拓了偏C端的AI PC路径。
一位AI业内人士向21世纪经济报道记者表示:“从这款产品看,英伟达更多的是对产业链进行整合,既包括对Arm架构的应用、自己的全新框架系统的整合,也包括GPU、CPU的能力整合,这是对于自身产品能力外溢的一种自信和体现。这条产品线对于英伟达来说是一家性价比比较高的战略选择,并不会消耗太多的成本,因为大部分技术框架都是现成的,只不过是再丰富一条产品线,但是会对AI PC市场产生影响。”
另一方面,随着AI应用不断涌现,推理成本也成为关注焦点。黄仁勋谈到,英伟达通过不断提升硬件性能(如Blackwell GPU系列)和优化计算架构,大幅提高AI推理性能并降低成本。例如,新一代GPU的推理性能较上一代提升30到40倍,从而显著降低了数据中心的运行成本。此外,随着算力增强,训练和推理中的数据和模型精度不断提高,也推动了整个行业的发展。
谈及AI目前的发展速度是否可持续时,黄仁勋表示,从他所知的情况来看,没有任何物理限制阻碍这种发展。之所以能够如此快速推进AI计算,是因为英伟达具备高度集成的能力,能够将CPU、GPU和主板整合在一起。
黄仁勋也多次说到了三个“scaling law”,它们共同推动AI的发展,并且不断降低成本,他认为AI计算的发展可以非常快速地持续推进。
此外,黄仁勋一如既往地看好机器人、自动驾驶,他认为未来几乎所有的车都会具备自动驾驶能力。同时黄仁勋对智能眼镜和AI技术的结合表示感到兴奋,这种设备可以通过云端的Cosmos模型支持,将复杂AI能力压缩为小型模型,用于实时分析和交互。
采访最后,黄仁勋再次强调了GeForce显卡系列和AI相辅相成的关系,过去是AI GeForce助力了AI的发展,现在AI又反过来加速革新GeForce。
以下为21世纪经济报道记者整理的核心问答:
记者:去年你定义了一个全新的计算AI框架,你认为现在是时候重新考虑基础设施和系统组件的优化了吗?
黄仁勋:确实如此。我们关注那些极具挑战的领域,比如AI计算中最困难的部分。我们通过提升AI的计算密度来优化系统。无论运行速度多快,我们始终希望实现更高效的能耗比。
记者:虽然英伟达发布了AI PC相关产品,但是今年相关产品销量并未大幅增长,英伟达是否有能力改变这一现状?
黄仁勋:AI的开发最早是在云端完成的。过去几年里,应为的增长主要来自云端,云端AI已经变得非常强大,尤其是在处理复杂的大型模型时。例如,这些模型非常庞大,适合在数据中心运行和部署。
然而,我们仍然认为,有许多设计师、软件工程师、创作者和AI爱好者更喜欢在个人电脑上工作。问题在于,目前AI的大部分开发都需要在云端进行,涉及大量的数据传输和计算,而这对很多人来说并不方便。
幸运的是,Windows系统中的WSL 2(Windows Subsystem for Linux)提供了解决方案。这是一个虚拟化环境,可以在Windows上运行第二操作系统,并支持Docker容器。通过确保AI技术能够在PC上的WSL 2环境中运行,我们可以将云端的计算能力带到个人电脑上。
我们正在努力推动这一转变,我认为这就是正确的解决方案,我感到非常兴奋,开发者们能够利用Windows加上WSL 2在本地运行AI模型。
记者:发布会宣布了诸多进展,对于那些可能对AI缺乏了解的听众来说,你是否能用更简单的方式解释这些概念?
黄仁勋:作为一家科技公司,我们技术在影响并推动未来的消费者电子领域发展。昨天一个重要的宣布内容是,我们推出了一个名为“Cosmos”的基础模型。正如GPT专注于语言的基础模型、Stable Diffusion专注于图像,Cosmos是一种能够理解物理世界的模型。
它可以理解摩擦力、惯性、物体存在感以及几何和空间关系等物理属性。这些是儿童都能理解的物理现象,但当前的语言模型却无法处理。我们相信需要一个能理解这个物理世界的基础模型。
一旦Cosmos建立起来,它就能像GPT和Stable Diffusion那样支持许多应用。例如,您可以对Cosmos模型说,“告诉我这个房间里现在的情况”,它可以基于摄像头看到的信息回答你。
总之,Cosmos是一个理解物理世界的模型。它的意义在于,只有让AI理解物理环境,AI才能在现实世界中做出有意义的操作。自动驾驶汽车需要理解物理世界,机器人也需要理解物理世界。因此,Cosmos这样的模型是实现多模态的起点。
就像GPT模型推动了人工智能应用的发展,Llama对于人工智能的各种活动至关重要,而Stable Diffusion则激发了图像和视频生成模型的发展一样,我们期望Cosmos能够成为推动下一波人工智能创新的关键。
记者:你提到了scaling law,特别是测试时间计算方面。但是计算成本变得非常昂贵,有些运行需要耗费数千美元。英伟达如何应对这些高昂的成本?是否有解决方案可以让推理计算更具成本效益?
黄仁勋:解决推理计算性能和成本问题的直接方法是提升我们的计算能力。这也是为什么我们推出了Blackwell GPU NVL 72,其推理性能相比Hopper提升了30到40倍。通过这种提升,我们将推理计算的单位成本降低了同等幅度,因为数据中心的其他开销基本保持不变。
从历史上看,计算技术的进步一直依赖于降低计算成本。过去20年,我们将边际计算成本降低了约100万倍,使得像机器学习这样的技术成为可能。同样的趋势也会发生在推理阶段:通过不断提升性能,推理成本将会继续下降。
此外,我们还有一种方式。今天,许多测试时间计算阶段的输出会变成预训练、后训练模型的输入数据。这些数据会被用于后续的模型改进,这种方法不仅降低了训练和推理的综合成本,还能让模型变得更加智能。当然,这一过程需要时间。因此,这三种scaling law将会并存一段时间。
一方面,我们会努力提升所有模型的智能水平,另一方面,人们会不断提出更加复杂的问题,并期待得到更加智能的回答,这个循环将会持续不断地进行下去。
记者:你提到英伟达正在增加以色列的投资,并在当地扩展业务。您能谈谈英伟达未来在以色列的计划吗?
黄仁勋:我们几乎从全球各地招聘顶尖人才。目前,我们的公司在全球范围内收到了超过100万份求职简历,而我们只有大约32000名员工。在以色列,我们从最初收购Mellanox时的约2000名员工,增加到现在的近5000名员工。英伟达是以色列增长最快的雇主之一。
在过去几年里,以色列团队开发了NVLink、SpectrumX,我为团队感到自豪,但是今天没有新的合作或投资宣布。
记者:我们注意到英伟达最新的旗舰显卡RTX 5090和RTX 5080之间存在较大的性能差距。5090的核心数量是5080的两倍,而价格也高出一倍。为什么会设计出这样大的差距?
黄仁勋:原因很简单,总有一些用户想要“最好的”。如果我们提供稍差一点、便宜100美元的产品,他们也不在乎。对于他们来说,最重要的是品质。当然,2000美元的花费不算小,但其价值是值得的。
但请记住,这些技术通常被用于家庭影院级的环境。这些用户往往已经在显示器和音响系统上投入了上万美元,因此他们也希望配备最好的GPU。我们的很多客户都有这样的需求,他们愿意为了获得顶尖性能而投资更多。
记者:AI在PC游戏中越来越重要,你是否认为未来传统的实时渲染会完全被AI生成的内容取代?
黄仁勋:不会。还记得有人首次提出:“为什么不直接用ChatGPT生成一本书?”当时内部没人预料到这一点。原因在于,你需要为它提供基础,这就是条件反射的概念。
AI生成的内容需要“条件”或“上下文”作为输入,而这些条件的生成仍然需要传统渲染技术。例如,在视频游戏中,为了生成符合场景的AI内容,系统需要先提供初步的几何形状、纹理和光照信息。这些信息构成了AI生成内容的“上下文”。
记者:毫无疑问,超大规模企业对产品的需求是存在的,能否具体说明一下贵公司在扩大收入基础、吸引企业客户方面的紧迫感,尤其是在亚马逊等公司开发AI芯片的背景下,政府建设自己的数据中心以与超大规模云服务商竞争。你感受到的紧迫性有多强?能说明一下在企业和政府方面的需求或进展吗?
黄仁勋:我们的紧迫感源自于为客户服务,我从不为某些客户也在开发其他芯片而感到困扰。我们只是在做不同的东西。我很高兴他们在云端使用NVIDIA,也很高兴他们使用NVIDIA来开发他们的AI,我认为他们做出了好的选择。我们的技术发展速度非常快,每年性能翻倍,同时成本也几乎减半,这比摩尔定律的速度还要快。
目前,企业的关键在于两个行业的服务,软件行业和解决方案工程师,后者帮助客户将软件适配到业务流程中。我们的战略是与这两个生态系统合作,帮助它们构建具有自主能力的AI。
总之,过去一年我们在构建自主AI工具包方面取得了很大进展,现在关键是如何部署这些技术并加速应用。
记者:你提到了Agent AI,像AWS、微软、Salesforce这样的公司,这些公司也有平台,你们是如何合作的?
黄仁勋:我们不是一家虚拟企业公司,而是一个科技平台公司。我们将构建工具包、库和模型。我们关注ServiceNow、SAP、Oracle、Synopsys、Cadence和西门子等公司,他们在垂直领域很专业,但他们并不希望将精力投入到计算层和AI库的开发上。因此,我们为他们提供了这一解决方案。
我们开发了NIM和NEMO技术,如果我们的CSP(云服务提供商)希望使用它们——实际上许多CSP已经在使用了——他们可以用来训练他们的语言模型。我们为行业创造了这些库,这样他们就不需要自己去做,不需要重复构建这些东西了。
记者:你发布了Project DIGITS,你怎么看待非游戏PC市场中的一些最大未满足的需求?
黄仁勋:DIGITS代表的是 “deep learning GPU intelligence training system”。Digits是一个面向科学家和机器学习工程师的平台,今天,他们使用PC、Mac或工作站来进行这些工作。坦率地说,对于大多数人来说,用PC进行机器学习和数据科学,可能并不适合。
现在,我们有了一款小设备。它可以放在你的桌子上,像你与云端互动一样,它是无线的。它就像是你自己的私人数据中心。为什么你不想拥有类似的设备呢?你可以用它来进行机器学习模型的开发。如果你一直在云端工作,云端的延迟非常高。所以,我们使得拥有个人开发环境变得可能。
这对科学家和学生们来说,你可以随时让系统保持运行。我认为,等待着Digits的是巨大的潜力市场,因为人工智能可以开启一个新篇章,它把世界上的计算机抛在后面。
记者:自动驾驶领域,与2017年相比,2025年行业有什么区别?2017年遇到的问题是什么?而2021年的技术创新是什么?
黄仁勋:首先,未来所有的移动设备都会实现自动化。在未来,大多数汽车你仍然可以选择驾驶,但所有的汽车都有能力自动驾驶。
5年前,这项技术是否能强大并不确定,但现在技术,传感器技术、计算机技术和软件技术已经非常成熟。我认为现在有太多证据表明,新一代汽车,尤其是电动汽车,几乎每一辆都承诺具有自动驾驶能力。这些技术不再是实验性质,而是正在广泛落地。
特斯拉无疑是这个领域的领导者之一,但我们也看到来自中国的创新正在快速崛起。例如比亚迪、小鹏、蔚来、小米等公司展示了非常先进的技术水平。这些公司在汽车行业中设立了新的标准,证明了自动驾驶和电动车技术的潜力。
我认为世界已经发生了变化。虽然技术成熟的过程花费了一些时间,我们的认知也在不断发展,但现在我认为,自动驾驶的未来已经非常接近现实。
记者:问一个关于昨天宣布的新模型的问题,能否在智能眼镜中运行?
黄仁勋:我对能连接到云端的智能眼镜感到非常兴奋,它还涉及到你能够连接到虚拟现实技术、可穿戴技术,这一切都非常酷。如果你没有把大模型放在设备本身中,那么你就可以使用Cosmos在云端提供内容,它的规模很小。因此,Cosmos成为了一个知识传递工具,它将知识转移到一个更小的AI模型中。
之所以能做到这一点,是因为这个更小的AI模型高度专注,可以实现更精准的知识转移。是的,你仍然可以蒸馏出更多、更小的模型。这也是为什么我们一开始会从构建一个基础模型开始,然后再逐步构建更小的模型。这种方式使得整个模型架构更加高效并减少失真。
记者:有关于贸易和关税的问题,政策可能会影响到所有人,你对此有何担忧吗?
黄仁勋:我不担心这个,我相信政府会为自己的贸易谈判做出正确的决策。我们会根据情况做好自己能做的。
记者:AI目前的发展速度是可持续的吗?是否有可能在短期内保持这种增长?
黄仁勋:从我所知的情况来看,没有任何物理限制阻碍这种发展。我们之所以能够如此快速地推进AI计算,是因为我们具备高度集成的能力:我们能够将CPU、GPU和主板整合在一起。
同时,我们还将所有的软件和系统整合在一起。如果这需要由20家不同的公司来完成,并且需要相互集成,那会非常耗时。但因为我们在硬件、软件和系统层面都实现了一体化支持,所以我们可以非常高效地推进系统的发展。
其次,由于我们能够跨整个系统进行优化,性能的提升远远超过了仅靠晶体管密度提高所能实现的幅度。摩尔定律的进展速度已经放缓,但通过系统级的优化,我们的整体性能提升依然非常显著。
我认为,这种发展没有物理上的限制。随着计算能力的提高,研究人员可以使用更多数据训练更大的模型。同时,合成数据生成技术(synthetic data generation)也在持续扩展。我们有三个scaling law ,它们共同推动AI的发展,并且不断降低成本。因此,我认为AI计算的发展可以非常快速地持续推进。
记者:你提到了英伟达与联发科、台积电等中国台湾公司的合作,能否分享一下你在中国台湾的业务计划?
黄仁勋:我们在中国台湾有很多员工,我们的办公楼已经不够用了,我需要找到解决办法。
我们与联发科在多个领域有合作,其中包括自动驾驶相关的软件开发。我们还共同开发了一款集成芯片,将CPU和GPU无缝结合。联发科的团队在设计芯片时与我们密切合作,做得非常出色。事实上,这款芯片的硅片第一次流片就非常成功,展现了联发科在低功耗芯片方面的卓越能力。我们非常高兴能与他们合作。
记者:关于教育方面,我想知道学校和学生应该学习哪些知识和技能,以应对未来的发展需求?
黄仁勋:我这一代人是第一代必须学习如何使用计算机来完成科学工作的群体。在我们之前,人们只使用计算器、滑尺和纸笔。而我的一代人学会了用计算机编写软件、设计芯片以及模拟物理现象。我们用计算机完成了我们的任务。
下一代人将是第一批学习如何使用AI完成工作的群体。AI就是新一代的计算机,每个领域都需要学习如何使用它。无论是生物学、农业、化学还是量子物理学,AI都将成为不可或缺的工具。未来的每个学生将需要学习如何使用AI,就像今天的学生必须学习计算机一样。这种转变说明了AI革命的深远影响。
AI不仅仅是关于大型语言模型,它将成为未来几乎所有领域的一部分。这是一项极具变革性的技术,发展速度非常快。我非常感谢你们对这个领域的兴趣,以及您们对推动行业发展的支持。
如果你观察计算机图形领域的摩尔定律曲线,你会发现它实际上已经开始减速了。但随着AI的加入,整个行业得到了极大的推动,性能提升进入了指数增长的轨道。
现在,帧率已经达到了每秒200、300甚至400帧,同时所有的图像都实现了光线追踪,效果极其美观。AI技术彻底改变了计算机图形领域的增长趋势,我们正在见证一条全新的指数增长曲线。这不仅仅局限于计算机图形领域,它几乎影响了每一个行业。
这就是为什么我们的行业会发生如此迅速的变化,而其他行业也会随之快速变革的原因。
来源:雷霆战神王