DeepSeek引发了6000亿美元的恐慌,中国AI新贵对Nvidia造成打击

B站影视 2025-01-29 09:21 2

摘要:此次抛售是由中国人工智能初创公司DeepSeek引发的,该公司最新的V3和R1人工智能模型似乎可以与任何美国公司最好的模型相媲美,而训练成本却只是其一小部分。由于 Nvidia 强大的图形处理单元是开发最先进人工智能模型的最大成本之一,投资者突然彻底质疑他们对

人工智能推动了英伟达市值飙升至3 万亿美元。但周一,人工智能却引发了英伟达投资者的恐慌,导致其股价下跌近17%,市值蒸发近6000亿美元。

此次抛售是由中国人工智能初创公司DeepSeek引发的,该公司最新的V3和R1人工智能模型似乎可以与任何美国公司最好的模型相媲美,而训练成本却只是其一小部分。由于 Nvidia 强大的图形处理单元是开发最先进人工智能模型的最大成本之一,投资者突然彻底质疑他们对人工智能业务的假设。

尽管关于 DeepSeek 如何开发其模型仍有许多未解之谜,但这家新贵显然正在撼动人工智能市场。不过,对英伟达的末日的预言可能为时过早。同样,也有人声称 DeepSeek 的成功意味着美国应该放弃旨在限制中国获得用于人工智能的最先进计算机芯片的政策。

DeepSeek表示,它拥有10,000 块 Nvidia 旧款 A100 GPU的使用权,这些芯片是在美国实施出口管制之前获得的,美国实施出口管制限制了中国公司购买这些顶级芯片的能力。该公司还提到在 Nvidia的H800芯片上训练V3这是Nvidia在中国销售的一款芯片,专门为遵守美国出口管制而设计。

无论如何,这比美国公司通常用于训练其最先进的 AI 模型的处理能力要低几个数量级。例如,埃隆.马斯克的 Xai 在田纳西州建立了一个名为Colossus的计算集群,其中有100,000个Nvidia更先进的H100 GPU。

更重要的是,DeepSeek的 R1 模型(该模型旨在解决数学、辑问题和编码问题,并挑战 OpenAI 的 o1"推理"模型)足够小,可以在笔记本电脑上运行,笔记本电脑的主要处理能力来自传统的中央处理器(CPU),而不需要访问数据中心运行的许多GPU。

不只是投资者抓住了这一消息。美国对先进计算机芯片出口管制的批评者指出,DeepSeek 的成功表明贸易限制没有发挥作用。一些人甚至认为,出口限制适得其反﹣﹣本意是阻碍中国人工智能公司的发展,阻止它们赶上美国,但实际上却迫使中国人工智能研究人员开发出更聪明的方法来制造更高效的人工智能模型。

南加州大学法学教授、中国科技监管书籍作者张安吉拉上周在《金融时报》的一篇专栏文章中写道:"中国在效率方面的成就并非偶然。这是对美国及其盟友不断升级的出口限制的直接回应。""通过限制中国获得先进的人工智能芯片,美国无意中刺激了中国的创新。"人工智能怀疑论者加里.马库斯周日也在他的博客上附和了这些观点。

更便宜的人工智能意味着更多的人工智能这两种新兴的说法都可能被证明是短视的。这是因为 DeepSeek 的影响可能会增加对先进AI芯片的需求,这违反直觉◇包括 Nvidia 和竞争对手正在开发的芯片。部分原因在于一种被称为杰文斯悖论的现象。

以19世纪英国经济学家威廉.斯坦利.杰文斯(William Stanley Jevons)的名字命名,他发现当技术进步使资源的使用效率更高时,该资源的总体消耗量往往会增加。如果对某种东西的需求相对有弹性,那么这是有道理的﹣效率提高导致价格下降,从而为产品带来更大的需求。

杰文斯悖论很可能在这里发挥作用。到目前为止,大型组织采用人工智能的速度缓慢的原因之一是这些模型的运行成本太高。这使得企业很难找到能够获得正投资回报(ROI)的用例。到目前为止,对于像 OpenAI 的 o1这样的新"推理"模型来说,情况尤其如此。但 DeepSeek 的模型,尤其是它的o1竞争对手R1,运行成本非常低,因此公司现在可以负担得起将它们插入更多流程并部署到更多用例中。从整个经济来看,这可能会导致对计算能力的总体需求猛增,即使每个单独的计算所需的功率要小得多。

微软首席执行官萨蒂亚.纳德拉和前英特尔首席执行官帕特.基辛格周一在社交媒体上都提到了这一点。纳德拉明确提到了杰文斯悖论,而基辛格则表示"计算遵循"他所谓的"气体定律"。他写道:"大幅降低成本将扩大人工智能的市场……这将使人工智能得到更广泛的应用。""市场正在犯错误。"

现在的问题变成了究竟需要什么样的计算机能力。Nvidia 的顶级 GPU 针对训练最大的大型语言模型(LLM)进行了优化,例如 OpenAI的GPT-4 或Anthropic 的 Claude 3-Opus。在 AI 研究人员和开发人员所谓的推理方面,该公司的优势较小﹣﹣即使用经过全面训练的 AI 模型执行任务。在这方面,Nvidia的一些竞争对手包括Advanced Micro Devices (AMD)和Groq等新贵,都声称他们可以比 Nvidia 的 GPU 更快、更高效地运行AI应用程序。

Alphabet 的谷歌和亚马逊的 AWS 也打造了自己的 AI 芯片,其中一些针对推理进行了优化。

其中一些竞争对手确实可能开始削弱 Nvidia 的市场主导地位。(该公司目前控制着基于数据中心的 AI计算市场80% 以上的份额;如果排除云提供商的定制芯片,Nvidia 的份额可能高达98%。)但 Nvidia 不太可能迅速或完全失去这种主导地位。它的 GPU 也可以用于推理一﹣而且它的GPU编程软件CUDA拥有庞大而忠诚的开发者社区,不太可能在一夜之间叛逃。如果由于杰文斯悖论导致对AI计算机芯片的整体需求增加,那么即使市场份额下降,Nvidia 的整体收入仍可能继续攀升,因为它在更大且不断增长的市场中所占的份额将更小。

对先进计算机芯片的需求可能继续增长的另一个原因与R1等推理模型的工作方式有关。以前的LLM 在训练过程中使用更多的计算机能力会变得更强大,而这些推理模型使用所谓的"测试时间计算"-﹣它们在推理过程中使用的计算能力越多,它们提供的答案就越好。因此,虽然人们可以在笔记本电脑上运行R1并让它在一小时后输出一个难题的良好答案,但让同一个模型访问云端的GPU或AI芯片可能会让它在几秒钟内给出相同的答案。对于许多AI商业应用而言,延迟或模型产生输出所需的时间很重要。通常时间越短越好。而要缩短推理模型的时间,仍然需要先进的计算芯片。

重新思考出口规则出于这些原因,如果美国将让中国在人工智能领域竞争变得更加困难视为国家安全优先事项,那么继续限制中国获取最尖端计算机芯片可能仍然有意义。最近离开 OpenAI 的人工智能政策专家 Miles Brundage在周末的播客中提出了这一观点,他表示,即使 DeepSeek 证明强大的人工智能模型可以在更少、更不先进的芯片上构建,但能够获得更先进的芯片始终是一种优势。

"我认为每个人都更愿意拥有更多的计算能力来进行训练,进行更多的实验,从模型中抽样更多次,并采用一些奇特的方式来构建代理,让它们相互纠正、辩论并投票选出正确答案,"Brundage 说。"因此,有各种各样的方法可以将计算能力转化为更好的性能,而美国公司目前处于更有利的地位,因为他们拥有更多的芯片数量。"

因此,出口管制可能仍会减缓中国在任何地方使用人工智能的步伐,而这将使美国在部署人工智能并获得其利益时在经济甚至军事上占据优势。

除此之外,还有另一个理由可以解释为什么这对Nvidia 和美国国家安全政策来说可能并不像投资者和批评人士认为的那么糟糕:DeepSeek完全有可能没有如实说明它可以使用多少颗顶级 Nvidia 芯片来训练其模型。

许多人工智能研究人员对 DeepSeek的说法表示怀疑,他们声称自己的V3模型是在大约 2,000块 Nvidia 性能较差的 H800 计算机芯片上训练的,或者自己的 R1模型是在如此少的芯片上训练的。人工智能公司 Scale Al 的首

席执行官 Alexandr Wang 上周在达沃斯接受CNBC采访时表示,他掌握的信息表明,DeepSeek秘密获得了 50,000 块 Nvidia H100 GPU(其最新型号)的使用权。据了解,在实施出口管制之前,拥有 DeepSeek 的对冲基金HighFlyer 已经积累了大量性能较差的 Nvidia GPU。如果这是真的,那么Nvidia的处境很可能比投资者恐慌所认为的要好﹣﹣而且美国出口管制的问题不在于政策,而在于政策的实施。

来源:书香盈袖

相关推荐