摘要:因此,许多分析师认为 DeepSeek 的成功破坏了推动美国人工智能行业发展的核心信念,而 Nvidia 和 Microsoft 等引领这一变革的公司并不像之前认为的那样有价值或技术领先。科技股在几天内下跌了数千亿美元。
鞭牛士报道,1月31日消息,据时代杂志报道,本周,硅谷、华盛顿特区、华尔街等地的领导人因中国人工智能公司DeepSeek的意外崛起而陷入混乱。
DeepSeek 最近发布的人工智能模型可与 OpenAI 相媲美,而且价格似乎只是后者的一小部分,尽管美国出台了旨在减缓中国进步的政策。
因此,许多分析师认为 DeepSeek 的成功破坏了推动美国人工智能行业发展的核心信念,而 Nvidia 和 Microsoft 等引领这一变革的公司并不像之前认为的那样有价值或技术领先。科技股在几天内下跌了数千亿美元。
但人工智能科学家反驳说,许多担忧都是夸大其词。他们表示,尽管 DeepSeek 确实代表了人工智能效率的真正进步,但它并不是一项重大的技术突破——而且美国人工智能行业仍然比中国具有关键优势。
兰德公司人工智能研究员伦纳特·海姆表示:这并不是人工智能前沿能力的飞跃。我认为市场只是搞错了。
以下是关于 DeepSeek 的含义的几种广为流传的说法,以及科学家认为它们不完整或完全错误的原因。
声明:DeepSeek 比其他模型便宜得多。
去年 12 月,DeepSeek 报告称其 V3 模型的训练成本仅为 600 万美元。与 OpenAI 声称的训练GPT-4 所花费的1 亿多美元,以及 Anthropic 训练其最新版本的 Claude 模型所花费的几千万美元相比,这个数字似乎低得惊人。
DeepSeek 的较低价格得益于一些巨大的效率提升,公司研究人员在发布模型时发表的论文中描述了这一点。但这些提升是否出乎意料?海姆认为并非如此:机器学习算法随着时间的推移一直在变得更便宜。
人工智能公司 Anthropic 的首席执行官达里奥·阿莫迪 (Dario Amodei)在 1 月 28 日发表的一篇文章中表达了同样的观点,他写道,虽然 DeepSeek 研究人员的效率提升令人印象深刻,但它们并不是独特的突破或从根本上改变法学硕士经济效益的东西。
他写道:这是持续成本降低曲线上的一个预期点。这次的不同之处在于,第一个展示预期成本降低的公司是中国公司。
更让人难以理解的是,DeepSeek 可能也没有完全诚实地说明其开支情况。在有关其模型训练成本低廉的传言出现后,科技公司首席执行官援引报道称,DeepSeek 实际上拥有 50,000 块 Nvidia 芯片,但由于美国出口管制,该公司无法透露这些芯片的价格。这些芯片的价格约为 10 亿美元。
然而,DeepSeek 的新 R1 模型确实比其竞争对手 OpenAI o1 模型便宜得多,其模型访问费用大约低 30 倍(每百万代币或输出的单词片段 2.19 美元,而 OpenAI o1 为 60 美元)。这引发了一些投资者对美国人工智能行业即将爆发价格战的担忧,这可能会降低预期的投资回报,并使美国公司更难筹集建设新数据中心以支持其人工智能模型所需的资金。
美国科学家联合会人工智能和新兴技术政策副主任奥利弗·斯蒂芬森 (Oliver Stephenson) 表示,人们不应该根据这个价格点得出结论。
「虽然 DeepSeek 确实提高了效率,但他们的定价可能是一种吸引眼球的策略。」他说。「他们可能会在推理上亏本。」(推理是已经形成的人工智能系统的运行。)
1 月 27 日星期一,DeepSeek表示其遭受网络攻击,并限制中国以外用户的新注册。
声明:DeepSeek 表明出口管制不起作用。
2022 年,当人工智能军备竞赛升温时,拜登政府采取行动切断中国获取尖端芯片的渠道,其中最著名的是英伟达的 H100。结果,英伟达制造了一款劣质芯片 H800,合法出售给中国公司。拜登政府后来还选择禁止向中国出售这些芯片。但一年后,当这些额外的管制措施生效时,中国公司已经囤积了数千台 H800,为英伟达带来了巨额意外之财。
DeepSeek 表示,其 V3 模型是使用 H800 构建的,对于该公司正在创建的模型类型而言,其性能已经足够。但尽管取得了这一成功,专家们认为芯片控制可能阻止了中国进一步发展。
卡内基国际和平基金会技术与国际事务项目访问学者斯科特·辛格 (Scott Singer) 表示:在中国拥有更多计算能力的环境中,我们预计会取得更多突破。出口管制可能正在发挥作用,但这并不意味着中国将无法构建越来越强大的模型。
展望未来,由于芯片的限制,DeepSeek 和其他中国公司可能越来越难以跟上前沿模型的步伐。OpenAI 的 GP4 训练了大约 10,000 个 H100,而下一代模型可能需要十倍或一百倍的数量。即使中国能够通过提高效率来构建强大的模型,出口管制也可能限制他们将模型部署到广泛用户群的能力。
「如果我们认为未来人工智能代理会代替某人工作,那么你有多少数字工作者取决于你有多少计算能力。」Heim 说。「如果人工智能模型不能得到如此广泛的使用,这将限制它对世界的影响。」
观点:Deepseek 表明高端芯片并不像人们想象的那么有价值。
随着本周 DeepSeek 的炒作不断升温,许多投资者认为,该公司的成就威胁到了英伟达在人工智能领域的主导地位,因此抛售了这家今年 1 月全球市值最高的公司的股票。结果,英伟达股价周一下跌 17%,市值缩水近 6000 亿美元,原因是投资者认为,在这种新模式下,英伟达的芯片价值会降低。
但许多人工智能专家认为,英伟达股价下跌是市场不理性的表现。他们中的许多人急于逢低买入,导致股价收复部分失地。
他们指出,从历史上看,计算能力效率的提高导致对芯片的需求增加,而不是减少。随着科技股下跌,微软首席执行官萨蒂亚·纳德拉 (Satya Nadella)在 X 上发布了杰文斯悖论维基百科页面的链接。
杰文斯悖论最早出现在 19 世纪,以一位经济学家的名字命名,他指出,随着煤炭燃烧效率的提高,人们实际上使用了更多的煤炭,因为煤炭变得更便宜,也更广泛地可用。
专家认为,在开发先进人工智能的竞争中也会出现类似的情况。「我们看到的是建立在 Nvidia 产品基础上的令人印象深刻的技术突破,随着你使用 Nvidia 产品的次数增加,它会变得更好。」斯蒂芬森说。「这似乎不是一种 Nvidia 产品需求减少的情况。」
就职两天后,唐纳德·特朗普总统宣布成立一家价值 5000 亿美元的公私合资企业,建设人工智能数据中心,其理念是规模对于构建最强大的人工智能系统至关重要。然而,DeepSeek 的崛起让许多人认为这种方法是错误的或浪费的。
但一些人工智能科学家不同意这种观点。
「DeepSeek 表明人工智能正在不断进步,而且不会停止。」海姆说。「如果人工智能得到使用,它将对经济产生巨大影响,因此此类投资是有意义的。」
美国领导层已表示,DeepSeek 让他们更加渴望建立 AI 基础设施,以保持该国的领先地位。特朗普在周一的新闻发布会上表示,DeepSeek应该为我们行业敲响警钟,我们需要全神贯注于竞争才能取胜。
然而,斯蒂芬森警告称,数据中心的建设将带来大量的外部负面因素。数据中心通常使用大量电力,同时伴随着当地电费的大幅上涨,并威胁到供水,他补充道:在进行这些基础设施建设时,我们将面临很多问题。
来源:鞭牛士