解密DeepSeek:关于中国AI初创企业崛起的5个误解与现实

B站影视 2025-02-03 08:05 3

摘要:在中国人工智能初创公司发布其推理模型 R1 几天后,DeepSeek 继续受到科技行业高管和立法者的一致好评,这引发了从纽约到东京等市场科技股的大规模抛售。

鞭牛士报道,2月3日消息,据印度媒体报道,在中国人工智能初创公司发布其推理模型 R1 几天后,DeepSeek 继续受到科技行业高管和立法者的一致好评,这引发了从纽约到东京等市场科技股的大规模抛售。

R1 模型的质量和成本效益是 DeepSeek 人气飙升的主要原因。该公司声称,其 AI 模型在性能上可与 OpenAI 的 o1 推理模型相媲美,在某些情况下甚至超过后者,同时使用更少的图形处理单元 (GPU),成本也低得多。

DeepSeek 的聊天机器人应用程序可免费访问 R1,已在多个国家/地区的应用商店排行榜上名列前茅。然而,一些人对该公司的成功持谨慎和怀疑态度。OpenAI 指责 DeepSeek 窃取知识产权,并表示有证据表明该公司使用其 GPT 模型来训练自己的模型。

毋庸置疑,DeepSeek 的热情正在逐渐被审视所取代,人们开始质疑其 AI 模型是如何开发的,以及对其更广泛影响的各种解释。随着讨论的展开,让我们来揭穿一些围绕 DeepSeek 崛起的常见误解。

误解 1:DeepSeek 的 AI 模型表明 AGI 触手可及

现实:DeepSeek 的 AI 模型在效率和成本方面有显著的提升,但并不一定预示着向通用人工智能 (AGI) 的飞跃。

AGI 是科技行业用来描述能够在各种任务上匹敌或超越人类智力的 AI 模型的术语。目前还没有人宣布他们已经开发出这样的 AI 模型。然而,OpenAI 及其一些竞争对手表示,他们正热切地致力于实现 AGI 里程碑。

据报道,2023 年,DeepSeek 从中国对冲基金 High-Flyer 的 AI 研究部门发展成为一家 AI 公司。该公司由对冲基金经理梁文峰创立,目标是在通往 AGI 的道路上开发大型语言模型 (LLM)。

OpenAI 首席执行官 Sam Altman 曾多次表示,ChatGPT 的开发者将有信心实现 AGI。在回应 DeepSeek 的炒作时,Altman 再次将焦点转移到 AGI,同时称赞 R1 模型令人印象深刻。

尽管 R1 标志着 AI 霸权之争的转折点,但 DeepSeek 并未引入全新技术。纽约大学 (NYU) 教授兼 AI 专家 Gary Marcus 向 CNBC 表示:实现 AGI 可能还需要五六个突破,能够率先实现这些突破的公司或国家可能会获胜。

误解二:DeepSeek 的突破表明出口管制不起作用

现实:美国对先进 GPU 销售的出口限制可能会继续对中国的人工智能发展产生重大影响。

DeepSeek 的突破被认为是美国出口管制的意外结果,美国出口管制限制中国科技公司购买先进的 GPU 来扩展其 AI 模型。据报道,由于无法使用 Nvidia 的顶级芯片,DeepSeek 研究人员被迫想出巧妙的方法,使 AI 模型在原始计算能力消耗方面更加高效。

批评人士认为,美国的出口管制适得其反,但据报道,在贸易限制实施之前,DeepSeek 就储存了 10,000 块 Nvidia 老一代 A100 GPU。

最近离开 OpenAI 的人工智能政策专家 Miles Brundage 表示,出口管制可能仍会阻碍中国开展更多人工智能实验和构建人工智能代理的步伐。

「DeepSeek 迫于形势,不得不寻找一些可能比美国公司更快的技术。但这并不意味着他们不会从拥有更多 [GPU] 中受益。这并不意味着他们能够像 OpenAI 那样立即从 o1 跳到 o3 或 o5,因为他们拥有更庞大的芯片群。」Brundage 在最近的播客采访中说道。

此外,Claude系列人工智能模型背后的公司Anthropic的首席执行官Dario Amodei表示,DeepSeek的成果使得出口管制政策比一周前变得更加重要。

误解三:DeepSeek 对 Nvidia 构成严重威胁

现实:DeepSeek 的 R1 模型对 Nvidia 来说可能并不像有些人想象的那么令人担忧。

DeepSeek 的热议引起了 Nvidia 投资者的恐慌,导致其股价在 1 月 27 日下跌 17%,市值蒸发近 6000 亿美元。这家芯片巨头的股价从 1 月 28 日的大幅下跌中恢复过来,但在 1 月 29 日又下跌了 4%。

虽然 DeepSeek 的 R1 模型可能减少了对 Nvidia 等公司大量专用 AI 硬件的需求,但这并不意味着这家芯片巨头将走向灭亡。

微软首席执行官萨蒂亚·纳德拉指出,DeepSeek 的影响可能会增加对高级 GPU 的需求,这反常识。「杰文斯悖论再次来袭!」纳德拉在 X 上的一篇文章中写道。

杰文斯悖论是一种经济理论,它表明当技术进步使资源的利用更加高效时,该资源的总体消耗往往会增加。

科技投资者 Andrew Ng 也表示,DeepSeek 的结果是否会减少对 GPU 和计算能力的需求还有待观察。他在 X 上的一篇文章中表示:有时,让每单位商品更便宜,可以带来更多美元用于购买该商品。

误解四:DeepSeek R1 是一个完全开源的模型

现实:DeepSeek R1 可以免费下载、修改和重复使用,但它可能不被视为真正的开源。

DeepSeek R1 的出色成绩被许多人解读为中国在 AI 霸主地位争夺战中领先于美国的标志。但除了地缘政治角度之外,DeepSeek 的成功也被视为开源 AI 战胜封闭 AI 的标志。

Meta 首席人工智能科学家 Yann LeCun 对此表示赞同:DeepSeek 受益于开放研究和开源(例如 Meta 的 PyTorch 和 Llama)。他们提出了新的想法,并在其他人的工作基础上构建了这些想法。因为他们的工作是公开的和开源的,所以每个人都可以从中受益。这就是开放研究和开源的力量。

R1 的底层模型架构和权重(用于指示 AI 模型如何处理信息的数值)已在宽松的 MIT 许可下公开。这意味着该模型可以不受限制地部署。

但 R1 并不符合广泛接受的开源定义。根据开放源代码促进会 (OSI) 的规定,真正的开源 AI 模型必须提供有关用于训练 AI 的数据、用于构建和运行 AI 的完整代码以及训练中的设置和权重的详细信息。

用于训练 R1 的数据尚未公开。训练代码和其他训练说明也尚未提供。开源 AI 开发人员通常对发布训练数据集持谨慎态度,因为这可能会引发侵犯版权的诉讼。

误解五:DeepSeek 的 AI 模型存在额外的隐私风险

现实:DeepSeek 的 AI 与其他 LLM 一样,对隐私构成同样的风险

DeepSeek 的迅速崛起也引发了用户和政府对数据隐私的担忧。其中一些担忧源于这家人工智能初创公司的中国背景,而另一些人则指出了其人工智能技术的开源性质。

DeepSeek 在其隐私政策中明确表示:我们将收集的信息存储在位于中国的安全服务器中。

然而,Perplexity 首席执行官 Aravind Srinivas 等科技行业人士曾多次试图缓解这种数据保护担忧,他们指出 DeepSeek 的 R1 模型可以下载并在笔记本电脑或其他设备上本地运行。运行本地实例意味着用户可以私下与 DeepSeek 的 AI 进行交互,而公司不会获取输入数据。

Srinivas 表示,Perplexity 托管的 R1 模型位于美国和欧盟的数据中心,而不是中国。他还声称,Perplexity 托管的 R1 版本不受审查限制。

来源:鞭牛士

相关推荐