DeepSeek启示录:决定未来AI走向的三大议题

B站影视 2025-02-05 17:34 2

摘要:几周前,DeepSeek 引起了巨大轰动,现在热度稍微降了下来,媒体开始转向其他新闻话题,比如美国联邦政策的变化、清理研究数据以符合最新行政命令的要求,以及特朗普对加拿大、墨西哥等国家关税政策可能带来的影响等。

通常,一款新 AI 模型的发布不会在科技圈外引起太大轰动,更不会让股市因为恐慌而损失上万亿美元,但 DeepSeek 是个例外。

几周前,DeepSeek 引起了巨大轰动,现在热度稍微降了下来,媒体开始转向其他新闻话题,比如美国联邦政策的变化、清理研究数据以符合最新行政命令的要求,以及特朗普对加拿大、墨西哥等国家关税政策可能带来的影响等。

那么,DeepSeek 在人工智能领域会带来哪些长远的影响呢?新闻热度降温之后,以下是值得关注的三个议题。

AI 的能耗问题

首先,DeepSeek 的出现让业界重新审视人工智能的能耗问题,即人工智能模型在追求更佳答案的同时应该消耗多少能源才是最合理的。

想必大家已经有所耳闻 DeepSeek 非常高效节能,这在其训练阶段确实如此,然而在推理阶段,也就是当你向模型提问并期待得到答案时,情况就变得复杂起来了。

DeepSeek 采用了一种“思维链”技术,将复杂的问题(例如是否可以为了保护某人的感情而撒谎)分解成一系列小问题然后逐个击破。这种方法使得像 DeepSeek 这样的模型在数学、逻辑、编程等方面表现亮眼。

然而,这种“思维链”方式可能会比其他常见的人工智能模型消耗更多电力。尽管目前人工智能的能耗仅占全球总排放量的一小部分,但随着其应用越来越广泛,这个问题也将变得不容忽视。

我们需要考虑的是,是否所有的任务都值得这么高的能源消耗?而这取决于我们使用人工智能的目的,比如,为治疗严重疾病进行的医疗研究是非常值得的,但生成无意义的内容则不然。

一些业内专家担心,DeepSeek 的卓越性能促使大量公司将其整合到众多应用程序和设备中,这可能会导致终端用户在各种情景下频繁进行调用,进而带来不必要的资源浪费。比如,让 DeepSeek 解释爱因斯坦的相对论完全就是一种浪费,因为这根本不需要逻辑推理步骤,任何一个普通的 AI 聊天模型(甚至网络搜索)都能更快且更节能地完成任务。

脱离人工反馈训练模型

其次,DeepSeek 在其训练方法上的创新也值得注意,这可能会被其他公司效仿。

先进的人工智能模型不仅仅依赖大量文本、图像和视频来学习,它们还非常依赖人类工作者来清洗这些数据、对其进行标注,以及帮助模型选择更佳的答案。

人类工作者参与其中的一种方式是通过“基于人类反馈的强化学习(RLHF)”,这是一种将传统强化学习方法与人类反馈相结合的技术。模型生成一个答案,人类工作者对该答案进行评分,然后利用这些评分来改进模型。起初 OpenAI 率先使用了这项技术,现如今它已被业界广泛使用。

正如此前所报道的那样,DeepSeek 采用了不同的方法,它尝试一种自动化评分和强化学习过程的方法。“跳过或减少人类反馈是一件大事,这几乎完全是在脱离了人工反馈的情况下训练模型。”阿里巴巴前研究总监、以色列 AI 编码初创公司 Qodo 的联合创始人兼首席执行官 Itamar Friedman 表示。

这种方法在数学、编程等领域特别有效,但在其他领域则效果不佳,因此仍然需要依赖人类工作者。即便如此,DeepSeek 并没有止步于此,他们采用了类似 2016 年谷歌 DeepMind 训练 AI 模型以精通围棋的方法来进一步提升和优化技术。

就像训练 AI 预测棋局的各种可能动作及结果一样,DeepSeek 也让其系统学会了评估不同的选项并预测结果。由于这些技术创新已经被记录在 DeepSeek 的开源文档中,其他公司很可能会跟进和效仿。

开源还是闭源?

最后,DeepSeek 的成功激发了关于人工智能研究是否应开源的重要辩论。

早在 DeepSeek 免费发布其模型之前,一些 AI 公司就已经主张该行业需要公开透明。他们认为,如果研究人员遵循某些开源原则并展示他们的工作成果,那么全球开发超级人工智能的竞赛就可以被视为一项为公众利益而开展的科学研究项目,任何一个参与者的权力都会受到其他参与者的制衡。

这是一个美好的愿景,Meta 在很大程度上支持这一愿景。风险投资家 Marc Andreessen 也表示,“开源方法比政府监管更能有效地保护人工智能的安全。”

而 OpenAI 则持相反观点,认为模型闭源有助于防止被不法分子利用。考虑到 OpenAI 过往的立场,其首席执行官奥尔特曼在上周五 Reddit 问答互动中的表态令人惊讶,“在这一点上,我们站在了历史错误的一边,我们需要找到不同的开源策略。”他说道。

包括特朗普总统在内的很多人则强调,“需要进一步加强美国在人工智能领域的竞争力,将 DeepSeek 的成功视为一个警钟。”

Anthropic 创始人兼首席执行官 Dario Amodei 表示,“这也提醒我们,需要严格控制未来几年哪些类型的先进芯片出口到中国。”同时,一些立法者也支持类似的观点。

接下来的几个月,随着更多基于 DeepSeek 的技术和产品问世,这些问题将会得到进一步探讨和验证。

原文链接:

来源:麻省理工科技评论APP

相关推荐