摘要:中国人工智能实验室DeepSeek推出的人工智能语言模型R1堪称一场地震。它在所有应用商店榜单上超越了美国的竞争对手ChatGPT,触发科技股市高达1万亿美元的抛售,并在硅谷引发末日般的评论。
中国人工智能实验室DeepSeek推出的人工智能语言模型R1堪称一场地震。它在所有应用商店榜单上超越了美国的竞争对手ChatGPT,触发科技股市高达1万亿美元的抛售,并在硅谷引发末日般的评论。
美国知名风险投资家马克·安德森(Marc Andreessen)将R1的发布誉为全球人工智能发展竞赛中的“斯普特尼克时刻”(Sputnik moment),比肩当年苏联通过发射卫星而令冷战对手美国震惊的历史性事件。
对美国人的震惊有多大呢?英伟达,作为为AI模型提供支持的领先计算机芯片制造商,股价暴跌17%,市值蒸发近6000亿美元,跌幅创美国股市最高记录。谷歌母公司损失了1000亿美元,微软损失了70亿美元。美国总统唐纳德·特朗普表示,DeepSeek应该成为“美国行业的警钟,我们需要全力以赴,专注于竞争以取得胜利”。
根据DeepSeek的说法,其R1模型在“各种基准测试”中表现优于OpenAI的o1-mini模型,而Artificial Analysis的研究表明,R1模型在整体质量方面也超越了谷歌、Meta和Anthropic开发的模型。
业界的震动不仅源于质量的高低,还在于DeepSeek声称仅花费不到600万美元就训练出了一款可与ChatGPT媲美的人工智能模型。相比之下,OpenAI的主要合作伙伴微软计划今年在人工智能基础设施上投入约800亿美元。
DeepSeek拿出的,不仅仅是“中国的ChatGPT”, 代表着中国对OpenAI的回应,R1的影响要大得多,原因有几个方面。
思维链模型:推理飞跃
首先,它是一种“思维链”模型,这意味着当你给它一个查询时,它会通过自我推理来给出答案:这种技巧看似简单,但极大地提高了回答质量。
反复测试表明,DeepSeek-R1在解决数学和科学问题方面的能力与OpenAI于2024年9月在旧金山发布的o1模型相当,而后者的推理模型被认为是行业领先者。
OpenAI当时表示,o1的工作方式比以前的大语言模型(LLM)更接近人类的思维方式。“在回答之前进行思考,先生成一条长长的内部思维链再响应用户”, 这是OpenAI对其自身创作的描述。
在此一方面,R1不仅可以直接与o1进行比较,还增强了自身回答数学和编程问题的能力——这些问题在AI专家中被高度重视。不仅如此,R1的能力不限于数字和代码,它在语言处理和自然语言推理任务中的表现也令人印象深刻,这意味着其高效的方法适用于更广泛的应用,而不仅仅是结构化问题求解。
此外,R1还更具可访问性。它不仅通过应用程序免费提供使用(而OpenAI的o1则需要每月支付20美元),而且对于开发者来说,完全免费,可以下载并集成到他们的业务中。例如,基于其出色的性能和低成本,R1将鼓励更多科学家在日常研究中尝试使用大语言模型,而无需担心成本问题。
除了低成本,R1的开放性可能会给科学研究带来颠覆性的变化:通过其应用程序接口(API),研究人员可以花费专有模型成本的一小部分使用该模型,或者通过在线聊天机器人DeepThink免费查询。此外,他们还可以将该模型下载到自己的服务器上,免费运行并在此基础上进行开发——这是像o1这样的封闭模型所无法实现的。
从人工智能研究的角度来说,DeepSeek展示了一种改进无数其他模型的方法。它通过使模型构建变得更便宜、更快速、更易于获取,代表了全球AI的重大进展。虽然LLM并不是通向先进AI的唯一途径,但DeepSeek的创新当得起“AI里程碑”的美誉。
Anthropic的联合创始人杰克·克拉克(Jack Clark)表示,该公司的模型Claude也受到启发。
“现在互联网上出现了一个开放权重的模型,任何足够强大的基础模型都可以通过它引导成为一个AI推理器,”
克拉克在他的新闻简报Import AI中写道:
“全球的AI能力刚刚实现了一次不可逆的进步。”
Anthropic另一位联合创始人达里奥·阿莫迪(Dario Amodei)则撰文表示,这背后是范式的改变。
“每隔一段时间,正在扩展的基础事物会发生一些变化,或者在训练过程中加入一种新的扩展方式。从2020年到2023年,主要的扩展内容是预训练模型:这些模型通过大量的互联网文本训练,并在其基础上进行少量额外的训练。而在2024年,使用强化学习(RL)来训练模型生成思维链的想法,成为了扩展的一个新重点。……这个新范式的特点是,首先使用普通类型的预训练模型,然后在第二阶段通过RL增加推理能力。”
DeepSeek在构建其R1模型时的重大创新是摒弃了人工反馈,设计算法来识别并纠正自身的错误。研究人员写道:
“DeepSeekR1-Zero展示了自我验证、反思和生成长链推理等能力……值得注意的是,这是首次通过强化学习验证大规模语言模型的推理能力可以仅通过这种方式进行激励。”
总之,DeepSeek先进的推理能力、创新的训练方法以及对可访问性的承诺,为人工智能的发展树立了新的标准。阿莫迪特别提到:
“我怀疑R1引起如此多关注的主要原因之一在于,它是第一个向用户展示模型推理过程(链式推理)的模型,而OpenAI的o1仅向用户展示最终答案。DeepSeek证明了用户对这一点感兴趣。”
他认为,这仅仅是一个用户界面设计的选择,与模型本身无关。
然而,所有这些因素使得R1的表现更容易被人们欣赏,就像2022年ChatGPT的聊天界面首次使人工智能变得触手可及一样。
▲ 图源Pexels
挑战硅谷现成叙事
颠覆AI发展方式
其次,R1的创建方法削弱了硅谷目前的AI发展方式。美国主导的方式是通过简单地增加更多的数据和计算能力来扩展现有模型,以实现更高的性能。这种方法导致了该行业能源需求的巨大增加,并使科技公司与政客紧密相连。开发AI的费用如此庞大,以至于科技公司希望借助国家来融资和兴建基础设施,而政客则希望购买它们的忠诚,并在支持高速增长的公司方面表现积极。
一个典型的例子就是特朗普在1月早些时候宣布的5000亿美元“星际之门”(Stargate)计划,号称“历史上最大的人工智能基础设施项目”——一个由OpenAI、甲骨文和软银联合投资的合资项目,旨在在全美范围内建立数据中心网络,目标是建设支持人工智能开发所需的关键数据中心和计算基础设施。
然而,在R1问世之后,特朗普说他一直在“阅读有关中国”及其公司的内容,特别是一家提出了“更快且更低成本的人工智能方法”的公司。“这很好,因为你不需要花费那么多钱。我将其视为一种积极的因素,一种资产,”特朗普表示。
市场对旧AI发展方式受到的冲击反应迅速且猛烈。《金融时报》报道称,对冲基金Elliott Management在一份致投资者的通知中表示,人工智能被“过度炒作”,而作为这一热潮的大赢家之一的英伟达正处于一个“泡沫”之中。
作为主导AI行业的芯片供应商,人们把英伟达与19世纪加利福尼亚淘金热时期的“铁锹和水桶商”作比较,因为它恰好在金矿高潮中出现,成为世界上最富有行业的主要供应商。然而随着DeepSeek的崛起,科技公司可能会开始质疑是否还需要像以前那样大量购买英伟达的工具。
从长远来看,AI领域的新竞争者对英伟达来说,可能会是个好消息吗?其他公司在AI军备竞赛中投入的计算能力是否代表了浪费的资金?通过开发出一个与美国同行相匹敌、在许多方面超越它们的AI模型,DeepSeek挑战了硅谷的故事,即技术创新需要庞大的资源和最小的监管。
DeepSeek做了什么是财力雄厚的OpenAI没有做到的呢?很难确定答案,因为OpenAI对其GPT-o1模型的训练过程一直非常保密。不过,两家公司在方法上的一些明显差异,以及DeepSeek似乎在某些领域取得的令人印象深刻的突破,都值得关注。可能最大的差异——也是导致像英伟达这样的芯片制造商股票暴跌的原因——在于DeepSeek能以远高于其规模对手的效率创造出竞争模型。
OpenAI能否转向高效?当然可以。但其与微软的合作伙伴关系和问题重重的领导结构可能使这种转变昂贵得多。这家公司深度整合了微软的Azure基础设施——曾经看似是战略优势——不过现在看起来越来越像一种负担。虽然OpenAI一直在推动客户转向微软庞大的数据中心,但市场正在发现一条不同的道路:高效的开源AI模型,可以在明显更便宜的基础设施上运行。
OpenAI的方式与新兴的轻量级、可访问AI之间的鲜明对比使得该公司面临一个特别困难的局面。它的整个商业模式,建立在高昂定价和假设先进AI需要云计算和庞大数据中心的前提下,正在受到竞争者的挑战,后者通过更加精简的操作取得了大致相当的结果。
近年来,OpenAI通过将现有的机器学习算法扩展到前所未有的规模,在语言处理领域实现了一系列令人瞩目的突破。其GPT-4可能是通过使用数万亿单词的文本以及数千个强大的计算芯片进行训练的,整个过程耗资超过1亿美元。
然而,早在2023年4月,公司CEO山姆·阿尔特曼(Sam Altman)就表示,进一步的进展不会来自于模型规模的继续扩大。
“我认为,我们已经到了这个巨型模型时代的尽头,我们会以其他方式改进它们。”
此声明表明,GPT-4或许是OpenAI通过扩大模型规模并输入更多数据这一策略所产生的最后一次重大进展。当时,阿尔特曼并未说明将取而代之的研究策略或技术可能是什么。在描述GPT-4的论文中,OpenAI表示,其估算结果显示,扩大模型规模的回报出现递减。阿尔特曼还说,公司能够建设数据中心的数量以及建设速度也存在物理限制。
不过这并不妨碍包括Anthropic、AI21、Cohere和Character.AI在内的许多资金充裕的初创公司,投入巨大的资源,致力于构建越来越大的算法,试图赶上OpenAI的技术。直到DeepSeek出现的时刻。
R1颠覆了“扩展是前进之路”的普遍认知。据认为,R1的开发成本比OpenAI的o1便宜95%,而且仅使用了Meta的Llama 3.1模型十分之一的计算能力。能够以极小的预算实现等效的性能,才是R1令人震惊之处,这也是它发布后产生巨大影响的原因。这表明,美国公司可能在浪费资金,且更灵活的竞争者能够击败它们。
DeepSeek粉碎了“AI霸主地位需要亿万美元支票”的神话。更进一步地,DeepSeek的发展引发了对AI基础设施(如芯片)重大投资必要性的质疑,并对美国科技公司在AI领域的市场领先地位产生了影响,这可能会对美国科技行业的估值施加压力。
美国投资银行高盛的分析师在2024年6月发布了一份题为《生成式AI:过多的支出,过少的收益?》的报告,敲响了AI投资的警钟。该报告质疑未来几年内对AI的1万亿美元投资是否“值得”,并表达了对投资回报的担忧,而这种担忧现在被DeepSeek的案例所加剧。
如同Forrester的分析师所说。DeepSeek刚刚“打开”了AI投资回报的路径。由于精妙的优化,训练模型的成本壁垒大幅降低,预计这些优化方法将被全球的模型开发者复制并改进。
短期来看,这对英伟达来说是个坏消息,因为它将抑制需求。然而,从长期来看,较低的成本(以及因此而降低的能耗)将为更多的初创企业和企业提供创建模型的机会,从而增加整体需求。这进一步验证了一个事实:仅依靠提供核心AI基础模型的供应商是不够的,此一颠覆性转变将进一步打开AI模型市场的大门。对于技术领导者而言,这应该是一个强烈的信号,要求他们认真审视对AI领域几个大玩家的过度依赖。
▲ 图源Pixabay
新冷战:人工智能的两个世界?
由此,DeepSeek改变了全球AI格局,但尚待观察的是,DeepSeek对美中“新冷战”的影响。这种情形与冷战初期的“Sputnik时刻”的确有异曲同工之处。那时,苏联成功发射人造卫星让美国感到自身的技术优势受到威胁,并迫使美国加大对科学技术、尤其是太空探索的投入。而这一次,DeepSeek的突破可能会引发美国对AI技术的紧急反应,促使政府和企业加大投入,确保在未来的技术竞争中保持领先地位。
DeepSeek的成功无疑会对美国政治产生深远的影响。硅谷和华盛顿曾深信美国在AI领域遥遥领先于中国,但现在,一家中国小公司凭借有限的资源,创造了比硅谷想象中还要出色的AI技术。这无疑让美国的决策者感到震惊,也使他们开始质疑,若中国能够在如此短的时间内实现这一突破,那未来它可能还会带来怎样的惊人创新。
DeepSeek的成就或许会成为一个警钟,提醒美国技术领域的领导者,不仅要关注当前的技术优势,还需要认识到全球技术竞争的复杂性和不可预测性。这种重新评估可能会推动美国在AI领域加速创新,同时也可能加剧美中之间的技术竞争和战略对抗。
在中美人工智能对抗中,围绕计算资源及其获取的表述,在过去这几年似乎被赋予了“万能解决方案”的意味,用以赢得“人工智能竞赛”。这种表述方式为很多论点创造了叙事空间,例如,声称对人工智能行业进行监管会削弱国家安全,同时也会削弱美国与中国竞争的能力。
这样的论点强调了美国必须不惜一切代价,在发展通用人工智能(AGI)所需的计算能力上超越中国,以便在中国“赶上”之前取得领先。这促使一些人工智能公司貌似有力地辩称,快速建设大规模数据中心带来的负外部性,不过是为了开发AGI不得不付出的代价。
这样的论点对人工智能公司来说具有显著的商业潜力,因为它们通过积累更多的芯片来获得竞争优势。虽说DeepSeek的崛起对美国过度关注计算能力是个讽刺,但美国技术领域的领导者的冷战思维已然积重难返。如达里奥·阿莫迪就预测,在2026-2027年,人工智能可能会最终进入两个截然不同的世界之一。
“在美国,多家公司肯定会拥有所需的数百万块芯片(以数百亿美元的成本)。问题是中国是否也能获得数百万块芯片?如果中国能够做到,我们将生活在一个两极世界中,美国和中国都将拥有强大的人工智能模型,这将导致科学和技术的飞速发展……
如果中国无法获得数百万块芯片,我们将(至少暂时)生活在一个单极世界中,只有美国及其盟友拥有这些模型。单极世界是否会持久尚不清楚,但至少存在一种可能性,即由于人工智能系统最终可以帮助制造更智能的人工智能系统,暂时的领先优势可能会转化为持久的优势。因此,在这个世界中,美国及其盟友可能会在全球舞台上取得支配且持久的领先地位。”
为了增加美国领先的单极世界出现的可能性,几乎是必然地,美国要祭出国家安全这个法宝。DeepSeek的迅速崛起引发了美国的国家安全担忧,远胜于TikTok。白宫新闻发言人卡罗琳·莱维特(Karoline Leavitt)在她的首次新闻发布会上表示,国家安全委员会正在“调查”DeepSeek可能带来的安全影响。与此同时,美国海军已经禁止其成员使用DeepSeek,理由是“潜在的安全和伦理问题”。美国众议院首席行政事务官也向国会办公室发出通知,警告不要使用DeepSeek的服务。
美国最初禁止TikTok的主要原因之一是担心其中国母公司字节跳动从美国用户那里收集大量数据。如果美国人开始使用DeepSeek来管理他们的生活,其隐私风险将类似于“强化版的TikTok”。相对而言,TikTok收集的信息主要是无害或通用的数据,但大型语言模型的拥有者可以更深入地了解用户的个性、兴趣,以及他们的希望和梦想。
从潜在经济影响的角度来看,DeepSeek的崛起确实对美国最具价值的科技公司产生了巨大压力,特别是那些在AI领域投入巨资的公司。然而,除了这些经济后果之外,国家安全的具体影响仍不明确。这其中的关键问题在于如何界定AI技术的安全性,特别是当它们跨越国界并由不同的国家监管时。
DeepSeek的模型在提高效率和降低成本方面取得了突破,然而这些技术如何被利用,以及它们可能带来的信息泄露和间谍活动风险,仍然是未解之谜。随着AI的全球化应用,国家安全层面的挑战也变得愈加复杂,如何有效监管这些技术成为了一个亟待解决的问题。
▲ 图源Pixabay
AI应该人人能负担并可获取
所有这一切都意味着R1发布的确切影响是无法预测的。涉及的因素太复杂,未知数太多,无法确定未来会怎样。然而,这并没有阻止科技界和市场的疯狂反应,CEO们惊慌失措,股价暴跌,分析师们急忙修正行业预测。而这实际上正展示了AI领域的特点:它充满了热度、不确定性和过度反应。
可以确定的是,实现下一个层次的人工智能智能仍然需要大量的计算资源。推动我们迈向下一个里程碑的因素仍然不确定——是规模、数据、微调、强化学习,还是完全不同的其他因素。DeepSeek目前代表了我们所知道的最先进技术,但它并不是下一个层次的人工智能。
不过我们仍然可以断言:DeepSeek R1代表了人工智能发展中的一个重要里程碑。AI行业现在正处于十字路口:通往AI主导地位的道路可能不再是由庞大的数据中心和巨额预算铺就,而是通过优雅的算法和无情的高效性,最终将人工智能从象牙塔带入到大众手中。
在接受中国媒体采访时,梁文锋表示:“AI应该是人人都能负担得起并可获取的。”这一点,就是DeepSeek的最大意义之所在。
来源:胡泳