DeepSeek崛起!中美AI竞赛新格局,CNBC深度访谈揭秘其成功之道

B站影视 2025-01-27 16:54 1

摘要:在2025年初的科技圈,一个名为DeepSeek的中国AI初创公司引发了全球范围内的广泛关注。1月20日,DeepSeek正式推出了其DeepSeek-R1模型,并慷慨地开源了模型权重,这一举动立即在业界掀起了波澜。

在2025年初的科技圈,一个名为DeepSeek的中国AI初创公司引发了全球范围内的广泛关注。1月20日,DeepSeek正式推出了其DeepSeek-R1模型,并慷慨地开源了模型权重,这一举动立即在业界掀起了波澜。

DeepSeek-R1模型以其低廉的成本和卓越的性能,在众多第三方测试中脱颖而出,甚至超越了OpenAI的最新模型o1,这一成就不仅震惊了硅谷,也让meta等科技巨头内部感到了前所未有的压力。据报道,meta的工程师们正紧锣密鼓地尝试复制DeepSeek的成功经验。

DeepSeek的出色表现吸引了大量用户,其服务器几度因访问量过大而宕机。更令人瞩目的是,DeepSeek在苹果中国地区和美国地区的应用商店免费App下载排行榜上迅速登顶,并在美区下载榜上超越了ChatGPT,成为了新的热门应用。

DeepSeek的成就也赢得了国内外众多大佬的高度评价。微软首席执行官萨蒂亚·纳德拉在世界经济论坛上称赞DeepSeek的新模型令人印象深刻,表示中国AI的进步必须被认真对待。谷歌前CEO埃里克·施密特也在节目中改变了美国在AI方面保持领先优势的看法,他认为中国在过去6个月里以非同寻常的速度迎头赶上,DeepSeek就是其中的代表之一。

AI科技初创公司Scale AI的创始人亚历山大·王也公开表示,DeepSeek的AI大模型性能与美国最好的模型相当。著名投资公司A16z的创始人马克·安德森更是发文称DeepSeek-R1是他见过的最令人惊叹的突破之一,而且还是开源的,这是给世界的一份礼物。

不仅如此,DeepSeek还受到了游戏科学创始人冯骥的盛赞,他认为DeepSeek可能是个国运级别的科技成果。金沙江创投的朱啸虎也称DeepSeek是技术理想主义者的胜利。

外媒对DeepSeek的报道也络绎不绝。英国《金融时报》称中国小型AI初创公司DeepSeek震惊硅谷,Business Insider则指出DeepSeek-R1模型的开源为美国AI玩家带来了麻烦。CNBC更是推出了长达40分钟的专题报道,探讨DeepSeek对美国AI主导地位的冲击。

在CNBC的节目中,美国AI初创公司Perplexity的首席执行官Aravind Srinivas分析了DeepSeek对美国AI的影响,并给予了高度评价。他认为,虽然中国在AI竞争中存在硬件资源等劣势,但由于需求是发明之母,中国团队找到了许多数值稳定的方法,构建出了更高效的解决方案。DeepSeek-R1模型不仅在API价格上比GPT-4便宜10倍,速度极快,而且在某些基准测试中表现更好。他们用较少的计算资源和预算,做出了如此惊人的模型,并且免费公开了技术论文。

Aravind Srinivas还表示,DeepSeek的创新让他感到惊讶,他们的技术论文中提出了许多聪明的解决方案,如混合专家模型和8位浮点训练等。这些创新不仅让DeepSeek在AI竞赛中脱颖而出,也为整个行业带来了新的启示。

对于DeepSeek对美国AI生态系统的影响,Aravind Srinivas认为,如果整个美国AI生态系统都依赖于中国的开源模型,那将是非常危险的。但他也表示,美国公司不应该把所有的精力都放在禁止和阻止中国上,而是应该努力超越他们,赢得竞争。他认为meta等美国公司仍然有能力构建出比DeepSeek更好的模型,并将其开源。

DeepSeek的成功不仅改变了AI领域的格局,也引发了人们对大型语言模型商业化的思考。Aravind Srinivas认为,随着预训练和后训练系统的逐渐商业化,今年会有更多的商业化尝试。推理模型也会经历类似的轨迹,最初可能只有一两个玩家知道如何做到,但随着时间的推移,更多的玩家会加入。

来源:ITBear科技资讯

相关推荐