摘要:中国AI初创公司深度求索(DeepSeek)在训练其DeepSeek-R1-Zero模型过程中观察到这一特别现象,将其称为“顿悟时刻”(Aha Moment)。
DeepSeek的开源策略不仅降低了AI技术的使用门槛,使AI应用生态从“寡头游戏”转向“全民参与”,还使得其影响力迅速扩散到全球。
“等等,等等。这一步可能有误。”
这是AI首次展现出像人类一样的思维和内心独白——就像人类在解决难题时,突然意识到之前的思路可能有问题,从而停下来重新思考。
中国AI初创公司深度求索(DeepSeek)在训练其DeepSeek-R1-Zero模型过程中观察到这一特别现象,将其称为“顿悟时刻”(Aha Moment)。
DeepSeek团队在研究论文中写道,这一时刻不仅是模型的“顿悟时刻”,也是观察其行为的研究人员的“顿悟时刻”。“‘顿悟时刻’强有力地提醒我们,强化学习有可能在人工智能系统中解锁新的智能水平,为未来更自主、更具适应性的模型铺平道路”。
1月11日,DeepSeek在全球上线APP;1月20日,DeepSeek正式发布最新开源模型R1,以极低的训练成本实现了与OpenAI顶尖模型相当的性能。
1月26日,DeepSeek在苹果公司的App Store免费应用下载榜上以惊人的速度攀升至全球第一,并且在此后持续保持优势地位。不久又在约140个国家的手机应用下载排行榜上占据榜首。
1月31日,英伟达、亚马逊和微软三家美国科技巨头在同一天宣布接入DeepSeek-R1。
DeepSeek引发的现象级效应,于全球AI领域而言,又何尝不是一个“顿悟时刻”—— AI大模型原来不一定只有砸钱、砸算力才能做出来。“低成本中国模型的成功动摇美国科技优势”,最新一期《经济学人》封面文章以此为题。“DeepSeek挑战了人工智能产业在过去一段时间的关键理念,即认为更强大的硬件才是推动人工智能发展的关键。”英国《金融时报》直言。
顿悟的不止科技界,还有金融界——“DeepSeek的崛起可能会使美国科技公司的‘天价估值’受到质疑”,德意志银行(下称“德银”)表示。
当越来越多的“顿悟时刻”开始出现,AI产业的游戏规则,或正在被改写。
“小力出奇迹”
DeepSeek的颠覆性并非来自技术上的突破性进展,而在于通过算法优化和模型压缩技术,大幅降低了训练和推理的成本。
DeepSeek出现之前,科技巨头采取的是“大力出奇迹”的策略:构建更大的模型,使用更大的数据集,部署更大的算力。
OpenAI训练ChatGPT-4的成本高达7800万美元,甚至可能达到1亿美元。而DeepSeek大模型训练成本不到600万美元,仅为同性能模型的5%到10%。
低成本意味着美国科技巨头试图用巨额投资构筑的“护城河”被攻破,大模型训练不再是科技巨头的专利。
“DeepSeek成功打破了人工智能行业此前的一种模式:如果想参与人工智能竞赛,就必须预先投入数十亿美元建设数据中心。美国企业试图用巨额投资构筑‘护城河’,但与传统行业不同,人工智能领域的先发优势并不绝对。”德国《世界报》如是说。
“长期以来,欧洲自认在人工智能竞赛中毫无胜算,因为欧洲无法像美国科技巨头那样筹集到巨额资金以建立强大算力。DeepSeek模型表明,即使资金和计算能力有限,也能开发出优秀的人工智能模型,这为欧洲研究人员开辟了一条道路。”瑞士《新苏黎世报》认为,DeepSeek的经验为欧洲研发先进的人工智能模型提供了一条可借鉴之路。
开源的阳谋
如果说DeepSeek通过低成本打破了美国科技巨头的“资本护城河”,那么,其开源策略则将攻下硅谷的“技术护城河”。
与OpenAI、Anthropic等美国科技巨头的闭源模式不同,DeepSeek选择了将其大模型开源,并发布了详细的论文和技术文档,供全球开发者和研究人员使用。
这一策略不仅降低了AI技术的使用门槛,使AI应用生态从“寡头游戏”转向“全民参与”,还使得DeepSeek的影响力迅速扩散到全球。
“我们正生活在一个特殊的时代:一家非美国公司在真正践行着OpenAI最初的使命——开展真正开放的前沿研究,为所有人赋能。”英伟达高级研究科学家Jim Fan评价道。
2月1日,OpenAI首席执行官奥尔特曼首次承认,OpenAI的闭源策略“站在了历史错误的一边”。“我们需要找到一个不同的开源策略”,“目前的OpenAI正处于一个‘复杂而微妙’的境地,并且面对重重挑战”。
DeepSeek开源的意义远不止于打破“技术护城河”。
近日,美国、意大利、澳大利亚、韩国等国家相继出台政策,对DeepSeek进行限制乃至封杀。
彭博社的专栏文章认为,DeepSeek的开源模式使得美国政府难以通过封杀手段限制其影响力,因为其技术和代码已经融入了全球AI社区。“华盛顿几乎不可能再去消除DeepSeek的影响了”。
硅谷的行动
面对DeepSeek的猛烈冲击,硅谷科技巨头行动迅速。
2月1日,OpenAI发布o3-mini,这是OpenAI首个开放给免费用户的推理模型。
2月5日,谷歌旗下AI大模型Gemini系列全面上新;几小时后,OpenAI宣布ChatGPT Search向所有人开放,无需注册。
OpenAI首席全球事务官Chris Lehane表示:“随着有关DeepSeek的消息传出,表明这是一场非常真实的竞争。无论谁在这场竞争中胜出,都将真正塑造未来世界的模样。”
当下正值美股财报季,在各大科技公司的财报电话会议上,DeepSeek成为了高频词汇。
芯片设计巨头ARM首席执行官Rene Haas称赞DeepSeek“对行业非常有益”,它提高了效率,降低了成本,扩大了对整体计算的需求。
美国超威半导体公司(AMD)首席执行官苏姿丰表示,DeepSeek正在推动“有利于AI应用”的创新,用更少的基础设施实现训练和推理能力的新方法是一件好事。
谷歌首席执行官桑达尔·皮查伊也承认,DeepSeek做得“非常出色” 。
高通首席执行官克里斯蒂安诺·阿蒙表示,DeepSeek-R1的推出是AI产业的一个转折点。其认为AI模型后续将变得更小、更高效、更为定制化,针对不同需求的垂直AI模型和AI应用将加速出现,AI的渗透率将变得更高。
Meta首席执行官扎克伯格表示,DeepSeek做了“许多新颖的事情”来快速且廉价地训练其模型,而Meta仍在“消化”这些想法。他补充说,DeepSeek已经取得了一些进展,Meta希望将其应用到自己的系统中。
美国数据软件巨头Palantir Technologies首席技术官Shyam Sankar表示,DeepSeek证明了AI模型正在“商品化”。“但我认为真正、更深刻的教训是,我们正在与中国进行一场人工智能军备竞赛”。“我们必须意识到,人工智能竞赛是赢家通吃的。动员起来的时候到了”。
重估中国资产
“就像1957年苏联发射斯普特尼克卫星震惊了整个西方世界一样,2025年可能成为全球投资界不得不重新审视中国实力的分水岭之年。”德银在最新发布的研究报告中写道。
DeepSeek造成的震动如海啸般从硅谷漫延至华尔街。外资已经开始对整个中国资产进行重估。
高盛最新研报强调,DeepSeek的崛起意味着AI行业的发展,正从硬件基础设施层向软件应用层转移,这一趋势为全球市场的多元化发展提供了新的机遇,尤其是中概科技股中长期价值重估的机会。
“DeepSeek的R1模型以不到600万美元的成本,实现了与GPT-4和Llama等领先模型相当的性能,更加光明的增长前景和技术突破,将带来巨大的生产力提升,有助于缩小美国与中国科技股或半导体股票之间高达66%的估值差距。”高盛研报指出。
高盛维持对MSCI中国指数的超配评级,预计以发布报告当日的66点为基准,该指数今年将上涨14%至75点,乐观预期下涨幅甚至将达到28%。
紧随高盛之后,德银也发布报告表示,低成本的DeepSeek-R1模型在海外的流行和应用深度的拓展,是中国知识产权得到认可的重要标志,显示出中国在高附加值领域的全新突破,也表明中国在全球供应链中的地位正以前所未有的速度扩张。
在德银看来,2025年将是投资界认识到中国在全球竞争中处于领先地位的关键一年。一方面,中国企业在多个制造和服务领域,提供了高性价比和优质产品。另一方面,随着政策支持消费和金融自由化,中国企业的盈利能力有望超出预期。
德银在报告特别提到,“DeepSeek的发布已经动摇了外界认为可以遏制中国的观点。”
来源:金融界