从“小猪”到“强者”:DeepSeek 如何颠覆AI行业并改变中国叙事

B站影视 2025-02-08 11:16 1

摘要:2022 年,人工智能初创公司 DeepSeek的创始人以“一只普通的小猪”的笔名悄悄向中国慈善机构捐赠了 1.38 亿元人民币(1900 万美元)。据报道,这个名字是对王小波黑色幽默短篇小说《一只特立独行的猪》的致敬,掩盖了梁文锋的真实身份,梁文锋的量子交易

2022 年,人工智能初创公司 DeepSeek的创始人以“一只普通的小猪”的笔名悄悄向中国慈善机构捐赠了 1.38 亿元人民币(1900 万美元)。据报道,这个名字是对王小波黑色幽默短篇小说《一只特立独行的猪》的致敬,掩盖了梁文锋的真实身份,梁文锋的量子交易业务幻方量化(High-Flyer Quant)正面临越来越大压力。

同年1月28日,梁文锋旗下的对冲基金幻方量化向公众发表声明,否认其量子交易导致中国股市暴跌。

“最近几天,市场有传言称量化交易机构协同抛售导致市场下跌,”幻方量化表示。“我们与业内主要参与者的管理人员进行了讨论,他们都否认了这一说法。请不要相信这些传言,谢谢。”

三年后,幻方量化的子公司 DeepSeek 因真正导致美国股市动荡而登上头条新闻。1 月 27 日,大规模抛售导致近 1 万亿美元的科技股蒸发,仅英伟达一家就蒸发了 6000 亿美元。

催化剂是 DeepSeek 发布了 R1 推理模型,而就在几周前,该公司刚刚发布了更传统的 V3 大型语言模型 (LLM)。这些模型的性能可与 OpenAI 的产品相媲美,但成本却只是后者的一小部分,这让人们对美国芯片和人工智能公司高估值背后的假设产生了怀疑。

硅谷风险投资家 Marc Andreessen 称赞 R1 模型为人工智能的“人造卫星时刻”,指的是苏联将第一颗卫星送入太空,刺激了与美国的太空竞赛。德意志银行分析师 Peter Milliken 表示,“这更像是中国的人造卫星时刻”,显示了中国在人工智能创新和能力方面的整体实力。

甚至美国总统唐纳德·特朗普也注意到了这一点,称DeepSeek是人工智能主导地位争夺战的“警钟”。

中国的新闻界热情洋溢,新华社本周在一篇社论中称,DeepSeek“有望掀起新一轮人工智能创新浪潮”,这将加速构建自主可控的产业生态进程。

《科技日报》表示,DeepSeek 的突破挑战了西方的“计算霸权”。“DeepSeek 就像一道强光,穿过雾气,”它说。中国著名生命科学家饶毅称 DeepSeek 是自 1840 年代鸦片战争以来中国最伟大的发明,一位科技高管在一篇广泛分享的社交媒体帖子中写道,DeepSeek 可以改变中国的国家命运。

DeepSeek 的突破是在 OpenAI 于 2022 年底推出 ChatGPT 以来,中国在 AI 竞争中被美国逼入绝境之际取得的。美国收紧了对中国先进芯片的出口管制,尤其是英伟达的图形处理单元 (GPU),这些芯片被视为训练 AI 模型不可或缺的,这剥夺了中国在战斗中最强大的武器。与此同时,中国的人工智能公司因资本市场较小而处于不利地位,这使得它们无法与美国同行的惊人支出相提并论。

凭借在 AI 进步方面的领先地位和对先进芯片的近乎垄断,美国已成为该行业最强大的全球参与者。就中国而言,它一直在炫耀自己的肌肉。不确定性的情况下,OpenAI 使 ChatGPT 在中国无法访问。去年夏天,它填补了一个漏洞,该漏洞允许人们在没有虚拟专用网络的情况下使用其应用程序编程接口 (API),从而阻止了该国的互联网协议地址。中国实际上被当作伊朗或朝鲜对待。

DeepSeek-R1 打破了成为 AI 领导者需要多少资金的观念,从而重置了这种叙事。

中国正洗刷了自 ChatGPT 推出以来的自卑感和自我怀疑。中国在该领域的传统优势,如海量数据,突然之间显得无关紧要。

现在是 OpenAI 首席执行官山姆·阿尔特曼 (Sam Altman) 在进行自我反省。他最近表示,他的公司在其专有模型方面站在了“历史错误的一边”,并指出开源模型已经取得了进步。他说 OpenAI 需要一个 “不同的开源策略”,但补充说这不是一个高度优先事项。

虽然 OpenAI 表示,它有证据表明 DeepSeek 在未经适当授权的情况下使用一种称为蒸馏的过程在这家美国公司的数据上训练其模型,但当阿尔特曼表示他没有起诉计划时,对 DeepSeek 的怀疑很快就烟消云散了。

DeepSeek 在海外的受欢迎程度也引发了隐私问题。出于隐私和安全考虑,意大利、澳大利亚和韩国以及美国海军和美国宇航局已禁止在设备上使用DeepSeek。然而,由于 DeepSeek 的模型是开源的,英伟达、Microsoft 和 Amazon.com 等美国科技巨头提供了不向中国发送数据的托管解决方案。

“永远不要低估中国科学家和工程师的聪明才智,”中国常驻联合国代表傅聪周二在纽约举行的新闻发布会上说。“从华为到 TikTok,再到现在的 DeepSeek——美国还想禁止多少?”

金融服务公司 Gavekal 的分析师 Tilly Zhang 指出,DeepSeek 展示了中国公司如何在软件创新方面取得显著进步,缓解了美国出口管制对硬件的限制。“AI 领导地位的竞争不再只是谁能获得最好的芯片,而是谁最好地利用它们,”Zhang 说。

在国内,DeepSeek 的影响力急剧上升,将一些人曾经称之为默默无闻的对冲基金“副业”变成了民族自豪感和技术实力的源泉。它已迅速成为中国混乱的 AI 行业的重心,从 GPU 开发商到云服务提供商,主要参与者都向这家低调的公司致敬。

中国的芯片开发商和 AI 基础设施服务提供商,包括 Moore Threads 和 Iluvatar Corex,争先恐后地调整他们的硬件以运行 DeepSeek 模型,希望这家初创公司能够引领创建完全自主的 AI 链。例如,总部位于深圳的 AI 开发人员一站式服务和平台 Gitee AI 表示,它通过由上海芯片设计公司 MetaX 的 GPU 提供支持的服务器提供四个基于 DeepSeek-R1 的模型。Microsoft GitHub 的中国替代品 Gittee 补充说,它已经“实现了从芯片和平台到计算能力和模型对国产技术和中国制造的充分利用”。

除了 GPU 开发商之外,中国的主要云服务提供商——包括腾讯控股、华为技术、百度和阿里,在中国消费者和企业的需求飙升的情况下,加班加点地在各自的平台上支持 DeepSeek 的新模式。

与此同时,DeepSeek 自己的应用程序于 1 月初发布,也得到了快速采用。中国消费者在农历新年假期期间争先恐后地下载聊天机器人,并生成了庆祝这个节日的诗歌和文章。

根据追踪全球 AI 服务受欢迎程度的网站 Aicpb.com 汇编的最新数据,DeepSeek AI 助手在 Android、Apple iOS 和 Web 上作为免费应用程序提供,1 月份平均每天活跃用户 (DAU) 为 2220 万,超过了豆包同期的 1700 万 DAU,成为中国最受欢迎的 AI 应用程序。

已经有早期迹象表明,DeepSeek 效应已经开始向下游渗透到其他行业,为中国的智能制造工作等领域提供支持。据报道,在香港上市的 UBTech Robotics 是人形机器人的领先制造商之一,已开始在其机器人上测试 DeepSeek。在医疗保健市场,当 AI 医疗平台 ClouDr 加入 DeepSeek-R1 时,这家中国公司在香港上市的股票价格飙升。

开发人员的需求如此之大,以至于 DeepSeek 在周四暂时阻止了用户为其账户充值以通过其 API 访问模型。在上海和深圳的在岸股票市场,在投资者的狂热中,即使是与 DeepSeek 无关的公司股票也飙升。在香港,恒生科技指数(其中最大的成员包括腾讯和小米)周四接近四个月高点,此前过去两周上涨了 10% 以上,这要归功于 DeepSeek 成功后的强劲购买。

在所有备受瞩目的关注中,DeepSeek 一直保持低调。该公司位于杭州市中心一处商业地产的办公室成为科技和求职者的圣地,而梁文锋的家乡在农历新年假期返回时,也给了这位企业家英雄般的欢迎。然而,该公司避免宣传自己,对谣言和自己的成就保持沉默。

在 2024 年 5 月 DeepSeek-V2 推出后,梁文锋在接受中国当地科技媒体 36Kr 的早期采访时,对中国公司不愿意进行自己的前沿研究表示失望。“中国必须成为 [全球创新] 的贡献者,而不仅仅是总是搭便车,”他说。他指出,创新是由好奇心和创造欲望驱动的,而不仅仅是业务需求。

在广泛分享的关于梁文锋和 DeepSeek 的简介中,这家初创公司被描述为“技术理想主义的极端案例”,其创始人对通过创新改变世界有着清晰的愿景。

梁文锋远非一只“普通的小猪”,所有的目光都集中在梁文锋身上,因为他现在牢牢地站在中国人工智能革命的最前沿。

来源:科技新鲜汇Tech

相关推荐