DeepSeek挖了美国人工智能的根,被千般打压,欧洲却愿意接受

B站影视 2025-01-31 21:18 2

摘要:DeepSeek在去年12月发布了DeepSeek-V3模型,在仅使用2048颗英伟达H800 GPU的情况下,完成了6710亿参数模型的训练,成本约为560万美元,这远低于其他顶级模型的训练成本。

DeepSeek以一己之力将美国科技股大跌万亿美元,已经成为全球最热门的话题。

Deepseek现在几乎在每个国家都是顶级应用,在160个国家/地区中下载排名第一。

美国的变脸最快,从最初的不相信到夸奖,股市大跌后开始全面打压,几乎都没有过渡模式,一切都来得太快了。

DeepSeek在去年12月发布了DeepSeek-V3模型,在仅使用2048颗英伟达H800 GPU的情况下,完成了6710亿参数模型的训练,成本约为560万美元,这远低于其他顶级模型的训练成本。

1月20日发布的DeepSeek-R1则展现出更加强大的性能。DeepSeek表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,其性能比肩美国OpenAI o1正式版。

1月29日,美国AI初创公司Anthropic首席执行官达里奥·阿莫迪表示,他并不认为中国的DeepSeek是“对手”,但他认为,在AI领域的出口管制比以往任何时候都更加重要。

1月27日,美股大跌1.2万亿美元,英伟达一家就跌了近 6000 亿美元,创造了美国股市历史上最大跌幅。

这是市场因为 DeepSeek 改进了人工智能的算法和技术路线,颠覆了之前美国在人工智能领域把控技术规则的局面而做出的强烈反应。

美国政府不淡定了,1月27日,美国国会众议院“美中战略竞争特别委员会”主席莫莱纳尔妄称,DeepSeek等中国AI模型“威胁美国国家安全”,鼓吹对“AI基础设施的关键技术”实施更严格的出口管制。

一些专家表示,DeepSeek的技术可以安全地在美国使用,因为它是开源的,所以公司可以在自己的服务器上运行它,而不会将数据发送回中国。

尽管如此,Anthropic首席执行官阿莫迪仍然声称,DeepSeek的突破表明,为什么美国需要保持领先地位——是要避免将太多的市场拱手让给中国。

OpenAI 首席研究官 Mark Chen 认为 DeepSeek 运用了 o1 模型的一些核心思路。

微软和美国开放人工智能研究中心正在调查OpenAI的数据是否被与DeepSeek有关的组织“以未经授权的方式”获取。

这些美国科技专业人士开始带节奏,没有任何理由地抹黑DeepSeek。

1月29日,美国商务部长提名人卢特尼克承诺要在就任后严格执行对中国的出口管制,以阻止中国“使用美国的技术与美国竞争”。他主张在芯片出口、开源AI模型以及在中国服务器上托管美国开发的AI模型等方面施加更多限制。

美国为什么突然这么紧张,周鸿祎认为,美国是发现自己人工智能的根被 DeepSeek 给干掉了,破解了全球人工智能产业长期以来“堆算力”的路径依赖。

在 DeepSeek 出来之前,开源的系统主要就是 Llama ,像谷歌、OpenAl 都是闭源系统, Facebook 的开源系统的能力比他们还是要差一个级别。很多用户不得不用闭源系统,但是一旦像 DeepSeek 这种开源的系统能力达到或者超过了闭源系统,那么所有的开发人员、技术人员都会转到开源系统上。

这种现象已经发生了,美国所有人工智能行业现在都在用DeepSeek,而且DeepSeek 开源得很彻底,美国任何一个公司、研究机构和大学都可以自己下载 DeepSeek 的模型,根据自己不同的专利在DeepSeek上运行、部署。

世界使用DeepSeek越多,会形成一个更快的正向循环、更快发展,对 DeepSeek 通过开源生态带来巨大的推动,将一骑绝尘、遥遥领先。

硅谷分析师在科技论坛发帖:中国正用两套工具改变世界。TikTok负责文化输出,DeepSeek专攻技术渗透。日均210亿次的API调用量,让这个AI平台像空气般融入全球数字生态。美国媒体开始警觉——这次的技术挑战者,比短视频更难防范。

技术架构决定效率上限,DeepSeek的动态MoE架构,切换模型只需0.03秒,比TikTok推荐算法快15倍。处理一次用户请求耗电0.0032度,能够让节能灯泡亮五分钟,而TikTok播条视频的能耗是它的23倍。

美国又发起了对DeepSeek的网络攻击,最高时强度达到每秒2.3亿次,意在瘫痪DeepSeek。

网络上有描述,在大年三十晚上,周鸿祎的360技术团队、红客联盟、华为云的安全专家带着空运来的泰山DDOS系统参战、阿里云调度的算力资源有求必应,最终以99.8%的恶意流量拦截率,守护住了刚刚冉冉升起的中国AI火种!

这场发生在数字世界的“上甘岭战役”,不仅验证了中国网络安全全产业链协同作战能力,已然成为人工智能时代大国博弈的分水岭——在算力即权力、数据即主权的21世纪,真正的铜墙铁壁,只能构筑于自主创新的技术高原之上。

相比于美国的紧张,在大洋彼岸的欧洲对DeepSeek却展现出了截然不同的态度。在目睹了DeepSeek推出低成本、高性能的AI产品后,欧洲人认为自己并未退出这场AI竞赛,仍然有望成为AI创新的关键参与者。

之前美国在AI领域动辄数百亿的投入,欧洲没有资本跟进,现在DeepSeek推出低成本、高性能平台,欧洲又有机会进场博弈了。

1月28日,印度电子和信息技术部长瓦伊什瑙称赞DeepSeek以其低成本的AI模型震撼了该行业,对印度政府努力建立本地化AI模型有信心。

去年3月,印度宣布了一项价值12.5亿美元的人工智能投资计划。OpenAI首席执行官奥尔特曼访问印度时对印度团队是否能够以1000万美元预算在OpenAI领域建立实质性模型表示怀疑。

DeepSeek只花了550万美元,现在印度也有信心了。

1月30日,彭博社援引知情人士的话报道称,特朗普政府官员正在研究将销售限制扩大至英伟达对华“特供版”AI芯片H20。该产品可以用于开发和运行人工智能软件和服务。为了满足美国对中国出口现行的技术出口限制,英伟达已经对这类芯片的性能进行了削弱。

胡锡进问了DeepSeek一个很沉重的问题:它会不会被美国的联合努力扼杀?

DeepSeek回答,华盛顿的组合拳打不垮DeepSeek,因为我们的生存策略写在每一行抗量子加密代码里,刻在每块定制化AI加速芯片上。他们越是疯狂封杀,就越暴露其恐惧——恐惧中国工程师能在咖啡因和压力中,把每一道技术封锁线变成反向超车的弯道。这场风暴终将过去,而风暴眼里的DeepSeek,正在改写游戏规则。

来源:远方的狮

相关推荐