闪耀世界的DeepSeek,离不开美国的制裁

B站影视 2025-01-26 22:11 3

摘要:但就在过去不到一个月的时间里,名为“DeepSeek-V3”和“DeepSeek-R1”的两款AI大模型,却以极低的成本和突出的性能震惊世界,甚至引起了全球AI头部企业美国Meta公司内部的恐慌,硅谷的工程师们纷纷加班加点,试图复制出这些模型的效果。

AI(人工智能)作为时下最前沿的技术,被视作是人类未来发展的方向,世界各国争先抢后,都想占领这一“科技高地”。

但就在过去不到一个月的时间里,名为“DeepSeek-V3”和“DeepSeek-R1”的两款AI大模型,却以极低的成本和突出的性能震惊世界,甚至引起了全球AI头部企业美国Meta公司内部的恐慌,硅谷的工程师们纷纷加班加点,试图复制出这些模型的效果。

让人没有料到的是,这些成果竟然来自一家中国的AI初创公司——深度求索(DeepSeek)。要知道,此前美国都是以俯视的态度看待别国AI技术发展的,因为其掌握着从硬件到软件的绝对话语权。

而要说DeepSeek的两款模型有多让人惊讶,看看AI界大佬们的反应就知道了。

曾被《时代》周刊评为全球AI领袖的美国华尔街顶级风投A16Z创始人马克·安德森(Marc Andreesen)如此称赞:

“DeepSeek R1是我见过的最令人惊叹,最令人印象深刻的突破之一,并且是它还是开源的,这是对全世界最让人印象深刻的礼物。”

而在AI领域颇具影响力的Scale AI公司创始人兼CEO的亚历山大·王(Alexander Wang)则表示,他们在使用DeepSeek的产品进行测试时得到了最好的效果,甚至和完全不亚于美国顶级的模型。他此前还直截了当地指出,DeepSeek-V3是中国人用科技给美国的当头一棒,“当美国人还在休息时,中国(科研人员)却仍工作,(他们)正以更少的成本、更快的速度和更佳的性能迎头赶上。”

之所以能引起全球科技界的高度关注,与DeepSeek开发的模型所具备的两个特点有关:物美和价廉。

在几天前外网的AI大模型排行榜 Arena上,DeepSeek-R1 基准测试成绩已经飙升到全类别大模型的前三,具体到风格控制类模型(StyleCtrl)分类里则与OpenAI o1 共享第一名,其竞技场得分更是高达1357分,超过了 OpenAI o1 的1352分。

更为夸张的是DeepSeek-R1的训练成本之低,仅为550万美元,和OpenAI o1模型高达30亿美元的训练成本相比简直不值一提。

此前发布的DeepSeek -V3同样霸榜开源模型排名,其性能和全球领先的 GPT -4旗鼓相当,但该模型的训练成本预估仅为GPT-4 的5%。

以处理每百万字文本的收费标准为例,OpenAI的价格是15美元(约108元人民币),DeepSeek则是0.138美元(也就是1元人民币)!

一名来自Meta公司的员工在匿名平台teamblind上发帖称:

“一切都是因为DeepSeek-V3的发布,它不仅在基准测试中彻底打败了Llama 4,更让人丢脸的是,做到这些的是一家‘不知名的中国公司且只用了550万美元的训练预算’。

毫不夸张的说,工程师们正在马不停蹄地对DeepSeek进行分析,尝试去复制它的所有技术。

(Meta公司)高层正为GenAI研发部门的高额研发费用而烦恼。他们不知道怎么领导交代,毕竟部门里随便一个高管的工资都比整个DeepSeek V3的训练成本(550万美元)高,更别说还有几十位这样的管理者。

DeepSeek-R1的发布更是火上浇油,由于具体细节设计公司机密,不方便在此透露,但不用很久就会公布了。”

除了美国硅谷的AI公司高管们坐不住,为这些企业提供高性能芯片的英伟达可能多少也有些汗流雨下了,就在DeepSeek-R1发布后,英伟达股价下跌3%。

此前,美国发展AI的思路就是拼命堆芯片以换取高算力对海量数据进行分析处理,这也让AI芯片巨头英伟达赚的盆满钵满,不仅78%的员工早就是百万富翁,其中更有一半以上的净资产过亿。

如今,DeepSeek的模型几乎是打开了AI发展的新思路,不靠硬件靠软件,以极致的工程优化,实现同样甚至更好的效果,其硬件据说是DeepSeek通过某种途径得到的一万张英伟达H100+华为昇腾芯片混搭而成。

据小道消息称,在DeepSeek-R1的训练日志里赫然留下一条中文注释:华为Mate 60都能跑气不气?啥意思,就是告诉你,我用手机都能跑分,而你要花天价用超级计算机。

反过来说,DeepSeek的成就也离不开美国的制裁,如果不是美国选择对中国进行AI芯片出口管制,只允许英伟达等公司向中国出售“阉割版”芯片,何来中国工程师苦心钻研工程优化,并最终打造出AI界的“拼多多”?

据此前DeepSeek的创始人梁文锋称,中国的AI大模型,要想在某一个领域实现跟美国大模型一样的效果,至少需要消耗4倍的算力,由于美国的制裁,我们又拿不到英伟达最好的芯片。
美国就是想通过这样的“组合拳”,彻底拉开我们在人工智能领域和美国的差距,甚至彻底把我们甩开。
面对这样的困境,中国的人工智能工程师别无他法,只能另辟蹊径,就是去“研究新的模型结构,在有限的资源下,争取实现更强的模型能力。”

梁文锋这样说道:

“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼······我们看到的是,中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。

英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。

很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。”

更振奋人心的是,DeepSeek的团队,竟然全部由中国本土人才组成,梁文锋如此描述道:

“并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。
V2模型没有海外回来的人,都是本土的,前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。”

有志者,事竟成,破釜沉舟,百二秦关终属楚;苦心人,天不负,卧薪尝胆,三千越甲可吞吴。美国以为靠制裁就能限制中国的发展,事实却是啪啪打脸,因为不折不挠的中国人永远不会向困难低头,而是会想尽一切办法,打破禁锢,迎来光明。

正如毛主席当年的豪言壮语:“封锁吧!封锁它十年八年,中国的一切问题都解决了。”

来源:慷慨高歌

相关推荐