中国AI绝杀三大神话!DeepSeek用557万干翻美国1亿,硅谷连夜复现

B站影视 2025-01-28 06:01 4

摘要:第一个神话:打破全球AI大模型必然是美国领先的神话。美国AI要领先,这不仅仅是美国人自己认为的,而且连中国中科院个别院士、清北的一些教授都在喊着中国落后几年、甚至喊出落后五年十年都有。我当时就气得批判他们,AI大模型才出来多久,连比AI大模型出来都长的5-10

中国AI绝杀三大神话!DeepSeek用557万干翻OpenAI的1亿,硅谷连夜复现!

DeepSeek国运级创新,难怪美国人抓狂!

第一个神话:打破全球AI大模型必然是美国领先的神话。美国AI要领先,这不仅仅是美国人自己认为的,而且连中国中科院个别院士、清北的一些教授都在喊着中国落后几年、甚至喊出落后五年十年都有。我当时就气得批判他们,AI大模型才出来多久,连比AI大模型出来都长的5-10年都出来了。

一个北大教授居然认为中国是第二梯队,排在美国之外的德国英国后面,这简直就是瞎跪。法国总统马克龙都说了,现在世界AI被美国和中国垄断了,欧洲要学中国的创新。这北大教授他一下子来了一句中国的AI排在德国和英国后面,简直不可思议。

我在上个月文章就说了,甚至美国媒体认为以说是比中国第六代战斗机更大的斯普特尼克时刻(苏联第一颗卫星发射,美国人被震撼)。

实际上,到今天,现在硅谷已经不仅仅把DeepSeek R1定义为中国AI的胜利了,而将其定义为开源模型对闭源模型的胜利。谷歌担心DeepSeek以后可能会成为AI时代的底座,类似安卓成为智能手机主流底座一样。

第二个神话:AI用卡越多越好,没有足够算力就会落后的社会。结果在中国性价比镰刀面前被切割得粉碎。

目前AI大模型在增加参数方面已经出现钝化的情况,就是说你加了多少参数对整个AI模型的提升效果不好,没有看到特别明显的优化特点。特别是,增加很多参数又会导致对硬件的损耗非常的大。所以整个业界出现了死胡同,就是你不加参数体现不了你的优势,但是你加的参数、加了很多硬件效果也起不来,所以整个业界都是属于一个停滞状态的情况。

2025年推出的DeepSeek R1模型,在数学能力测试中,MATH基准测试上达到了77.5%的准确率,与OpenAI的o1不相上下;在编程领域,R1在Codeforces评测中达到了2441分的水平,高于96.3%的人类参与者。也就是比绝大多数人编程更强。

以不到600万美元的投入和2048块低性能的H800芯片的条件下完成的,训练时间仅用两个月。这种“四两拨千斤”的模式,颠覆了人们对OpenAI“大力出奇迹”式的固有认知,结果令全球侧目。

DeepSeek出现,以美国OpenAI十分之一不到的成本就训练出比肩他们、甚至很多方面更好的结果。这个性价比太高了,哪怕你只有90%结果,一半价格都有人用。现在是一样效果,购买十分之一价格不到。难怪媒体报道说,整个美国科技界,乃至全球掀DeepSeek复现狂潮!网上已经出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等纷纷成功复现,只用强化学习,没有监督微调,30美元就能见证「啊哈时刻」!全球AI大模型,或许正在进入下一分水岭。

而这个结果对美国那些AI投资大量成本的公司是毁灭性的。他们的商业闭环被干翻了。而且还能用华为昇腾910B跑,性能只是损失5%,成本下降70%。

第三个神话就是必须欧美才会创新。这次创新群体全部是国内高校培养的本土学生。工作年限小于8年。其中不乏应届生、实习生。在这里,工作经验不再是衡量人才的唯一标准。DeepSeek的HR在社交媒体平台表示,“着重考察人选素质和对大模型的热爱”。“投身于探索 AGI 的本质,不做中庸的事,带着好奇心,用最长期的眼光去回答最大的问题”。

也就是说,我们过去迷信只有留学回来的才有最新创新精神是错误的;当然留学要鼓励,但是无原则就高看一眼没必要。关键是企业和团队创新的机制和动力,好奇心和热情是最关键的。年轻人少很多条条框框束缚,天马行空反而出一个巨大创新。

所以业界认为这是一个国运级创新,一下子把中国AI大模型落后美国风险和产业被甩开的焦虑解决了。

来源:中立看科技

相关推荐