摘要:物联网技术DeepSeek新版模型正式发布,这几天我看技术大佬们都转疯了,延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。
物联网技术DeepSeek新版模型正式发布,这几天我看技术大佬们都转疯了,延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。
而最“吓人”的人,这个国产之光AI团队,只有139个人,分别是来自TOP名校的在博、在硕,甚至都没考虑社会与钱途那点事,直接开源,而这一开源,直接把美国那边的AI领域的大佬全都给炸出来了。
而就是这139人,把把谷歌的两个thinking 版本都干翻了,谷歌多少人,多少钱,多少算力?这不用说了,在技术几乎总是半年甚至三个月就会有版本迭代的当前AI市场中,DeepSeek 彻底开源,直接放开让全世界研究,美国你想研究也可以,但明着告诉你,不搞山寨了,是时候开始创造了。
过去三十年,中国公司都只强调赚钱,对创新和原创是忽视的,而创新并不完全是商业驱动的,需要年轻人对科技真正的好奇与创造欲,走出阶段性惯性束缚,也就是待价而沽的山寨王,现在不一样了,玩的就是真正创造,从下面这段采访中,你也可以看出一点态度:
你听,“并没有什么高深莫测的奇才”,你是不是感觉有点陌生?
按照惯性的常理来说,当一个国产之光让整个硅谷难安了,而且军民通吃,对六代机的设计都能产生影响的这么一个AI革命公司里的顶尖天才却说自己平平无奇,按照以往的习惯,我该听到的大概率应该是遥遥领先、超越美国之类的待价而沽,而且其中难免掺杂一点模糊的数据与技术来源。
而这次,完全不一样,首先完全开源,谁能都看,谁都可以拿去学习,另外,做了这么牛的事,却一个比一个低调,这充分说明了,这次是来真的了,而且核心的东西真的抓在了自己的手里,这是一群在前沿技术上想把山寨二字摘掉的一群年轻人,这才是最让人佩服的。
而DeepSeek的出现可能真的会改变全世界AI的竞争格局,若真是又有钱又有技术,那么就能承担超大模型预训练,各个行业的龙头企业有行业知识,有一定算力,做行业领域的蒸馏,各个具体业务组织,具备具体的业务知识和落地场景,做定制化的微调和工程落地,一旦这样的格局形成,那么中国的全产业链优势就能发挥了。
算力卡脖子的问题也解决了,就只有大模型预训练阶段最消耗算力,未来的某一天,要是给它凑够10万片H200,那我真的觉得,新的AI时代真就被这139个人领衔了。
但我并不是技术宅,与其现学现卖的相关于AI的论文理解也很容易让人啼笑皆非,因为理解与懂是两码事,初学与深造又是两个火候的事,所以很多更加专业的事情我相信玩AI的读者一定比我还精通,我就别要弄巧成拙了,但事就是这么个事,所以看看对于开源的评价,这是LeCun的几句话:
但其实在去年,当然现在应该说前年了,不过阳历年还没过,在2023年7月的时候,幻方量化宣布成立大模型公司DeepSeek,正式进军通用人工智能领域,当时报道的就是139人,二与之对比,OpenAI有1200名研究人员,Anthropic则有500多名研究人员。
知道当时OpenAI怎么看待DeepSeek的吗?说真的,就与大家在创业阶段遭遇的评价一样,openAI 整天吹自己要AGI ,无数局外人都跟着起哄,1年多过后,开源的deepseek 说自己的目标是AGI ,有人还是不正眼看一下的,会问 ,你什么水平啊? 你多少人,多少卡?多少科学家?你几个图灵奖得主? 你也搞AGI ?
我就不看论文了,反而对LeCun更感兴趣了,我去看了看他往日对此偏见的侧面回应,他一心搞“世界模型”,认为今天的 LLM 就是个鸡肋,根本搞不出 AGI,图灵奖得主,又不是开玩笑的。
也许人最难的时候,就是明明看到现有工程有缺陷,但是新的东西还没搞出来的时候,换句话说,就像你能看出你公司的弱势,也有能力帮助公司蒸蒸日上,可惜的是,你不再其位,也不让你上位,那么你就无法证明你的思路与想法还有笃定的经验与信念,与其说不能证明你自己很可惜,倒不如说不能证明一种大家都受益的见证而更加遗憾。
我的理解就是LeCun似乎在表达这个心境阶段。
而总有人说中国没有创新的土壤,但是看起来,中国是有创新土壤的,宽松的环境,充足的自由,一流的人才,若是没有这些条件,r1 怎会有这样强大的性能?
所以目前对于那些依然反对的人,大家也没必要在乎,因为还有一个理论逻辑在,就是你自己又没有创新过什么东西,那么你又哪里知道创新需要什么样的土壤!
其实,让我来说,现阶段的创新之路,走上取经路,比取到经更重要,对于那些筷子减震的大屏彩电而言,没有性能的追求,却打着性能的口号,我觉得那种经是念不起来的,因为本质的关系是,我不认为让一辆一日千里的交通工具变成每隔2个小时要去充电桩蹲守的大玩具时,那么在虚荣心之外还剩下什么竞争力呢?
而这一次的开源其实对应的是另一句话,也可以狠狠打一些1450的脸,试问,我此时能否也可以反向问一句,庆幸科技掌握在文明手里?
而总理接见deepseek老板,不是因为他是量化基金的老总,而是他的团队搞出deepseek v3,r1后给国家吃下了定心丸,两年时间,大佬们也一直在评估,好不容易有这么一匹黑马,得好好的伺候着,这就像一个校园里出现的天才一样,我认为学校也应该大力支持他们,帮助他们带出更多的科技创新人才,不,是天才吧,事总是说起来容易,做起来难,这已经做到这种地步了,至于信念与执着我相信并不需要旁人再去说什么教条了,这些悍将在没人知道他们的时候也能坚持走到今天,留给我的真就只剩下大拇指与今后的全力支持他们的鼓励了。
更惊人的是,它的轻量化设计让它能够流畅运行在个人电脑甚至手机上!已经有开发者将其集成到移动端应用中,体验到了前所未有的便捷与高效。
这正是开源的力量,也是为什么连美国AI圈都对DeepSeek赞不绝口。
我并不是一个资深的技术宅,所以我自己是玩不动这东西的,但我看了看几个混迹于科技圈的读者朋友发来得体验感受,他们都说看着R1第一人称的思考过程,你不能不强烈感觉它是一个简单的聊天对象,而这也是OpenAI不愿意透漏的,很多人表示单纯阅读那些思考过程也很有收获。
这些能力都不是被教会的,而是自发进化出来的。正如英伟达资深研究员Jim Fan所说:"最有趣的结果也许是最可能的。"
我知道,隔壁那停留在只知道丑女美颜主播的美颜功能是AI的,是不知道AI进化范式的改写是通过什么达成的。
但是,一个改写AI历史的时刻真的已经悄然而至了,在这一刻,作为每一个中国人,都值得喊一声,“DeepSeek牛逼!”
来源:硬核Deep