摘要:哈佛大学的一位教授最近揭示了一个令人震惊的事实:DeepSeek多模态团队中的第四位工程师原本有机会获得英伟达的全职职位。然而,他最终选择了回国加入DeepSeek,这一决定动摇了美国在人工智能领域的领导地位,导致相关公司的市值蒸发了约一万亿,并彻底改变了全球
DeepSeek对美国构成的威胁正在加剧。截至昨天,DeepSeek的日活跃用户数已达到ChatGPT的23%,每日下载量接近500万次!
a16z的联合创始人Marc Andreessen指出,那些为DeepSeek的成功做出关键贡献的人才本有机会留在美国。
哈佛大学的一位教授最近揭示了一个令人震惊的事实:DeepSeek多模态团队中的第四位工程师原本有机会获得英伟达的全职职位。然而,他最终选择了回国加入DeepSeek,这一决定动摇了美国在人工智能领域的领导地位,导致相关公司的市值蒸发了约一万亿,并彻底改变了全球AI格局。
这种情况是偶然发生的,还是某种必然趋势?
美国未能留住DeepSeek的关键人物,这让人联想到“钱学森”再次归国的情景。近日,政治学家、哈佛大学教授兼前国防计划助理部长Graham Allison在社交媒体上提问:“谁错过了DeepSeek?”
他提到,DeepSeek已经重新定义了我们对美国在全球AI领域地位的理解。Allison特别提到了潘梓正(Zizheng Pan),他是DeepSeek多模态团队的重要成员,在开发DeepSeek的R1模型方面发挥了重要作用。
在回国之前,潘梓正曾在英伟达实习并获得了全职工作邀请。Allison认为,这种人才流失现象表明美国需要更加努力地吸引和留住国际人才。
英伟达失去了一位潜在的人才,禹之鼎,英伟达的高级研究科学家,分享了关于潘梓正的选择及其成就的看法。
在2023年的夏天,当考虑是否给潘梓正提供全职工作时,他毫不犹豫地选择了加入DeepSeek。禹之鼎表示,潘梓正的决定至今让他印象深刻,并对其在DeepSeek取得的成就感到高兴。
潘梓正于2024年正式加入DeepSeek担任研究员。在此之前,他在蒙纳士大学攻读计算机科学博士学位,专注于深度神经网络效率的研究。
潘梓正的经历反映了中国AI新星如何撼动全球格局。Lex Fridman在其播客中讨论了DeepSeek如何通过技术创新挑战全球AI行业现状,包括其独特的MoE架构和MLA技术等。
关于DeepSeek是否使用了OpenAI的数据的问题引发了广泛讨论。尽管有报道指出OpenAI声称DeepSeek利用了他们的数据进行训练,但专家们一致认为,这样的指控更多是为了转移注意力。实际上,大多数公司都是基于公开可用的数据进行训练。
DeepSeek之所以能够以较低的成本实现高效训练和推理,部分原因在于采用了创新的模型架构和技术,如MoE和MLA。这些技术不仅提高了计算效率,还大幅降低了内存占用,使得DeepSeek能够在保持高性能的同时降低成本。
对于未来AGI竞赛的赢家预测,虽然谷歌凭借其基础设施优势被视为领跑者,但在商业化方面,OpenAI目前处于领先地位。微软、谷歌和亚马逊已经在AI领域投入大量资金,而Meta的巨额利润主要来自于推荐系统而非大模型。
尽管如此,随着技术进步和硬件改进,AI模型的推理成本将持续下降,这将推动AGI的发展。
最终,谁能在这场竞赛中胜出仍是个未知数,但可以肯定的是,未来的市场将属于那些不断创新和适应变化的企业。
来源:研究生的酸甜苦辣咸