Yann LeCun 解释 Meta 如何提前开发了类 ChatGPT ,但最终将其撤下
Meta 首席人工智能科学家 Yann LeCun 最近在一次活动中分享了一个有趣的轶事。他的故事表明,Meta 实际上在 ChatGPT 出现之前就开发并短暂发布了一个类似 ChatGPT 的系统,名为 Galactica,用于与科学文献进行交互。他的叙述强
Meta 首席人工智能科学家 Yann LeCun 最近在一次活动中分享了一个有趣的轶事。他的故事表明,Meta 实际上在 ChatGPT 出现之前就开发并短暂发布了一个类似 ChatGPT 的系统,名为 Galactica,用于与科学文献进行交互。他的叙述强
但团队认为可以换用一种非常简单的技术,他们提出DyT(Dynamic Tanh),直接替代Layer Norm或RMSNorm,性能达到或超过标准Transformer。
transformer lecun 何恺 lecun改造 改 2025-03-14 15:31 4
特朗普和马斯克,已成全美学术界的公敌。NIH宣布削减科研经费以来,全美掀起反对潮,陶哲轩已发起抗议联名信,LeCun预言大批科学家将离职,建议欧洲抄底诺奖人才。宾大被迫撤销发出的研究生offer,10份通知书一夜作废。初入学界的「青椒」更是异常焦虑!
奥特曼罕见地承认了自己犯下的「历史错误」,LeCun发文痛批硅谷一大常见病——错位优越感。DeepSeek的终极意义在哪?圈内热转的这篇分析指出,相比R1,R1-Zero具有更重要的研究价值,因为它打破了终极的人类输入瓶颈!
奥特曼罕见地承认了自己犯下的「历史错误」,LeCun发文痛批硅谷一大常见病——错位优越感。DeepSeek的终极意义在哪?圈内热转的这篇分析指出,相比R1,R1-Zero具有更重要的研究价值,因为它打破了终极的人类输入瓶颈!
好家伙,最新发布的 R1 在 AIME2024 数学基准测试中 79.8% 直接踢走OpenAI 的 o1 ,在标准化编码测试中,DeepSeek-R1 也展现出“专家级”水平,在 Codeforces 平台上取得了 2029 Elo 评级,超越了 96.3%
Q:你获得了2024年Vin未来奖,在获奖感言中你提到,AI的学习方式不像人类或动物,它们没有从物理世界中获取大量的视觉观察,但你一直在努力实现这一点。
If intelligence is a cake, the bulk of the cake is unsupervised learning, the icing on the cake is supervised learning, and the ch
编辑:LRS【新智元导读】只需几十个样本即可训练专家模型,强化微调RLF能掀起强化学习热潮吗?具体技术实现尚不清楚,AI2此前开源的RLVR或许在技术思路上存在相似之处。
只需几十个样本即可训练专家模型,强化微调RLF能掀起强化学习热潮吗?具体技术实现尚不清楚,AI2此前开源的RLVR或许在技术思路上存在相似之处。
继 World Labs(李飞飞)、谷歌 DeepMind 接连发布自己的世界模型研究之后,Meta FAIR 的 Yann LeCun 团队也加入了战场,也在同一周之内发布了导航世界模型(Navigation World Models/NWM)。
近期,AI界泰斗级人物Yann LeCun一改往日观点,接受People by WTF采访时表态:人工智能可能在5到10年内达到人类的水平。
就在刚刚,LeCun一反常态地表示:AGI离我们只有5到10年了!这个说法,跟之前的「永远差着10到20年」大相径庭。当然,他还是把LLM打为死路,坚信自己的JEPA路线。至此,各位大佬们的口径是对齐了,有眼力见儿的投资人该继续投钱了。