前 OpenAI 研究员、清华大学吴翼博士亮相 2025 ML-Summit,剖析大型推理模型强化学习系统
近日,ACM 将 2024 年的图灵奖授予强化学习之父 Richard S. Sutton 和其导师 Andrew G. Barto,以表彰他们在强化学习领域的开创性贡献。正如 Sutton 所言:“尽管生成式 AI 目前备受关注,但强化学习一直在稳步提升自己
近日,ACM 将 2024 年的图灵奖授予强化学习之父 Richard S. Sutton 和其导师 Andrew G. Barto,以表彰他们在强化学习领域的开创性贡献。正如 Sutton 所言:“尽管生成式 AI 目前备受关注,但强化学习一直在稳步提升自己
在 ChatGPT 诞生两年后,DeepSeek App 上线仅 20 天,日活超 2000 万,成为比 ChatGPT 增长还要迅猛的超级 APP 。
deepseek 吴翼 deepseek专场 2025-02-07 20:52 6
近日,有消息称蚂蚁集团已成立强化学习实验室,大模型初创企业边塞科技创始人吴翼已入职,担任该实验室首席科学家。吴翼就入职蚂蚁事件在朋友圈回应称:“最近受蚂蚁邀请做蚂蚁大模型强化学习方向的研究,我在清华大学交叉信息院的任教以及边塞科技都在继续。蚂蚁有很好的大模型应