前 OpenAI 研究员、清华大学吴翼博士亮相 2025 ML-Summit,剖析大型推理模型强化学习系统
近日,ACM 将 2024 年的图灵奖授予强化学习之父 Richard S. Sutton 和其导师 Andrew G. Barto,以表彰他们在强化学习领域的开创性贡献。正如 Sutton 所言:“尽管生成式 AI 目前备受关注,但强化学习一直在稳步提升自己
近日,ACM 将 2024 年的图灵奖授予强化学习之父 Richard S. Sutton 和其导师 Andrew G. Barto,以表彰他们在强化学习领域的开创性贡献。正如 Sutton 所言:“尽管生成式 AI 目前备受关注,但强化学习一直在稳步提升自己
编辑:KingHZ 泽正【导读】本月,OpenAI科学家就当前LLM的scaling方法论能否实现AGI展开深入辩论,认为将来AI至少与人类平分秋色;LLM scaling目前的问题可以通过后训练、强化学习、合成数据、智能体协作等方法得到解决;按现在的趋势估计