前 OpenAI 研究员、清华大学吴翼博士亮相 2025 ML-Summit,剖析大型推理模型强化学习系统 近日,ACM 将 2024 年的图灵奖授予强化学习之父 Richard S. Sutton 和其导师 Andrew G. Barto,以表彰他们在强化学习领域的开创性贡献。正如 Sutton 所言:“尽管生成式 AI 目前备受关注,但强化学习一直在稳步提升自己 博士 吴翼 推理模型 openai研究员 吴翼博士 2025-03-12 20:14 3