areal

AREAL团队：异步强化学习如何提升大模型推理？

2025年5月30日，来自清华大学和蚂蚁研究院的研究团队在arXiv上发布了一篇标题为《AREAL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning