语言智能体

ARIA：用意图驱动的奖励聚合训练更聪明的语言智能体

在2025年5月31日发表于arXiv的一篇前沿研究论文中，来自复旦大学和字节跳动Seed团队的研究者们提出了一种名为ARIA（Aggregates Rewards in Intention space）的创新方法，旨在解决语言智能体在开放式语言行动环境中面临