ARIA:用意图驱动的奖励聚合训练更聪明的语言智能体 在2025年5月31日发表于arXiv的一篇前沿研究论文中,来自复旦大学和字节跳动Seed团队的研究者们提出了一种名为ARIA(Aggregates Rewards in Intention space)的创新方法,旨在解决语言智能体在开放式语言行动环境中面临 训练 智能体 语言 aria 语言智能体 2025-06-05 23:41 3