在经济问题上进行后训练,让大语言模型产生战略性泛化能力 近日,由杜克大学的周宇发、上海交通大学EPIC实验室的王少博、董星宇、金相奇、陈怡方、闵越,阿里巴巴集团钱团队的杨可欣、任兴章、刘岱恒,以及上海交通大学的张临风等学者共同合作的一项重要研究,于2025年5月31日发表在arXiv预印本平台(arXiv:2506 训练 模型 泛化 多智能体 recon 2025-06-05 23:40 4