构念

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证

随着大语言模型（LLM）能力的快速迭代，传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征，例如价值观、性格和社交智能？如何建立更全面、更可靠的 AI 评估体系？北京大学宋国杰教授团队最新综述论文（共 63 页，包含 500 篇引文），首次尝试系

模型心理测量学模型心理测量学心理测量学系统构念 2025-05-27 18:48 8

北大发布首篇大语言模型心理测量学系统综述：评估、验证、增强

北大发布首篇大语言模型心理测量学系统综述：评估、验证、增强

随着大语言模型（LLM）能力的快速迭代，传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征，例如价值观、性格和社交智能？如何建立更全面、更可靠的 AI 评估体系？北京大学宋国杰教授团队最新综述论文（共 63 页，包含 500 篇引文），首次尝试系

模型心理测量学模型心理测量学心理测量学系统构念 2025-05-27 15:54 8