HARDTESTS:提升LLM编程能力的高质量测试用例研究 卡内基梅隆大学、加州大学圣巴巴拉分校和德克萨斯大学奥斯汀分校的研究团队,包括Zhongmou He、Yee Man Choi、Kexun Zhang、Jiabao Ji、Junting Zhou、Dejia Xu、Ivan Bercovich、Aidan Zh 编程 llm 测试用例 hardtests 高质量测试用例 2025-06-04 16:41 4