阿里通义千问Qwen推CodeElo,o1-mini夺冠超90%人类程序员 阿里通义千问 Qwen 最新推出 CodeElo 基准测试,通过和人类程序员对比的 Elo 评级系统,来评估大语言模型(LLM)的编程水平。 程序员 qwen codeelo 2025-01-04 13:32 4
Qwen版o1发布即开源!32B参数比肩OpenAI o1-mini,一手实测在此 深夜,通义团队突然上线推理模型QwQ,参数量只有32B,在GPQA上击败了o1-mini。 开源 o1 qwen 2024-11-28 21:22 3