阿里Qwen3-Max：性能超GPT5，多测评成绩优异

摘要：【9月24日云栖大会，阿里通义旗舰模型Qwen3 - Max亮相，性能跻身全球前三】9月24日，2025云栖大会开幕，阿里通义旗舰模型Qwen3 - Max重磅登场，性能超越GPT5、ClaudeOpus4等，位列全球前三。它有指令和推理两大版本，预览版在Ch

【9月24日云栖大会，阿里通义旗舰模型Qwen3 - Max亮相，性能跻身全球前三】9月24日，2025云栖大会开幕，阿里通义旗舰模型Qwen3 - Max重磅登场，性能超越GPT5、ClaudeOpus4等，位列全球前三。它有指令和推理两大版本，预览版在ChatbotArena排行榜排第三，正式版性能有望再突破。 Qwen3 - Max是通义千问家族最大、最强基础模型。其预训练数据量达36T tokens，总参数超万亿，Coding编程和Agent工具调用能力强。Instruct版本在SWE - BenchVerified测试中获69.6分，列全球第一梯队；在Tau2 - Bench测试中，Qwen3 - Max得74.8分，超ClaudeOpus4和DeepSeek - V3.1。 Qwen3 - Max的推理增强版本Qwen3 - Max - Thinking - Heavy表现非凡。结合工具调用和并行推理技术，推理能力创新高，在AIME25和HMMT测试中均获满分100分，为国内首次。其优异成绩得益于解题时调动工具、写代码做题，增加计算资源也提升了模型表现。大模型预训练原理ScalingLaw认为，增长数据和参数规模是通向AGI可能路径之一。部分学者认为预训练ScalingLaw逼近上限，而Qwen3 - Max性能突破显示，增大数据和模型参数仍能打造更强模型，增强了信心。通义千问系列模型已实现全尺寸覆盖，有三百多个大模型，能满足不同场景需求。即日起，用户可在通义千问QwenChat免费体验Qwen3 - Max，也能通过阿里云百炼平台调用API服务。

本文由 AI 算法生成，仅作参考，不涉投资建议，使用风险自担

来源：和讯网

标签：测评云栖 qwen3 swe gpt5

本文地址：http://news.43b.com.cn/a/1322242.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!