阿里通义Qwen3-Max：性能超GPT5，多项测试成绩亮眼

摘要：【9月24日，2025云栖大会开幕，阿里通义旗舰模型Qwen3 - Max亮相，性能跻身全球前三】9月24日，2025云栖大会开幕，阿里通义旗舰模型Qwen3 - Max重磅登场，性能超过GPT5、Claude Opus4等，位居全球前三。它包含指令和推理两大

【9月24日，2025云栖大会开幕，阿里通义旗舰模型Qwen3 - Max亮相，性能跻身全球前三】9月24日，2025云栖大会开幕，阿里通义旗舰模型Qwen3 - Max重磅登场，性能超过GPT5、Claude Opus4等，位居全球前三。它包含指令和推理两大版本，预览版在ChatbotArena排行榜排第三，正式版性能有望再突破。 Qwen3 - Max是通义千问家族最大、最强基础模型，预训练数据量达36T tokens，总参数超万亿，有强大Coding编程与Agent工具调用能力。在SWE - Bench Verified测试中，Instruct版本获69.6分，列全球第一梯队；在Tau2 - Bench测试中，取得74.8分，超Claude Opus4和DeepSeek - V3.1。 Qwen3 - Max的推理增强版Qwen3 - Max - Thinking - Heavy表现出色，结合工具调用和并行推理技术，推理能力创新高。在AIME25和HMMT测试中均获满分100分，为国内首次。其优异成绩得益于解题时调动工具、写代码做题，以及增加计算资源。大模型预训练原理Scaling Law认为增长数据和参数规模是通向AGI路径之一。虽部分学者认为预训练Scaling Law逼近上限，但Qwen3 - Max性能突破说明增加大数据和模型参数仍能锻造更强模型。通义千问系列模型已实现全尺寸覆盖，含三百多个大模型，可满足不同场景需求。即日起，用户可在通义千问QwenChat上免费体验Qwen3 - Max，也能通过阿里云百炼平台调用API服务。

本文由 AI 算法生成，仅作参考，不涉投资建议，使用风险自担

来源：和讯网

标签： claude 云栖 bench qwen3 gpt5

本文地址：http://news.43b.com.cn/a/1322239.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!