摘要:【9月24日,2025云栖大会开幕,阿里通义旗舰模型Qwen3 - Max亮相,性能跻身全球前三】9月24日,2025云栖大会开幕,阿里通义旗舰模型Qwen3 - Max重磅登场,性能超过GPT5、Claude Opus4等,位居全球前三。它包含指令和推理两大
【9月24日,2025云栖大会开幕,阿里通义旗舰模型Qwen3 - Max亮相,性能跻身全球前三】9月24日,2025云栖大会开幕,阿里通义旗舰模型Qwen3 - Max重磅登场,性能超过GPT5、Claude Opus4等,位居全球前三。它包含指令和推理两大版本,预览版在ChatbotArena排行榜排第三,正式版性能有望再突破。 Qwen3 - Max是通义千问家族最大、最强基础模型,预训练数据量达36T tokens,总参数超万亿,有强大Coding编程与Agent工具调用能力。在SWE - Bench Verified测试中,Instruct版本获69.6分,列全球第一梯队;在Tau2 - Bench测试中,取得74.8分,超Claude Opus4和DeepSeek - V3.1。 Qwen3 - Max的推理增强版Qwen3 - Max - Thinking - Heavy表现出色,结合工具调用和并行推理技术,推理能力创新高。在AIME25和HMMT测试中均获满分100分,为国内首次。其优异成绩得益于解题时调动工具、写代码做题,以及增加计算资源。 大模型预训练原理Scaling Law认为增长数据和参数规模是通向AGI路径之一。虽部分学者认为预训练Scaling Law逼近上限,但Qwen3 - Max性能突破说明增加大数据和模型参数仍能锻造更强模型。通义千问系列模型已实现全尺寸覆盖,含三百多个大模型,可满足不同场景需求。 即日起,用户可在通义千问QwenChat上免费体验Qwen3 - Max,也能通过阿里云百炼平台调用API服务。
本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担
来源:和讯网