摘要:【9月24日云栖大会,阿里通义旗舰模型Qwen3 - Max亮相,性能跻身全球前三】9月24日,2025云栖大会开幕,阿里通义旗舰模型Qwen3 - Max重磅登场,性能超越GPT5、ClaudeOpus4等,位列全球前三。它有指令和推理两大版本,预览版在Ch
【9月24日云栖大会,阿里通义旗舰模型Qwen3 - Max亮相,性能跻身全球前三】9月24日,2025云栖大会开幕,阿里通义旗舰模型Qwen3 - Max重磅登场,性能超越GPT5、ClaudeOpus4等,位列全球前三。它有指令和推理两大版本,预览版在ChatbotArena排行榜排第三,正式版性能有望再突破。 Qwen3 - Max是通义千问家族最大、最强基础模型。其预训练数据量达36T tokens,总参数超万亿,Coding编程和Agent工具调用能力强。Instruct版本在SWE - BenchVerified测试中获69.6分,列全球第一梯队;在Tau2 - Bench测试中,Qwen3 - Max得74.8分,超ClaudeOpus4和DeepSeek - V3.1。 Qwen3 - Max的推理增强版本Qwen3 - Max - Thinking - Heavy表现非凡。结合工具调用和并行推理技术,推理能力创新高,在AIME25和HMMT测试中均获满分100分,为国内首次。其优异成绩得益于解题时调动工具、写代码做题,增加计算资源也提升了模型表现。 大模型预训练原理ScalingLaw认为,增长数据和参数规模是通向AGI可能路径之一。部分学者认为预训练ScalingLaw逼近上限,而Qwen3 - Max性能突破显示,增大数据和模型参数仍能打造更强模型,增强了信心。通义千问系列模型已实现全尺寸覆盖,有三百多个大模型,能满足不同场景需求。 即日起,用户可在通义千问QwenChat免费体验Qwen3 - Max,也能通过阿里云百炼平台调用API服务。
本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担
来源:和讯网