中国大模型首进全球三甲，阿里扔出技术“核弹”

摘要：阿里云在2025云栖大会上掷出一枚技术“核弹”，Qwen3-Max以万亿参数和36万亿训练token数，在全球AI竞赛中重新洗牌。

阿里云在2025云栖大会上掷出一枚技术“核弹”，Qwen3-Max以万亿参数和36万亿训练token数，在全球AI竞赛中重新洗牌。

阿里Qwen3-Max突破全球AI三强

9月24日，阿里巴巴通过“通义千问Qwen”微信公众号正式宣布推出Qwen3-Max——该公司迄今为止“规模最大、能力最强的模型”。该模型的预览版在权威的LMArena文本排行榜上位列全球第三，超越了OpenAI的GPT-5-Chat。

Qwen3-Max-Instrurct测评分数

这不仅是一次技术迭代，更是中国AI企业首次在通用大模型核心评测中跻身全球顶尖阵营。Qwen3-Max的正式版本在代码能力和智能体能力方面进一步提升，在涵盖知识、推理、编程、指令遵循的全面基准测试中均达到业界领先水平。

Qwen3-Max作为阿里通义千问家族的旗舰模型，展现了令人瞩目的技术规格。模型总参数超过1T（万亿），预训练数据量达到36T tokens。

Qwen3-Max-Thinking-Heavy 测评分数

这一参数规模使Qwen3-Max稳稳站在全球大模型的第一梯队。

在模型架构上，Qwen3-Max采用了MoE（混合专家）架构。这种设计允许模型根据不同任务激活不同的专家网络，既保证了模型的能力，又提高了计算效率。

与传统的密集模型相比，MoE架构在大规模扩展时具有明显优势。Qwen3-Max还支持1M tokens的上下文长度，这一指标对于处理长文档、复杂代码库和延展对话至关重要。超长上下文支持意味着模型可以理解和处理更为复杂的信息结构，为高级推理任务奠定基础。

在训练效率方面，Qwen3-Max实现了30%的MFU（模型浮点运算利用率）提升，表明阿里在训练超大规模模型方面已经积累了深厚的技术经验。

性能表现全面超越国际顶尖模型的实测数据

Qwen3-Max在多项国际权威基准测试中展现出卓越实力。在专注于解决现实编程挑战的SWE-Bench Verified测试中，Qwen3-Max-Instruct版本取得了69.6分的优异成绩，稳居全球第一梯队。

在评估智能体工具调用能力的Tau2-Bench测试中，Qwen3-Max更是实现了突破性表现，以74.8分超越Claude Opus 4与DeepSeek-V3.1。

数学推理能力上，Qwen3-Max的推理增强版本Qwen3-Max-Thinking展现出非凡性能，在AIME 25和HMMT等高难度数学推理测试中均取得满分100分的成绩，这是国内大模型首次在此类测试中获得满分。

该模型在解数学题时懂得调动工具，能够写代码做题，同时增加测试时的计算资源也让模型表现进一步提升。

在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中，Qwen3-Max-Instruct版本均达到业界领先水平，展现出全面而均衡的能力图谱。

战略意义中国大模型技术的里程碑突破

Qwen3-Max的发布标志着中国在大模型领域正式跻身全球第一梯队。这一成就对国内AI产业发展具有深远战略意义。

大模型预训练的Scaling Law（规模化法则）认为，持续增长数据和参数规模是通向AGI的可能路径之一。面对自然数据数量有限的挑战，有学者认为预训练的Scaling Law即将逼近上限，但Qwen3-Max的性能突破显示，继续增大数据、模型参数，依然能锻造出更强的模型。

阿里云已构建起从0.5B到超万亿参数的全尺寸模型覆盖，包含三百多个大模型，可满足不同场景的需求。这种全栈式布局为AI技术在各行业的应用落地奠定了坚实基础。

Qwen3-Max的成功验证了“算力投入—模型提升—应用落地”的正向闭环模式，预计将推动国内AI产业在2025年第四季度迎来应用商业化的加速期。

Qwen3-Max的发布不仅代表技术突破，更具有深远的产业影响。阿里巴巴集团CEO吴泳铭在云栖大会上表示，大模型是下一代操作系统，而AI云是下一代计算机。公司计划三年内投入超过3800亿元用于AI模型与基础设施建设，彰显了对AI技术的长期承诺。

资本市场对这一突破反应积极。模型发布当日，阿里巴巴港股涨幅扩大至逾4.5%，创近4年来新高；美股夜盘涨超5%。值得注意的是，美国"女股神"凯西·伍德(Cathie Wood)重新开仓买入阿里巴巴股份，为四年来首次，显示国际资本对中国AI技术的认可。

全球竞争格局的重塑

Qwen3-Max的成功标志着全球AI竞争格局正在重塑。当前LMArena排行榜前三名分别是谷歌的Gemini-2.5-Pro、Anthropic的Claude-Opus-4.1和OpenAI的GPT-O3。Qwen3-Max的崛起使中国首次在顶级大模型竞争中跻身第一梯队，改变了由美国科技巨头主导的竞争格局。

从技术路线来看，Qwen3-Max采用了与GPT-5-Chat不同的发展路径。GPT-5-Chat是OpenAI专门为企业级对话设计的独立模型，支持多模态输入、上下文感知和自然语言理解。而Qwen3-Max更注重通用能力与专业能力的平衡，在保持强大对话能力的同时，在代码生成、逻辑推理等专业领域表现突出。

随着Qwen3-Max-Thinking推理版本的正式发布临近，阿里云有望在高端企业市场与国际厂商展开直接竞争，重塑全球AI大模型市场格局。

编辑点评从追随者到规则制定者

Qwen3-Max的里程碑意义远超技术本身：它标志着中国大模型首次在核心能力标准（编程、数学、工具调用）上主导话语权。当GPT-5因忽视用户体验跌落神坛，阿里以“顶级性能+场景深耕”的组合拳打开新局。随着Thinking版本即将发布，中国AI的“算力投入—模型提升—应用落地”闭环正加速形成——大模型的竞争，终于迎来东方时间。

微信订阅

欢迎通过邮局渠道订阅2025年《电脑报》邮发代号：77-19单价：8元，年价：400元主编｜黎坤总编辑｜吴新“壹零社：用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子，商业故事。《中国知网》每周全文收录；中国科技报刊100强；2021年微博百万粉丝俱乐部成员；2022年抖音优质科技内容创作者”