中国大模型首进全球三甲,阿里扔出技术“核弹”

B站影视 日本电影 2025-09-24 17:04 1

摘要:阿里云在2025云栖大会上掷出一枚技术“核弹”,Qwen3-Max以万亿参数和36万亿训练token数,在全球AI竞赛中重新洗牌。

阿里云在2025云栖大会上掷出一枚技术“核弹”,Qwen3-Max以万亿参数和36万亿训练token数,在全球AI竞赛中重新洗牌。

01

阿里Qwen3-Max突破全球AI三强

9月24日,阿里巴巴通过“通义千问Qwen”微信公众号正式宣布推出Qwen3-Max——该公司迄今为止“规模最大、能力最强的模型”。该模型的预览版在权威的LMArena文本排行榜上位列全球第三,超越了OpenAI的GPT-5-Chat。

Qwen3-Max-Instrurct测评分数

这不仅是一次技术迭代,更是中国AI企业首次在通用大模型核心评测中跻身全球顶尖阵营。Qwen3-Max的正式版本在代码能力和智能体能力方面进一步提升,在涵盖知识、推理、编程、指令遵循的全面基准测试中均达到业界领先水平。

Qwen3-Max作为阿里通义千问家族的旗舰模型,展现了令人瞩目的技术规格。模型总参数超过1T(万亿),预训练数据量达到36T tokens。

Qwen3-Max-Thinking-Heavy 测评分数

这一参数规模使Qwen3-Max稳稳站在全球大模型的第一梯队。

在模型架构上,Qwen3-Max采用了MoE(混合专家)架构。这种设计允许模型根据不同任务激活不同的专家网络,既保证了模型的能力,又提高了计算效率。

与传统的密集模型相比,MoE架构在大规模扩展时具有明显优势。Qwen3-Max还支持1M tokens的上下文长度,这一指标对于处理长文档、复杂代码库和延展对话至关重要。超长上下文支持意味着模型可以理解和处理更为复杂的信息结构,为高级推理任务奠定基础。

在训练效率方面,Qwen3-Max实现了30%的MFU(模型浮点运算利用率)提升,表明阿里在训练超大规模模型方面已经积累了深厚的技术经验。

02

性能表现全面超越国际顶尖模型的实测数据

Qwen3-Max在多项国际权威基准测试中展现出卓越实力。在专注于解决现实编程挑战的SWE-Bench Verified测试中,Qwen3-Max-Instruct版本取得了69.6分的优异成绩,稳居全球第一梯队。

在评估智能体工具调用能力的Tau2-Bench测试中,Qwen3-Max更是实现了突破性表现,以74.8分超越Claude Opus 4与DeepSeek-V3.1。

数学推理能力上,Qwen3-Max的推理增强版本Qwen3-Max-Thinking展现出非凡性能,在AIME 25和HMMT等高难度数学推理测试中均取得满分100分的成绩,这是国内大模型首次在此类测试中获得满分。

该模型在解数学题时懂得调动工具,能够写代码做题,同时增加测试时的计算资源也让模型表现进一步提升。

在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中,Qwen3-Max-Instruct版本均达到业界领先水平,展现出全面而均衡的能力图谱。

03

战略意义中国大模型技术的里程碑突破

Qwen3-Max的发布标志着中国在大模型领域正式跻身全球第一梯队。这一成就对国内AI产业发展具有深远战略意义。

大模型预训练的Scaling Law(规模化法则)认为,持续增长数据和参数规模是通向AGI的可能路径之一。面对自然数据数量有限的挑战,有学者认为预训练的Scaling Law即将逼近上限,但Qwen3-Max的性能突破显示,继续增大数据、模型参数,依然能锻造出更强的模型。

阿里云已构建起从0.5B到超万亿参数的全尺寸模型覆盖,包含三百多个大模型,可满足不同场景的需求。这种全栈式布局为AI技术在各行业的应用落地奠定了坚实基础。

Qwen3-Max的成功验证了“算力投入—模型提升—应用落地”的正向闭环模式,预计将推动国内AI产业在2025年第四季度迎来应用商业化的加速期。

Qwen3-Max的发布不仅代表技术突破,更具有深远的产业影响。阿里巴巴集团CEO吴泳铭在云栖大会上表示,大模型是下一代操作系统,而AI云是下一代计算机。公司计划三年内投入超过3800亿元用于AI模型与基础设施建设,彰显了对AI技术的长期承诺。

资本市场对这一突破反应积极。模型发布当日,阿里巴巴港股涨幅扩大至逾4.5%,创近4年来新高;美股夜盘涨超5%。值得注意的是,美国"女股神"凯西·伍德(Cathie Wood)重新开仓买入阿里巴巴股份,为四年来首次,显示国际资本对中国AI技术的认可。

04

全球竞争格局的重塑

Qwen3-Max的成功标志着全球AI竞争格局正在重塑。当前LMArena排行榜前三名分别是谷歌的Gemini-2.5-Pro、Anthropic的Claude-Opus-4.1和OpenAI的GPT-O3。Qwen3-Max的崛起使中国首次在顶级大模型竞争中跻身第一梯队,改变了由美国科技巨头主导的竞争格局。

从技术路线来看,Qwen3-Max采用了与GPT-5-Chat不同的发展路径。GPT-5-Chat是OpenAI专门为企业级对话设计的独立模型,支持多模态输入、上下文感知和自然语言理解。而Qwen3-Max更注重通用能力与专业能力的平衡,在保持强大对话能力的同时,在代码生成、逻辑推理等专业领域表现突出。

随着Qwen3-Max-Thinking推理版本的正式发布临近,阿里云有望在高端企业市场与国际厂商展开直接竞争,重塑全球AI大模型市场格局。

05

编辑点评从追随者到规则制定者

Qwen3-Max的里程碑意义远超技术本身:它标志着中国大模型首次在核心能力标准(编程、数学、工具调用)上主导话语权。当GPT-5因忽视用户体验跌落神坛,阿里以“顶级性能+场景深耕”的组合拳打开新局。随着Thinking版本即将发布,中国AI的“算力投入—模型提升—应用落地”闭环正加速形成——大模型的竞争,终于迎来东方时间。

微信订阅欢迎通过邮局渠道订阅2025年《电脑报》邮发代号:77-19单价:8元,年价:400元主编|黎坤总编辑|吴新壹零社:用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子,商业故事。《中国知网》每周全文收录;中国科技报刊100强;2021年微博百万粉丝俱乐部成员;2022年抖音优质科技内容创作者”

来源:壹零社

相关推荐