摘要:当其他品牌智能手机已让人机协作渗透至“一句话点外卖、智能识屏解析”等生活场景时,缺失AI助手的iPhone17系列则令人倍感遗憾。毕竟,对于用户而言,手机助手早已不是“语音指令”的简单工具,而是能秒级调整设置、AI处理文档、个性化交互的智能设备。
近日,苹果iPhone17系列凭借创新设计与性能革新,瞬间引爆了消费市场。然而,国行版本未搭载AI智能体手机助手的“短板”,却成了众多用户吐槽的焦点。
当其他品牌智能手机已让人机协作渗透至“一句话点外卖、智能识屏解析”等生活场景时,缺失AI助手的iPhone17系列则令人倍感遗憾。毕竟,对于用户而言,手机助手早已不是“语音指令”的简单工具,而是能秒级调整设置、AI处理文档、个性化交互的智能设备。
当人工智能从实验室走向千行百业,其进化速度正以“月”为单位刷新认知。9月24日,2025年云栖大会的开幕,为全球AI从业者递上一张观察技术前沿的“最佳观景台”。阿里云智能首席技术官周靖人在主论坛的发布,堪称一场AI技术的“超级盛宴”。此次通义千问多款模型齐发,旗舰模型Qwen3-Max参数规模突破万亿,在MMLU、GSM8K、HumanEval等国际主流评测中多项指标全球领先;Qwen3-VL作为千问家族最强视觉语言模型,真正实现“看懂世界、理解世界并指导行动”;Qwen3-Omni系列打造全模态交互体验,拟人化程度极高,已在32项开源基准测试中斩获SOTA;Qwen3-Next则重构底层架构,在性能不减的前提下将大幅降低训练成本,兼顾效果与效率;广受开发者欢迎的编程模型Qwen3-Coder升级为Plus版本,推理更快、代码更安全。
同时,通义万相家族也正式推出通义万相Wan2.5-preview系列模型,该系列模型全面覆盖文生视频、图生视频、文生图以及图像编辑四大核心模型领域。
此次发布不仅是阿里云技术实力的集中展示,更预示着AI大规模落地应用的新纪元已然开启。
Qwen3-Max的突破:从稳定训练到顶尖推理
在使用大模型之前,用户们往往都会通过各类媒介去了解其性能表现,因此测试榜单中的成绩极具参考价值。
作为向来“战绩”优秀的通义千问家族而言,此次新推出的Qwen3-Max自然也再次刷榜!
在实际能力评测中,Qwen3-Max-Instruct版本展现出顶尖的代码生成与智能体交互水平。在面向真实编程挑战的SWE-Bench Verified测试中,它以69.6分的成绩稳居全球顶尖模型行列;而在更严苛的智能体工具调用测试Tau2-Bench上,其74.8分的表现甚至超越了Claude Opus 4,显示出强大的实际应用潜力。
尤为引人注目的是其深度推理版本Qwen3-Max-Thinking。该模型通过集成代码解释器与并行测试时计算技术,在AIME 25、HMMT等高难度数学推理基准中取得了100%的准确率,展现出接近人类专业水平的逻辑推演能力。这一突破标志着大模型不仅在知识广度上扩展,更在思维深度上向更高层次的认知能力迈进。
Qwen3-Max作为通义千问家族的旗舰模型,凭借超过1万亿的参数规模和基于36万亿token的预训练数据,在基础能力上实现了显著提升。它延续了Qwen3系列的结构设计,并采用自主研发的global-batch负载均衡损失函数,在训练过程中展现出更佳的稳定性。
据了解,在训练效率方面,Qwen3-Max借助PAI-FlashMoE的多级流水并行优化技术,模型训练效率相比前代提升30%。针对长序列训练场景,团队进一步采用ChunkFlow策略,使训练吞吐量达到序列并行方案的3倍,有力支撑了模型处理长达100万token上下文的能力。同时,通过多项系统级优化,因硬件故障导致的训练中断时间大幅缩减至Qwen2.5-Max的五分之一,保障了超大规模训练的连续性与可靠性。
基于此,才让Qwen3-Max拥有了跻身全球领先的硬实力。
通义千问家族:让大模型从能用迈向好用
除了万众瞩目的Qwen3-Max之外,千问3家族的其他几款大模型也在多模态理解、智能交互、代码生成与计算效率等方面实现了全方位突破,展现出强大的技术领先性和落地潜力。
先来看Qwen3-VL,我们平时接触传统意义上的视觉语言模型大都只能识别图片等信息,若希望做更深层的识别则需要借助其他工具来完成,影响工作连续性。而Qwen3-VL则改变了这一切,它不仅能识别图像内容,更能深度理解图形用户界面(GUI)中的元素,包括按钮、菜单、图标等,并准确判断其功能与交互逻辑。它具备自主操作电脑和手机界面的能力,可自动调用“放大”“点击”“滚动”等智能体(Agent)工具,在任务执行过程中持续观察、推理与调整。
举个例子,当输入一张产品设计图时,Qwen3-VL能直接生成对应的Draw.io流程图、HTML/CSS/JS前端代码,实现“所见即所得”的视觉编程。更进一步,它还集成了先进的3D检测能力,可感知空间结构,精准判断物体的方位、视角变化及遮挡关系,在OS World等国际权威GUI操作基准测试中达到世界顶尖水平,为智能助理、自动化测试、人机协同等场景提供核心引擎。
Qwen3-Omni则是家族中的全模态预训练大模型选手,从训练初期即融合文本、图像、音频、视频等多种模态数据,实现真正的多模态对齐与协同理解。它的最大亮点在于支持实时流式响应:用户说话的同时,模型可同步生成文字回复并合成自然流畅的语音,交互延迟极低,体验高度拟人化,并支持深度定制。
这种“有性格、有记忆、多模态”的交互能力,使其在虚拟主播、智能客服、教育陪伴等场景中具备颠覆性潜力。
此外,更为强大的Qwen3-Coder-Plus能够以更少的token消耗达成更优的代码生成效果,大幅降低使用成本,并可实现多模态代码生成能力,例如根据截图自动生成可运行的UI代码,该能力目前在全球范围内处于领先地位。
Qwen3-Next则是一款注重计算效率的模型,尽管总参数量达80B,但每次推理仅激活约3B参数,性能却可媲美参数量高达235B的Qwen3旗舰版本。对比Qwen3-32B,Qwen3-Next训练成本下降超90%。这意味着开发者能以极低成本部署高性能模型,企业也能更高效地进行大规模训练与推理。
整体来看,通义千问此次发布的产品矩阵覆盖了从视觉操作、全模态交互、智能编程到高效计算的核心能力,不仅在多项国际评测中领跑,更将前沿技术转化为可落地的产品体验,持续推动大模型从“能用”走向“好用”乃至“不可或缺”。
据了解,通过持续的投入与研发,通义千问原生及衍生模型的数量已位居全球第一。开源模型的下载总量已经超过6亿次,得到了开发者们的广泛认可,在社区中引发了热烈讨论和广泛传播。
更智能化的大模型开启新未来
大模型正展现出变革性的能力与发展潜力,其发展态势对未来影响深远。
当下,大模型具备了Tool Use能力,这一能力意义重大,就如同人类创造和使用工具开启了加速进化历程一样,如今大模型凭借此能力能够连接各类数字化工具,从而完成真实世界的任务。
展望未来,自然语言将成为AI时代的源代码。人们只需用自然语言输入需求,AI就能自行编写逻辑、调用工具、搭建系统,完成数字世界的工作,还能通过数字化接口操作所有物理设备。届时,或许会有超过全球人口数量的Agent和机器人与人类一起工作,对真实世界产生巨大影响。同时,AI也能连接大部分真实世界场景和数据,为未来的进化创造条件。
在相关领域的发展进程中,通义千问取得了显著成果。通过持续的投入与研发,通义千问原生及衍生模型的数量已位居全球第一,如今已实现全模态和全尺寸的开源,开源模型的下载总量已经超过6亿次,得到了开发者们的认可,在社区中引发了热烈讨论和广泛传播。
当消费者为iPhone 17国行版缺失AI助手而吐槽其竞争力不足时,市场的反馈已然清晰:在智能时代,AI能力早已从“加分项”变为“必选项”,成为衡量产品价值的核心标尺。而通义千问系列大模型的集中突破,恰在另一条关键赛道上,以技术实力重新定义了“智能”的边界。这不仅是一场参数与性能的技术竞赛,更是一次从“单点智能”到“全栈赋能”的产业更迭。
AI的真正价值,从来不止于功能的叠加,而是通过指数级放大人类的智力杠杆,彻底重构成果的获取方式。
技术革命的浪潮永不停歇,Qwen3-Max的发布仅是中国大模型技术迈向成熟的新起点。随着后续正式版的迭代优化,以及全模态、高效率等技术的深度落地,我们有理由相信,中国大模型将在通往通用人工智能(AGI)的道路上,迈出更稳健的步伐,最终为各行各业注入智能动能,开启一个更智慧、更高效、更繁荣的全新纪元。
来源:小倩说科技