以终为始,场景定义算力“革命”

B站影视 内地电影 2025-05-23 18:35 2

摘要:从技术本质剖析,AI 模型的训练与推理均高度依赖强大的算力支撑。训练阶段,海量数据需快速处理分析以提取有效特征和模式,这要求算力具备卓越的计算速度与并行处理能力;推理阶段,算力则需实现实时或近实时响应,确保对输入数据的高效准确处理,满足实际应用场景需求。

AI+ 时代对算力的需求,不再是一个芯片 + 算法的简单组合,而是一整套“硬件、算法、平台、服务”的解决方案。

从技术本质剖析,AI 模型的训练与推理均高度依赖强大的算力支撑。训练阶段,海量数据需快速处理分析以提取有效特征和模式,这要求算力具备卓越的计算速度与并行处理能力;推理阶段,算力则需实现实时或近实时响应,确保对输入数据的高效准确处理,满足实际应用场景需求。

然而,AI 在各行业的落地进程中,既取决于算力在特定场景下的性能表现,也受制于相应解决方案的实施成本。所以对于算力供应方来说,精准把握业务需求并实现最优性能并非易事。底层基础设施与上层业务之间天然存在隔阂。

因此大家都在思考:支撑 AI 发展的 AI Infra(人工智能基础设施 ),要怎样才能适应不同行业的需求,实现“自我进化”?作为提供算力的基础,CPU 和云计算产品一直在尝试创新,它们能否打破当前阻碍 AI 落地的算力限制,帮助 AI 更快地在各个行业发挥作用?这些问题亟待探索与验证。

更“接地气”的算力解决方案

首先让我们看看这场“自我进化”,应当包含哪些核心命题。大概是:高性能、高稳定性、更普惠的价格,以及在特定场景下有可验证、可量化的效果提升。

其中一大关键,在于更务实地评估 AI 业务的未来体量,以终为始,有魄力选择最优性价比的硬件方案。

因为 AI 技术要实现真正的大规模落地,核心要解决两个问题:一是降低使用门槛,二是降低部署和运营成本。

而具体到解法,英特尔 + 阿里云给出第九代企业级实例 ECS g9i 的答案。

相比第八代实例,ECS g9i 算力最高提升 20%,其中全核睿频达 3.6GHz; L3 缓存提升 50%,达到 504MB;内存频率达到 6400MT/s,与此同时,价格还降低了 5%。

全核睿频 3.6GHz,意思是处理器在多核高负载下仍能保持较高频率,这一方面与制程工艺有关,一方面与散热设计有关。

而 L3 缓存是与内存之间的高速存储层,容量越大,CPU 访问数据的延迟越低。

内存频率则是指内存的数据传输速率。当前市场实际是 DDR4 和 DDR5 并存的状态,一般来讲 DDR4 的最高频率为 3200 MT/s。按 JESD79-5 标准,DDR5 内存的频率则是从 4800MT/s 起跳,6400MT/s 属于高端配置,接近 DDR5 的极限。

以上数据意味着 ECS g9i 瞄准的是对业务效果有着高要求,但在 TCO 维度正在寻找更优解的场景和公司。通常来讲,这类业务对云实例在弹性、安全、稳定性方面的要求也比较高,任何疏忽都将带来非常直观的业务损失。

因此, ECS g9i 的升级,一部分也在于平台能力的提升。据阿里云技术专家介绍, ECS g9i 已全面支持弹性临时盘,标配 eRDMA,单盘吞吐最大 4GB,延时降低至 8us。通过英特尔TDX 机密计算功能,ECS g9i 实现了物理级的安全隔离;通过双单路架构设计,提升了整体服务的稳定性,缩小了爆炸半径。

ECS g9i 的底层,是阿里云 CIPU 体系,即 Cloud Infrastructure Processing Unit,云基础设施处理器。阿里云判断,传统云计算经历了大型机替代(第一阶段)和超大规模云计算服务(第二阶段),正进入以“硬件加速 + 资源虚拟化”为核心的第三阶段,所以需要 CIPU 向上对接飞天操作系统,完成上层资源调度、虚拟化管理和服务编排;向下负责底层硬件加速和资源管控,将计算、存储、网络资源以“0”损耗的方式交付给飞天。

在底层的硬件资源上,与 ECS g9i 成为“搭档”的是英特尔®6 性能核处理器。选用部署广泛的 CPU,无疑降低了企业的门槛。且相比于前一代产品,至强®6 性能核处理器单插槽集成的物理核心数量翻了两倍,单核平均性能提升 1.2 倍,每瓦平均性能提升 1.6 倍,TCO 降低 30%。

除了芯片工艺本身,为了让 ECS g9i 能更好地服务 AI 推理场景, 英特尔®AMX 技术也起到了重要作用。

英特尔®引入了专用矩阵乘法指令(TMUL),通过硬件级优化大幅加速矩阵运算(如深度学习中的卷积操作)同时支持 INT8(低精度量化)、BF16 和 FP16(半精度浮点)三种数据格式,完美适配 2024-2025 AI 进入业务时的实际技术环境。

而这些创新的背后是英特尔的洞察,英特尔以往强调性能与算力,而未来将把重心转向可用性与工程集成能力,致力于降低用户的使用门槛。英特尔不局限于单纯销售芯片或设备,而是携手合作伙伴提供涵盖驱动、工具链、SDK 等在内的软件和服务,以缩短 AI 项目的上线周期。

英特尔与阿里的携手合作,将在阿里云平台上为用户提供更多高度优化、开箱即用的解决方案,让不同经验水平的用户,无论是资深从业者还是 AI 新手,都能从中受益。

AI Infra,正在为业务带来新增量

除了上述提到合作,英特尔还与阿里云的 PaaS、SaaS 等多种产品展开深度合作,使更多终端用户能够享受到合作带来的红利。

ECS g9i 与英特尔®至强®6 性能核处理器的组合,尤其在垂直场景的成绩相当不错,用于支撑 Web 类应用,性能提升 20%;支撑数据库业务时,性能提升 17%;支撑在线游戏业务时,性能提升 15%。当然,这样的性能表现,与 ECS g9i 对业务场景的理解和适配也密不可分。

以数据库业务为例。作为阿里云最广为人知的云原生数据库,PolarDB 衍生出了一个专门服务于 AI 场景的扩展版本,叫作“PolarDB for AI”,其核心在于通过 In-DB Model as an Operator 技术,将 AI 模型直接嵌入数据库内进行加速处理。

In-DB 就是 AI In DataBase。而 Model as an Operator ,就是说将模型封装为数据库原生操作符,像调用 SQL 函数一样,调用大模型。模型创建、模型评估、模型推理等功能,全部可以用 SQL 语句来完成。

对比传统数据库,这样的设计理念直接减少了数据移动,使数据库内嵌模型可以实时处理最新数据(如流数据),并保证事务一致性。同时进一步简化了开发流程,减少了运维开销。

但这也意味着,相比于传统云原生数据库,PolarDB for AI 需要更强大的算力支持。

比如,PolarDB for AI 的 架构中集成了 DeepFM 推理推荐算法,用户可通过 SQL 查询直接调用 DeepFM 进行推理,服务于点击率预测(CTR)或推荐排序等场景。这一般对算力的要求更高,推荐效果也更好。

而 ECS g9i 从软硬件两方面,都对 DeepFM 算法进行了加速。包括做到算子融合,减少冗余访存;推进框架优化,使用更高效的推理引擎;针对大小并发场景,还可以用 AVX-512 和英特尔AMX 分别加速向量计算和矩阵计算。最终实现对比上一代产品每核推理性能提升约 1.26 倍 -2.53 倍。在对抗 DeepFake 的风控场景,服务蚂蚁数字科技的 ZOLOZ Deeper 产品时, ECS g9i 与英特尔®至强6 性能核处理器的组合,也拿出了很好的表现。

ZOLOZ Deeper 是为了应对 AI 换脸、深度伪造等技术带来的安全威胁而研发的,其核心目标是通过端云一体的全链路技术体系,确保生物特征数据的真实性和安全性,广泛应用于身份认证、金融风控等场景。

ZOLOZ Deeper 的技术体系分为前端安全检测和后端深度学习模型分析两大模块:前者用于检测摄像头状态,实时分析用户行为,做好生物特征采集;后者做微表情和肌肉纹理分析,完成攻防迭代优化。

在这样的技术体系下,ECS g9i 的性能表现和 AMX 加速技术变得非常重要。

AMX 的加持下,ECS g9i 能够高效处理小模型推理任务,TCO 大幅度降低。工具套件对 CPU 进一步进行优化,使其达到峰值效率,提升了视觉模型推理的性能,使端到端性能提升约 10%。

这便是英特尔持续优化创新,以软件重新定义硬件,满足软件需要的低精度的计算、高带宽的要求,让芯片上每一个单元都能发挥最大价值,极大降低部署和运营成本,提升整体效率。

可以说,ECS g9i 是 AI 应用落地大趋势影响下的技术产物,搭配英特尔®至强6 性能核处理器,为行业提供了更“接地气”的算力解决方案,在垂直业务场景,实现了算力成本上的“以小博大”。

未来 AI 发展的关键词是简单、稳定、高效、便宜,不再是一个芯片 + 算法的简单组合,而是一整套“硬件、算法、平台、服务”的解决方案。AI 要真正普及,必须靠软硬一体、工程思维和生态协作来共同推动。

在 5 月 8 日的直播中,来自英特尔、阿里云、PolarDB、蚂蚁数字科技的几位专家,详细分享了算力引擎是如何加速 AI 应用落地进入“快车道”的,感兴趣的读者可以点击文末【阅读原文】查看直播回放视频进一步了解。

AI+ 算力 + 场景的共生进化

今天的企业,面临的问题不再是“要不要用 AI”,而是“怎么用得更聪明”。

过去,AI 技术往往被当作一个独立的“黑匣子”,企业要么堆算力,要么被复杂的部署流程劝退。但如今,ECS g9i 在 PolarDB for AI 、ZOLOZ Deeper 等多个场景的应用效果,正在证明一件事:AI 的落地不是“非此即彼”的选择题,而是需要根据业务场景,把算力、模型、数据捏合成一套“组合拳”。

这场变革的真正难点,在于如何让技术与产业“长在一起”。比如,来自 PolarDB 、ZOLOZ Deeper 的应用场景,加上 ECS g9i 以及英特尔®至强®®®AMX,才能发挥最大价值。

而这种生态上的协同,比以往出现的更加密集,也更加重要——它们共同解决了数据格式兼容、模型部署效率、业务场景适配等问题。需要相关企业长期扎根行业,丰富解决方案案例库。

好在,相关企业有充足的理由来完成这项长期投资。毕竟,谁能在自己的业务场景中,把算力调得“刚刚好”——既不浪费资源,也不拖后腿,谁就能在 AI 时代抢得先机。

技术进化不等人!抢先掌握 Intel 最新动态!

来源:InfoQ

相关推荐