从软件、架构到生态,Arm全面赋能AI时代

B站影视 2024-11-27 21:55 1

摘要:作为Arm一年一度最重要且规模最盛大的技术盛会,本届年度技术大会将全球最具影响力的技术领袖、生态伙伴和开发者汇聚一堂,聚焦生成式AI、边缘 AI、大语言模型 (LLM)、Chiplet技术、AI 基础设施、智能驾驶等前沿科技,共同探讨和展示AI时代下基于Arm

11月19日,以“让我们携手重塑未来”为主题的Arm Tech Symposia年度技术大会上海场在上海浦东丽思卡尔顿酒店隆重召开。

作为Arm一年一度最重要且规模最盛大的技术盛会,本届年度技术大会将全球最具影响力的技术领袖、生态伙伴和开发者汇聚一堂,聚焦生成式AI、边缘 AI、大语言模型 (LLM)、Chiplet技术、AI 基础设施、智能驾驶等前沿科技,共同探讨和展示AI时代下基于Arm技术的最新创新成果和未来发展趋势,致力于推动AI技术在Arm生态系统中的深远价值。

Arm Tech Symposia 年度技术大会上海现场

Arm基础设施事业部产品解决方案副总裁Dermot O’Driscoll在演讲中表示,我们正身处 AI 时代,现在是我们行业的关键时刻,或许比互联网时代,甚至智能手机时代都更加重要。AI 的发展将对各个行业提出越来越多样化的需求,将为各个应用市场带来全面变革。

变革之下,半导体行业正面临全新的需求,无论是算力、性能、能效,还是上市时间的需求都在不断提升。

对此,Dermot O’Driscoll认为,构建计算的方式必须随之演变,芯片不再是一个由离散模块或组件以模块化方式构建的简单集合。这种方法无法充分释放性能或能效。我们需要从整体解决方案的角度进行设计,这需要更深度的集成,更多的功能需要协作共存,以实现更低的延迟、更高的带宽,以及更高的能效。

Arm 基础设施事业部产品解决方案副总裁 Dermot O'Driscoll发表主题演讲

不难理解,伴随每一代技术革新,都看到大量计算需求部署在一个极度受限的功耗环境中,而这正是Arm的强项。

回顾计算技术的历史能够看到,计算技术起源于占据整个房间的大型机。第一次转型是将计算机从房间大小缩减到桌面大小的个人电脑,这一革命性变化让更多人得以接触计算技术,从而改变了世界。随后,计算技术再次实现飞跃,从桌面转移到口袋大小的智能手机,标志着行业的一次根本性变革。

每一步转型都需要具备卓越的可扩展性、性能和能效的解决方案,能够加速产品上市,这也是Arm计算平台的核心特性。这些特性不仅推动了行业变革,也将在AI时代继续引领潮流。

然而,在这个过程中,系统的设计思路正在发生变化。

众所周知,AI 通常需要异构计算,系统中需要多种计算要素的协作。为了管理不同应用程序中的工作负载,需要一种能够高效率编写软件的方式,让开发人员能够针对该硬件进行开发。业界需要谨慎考虑如何将这些计算组件结合在一起。

就像许多人都见识过一些令人惊艳的硬件,但由于软件表现不佳,甚至根本没有软件支持而未能发挥其潜力。Dermot O’Driscoll强调:“软件并非魔法,而是由开发者编写的。在当前许多情况下,我们需要以软件为中心的思维来思考硬件设计。硬件若无软件支持就毫无意义(Hardware is Nothing Without Software)。”

这一观点从行业厂商的团队配置中就能得到印证:“在传统的、AI 热潮兴起前的初创公司中,硬件和软件工程师的比例大约是 50/50。但现在,情况完全不同了,变成了 10/90——10% 的硬件工程师和 90% 的软件工程师。”

可见,软件的地位已经压倒性地提升,而围绕软件构建的复杂性也在持续增长。

Arm作为一家转型成功的计算平台型公司,正在尝试通过软硬件深度融合和架构创新,持续在 AI 时代引领计算变革。

Dermot O’Driscoll表示,我们聚焦于整体的技术栈,涵盖从底层硬件到整个技术栈中的软件和应用程序。其中,软件始终是Arm计算平台不可或缺的核心组成部分,Arm已投入30多年的时间来编写和优化软件。展望未来,技术将变得更加复杂,对支持的需求也将大幅增加。鉴于软件的开发成本高且耗时,因此Arm的投资策略必须不断进化。据悉,目前全球已有2000万名开发者在Arm平台上进行软件开发工作。

而之所以能够吸引众多软件开发者的原因,在于Arm拥有全球最大的计算平台,而这形成了良性循环:更多的硬件吸引更多开发者开发软件,进而推动对高能效硬件的需求,同时,这些软件也能帮助开发者更好地挖掘硬件性能;实现易用性和易访问性的双重保障,彼此互为循环。

正如Dermot O’Driscoll所述,这一过程贯穿整个技术栈,从底层的操作系统到顶层的应用程序和用户与科技的互动方式,一致的计算平台为开发者提供了信心,使他们能够编写出可在当前数十亿台 Arm 硬件上良好运行的软件。

以AI PC为例,目前已有众多原生应用程序在Windows on Arm平台上运行,也有丰富的开发工具,以及越来越多的创新应用。

在活动现场,Arm还介绍了专门面向AI工作负载设计的Armv9架构。

众所周知,Arm架构凭借低功耗、高性能的特点使它成为全球应用范围最为普及的技术架构。同时在过去几年中,Arm通过加入许多以AI为核心的功能,使该架构适用于未来发展,而这一进程还在持续。

据了解,早在2005年发布Armv7-A架构的时候,Arm就引入了SIMD(单指令多数据)扩展技术,为一系列整型和浮点型提供单指令多数据(SIMD)扩展操作,让终端开发者可以探索如何更好地加速机器学习负载;2016年,Arm又在Armv8-A中又引入了SVE(可伸缩向量扩展)技术,增强了其向量处理能力。同时在Armv8架构中引入了64位技术。

但真正开启AI时代的,是Armv9架构。

2021年,Armv9架构的发布使得Arm在人工智能市场的实力再上新台阶。据Dermot O’Driscoll介绍,除了引入SVE2技术外,还引入了SME(可伸缩矩阵扩展)技术,显著提升了Arm CPU对现有AI和ML工作负载的处理能力,从而在各种AI驱动的设备和应用中带来速度更快、响应更灵敏的用户体验。

两大关键技术:

可伸缩向量扩展 (SVE):SVE2 已应用于一些领先的计算产品中,如全新的天玑 9400,可加速工作负载,惠及开发者和终端用户。SVE2 提升了视频和图像处理,提供更好的照片质量。可伸缩矩阵扩展 (SME):新一代架构功能将为开发者提供通用指令集,使其能够一次在多个硬件平台上实现 Arm 架构中的加速效果。

展望未来十年,Arm的计算平台将持续为AI而优化,所有这些功能将通过软硬件能力的结合来实现。为此,Arm 正在抽象化许多硬件相关的技术细节,真正实现对开发者友善的设计,让用户能专注于打造优秀的软件与简单的整合。

除了架构升级之外,还能发现Arm也已经实现从一家产品公司转型为平台公司。

2018年,Arm在发布基础设施市场的产品规划以来,Neoverse平台已发展出V、N、E三大产品系列。2023 年,Arm 进一步扩展了Neoverse产品路线图,首度推出 Neoverse 计算子系统CSS,通过整合IP核心、互联产品以及软件和工具,满足快速变化的AI数据中心的需求。

Arm终端CSS 则在进阶制程节点上集结了最新Arm计算IP及可立即生产的物理实现,可满足日益增长的计算效率需求,协助合作伙伴打造同级最佳的消费应用解决方案。通过Arm 终端CSS,Arm不仅帮助芯片合作伙伴减少了开发工作量及缩短上市时间,同时提供了可扩展的差异化能力,使他们能够构建出独特且贴合市场需求的解决方案。

此外,Arm在今年上半年就曾宣布,预计将会在2025年推出Arm汽车CSS。针对汽车应用,Arm通过计算子系统将其汽车增强(AE)IP的配置进行预集成与验证,并在先进的代工工艺上,对性能、功耗和面积进行优化。

与此同时,生态一直都是Arm的优势和重点关注所在。Dermot O’Driscoll对此表示,无论是在硬件还是软件上的努力,Arm始终都在致力于打造一个赋能创新的产业生态,通过Arm计算平台持续为合作伙伴赋能,进而推动 AI 和芯片领域的持续创新。

Dermot O’Driscoll接受媒体采访

其中,Arm在2023年启动的Arm全面设计(Arm Total Design)生态项目就是这方面的一个有力证明。

据了解,Arm全面设计生态项目所构建的整个生态圈包括了芯片设计公司、软件公司和代工厂,可以支持从设计到制造的整个开发过程,使用Neoverse计算子系统 (CSS),通过提供标准构建模块和集成第三方组件的能力简化芯片开发,共同打造先进的芯粒和片上系统等更广泛、更高级的解决方案。同时,Arm全面设计的合作伙伴可以在先进节点上构建基于CSS的定制芯片,并获得无缝的开箱即用的软件体验。

该生态项目旨在通过促进行业合作伙伴之间的合作,生态系统合作伙伴能够专注于各自擅长的领域,进而更快、更具成本效益地开发出更好、更强大的产品,加速开发面向人工智能、高性能计算和数据中心应用的定制芯片解决方案。

据Dermot O’Driscoll透露,经过了一年的发展,Arm全面设计生态系统迅速扩张,已经有30家公司加入。

在本次大会期间,还汇聚了不同领域的战略合作伙伴,分享他们作为标杆企业对AI的前瞻洞察及战略布局,进一步展现了Arm繁荣多元的生态。

阿里云智能集团研发副总裁,龙蜥社区理事长马涛分享了阿里云对 AI 浪潮的观点,通过打造专为云原生时代设计的处理器,全新的Anolis 23,以异构计算的概念,结合软硬件协同优化的方式、开源社区的众测共创,有效应对AI时代的复杂挑战。马涛指出,AI时代数据中心的通用计算仍将以CPU为中心。也正是基于这样的认识,早在2021年阿里云便基于Armv9架构开发了倚天710,目前已成功应用在阿里云数据中心。128核心,主频达到3.2GHz,同时采用软硬件融合的方式,可以满足云原生创新设计对性能和稳定性的要求,有效提升了系统的效率和扩展性。

此外,联想全球中小企业产品和解决方案总经理郑爱国、小鹏汽车嵌入式总架构师唐黾也与 Arm中国区业务全球副总裁邹挺分别展开了深度对话,围绕各自领域中的 AI 机遇和战略进行了分享,致力于携手Arm,共同推进产业生态的繁荣发展,为用户带来更多元化、更高质量的产品体验。

综合来看,随着AI浪潮的兴起,Arm迎来新的发展机遇和增长空间,推出更多面向AI领域的最新进展及技术创新。展望未来,Arm在基础设施领域如何继续保持高增长的势头,进一步提高Arm的市占率?

Dermot O’Driscoll表示,在数据中心业务领域,亚马逊云科技、谷歌和微软等都已经宣布了基于Arm技术的定制产品。预计未来计算子系统(CSS)和Neoverse平台也将继续迎来更强劲的市场发展势头。

与此同时,Arm正在引领基础设施领域的增长趋势,通过持续致力于和行业的领先企业共同合作,助力客户更多地采用Arm计算技术。Dermot O’Driscoll认为,这些客户需要的不是通用产品,而是专为他们的应用和工作负载定制的解决方案,Arm计算平台具备的灵活性最能满足这个需求。

到目前为止,Arm在AI训练领域已经见证了很多创新。而接下来将看到更多关于AI推理领域的更多突破,即AI的实际应用。这些创新将从数据中心延伸到边缘计算,再进一步扩展至终端设备。因此,下一轮创新的重点将从AI训练转向AI推理。这意味着Arm和合作伙伴在AI推理领域将迎来巨大的机遇。

随着与合作伙伴的紧密合作,Dermot O’Driscoll预计,到2025年底,全球将有超过1,000亿台具备AI能力的Arm设备。

正如Arm曾经助力智能手机的崛起,Arm也将成为AI计算平台的驱动者,为AI技术的普及提供坚实支持。

AI时代,Arm大有可为。

来源:半导体行业观察一点号

相关推荐