摘要:Arm推出全新的Lumex计算子系统(CSS)平台,旨在为智能手机、个人电脑和更小尺寸的设备带来更快的设备端人工智能(AI)。该平台结合了支持SME2的CPU、新的Mali GPU系列,以及对主要AI框架的支持。
Arm推出全新的Lumex计算子系统(CSS)平台,旨在为智能手机、个人电脑和更小尺寸的设备带来更快的设备端人工智能(AI)。该平台结合了支持SME2的CPU、新的Mali GPU系列,以及对主要AI框架的支持。
作为全新Arm Lumex计算子系统(CSS)平台的一部分,Arm C1 CPU集群是第一个基于Armv9.3架构构建的集群,并集成了矩阵扩展SME2。此次升级实现了高达5倍的人工智能性能提升、4.7倍的语音延迟降低,以及与上一代产品相比2.8倍更快的音频生成速度。在实际演示中,SME2将文字转语音的速度提高了2.4倍,并在与支付宝和vivo的合作中,将大语言模型的响应时间缩短了40%。
C1 CPU家族包括:
C1-Ultra:单线程性能比Cortex-X925快25%,延续了6年来稳定的IPC提升。C1-Premium:面积比Ultra小35%,面向次旗舰设备。C1-Pro:持续性能高出16%,适合游戏和视频播放。C1-Nano:比Cortex-A520节能26%,面向可穿戴设备。在图形处理方面,新的Mali G1-Ultra GPU通过RTU v2将光线追踪性能翻倍,并在游戏和人工智能推理方面都实现了20%的提升。Arm表示,这款GPU将改善《堡垒之夜》《原神》《无尽对决》和《崩坏:星穹铁道》等游戏的视觉效果和响应速度。较小的G1-Premium和G1-Pro变体则专注于中端设备的效率。
Arm的新RTUv2引入了在光线追踪单元内部的硬件加速遍历功能,取代了RTUv1中使用的计算着色器方法,并从打包光线模型转变为单光线模型,以更好地处理不连贯的光线,从而提供更大的灵活性。虽然打包方法通过将多条光线组合在一起以提高效率,但在光线经过多次反射后发生发散时会遇到困难,而Mali G1-Ultra中使用的单光线模型更适合实现逼真的光照和反射效果。Arm声称在微基准测试中光线追踪性能最高可提升2倍,尽管实际应用中的性能提升会有所不同,在其Lumilings演示中提升了40%,在《原神》中提升了17%,在《堡垒之夜》中提升了11%,在《无尽对决》中提升了25%,在Mori演示中提升了26%。
Arm预计到2030年,SME和SME2将在超过30亿台设备上提供超过100亿TOPS的计算能力。Lumex平台将CPU、GPU和系统IP整合在一起,能够实现更快的助手响应、实时翻译、提升的摄影效果以及更接近桌面端品质的移动游戏体验。目前,三星、腾讯、阿里巴巴、vivo和支付宝等合作伙伴已经采用了Lumex平台。
来源:CHIP奇谱