摘要:从上图可以看出,麒麟9010相较于麒麟9000S唯一的变化,就是CPU部分的架构升级。而且从图中可以明显看到,麒麟9010的CPU三级缓存容量直接翻倍至8MB!
从上图可以看出,麒麟9010相较于麒麟9000S唯一的变化,就是CPU部分的架构升级。而且从图中可以明显看到,麒麟9010的CPU三级缓存容量直接翻倍至8MB!
同时CPU超大核主频明显降低了,结合其GB6跑分之单核性能提升8.5%成绩来看,唯一解就是其微架构全新升级了。此外右边三颗CPU大核的主频略微提升了一点点——同时L2缓存容量翻倍至1MB,综合这些所有的变化最终其CPU多核性能总共提升了6.3%。
CPU综合性能确实提升不多,但从超大核主频下降12.2%性能反而提升8.5%却可看出,这代在能效表现方面进步明显。下面就来看一下,这代超大核的微架构具体有哪些升级。
从上图可以看出,分支预测的前端直接去掉了L1 BTB,并相对应地做了更大的L0 BTB以及容量翻倍的L2 BTB,并以此改善了分支预测的精度。
其它的微架构前端部分,则可以看到其在前代6解码6发射的基础上,直接拓宽至8解码8发射。此后还可以看到,这代ROB深度直接从前代之240 entries 巨幅跨越为448 entries!
这么大的ROB明显不符合正常迭代逻辑,估计华为是考虑到未来该核心可能用于桌面平台的SoC设计,具体例子可参考苹果A系列与M系列的诸多微架构兼容设计。
后端部分则可看到整数ALU从前代的四组增加到了六组,并相应大幅提升了整数和浮点单元的吞吐量,同时Load单元和Store单元也有明显改进。
2,麒麟9020最新的麒麟9020终于是去掉了公版的小核直接换上华为自主设计的全新小核,从此麒麟芯片也是和苹果A系芯片以及高通最新旗舰骁龙8至尊版一样的全自研手机芯片了!
而且这批全新自研小核的待遇相当高,直接共享了容量高达1MB的二级缓存,而前代公版小核所拥有的L2缓存总容量仅为512KB,结合全新自研小核基于乱序执行设计所拥有的更高性能上限,麒麟9020的小核能效表现将会有质变式飞跃。
简单来说可以这样理解,顺序执行架构的公版小核就像单车道,前面堵了只能干等待;而乱序自研小核就是多车道,前面堵了可以借道超车,这样单位时间通车量即性能自然就上去了。
不过这代的超大核架构却并没有大变化,仅仅只是继续增加了访存单元和浮点单元的调度器深度,并相应增加ROB深度。此外这代的L3缓存继续增大至10MB,系统缓存则直接翻倍至8MB!
结合制程工艺的相应升级,这代大核在主频回归2.15GHz的同时性能还有所上升,而超大核主频则直接提升了8.7%,结合主频有所提升的自研小核,这代的CPU多核性能便提升了14%。同时得益于全新优化的超大核,这代CPU单核性能也有11%的提升。
有趣的是,麒麟9020的GPU部分也终于有所升级了。其虽然在规模上还是4簇共1024组ALUs,但在频率方面却提升了12%,结合架构方面的升级其性能便直接大幅提升了25%!
3,同行业对比从上图可以看出,CPU多核能效方面麒麟芯片是一个逐代进步的趋势,但苦于制程工艺所限最新的麒麟9020在这方面,依然不如基于台积电4nm工艺打造的骁龙8+ Gen1。
其中麒麟9000S的CPU多核能效趋近骁龙888,所以麒麟9010和麒麟9020的CPU多核能效便介于骁龙888和骁龙8+之间。
至于纯性能对比,则是麒麟9020的CPU单核性能略强于骁龙888,同时其CPU多核性能还略强于骁龙8+,总体而言综合表现已趋近骁龙8+。
可见在国产制程大幅落后于台积电的情况下,华为凭借三代麒麟芯片的努力,完成了CPU综合表现从趋近骁龙888到趋近骁龙8+的跨越,可惜在GPU方面依然明显落后于骁龙8+。
华为针对国产制程大幅落后台积电最新工艺的现状,直接用一年两个月三次迭代的“小步快跑”策略努力去减小与友商最新旗舰芯之间的差距,如今麒麟9020已经取得综合表现接近骁龙8+的成绩。
同时,麒麟9020相较于“小步快跑”策略的起点麒麟9000S,在CPU单核、多核性能两方面分别获得了20.4%、21.26%的明显进步,结合大幅提升25%的GPU性能,以及提升明显的整体能效表现,若将其看作是一整代的升级幅度那已是神U水平了。
回顾一代神U骁龙865,就是在制程工艺没有明显升级的情况下,相较于骁龙855在性能明显提升的同时还大幅提升了整体能效!这就是CPU、GPU架构优化升级所呈现出的极限腾挪魅力。
来源:真义科技