摘要:节选自:上海兆芯、最大8核支持DDR4的x86兼容CPU“ZX-D” ~性能媲美Intel和AMD的主流产品原文附翻译KX5000开始兆芯就在做纯自研IP,这点非常关键。
额……老铁们,我图吧老捡国产芯片垃圾的了。今天简单跟各位讲讲如何评价“用成熟工艺设计芯片才是真本事”还有自研指令集与安全可信逻辑关系简述。
节选自:上海兆芯、最大8核支持DDR4的x86兼容CPU“ZX-D” ~性能媲美Intel和AMD的主流产品原文附翻译 KX5000开始兆芯就在做纯自研IP,这点非常关键。
之前咱问过业内的群友,当时得到的回答是相对于指令集的自研,IP核/微架构的自研对于安全可信来说才是至关重要。
关于这个咱以后会更文章单独说,现在咱先尽量用通俗简单的方法跟各位说明一下。
稍微读过硬件发展史的各位可能知道,现代CPU其实已经没有RISC和CISC之分了,所谓的复杂指令集处理器其实在二三十年前的RISC86时代就已经不再是处理器原生支持了。简单来说为了兼顾处理X86复杂指令集和高性能高效率,现代CPU内部都是由前端负责翻译指令为CPU内部的微指令来执行,所有的现代CPU几乎都具有这个特性,因此即使是ARM CPU一样需要前端负责翻译指令→微指令,而现代处理器的架构水平完全是由微架构决定的。比如ARM A73/A72,英特尔的Sandy bridge/skylake,前者都是ARMV8的微架构,后者都是X86-86的微架构,但是这些处理器都是RISC处理器,只是前者翻译的是ARM指令(传统意义上的RISC),后者翻译的是X86-64指令(传统意义上的CISC),真正落实到微架构执行的微指令其实都是RISC。
所以指令集的切换其实并没有技术难度,有的只是专利壁垒。
在IDT winchip那个年头centaur的Billy Gray曾经有过一种想法就是做一种同时兼容MIPS和X86指令集的CPU,这完全可以实现,只不过当时IDT的人认为MIPS在桌面端没有市场,应该专心主攻X86。后来的事实也确实如此。20多年过后有一家企业用实践证明了IDT当年的判断没有问题。
现在我们也能看到同时兼容MIPS和RISC-V指令集的CPU,甚至能看到从MIPS跳车到Loongarc很快就能发布新品的厂家,没问题。因为这些处理器的微架构都是大同小异甚至完全相同,只是通过修改前端支持翻译的指令就能做到。甚至到了LATX可以通过二进制翻译直接兼容X86指令集,没问题。
但是确保CPU产品能做到安全可信的充分条件只需要自研微架构即可,自研指令集并不是必要条件。用自研微架构的方式能得到兼容X86和ARM指令集的安全可信CPU。
“x86设计一个架构大约需要数十亿美元,相较于Arm和Power架构要高得多” 其实兆芯做一代架构用不了这么多钱。虽然相比ZEN1的授权费用绝对要高上不少但是自研架构也没外国研发团队那么贵。这也是传统,威盛的centaur海外X86研发团队从IDT时代祖传的就是讲究一个短平快,研发耗时短研发费用和生产成本平价产品迭代快,虽然到兆芯也就是原威盛大陆团队这研发一代X86架构基本和外国耗时一样都是5年,但是研发费用低芯片生产成本低这点还是延续了的,简而言之KX5000的研发费用和芯片生产成本都并不高,尤其是28nm的KX5000配套的套片ZX200还在用40nm工艺生产,就决定了这套产品注定生产成本不高。
兆芯对工艺的迭代远远比华为海思保守,要知道KX5000是17年的CPU,而这时间华为海思已经用了两代TSMC 16nm了,KX6000在19年发布的时候和华为海思在16-17年出货的麒麟960使用的是同款TSMC N16 FFC(劣于麒麟955的N16 FF+,能效和密度都不如,只有生产成本低一个优点),所以相对的能效表现并不好。
麒麟955的16nm FinFET+(Plus)工艺相比后来的麒麟960甚至970更好,所以也奠定了一代神U的基础,能效高功耗低,除了生产成本贵产能需要抢以外没有缺点(后期960换工艺个人认为应该是海思抢不到产能导致的被迫用更差的工艺生产更高性能的芯片导致翻车)。 现在某些龙芯网宣KPI(尤其是已经确定传播过涉企不实信息被网信查办过的枪手铁流)喜欢扯什么《用成熟工艺设计芯片才是真本事》,听起来好像很对实际上根本不是这么回事。
其实有先进工艺不用更多情况不是因为要考虑国产备份工艺(KX6000那年头原定同时上线的HLMC的16nm国产备份工艺延期了很长时间),而是用先进工艺流片太贵一般的企业用不起。兆芯是在KX6000有年产数百万片的出货量基础下才能继续迭代工艺用6nm EUV先进工艺流片,这点其实和紫光展锐也比较相似,前期靠落后工艺大量出货创收,后期才能攻关先进工艺,这个路子其实华为海思多年前也是这么走的,华为在早期也用了很多年的28nm,中间跳过了20nm直接上的16nm,顺带避开了TSMC 20nm的坑,但是后来还是踩到了10nm的坑这就比较难评了,其实也应该跳过去直接等7nm DUV的。 现在国内已经有了N+1 N+2等效7nm DUV水平的工艺了龙芯还停留在TSMC 12nm并不是因为龙芯有多爱国所以坚持用国产工艺之类的,而是龙芯就用得起12nm FFC流片,即使是SMIC的14nm龙芯也不是次次都用得起的,成本太高,所以现在无法继续升级工艺只能搁这吃不到葡萄就说葡萄酸扯什么《用成熟工艺设计芯片才是真本事》了,要是真用成熟工艺设计芯片才是真本事龙芯完全可以用纯国产的28nm继续升级架构,而不是搁这用南京台积电的工艺甚至不是中芯国际的14nm去美化工艺量产芯片,甚至在12/14nm节点上还要搞得遮遮掩掩。实际上还是贪图台积电的低成本高良率又不想在宣传上被人知道自己在用不可控工艺。
龙芯在实践中讲的是商业逻辑在宣传中却玩起了意识形态,这种头身分离嘴上说一套实际做一套的操作其实还不如光做不说。这种嘴上很硬但是实际上真香的行为让人看了只会觉得滑稽。
其实用台积电流片从ZZZQ角度上讲用的肯定不能算是外国工艺,用了也就用了,没啥大不了的。但是被制裁之后还要想办法去偷鸡摸狗的用如果啥也没说就偷偷的用还则罢了,一边用一边还要高调《用成熟工艺设计芯片才是真本事》就多少有点好笑了。
我们有理由相信,龙芯一旦用得起国产7nm工艺之后对应的宣传口径一定会发生变化,到时候肯定会决口不提《用成熟工艺设计芯片才是真本事》,咱就敢跟各位说这个话了,不信的话各位等以后龙芯真用上先进工艺之后再回头看,历史自有定论。
就这样,谢谢朋友们!
来源:失传技术研究所