摘要:我(本文作者George Cozma)有幸采访了 IBM 的 Power CPU 首席架构师 Bill Starke,我们谈到了 Power 的未来以及他对未来内存标准行业发展方向的看法。但在采访之前,我们先介绍一下 IBM Power 和 Power CPU
各位优秀的互联网用户们,大家好,
我(本文作者George Cozma)有幸采访了 IBM 的 Power CPU 首席架构师 Bill Starke,我们谈到了 Power 的未来以及他对未来内存标准行业发展方向的看法。但在采访之前,我们先介绍一下 IBM Power 和 Power CPU 的历史,以方便那些不知道 IBM Power 是什么的人。
IBM Power 简介
大家好,各位优秀的互联网朋友。我从南卡罗来纳州回来了,在那里我度过了一段非常愉快的时光,我迫不及待地想参加明年在圣路易斯举行的 SC25。
在 SC 期间,我非常荣幸地采访了 Bill Starke。Bill Starke 是 IBM Power CPU 的首席架构师。
现在,你们中的一些人可能知道 IBM Power 是什么,但有些人不知道。这篇介绍更适合那些不知道 IBM Power 是什么的人。IBM Power 是 IBM 生产的两条 CPU 系列之一。一条是 IBM Power,另一条是 IBM Z。IBM Z 的历史可以追溯到 System 360,与 Bill 和我谈论的 Power 系统有着很大的不同。
有些人可能知道,Apple 长期在 PowerPC 系列 MacBook 和 Mac 台式机中使用 Power。
因此,对于你们中的一些人来说,Power 是一个已知量。然而,Power 最近已经不再是新闻了。自从在 Hotchips 2021 上宣布 Power10 以来,关于 Power 的讨论并不多。
从历史上看,IBM 有最初的 Power 版本,比如 POWER5,然后在两代之间,也就是在 POWER5 和 POWER6 之间,他们有一个 POWER5+,这是对上一代 Power 的增量更新。而对于 POWER9,IBM 似乎已经放弃了 + 方案,[其中] 没有 POWER9+。
对于 Power10 来说,情况似乎也是如此。似乎不会有 Power10+ 出现。相反,我们得到的是 Power11。
这就是比尔和我谈论的内容,以及 Power 的未来以及他们可能对未来架构做出的决定,所以,虽然没有明确提到,但 Power12。
无论如何,我希望这段视频前的简短介绍能澄清一些事情,以及为什么会问这些问题。这主要是因为关于 Power 的消息并不多。所以我非常好奇它发生了什么,Power 的未来会怎样?以下是我对 Bill Starke 的采访。
Bill Starke访谈
为提高可读性和简洁性,本记录已进行编辑。
George Cozma:各位互联网人士,大家好。我们仍在 SC24,不过我们不是去会议中心,而是和 IBM 一起在 Westin Peachtree 酒店,我和 IBM 的 Power 部门首席架构师 Bill Starke 一起。您愿意介绍一下自己吗?
Bill Starke:大家好,很高兴和你们聊天。是的,我是 Bill Starke。我是 Power 微处理器的首席架构师,很高兴参加 SC24。今天过得很棒。今天下了点小雨,但你知道,有点潮湿,但除此之外,你们玩得开心吗?我玩得很开心。
乔治·科兹玛:这很有趣,有很多很好的讨论和拍摄,我看到,我喜欢你的衬衫,Power 10 衬衫。
比尔·斯塔克:第十个宝宝。很好。
George Cozma:说到 Power,Power10 是第一个拥有所有 Power 徽标的,即独立徽标。我们会看到 Power11 徽标吗?
Bill Starke:我预计会如此。我参与设计这款处理器的程度比实际处理器的程度要低一些,但 Power 11 即将问世,可以这么说。好的。
乔治·科兹玛:那么您认为,Power 11 从高层次的角度来看会是什么样子呢?
Bill Starke:好的,是的,退一步来说,如果你多年来一直关注我们,你就会知道,POWER7、POWER8、POWER9、Power10,我们进行了相当大的转型,从 Power 9 升级到 Power 10。你知道,正如我们所描述的那样,我们从核心开始拆解。我们开始构建一个新的,重点是。我们总是关注每一代客户,你知道,我们经营企业。所以我知道很多人没有听说过我们的所有细节。我们并不是很出名,但实际上,当你在手机上滑动某个东西时,你知道,当你点击某个东西时,大多数时候它都是通过一台隐藏在某个窗帘后面的 Power 计算机运行的。你知道,你正在运行世界上所有顶级企业。但是,当我们转向 Power 10 时,如果你还记得当时的讨论,其中一件大事就是我们真正专注于将人工智能融入企业。甚至在此之前,您知道,我们在外部加速 AI 方面做得更多。我们与 NVIDIA 合作做了一些非常酷的事情,这些事情实际上都围绕着大型 HPC 和 AI 训练。
但再次强调,我们是一家企业企业。因此,我们需要确保您能够训练模型,以便以后可以在企业工作流程中运行和推理它们。当我们转向 Power 10 时,我们强烈地转向让我们专注于推理,因为我们知道世界可以正确地进行训练。而且,你知道,这是我们一直在涉足的一个巨大领域。我觉得有了 Power 10,我们不仅满足了当天的工作量和需要完成的工作,而且我们更好地解决了未来的工作量。很抱歉,这是一个很长的序言,关于 Power 11 的进展情况?
我们在现场发现,Power 10 甚至超出了我们的预期。回顾过去,它正是我们所需要的,而且面向更好的未来。因此,对于 Power 11,我们不会将其全部烧毁,而是从大量新 DNA 开始。我们实际上会扩展这些功能,即您在 Power 10 中看到的架构特性,并对其进行增强。我可以举几个例子,但我必须让您以面试官的身份插话。但如果您愿意,我可以举几个例子。
George Cozma:是的,举几个例子。那么 Power 11 核心是从 Power 10 核心衍生而来的吗?
Bill Starke:是的
乔治·科兹玛(George Cozma):最大的微观架构变化是什么?
Bill Starke:核心本身并没有太多变化。我的意思是,Power 10 核心的表现非常出色。所以,是的,它会运行得更快。是的,我们将能够启用更多核心。但是,从架构的角度来看,从根本上来说,这是一次进化。我们真正关注的是,当我们与客户交谈时,除了原始速度和反馈之外,您还需要哪些功能?或者我们可以在系统的哪些方面提供更多价值?是的。
George Cozma:那么,Power 11 是它自己的独立核心,不是吗?
比尔·斯塔克:哦,这是一个新的核心。
George Cozma:我之所以问这个问题,是因为在一些 LLVM 提交中,Power11 基本上被标记为 Power 10。所以很多人质疑它是不是一个新的核心?
Bill Starke:所以就任何 ISA 更改而言,你知道,任何新指令,诸如此类。不,ISA 与 Power 10 ISA 相同。所以在软件世界中,你知道,你会看到,嘿,这看起来一样。嗯,是的,你知道,你希望你的 ISA 具有连续性。我们没有看到任何像,哦,我们最好添加新东西的东西。我的意思是,当我说 Power 10 时,我们觉得我们不仅解决了现在的问题,而且很好地解决了未来的问题。你知道,这与此密切相关。
George Cozma:好的。我知道几天前发布了路线图,未来的 Power 芯片看起来很像 AMD 的 Rome 和 Milan,其中有一个 IODI,然后是多个 [计算] 芯片。
比尔·斯塔克:是的。
乔治·科兹玛:是什么促使您做出这样的设计的?
Bill Starke:我们多年来一直在评估,你知道,摩尔定律什么时候会到来,是的,我们必须通过封装来增强新芯片的性能。正如你所指出的,我们在 AMD 的朋友身上看到了这一点。我们在英特尔的朋友身上看到了这一点。我们在其他地方的朋友身上也看到了这一点。人们正在向芯片架构发展,以克服物理限制,摩尔定律曾经是我们的好朋友,但现在不再是我们的朋友了。所以我们需要做这些事情。所以我们决定在 Power 11 之后推出新产品。我不会透露名字,因为我们必须有官方命名,但我会让你猜猜 Power 11 之后的名字。也许是 12。好吧,我可以确认或否认这一点。但无论下一个东西叫什么,我们都将采用芯片架构。我们想说清楚的部分原因是我们总是被问到这个问题。我的意思是,你们什么时候才能实现这个目标?有哪些因素?现在,如果你愿意,我可以谈谈我们在评估这些架构时发现的一些问题。如果你具体问,是的,我们看起来有点像 AMD 做的事情。你知道,AMD 必须在他们做的事情上做出权衡。英特尔必须在他们做的事情上做出权衡。
我觉得这很有趣,因为我们几年前就制定了计划。正如我们所看到的,哦,这就是他们正在做的事情,这就是他们正在做的事情,我们看到我们自己推测的事情在他们正在建造的现实中发挥作用。我们还看到,哦,这如何证实或否定我们的工程分析所说的?基本上,它有点符合我们的判断。我的意思是,我不知道我是否应该对竞争对手的做法发表太多评论。你知道,这只是我的猜测。我不想对任何人说任何负面的话。但我认为无论是 AMD 的架构还是英特尔的 Sapphire Rapids,他们都必须做出某些权衡。我可以看到他们所做的明智之举。他们在解决某些问题方面非常不同。我可以看到他们需要做出的妥协。碰巧的是,在我们玩的领域中,我们玩的是不同的世界。我们正在企业中发挥作用,你知道,特别是我们拥有大型系统企业的传统。
如果您看一下这些方法的映射方式,就会发现我们提出的方法与 AMD 提出的方法更相似。我可以更详细地讲。我会说,让我非常兴奋的是,我看到他们不得不做出妥协的领域。在这些领域,我们有一些差异化,我觉得我获得了 chiplet 架构的价值,而不必做出一些负面妥协。所以,是的,我猜是什么客户端工作负载促使您使用更多具有分解计算的 IO,具有分解计算的单一 IO,而不是单一统一计算和分解 IO。因此,其中一个方面就是构建一个大型系统。从延迟的角度来看,最糟糕的事情是在中心进行计算并分解 IO。考虑构建拓扑。这不是关于构建插槽。而是关于在所有插槽之间以及插槽内部建立连接。我喜欢称之为硅半径。我需要设计出绝对最低的延迟,以便从硅片的一端到系统中硅片的最远端,而不是在插槽级别。我还必须尽可能多地聚合硅片。所以这些是相互矛盾的。因此这是一个有趣的工程问题。
George Cozma:我们刚刚看到 Azure 和 AMD 宣布推出 MI300C 芯片。现在,您怎么看它?它看起来像是英特尔 Sapphire Rapids 和 AMD 的混合体,您是否认为这在权衡方面妥协较少?因为我知道 AMD 必须做出的一大权衡是无法直接在芯片之间进行通信(和 L3 缓存)。
Bill Starke:我们是否可以说他们可能不得不在延迟和带宽方面做出一些妥协?是的,因为信号类型与 Sapphire Rapids 和所有小凸起边缘的东西不同。我相信英特尔曾表示,我们将在此基础上构建完整的高速公路系统。因此,我认为您看到的是 AMD 的演变,他们表示,我们将在延迟带宽方面做出一些妥协,并对其进行改进。然而,这导致了英特尔做出的一些妥协。所以这很有趣。他们在他们过去的位置和英特尔现在的位置之间寻找平衡。对于我自己来说,对于我们来说,从我们在中心和计算模型中使用的信号技术来看,信号技术不需要我做出带宽妥协。这是双重的。一个是各种未封装 SERDES 的能力。我的工程团队能够做到这一点,就像我绘制高速公路图一样,我并没有觉得我们必须切断车道。不,这几乎就是我在船上建造的。但另一方面,由于内存接口,我们并没有用所有这些极其低效的 DDR 端口来与内存通信,而是用自己的内存架构来降低内存的信号开销,使我们能够将带宽用于其他用途。因此,这是真正高质量信号和在其中容纳更多信号的能力的结合。我不必做出这种妥协。它还有助于我降低延迟,因为降低延迟的最佳方法是在硅片之外。基板中的导线比硅导线的运行速度快 10 到 50 倍。因此,最糟糕的情况就是堆积成堆的硅片,你知道,硅片和延迟对我来说可能比其他人都更重要,因为我必须构建非常大的 16 插槽系统。我并不是想只构建一个插槽优化或几个插槽优化。因此,对于不同类型的空间,你需要做出不同的权衡。所以我并不是想批评任何人。我只是说我们必须做不同的事情。我真的很钦佩 AMD 和英特尔在限制条件下所做的努力。
George Cozma:不,当然。这实际上是一个问题,即您如何看待这种混合?如果您想更多地谈论 OMI,我真的很喜欢您的 OMI,因为这不仅是 Power 的一个主要区别,也是任何 IBM 系统的一个主要区别。
Bill Starke:是的,我们的 Z 系统也使用 OMI。我的意思是,那里还有另一个领域。我刚刚描述了 OMI 的价值,它提供了所有这些信号传输,你知道,海滨资源可以进行其他高带宽信号传输。这只是一个因素。这只是因为它的海滨区域效率很高,因为你基本上运行的是高速系列,而不是运行低速 DDR 接口,相对而言。引脚数要少得多。但 OMI 的另一个特点是,它有多个。我可以在这里一直说下去。我不知道我们有多少时间,但我将谈到重点。可靠性,超可靠性。任何系统中最薄弱的组件之一是 DIM 连接器,并在 DIM 连接器上运行 DDR 协议。你知道,它必须通过模块、主板、DIM 连接器和 DIM 下方的 DIM 运行,因为 DRAM 速度正试图通过这些单端 DDR 协议越来越快。我不知道他们将如何处理 DDR6。我认为这个行业即将迎来一个严峻的警钟。我知道他们正在处理这个问题。我知道人们在 DDR5 信号完整性方面遇到了很多麻烦。是的。所以我没有那个。我没有以那种方式运行 DDR 协议。我运行的是这个漂亮的高速系列。如果我遇到问题,我会重播。这是一个非常智能的协议,就像 PCI 一样。你知道,你必须重新发送一个数据包,如果 CRC 失败,你就重播它。我还可以绕过车道。因此,如果某个通道出现问题,或者 DIM 连接器出现问题,我可以绕过它,让系统保持正常运行。这对于我们在 Z 系统、电力系统中所做的工作至关重要,尤其是像 SAP HANA 这样的大型工作负载。你有数十 TB 的内存,这些内存永远不能出现故障。
这是我们实现这一目标的秘诀之一。现在,另一件事是可靠性。此外,由于我能够更高效地利用处理器运行它,所以我不必局限于只在一个插槽后面放置 8 个或 12 个 DDR 端口。在单个插槽上,我的新内存架构后面有 32 个 DDR5 端口。带宽高得多。我可以获得三、四种类型的带宽,三、四种类型的容量。容量也很大。是的,绝对如此。特别是在 SAP HANA 世界中,它位于内存数据库中,这些数据库的大小可以是 8、16 TB 或更大。我们的规模要大得多。但是,是的,我认为我的方法和过去一样正确,我们仍然有八个插槽系统,它几乎是专门为 SAP HANA 工作而设计的。
乔治·科兹玛:所以我想,展望未来,力量将会存在。
Bill Starke:哦,Power 确实存在。这是另一个美妙之处。我们谈到了 Power 11。我们谈到了这一点,然后我们转向了芯片架构,接下来可能会命名为 Power 11 plus one。但是一旦你进入了芯片架构,我们看到的另一件事就是前进的道路。我们看到了如何在该架构内迭代集线器和周围的计算芯片。你可以看到如何逐步改变事物。首先,你可以看到,这允许你在插槽中获得更多硅片面积。好吧,这些都是微小的计算芯片。你可以看到它们如何根据需要增长。你可以看到你不必刷新整个东西。所以有一条增长路径,有一套围绕它的开发经济学,我会告诉你,作为一名首席架构师,我已经做了近 30 年,不是作为首席架构师,而是一名从事处理器工作的工程师。我可以比以往任何时候都更清楚地看到未来,只是因为,你知道,看到,好吧,我可以为 11 倍之后的事情做这件事。我可以为那之后的事情做这件事。我会为那之后的事情做这个转折。我会做这个转折。从发展的角度来看,我可以看到以更经济的方式实现这一目标。
乔治·科兹玛:好吧,我想他们只想问您最后一个问题,您最喜欢哪种奶酪?
比尔·斯塔克:你知道,我喜欢丹麦蓝葡萄酒,它和一杯红酒搭配起来味道非常好。
乔治·科兹玛:所以我认为我们还会推出更多《星际迷航》的内容。这取决于这个视频什么时候发布。不过,请点赞,订阅。我讨厌推销,但我不得不这么做。祝大家玩得愉快。
比尔·斯塔克:嘿,非常感谢您的邀请。
乔治·科兹玛:非常感谢。
专注半导体领域更多原创内容
关注全球半导体产业动向与趋势
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3990期内容,欢迎关注。
『半导体第一垂直媒体』
实时 专业 原创 深度
喜欢我们的内容就点“在看”分享给小伙伴哦
来源:西亚教育