处理器大神的逆转局——Jim Keller自述芯片设计职业生涯

B站影视 2025-01-29 20:12 2

摘要:这是计算机历史博物馆(Computer History Museum,简称CHM)对Jim Keller的视频采访,采访者为Douglas Fairbair,Doug是CHM半导体组的负责人。在其 40 多年的硅谷职业生涯中,Doug担任过多个工程和管理职位。

这是计算机历史博物馆(Computer History Museum,简称CHM)对Jim Keller的视频采访,采访者为Douglas Fairbair,Doug是CHM半导体组的负责人。在其 40 多年的硅谷职业生涯中,Doug担任过多个工程和管理职位。1971 年,Doug从斯坦福大学获得电子工程硕士学位后,就职于施乐帕洛阿尔托研究中心。1980 年,Doug协助创立了超大规模集成电路技术公司(VLSI Technology),并在那里担任负责ASIC开发的高级副总裁。1990 年,他创立了Redwood Design Automation并担任首席执行官,该公司于 1994 年被Cadence收购。自 1998 年起,Doug以顾问和董事会成员的身份,为多家公司提供服务。

因为是圈内人,所以Doug对Jim的采访驾轻就熟,双方不需要铺垫基础知识,在这个一个多小时的采访中,Jim完整讲述了自己的职业经历,从一个小时候有阅读障碍,大学一开始也是普通学生的半学渣,到发现自己的职业兴趣并开始努力学习,逐渐在职场崭露头角,Jim的主要工作经历在DEC->AMD->SiByte(Broadcom)->P.A.Semi->苹果->AMD->特斯拉->英特尔,到最后加入创业公司Tenstorrent,Jim的职业生涯经历了美国处理器发展的几个关键节点,例如从32位处理器向64位转变,例如参与苹果处理器的早期研发,例如全力投入RISC-V生态等,在不断升级打怪过程中,Jim自己也成长为处理器设计领域的大神。

以下是各节的视频及简介,感谢CHM对Jim的采访。

第一节

从阅读障碍到大学毕业

第一节:从阅读障碍到大学毕业

Jim Keller是工程师父亲+教师母亲的家庭组合,其父母6个孩子中的老二,从小有阅读障碍,小学二年级还不能阅读,到三四年级才逐渐开窍。

高中毕业考到宾州大学,是因为看到一个心仪的女孩子去了宾大,高中成绩都是B,在大学里一开始也延续这一优良传统,修双学位被哲学系主任给劝退,把精力集中在电子工程上以后,又一次开窍,成绩从全B跃升到全A。IBM当时给宾大捐了一条2寸线,所以Jim在大学里就开始自己制作晶体管了。不过那时候他的电磁场学得好,觉得自己会是一个RF工程师,第一份工作职位是逻辑电路设计工程师,但去了之后做的最多的工作是修电路板,修公司里各种出了问题的电路板,这也让Jim具备了极强的动手能力,以及对高速电路板的深刻理解。

在1982年(加入DEC的时间)以前,他就做了一块40MHz的PCB。虽然一直在修电路板,但是这些技能却也让他误打误撞进入了DEC。

第二节

在DEC开始处理器研发工作

第二节:在DEC开始处理器研发工作

Jim凭借开发电路板的能力进入了DEC。这一节是Jim在DEC的工作回顾,在DEC,他跟对了老板,整个项目组都对这个勤学好问的小老弟有好感,在DEC他既做逻辑设计,又做板级开发,甚至还自己动手写CAD工具。因为CAD不是他的本职工作,所以只好晚上花时间来写CAD。在DEC的各位技术大拿的带领下,Jim成长很快。DEC当时开发的第一代Alpha(EV4)芯片,时钟频率166MHz-200MHz,比市场上其他处理器的速度快三四倍。Jim大概是从第二代Alpha芯片,也即代号EV5的项目,真正有所贡献的。此后又完成了EV6的开发,到EV7流片时,他已经离开了DEC。

Jim谈到的在DEC的几个趣事:

为了debug EV5,他们几个核心组员在实验室住了1年。

虽然最后量产的芯片性能表现优异。但作为架构师,且参与了从寄存器级到板级开发任务的Jim,还是觉得这颗产品到处有bug,到处有妥协。

在开发EV6时,Jim同事的性能模型代码量有三万多行,但是这个同事说可以把代码压缩到1100行,然后Jim就做了一个1000行代码的性能模型,并且运行得很好。最后那个同事才说,其实他并没有做出1100行的性能模型,但他知道Jim有致命的好胜欲,所以被激将法触动的Jim爆发出了强大的产出能力。


第三节

Jim初进AMD

第二节:Jim初进AMD

这一节主要是讲述Jim在AMD的工作经历。上节说到,Jim Keller追随自己在DEC的上司跳到了AMD,在AMD,Jim参与了K7的开发,并主导了K8项目,Jim认为,他的AMD的主要贡献之一是合作制定了x86-64位规范以及HyperTransport 规范。Jim在AMD待了三年,然后就在互联网泡沫期冲入了初创公司。

他在AMD几个亮点:

Jim认为AMD的286、386和486 basically were mask copies of Intel processors. 到K5才有自己真正的设计。

K7大量借鉴了DEC EV6的设计

那个时代是美国处理器架构百花齐放的时期,Power、PA RISC和Sun等各领风骚

AMD的stand cell methodology 当时就很好了

第四节

SiByte与Broadcom

第四节:SiByte与Broadcom

这一节讲述Jim加入创业公司SiByte,以及SiByte被Broadcom收购以后,在Broadcom工作的经历。在1999年泡沫期,Jim离开AMD,追随他的上司加入创业公司SiByte,该公司主要业务是网路专用处理器(network-oriented processor),用现在的术语那就是NPU,SiByte里面源自于DEC的人很多,他们开发了PCIe PHY等技术。在SiByte,Jim开始接触客户,并享受与客户的交流,通过和客户交流,他能够挖掘出客户的真正需求,以及客户正在做什么产品。这段时间,Jim系统设计的能力得到了大幅提升,也认识到芯片规格制定要多与用户交流,而不能闭门造车。

SiByte很幸运地在泡沫末期卖给了Broadcom(2000年11月),在Broadcom,Jim对Henry Samueli非常折服,Samueli才气横溢,狂傲不羁。

Jim 和Henry一起跑客户,开始产品介绍由Jim来做,但是三天以后Henry忍不了就说我来吧,结果Jim发现Henry讲得比他自己之前讲的好太多。

采访者问了一个有趣的问题,即大公司和小公司对Jim有何影响?Jim认为,即使在DEC和AMD,虽然公司人很多,但他在的项目组人都不多,大概也就100多人。Jim说,在当时他有一个理论,而且有数据佐证,开发一个计算机(芯片)项目,400人需4年,300人需3年,200人需2年,100人需1年半。所以Jim当时的看法是,在基本人员数量之上,芯片开发并不是人越多时间就越少,实际上反而会因为增加人手而降低效率,超过400人,甚至项目(因为内部沟通合作之损耗)都无法完成。

所以,当时英特尔的Itanium项目有800人,而且按时完成了开发任务,曾经让Jim惊叹不已。

当然,随着芯片规模不断加大,合理团队规模还是扩大了,Jim二进宫AMD时,所在CPU团队人数就超过了500人。

这一节其他几个亮点:

Jim刚入行时处理器时钟频率是几十到百兆赫,在博通第一次见到10GHz示波器时非常惊讶:最早做100MHz都很难,到现在10GHz都实现了。回顾这一路走来,Jim认为工程师们创造了太多奇迹, 将很多不可能变成可能。

Jim(2000年-2004年在Broadcom)问Henry Samueli,何时可实现Gbps无线网络,Henry当时就给Jim演算起来,他通盘考虑了工艺进步、晶体管尺寸、封装和所需资金,对Jim说,如果当下就想实现千兆无线网,要花1万亿美元,但如可以等五年,就只要花1000亿美元。Henry预测5G在2018年可以实现,结果预言成真。

1980年代,摩尔定律还未人所皆知。但优秀人才通过优化各种因素,可用0.5微米工艺实现200MHz的处理器

第五节

P.A.Semi

第五节:P.A.Semi

这一节讲的是Jim从Broadcom出来加入创业公司P.A.Semi的经历。2004年,Jim加入P.A.Semi任工程副总裁,P.A.Semi在某种程度上来说,是SiByte人员的二次创业,SiByte的三位核心人员Dan Dobberpuhl, Amarjit Gill和Leo Joseph创立了P.A.Semi,Jim和另外五个人算是联创。

P.A.Semi开发了一款处理器,采用乱序执行的 PowerPC 内核,在架构设计上更为激进,能实现数据的流畅传输。为了让性能得以发挥,数据必须从 10 千兆端口流入,进入片上缓存或内存,无需再访问主存就能完成处理,然后进行一些关键操作,再将其发送出去。所以,从架构角度来看,这是一款更具突破性的产品。在设计的某些方面,它划分出了处理器区域、前端模块、内存控制器、PCI Express 以及通用的网络模块,此外还有网络加速模块。我们打造的这款产品,有两种投产方式。一种是作为面向思科等企业的网络处理器,另一种是将其作为独立产品,它本可以成为苹果个人电脑的组件。

在这款产品流片之后,Jim就加入了苹果(2008年),不过他在苹果的一次机会,促成了苹果收购P.A.Semi。那时候三星在与苹果合作开发一款1GHz运行频率的Arm核处理器,当时的工程师搞不定,就来请教Jim,Jim说我已经在苹果工作了,这个问题你可以请教P.A.Semi的Dan,Dan能够帮你解决,Jim让苹果工程师去请教Dan是为了给P.A.Semi找个大客户。Dan弄清楚了情况之后,就直接给乔布斯打了个电话,说服乔布斯收购了P.A.Semi

第六节

苹果处理器与乔布斯

第六节:苹果处理器与乔布斯

这一节,是Jim在苹果工作的经历。又是他在DEC的老同事拉他进入苹果。在这一节有苹果芯片早期开发的趣事。苹果第一代芯片的架构师,就像IP使用者,给大家的文档就是一份IP清单,这份清单通过后交给三星,由三星集成开发生产出来,居然也能工作。不过,内存延迟严重,性能也弱,软件几乎难以运行,但软件团队的人很厉害,他们把 OSX 系统大力精简后,让其能在这款芯片上运行。通过对软件进行优化并尽可能压缩,软件人员功力大增,后来他们得到更快的芯片时,软件就能真正发挥了。Jim认同:iOS 和安卓最大区别在于,安卓被移植到芯片上时,手机芯片已经相当不错,所以它从未像 iOS 那样进行深度精简。

Jim参与了 H2 项目,任H3项目的共同架构师,此后在H4、H5与H6的开发中也担重任。当时的苹果,在创新上非常激进,率先采用 64 位技术,率先实现高分辨率显示屏。在 H4 芯片中,其集成的 GPU 规模是其他竞品GPU 的五倍。这其中部分理念源自乔布斯和Mike Culbert。乔布斯认为,要打造最出色的技术,就得用最好的组件;要做出最棒的产品,就要最先进的技术和最优质的组件。后来,苹果团队在涉足触摸屏和视觉应用程序领域时,便大力投入到高分辨率、强大图形处理性能等方面。

苹果公司在芯片设计上的独创性,在Jim看来,团队新反而是好事。随着苹果设计团队不断壮大,成员来自五湖四海 :英伟达、英特尔、AMD以及一些小公司。他们在研究设计方法学时,并没有因循守旧地沿用资深工程师过去一直在用的设计方法,而是思考 “从每个人所采用的不同设计方法中,能提炼出哪些最佳特性?” Jim一度觉得,苹果公司或许拥有行业内最出色的设计方法,因为团队成员背景各异,想法层出不穷,有一种“混合优势”。

Jim在苹果公司工作时,与乔布斯直接交流的机会并不多,但Jim显然也受到了乔布斯“超现实引力场”的影响,他十分细致地观察乔布斯的做事方法,Jim说乔布斯不会告诉员工具体怎么做。他会说 “这是我想要的,你们能做到什么程度?” 以及 “告诉我你们能做到什么,然后咱们看看基于此能做出什么成果。” 苹果的公司文化,和Jim之前待过的DEC、AMD和SiByte都不一样,那些公司的文化都如出一辙:“我们是优秀的工程师,知道如何制造电脑” 工程师文化。苹果更像是秉持 “我想做这件事,然后我们要不遗余力地去实现它” 的产品经理理念。

第七节

AMD二进宫

第七节:AMD二进宫

这一节Jim讲述了二进宫AMD的经历。这次还是离不开老同事的帮助,Jim在P.A.Semi的前同事Mark Papermaster后来也在苹果与Jim共事,但Mark因“天线门” 被乔布斯解雇,之后就去了AMD。在Jim萌生去意时找了Mark,Mark便将Jim介绍给时任AMD CEO Rory Read,Jim很欣赏Rory,就二次加入AMD,Rory对Jim说:“我负责业务,你负责技术。我会确保公司资金不断,但你得设计出好芯片。”Jim在AMD最开始的职位是汇报给Mark。

据Rory给Jim分享,AMD 的服务器业务,从Opteron处理器起步,市场份额从 0 增长到 35%,然后又跌回了 4% 左右,他问Jim为什么会这样,Jim直言当时AMD产品不行,所以没人买。

如第三节所讲,Jim在第一段AMD工作时,和同事一起为AMD打造了K6、K7及K8等优秀的处理器。Jim离开之后,AMD的研发人员想更进一步提高频率,且又引入了大量定制设计,并采用了有问题的架构特性。结果后续的产品既没有达成频率目标,架构特性也不如人意。与此同时,AMD 在晶圆制造方面也困难重重,最终将这部分业务剥离出去,成立了Global Foundries。Jim说AMD“只能依靠二流的代工厂和二流的架构。所以,我被招来担任 ‘Zen’ 架构的设计师,负责重建架构。”

在Jim看来,AMD当时的产品设计方法糟糕、团队组织混乱、芯片架构也差劲。团队还反馈给Jim说无法与英特尔竞争是因为工艺制程跟不上英特尔。Jim则回应,现在AMD芯片的IPC只有英特尔的一半,如果能在IPC上赶上英特尔,我就能让AMD的工艺也和英特尔相当,如果IPC没搞好,就别抱怨工艺不好。

在真正开展工作时,Jim告诉Rory准备停掉当时所有的项目,Rory支持了Jim的计划,对Jim说你想怎么做就怎么做,不过他问Jim走上正轨要多久,Jim说要四年,Rory说我可能没有那么多时间,最终董事会对Rory失去耐心,Rory不得不离开AMD。

Jim在Rory支持下,对AMD产品线做了大刀阔斧的改变,他对指标要求严格,例如定指标时会提出芯片面积 10 平方毫米、功耗 5 W、频率 3.5 GHz,但团队成员会来求宽松,比如他们会说面积能做到 10 平方毫米,但频率只能达到 3 吉赫兹。Jim对这种协商一般都是回答“没门儿”。在Jim的推动下,新的芯片架构路线图发展很不错,不过他自己在不想离开却不得不离开(或许因为强硬的个性)AMD了。

Jim和Lisa Su共事约3年,Jim二进宫AMD时,Lisa Su恰好从飞思卡尔加盟AMD,并于2014年10月任AMD CEO,取代Rory,Jim在2015年9月离开AMD

第八节

特斯拉与马斯克

第八节:特斯拉与马斯克

这一节,Jim讲述了自己在特斯拉的经历。如上节所述,Jim最后在AMD的日子不是很开心,在他心生离意之后,之前在苹果合作过的Doug Field等几个前同事都怂恿他去特斯拉,在2015年前后,智驾概念还不像现在这么普及,所以Jim刚听到汽车会是一种计算平台的观点觉得很新奇,经过调研,他感觉智驾这条路线有潜力,而且当时Elon Musk也“小有名气”,于是Jim在前同事安排下,参加了马斯克亲自出马的面试。面试地点在SpaceX办公室,Jim父亲是某卫星项目总工程师,他小时候对火箭和卫星也很感兴趣,有了这个基础,两人相谈甚欢。Jim告诉马斯克,他能在 18 个月内打造出一款用于汽车的大芯片,马斯克貌似敷衍地回了句:“行。”在后来,Jim发现为什么马斯克这样回答,因为他对芯片几乎可以说是一窍不通。Jim原话这么评价马斯克在芯片方面的认知:对于很多芯片相关的内容,我需要向Elon解释,他会很感兴趣,但在这方面并没有太多自己的想法。

当然,在系统集成上马斯克有天才的直觉,Jim也对马斯克的第一性原理推崇备至,他认为,马斯克对第一性原理的理解远超世人。

说回Jim在特斯拉的工作,他主持开发了特斯拉Hardware 3硬件平台的核心芯片,只花了18个月。当然,这离不开他从AMD拉来的几位老同事的鼎力支持,Jim签了35个IP授权协议, 用了14 个月时间完成芯片流片,制造时间花了4个月,再用2个月在样片上跑软件,这款芯片上车一共只花了20个月的时间。Jim对这款芯片非常自豪,他认为这款芯片在其产品销售的生命周期,即从2018年到2023年9月,都是全球最出色的智驾芯片。

在谈及第二段在AMD工作经历时,Jim就自认为脾气不大好,马斯克又是强势的人,因此两个人在蜜月期之后的合作,自然免不了磕绊,这在Hardware 3开发阶段就有端倪:马斯克管理风格造成的特斯拉较高的人员流动率,给Jim的管理带来了一定的麻烦。但Jim心生去意还是在Hardware 3量产后的空档期,在Jim看来,第一代产品量产出货了,就要准备第二代产品迭代,但马斯克倾向于 “迈一大步,充分利用这次投入的成果,然后再迈一大步”的风格,所以从Hardware 3 到Hardware 4,在马斯克的规划中,是四五年才升级,这就相当于这四五年里,Jim工作量不大,而到下一代准备要时,又要拼命冲刺。说实话,马斯克的做法不太符合芯片规律,而Jim习惯的小步快跑、平稳迭代更适合芯片开发,于是Jim就又有了新下家。

第九节

英特尔

第九节:英特尔

Jim讲述了在英特尔的经历。他从技术人员视角,道出英特尔衰落的一个因素:因循守旧——当然这是所有行业老大都可能会犯的错误。

回到Jim的讲述。英特尔邀请他担任高级副总裁,负责芯片工程团队,Jim觉得很棒,因为英特尔拥有最出色的工艺,还有一大堆先进技术。

内心充满希望的Jim本想带人着手研发下一代高端服务器,但几乎什么都没干成,他在英特尔的岁月,都陷在内耗中了。之前,Jim所在团队最大规模也就2500人,而在英特尔,Jim那个业务组有 1 万人。但后来Jim逐渐发现,英特尔当时技术虽领先,但也受困于老旧的CAD和过时的设计流程。Jim的任务似乎从开发新技术变成了 “要如何对这么大的一个组织进行重新规划,使其正确定位?”

英特尔也发现了问题,也尝试调整。比如当时,其客户端产品CPU 团队、内存控制器团队、PCIe团队都归同一个人领导,大家协同工作,打造同一款产品。后来,时任执行副总裁Murthy Renduchintala(从高通过来)说 “我们要成立 IP 团队、SoC 团队和 CPU 团队”,就把原来团队拆了。但并没有重构好。比如,IP 团队算不上真正的 IP 团队,更个设计小组,把设计成果交给 SoC 团队,再由 SoC 团队测试。所以,英特尔的转型大都处于这种半吊子状态。

Jim面临的挑战是 “如何重新规划并解决 CAD 问题?”有一次 Jim接到Aart de Geus(时任新思科技CEO)的电话,他问:“(你们)以色列团队正在使用我们的新 CAD ,你们还在搞毛?” 我说:“太多争论了。”可见Jim在英特尔推行新设计方法学困难重重,他原话如下:那些人都很厉害。他们打造出了全球最出色的设计流程,并沿用了 25 年。但世界已经向前发展,变革即将到来, 有人会说 “我们已经准备好了”,但也有些人对此反应很大。要知道,工程师可是花了一辈子心血打造这些流程。

采访者直接问Jim,你是因为要管理一万名员工感到疲惫不堪而离开?Jim回答不是。他认为英特尔需要进行的调整,比CEO所设想的要大得多。Jim其实挺欣赏时任CEO Bob Swan,他说:“我们曾是同事,但对于需要做的事情,我俩愿景天差地别,但我没有感到疲惫不堪。”

其实真正让他离开的还是与CEO在关键决策上的不一致。Jim说他意识到得与公司的最高决策一致,不能在开会的时候不能在开会时说 “我们需要这么做”,结果别人回应 “CEO说的恰恰相反”,Jim回忆起在AMD时Rory对他言听计从的美好往事还唏嘘不已。

第十节

Tenstorrent

第十节:英特尔

Tenstorrent 这一节就是Jim创业的经历了。在特斯拉失意之后,Jim对自己职业生涯的规划,放在了去初创公司或者自己创业上,最终他加入自己投资的Tenstorrent,做CTO,但之后又成为该公司的CEO,终于补上了创业经历。

本节的几个亮点:

Jim认为,很多创业公司都有可能有不错的技术或产品构思,但创业公司要想真正成长起来,只有技术与创意是不够的,需要极强的工程化能力,确保交付的产品能够为客户搜需要。这也是Jim带给Tenstorrent的价值。

本市场焦点都被英伟达等巨鳄所在千亿美元市场所吸引,但但实际上,到处都有数十亿美元规模的业务。英伟达对一个年采购额100万美元的新客户不会投入精力,但Jim会,Jim认为,找到10个百万美元采购额的客户,就组成了实打实的千万美元销售额,

Jim在SiByte 设计芯片的时候,他们公司一度有 上百个设计方案,后来SiByte被Broadcom收购,其中一些芯片成为Broadcom相当重要的产品线,但一开始根本看不出哪些设计会脱颖而出。

把自己的软件开源为Tenstrorrent开辟了一个极佳的招聘渠道,很多人在开源社区看到Tenstorrent的代码,拿过来用,这些研究过Tenstorrent代码的人,有些就跑过来应聘。Jim说:“我们不是行业巨头,不搞专有技术,秉持开放的态度,所以能接触到巨头们接触不到的各类人才。”

采访者问Jim对员工灵活办公的看法,Jim也真实表达了一个老板该有的看法

第十一节

个人与家庭

这是本次采访的最后一段,有关Jim的个人与家庭。Jim结婚很晚,在40岁生日宴上遇到了自己朋友的妹妹,两人一见钟情,于是结婚,很快生下两个孩子,一个大二,一个2024年秋季入大学。

Jim喜欢举重和滑雪,不再跑步是因为他的膝盖坏掉了。在膝盖坏掉之前,Jim也是跑者,他跟采访者开了一个玩笑,说有一次认识了两个老年跑者,Jim就问这两个人打算跑到什么时候,其中一个说我要早点退跑,我准备80岁以后就不跑了。从这个笑话来看,Jim对他的膝盖还是有点意难平。

Jim是喜欢读书的,不忙的时候一周可以看好几本书。采访者问Jim有没有从之前共事过的CEO那里习得管理经验,Jim又说了个笑话,他说在AMD时他问过周边的高管,读过几本管理方面的书籍,20多个人的回答,平均值接近0。而那时候Jim已经看了20多本管理类的书,以一己之力拉高了平均数。

不过Jim还是点了几个他认为很优秀的管理者,Doug Fields,管理方式受人喜欢,也照顾自己的组员;Bob Mansfield,极其聪明,下属很难糊弄他;Elon Musk,但Jim认为Elon的管理天分是天授的,很难习得。

注:准备这篇文章才知道,一篇公众号文章,最多只能插入10个视频号视频的链接,奇怪的知识又增加了。所以不是最后一个视频我们忘记加了,而是系统限制我们加不了。

来源:王树一

相关推荐