芯片,历史低点

B站影视 欧美电影 2025-03-28 09:35 1

摘要:由于复杂性不断上升,芯片制造商从单片芯片转向多芯片组件,需要进行更多次迭代,而且定制化程度不断提高使得设计和验证更加耗时,因此首次硅片成功率正在急剧下降。

由于复杂性不断上升,芯片制造商从单片芯片转向多芯片组件,需要进行更多次迭代,而且定制化程度不断提高使得设计和验证更加耗时,因此首次硅片成功率正在急剧下降。

一项新的功能验证调查的细节凸显了开发功能齐全、可靠性高的先进芯片的难度越来越大。在许多情况下,这些设备比光罩大小的 SoC 更大,并且包含各种组件和布线方案,这些因素可能会降低它们的稳定性。因此,它们需要更多的优化和迭代。

这些设备包含更多逻辑,其中一些是在不同的工艺节点上开发的。它们拥有更多 SRAM 和更多互连,但两者的扩展速度都不如逻辑。此外,它们需要更多软件,而就 LLM 和其他 AI 算法而言,软件的发展速度比硬件快得多。它们还需要复杂的冷却技术、新材料、高度工程化和定制化的封装以及更精确的工作负载相关模型。更糟糕的是,它们需要的验证比计划允许的要多。

所有这些因素的综合影响在最新数据中得到了证实。西门子 EDA首席验证科学家 Harry Foster 表示:“该行业在实现首次硅片成功方面已达到历史最低点。从历史上看,成功率一直在 30% 左右。两年前,从 2023 年到 2024 年,这一比例下降到 24%。这次下降到 14%。这是一个数据点。另一个数据点是,从历史上看,我们看到大约三分之二的项目落后于计划。这一比例上升到 75%。”

图 1:功能正确且可制造的设计数量正在下降

在日益复杂和多层次的流程中,每一步都需要提高生产力。通常,这意味着要雇佣更多的工程师。但由于人才短缺,以及对工程师过去所需要了解的广泛培训的需求,这是不可能的。这就是为什么 EDA 供应商如此专注于将 AI 添加到他们的工具中,基本上是通过强化学习来将这些知识编纂成法典。但这种转变仍然需要时间。

“我们的做法没有起到作用,”福斯特说。“我们需要大幅提高生产力,但这并不是很多人喜欢谈论的指标,因为它很难衡量。说‘这比其他产品快 10%’相对容易。此外,许多公司缺乏制造非常复杂芯片的技能,或者这对他们来说是一件新鲜事。在 1990 年代后期,每个人都在谈论生产力差距。这是生产力差距 2.0。问题与 20 年前不同,但也有一些共同的主题。我们需要从孤立的工具集转向更加互联和集成的工具集。”

图 2:复杂性的增加,加上生产率的差距,导致硅片的制造时间变慢

然而,生产率问题不能完全归咎于复杂性。即使是主流芯片制造商生产芯片的速度也比过去更快。

“我最初是一名验证人员,我们似乎都对首次获得硅片抱有一定程度的偏执,” Cadence验证软件高级集团总监 Matt Graham 表示。“我们似乎已经沿着这条轨迹前进了很长一段时间。但在过去的一年到一年半里,突然间每个人都在制造更多的芯片。即使是那些不以消费者为中心的公司,比如那些为测试人员制造芯片的公司,现在也希望芯片数量增加四倍。他们从每 18 个月生产一款芯片发展到每年生产四到五款芯片。这是因为一切都突然变得更加专业化了。”

这种情况经常发生在重大技术变革中,工艺、工具和标准需要跟上。“我们经常从更具体到更通用,然后再回到更具体,我们似乎处于那些特定应用的周期之一,”格雷厄姆说。“这导致每个人生产的芯片数量增加了四到五倍,但没有人会配备人员来完成四倍以上的流片。如果你处于前沿,拥有 3D-IC 或基于芯片的设计,其中一个晶圆可能需要稍微旋转一下。”

在前沿技术方面,变化是深刻的、大量的,有时是针对特定设计的,因此很难找出问题所在。许多设计都是一次性的,仅供大型系统供应商内部使用,他们希望突破特定应用程序或数据类型的性能极限。在这些情况下,重新设计的成本是预算过程的一部分,这给数字增加了一些模糊性。

Synopsys系统设计集团战略项目和系统解决方案执行总监 Frank Schirrmeister 表示:“对于重新设计而言,逻辑功能仍然是最突出的问题。[西门子 EDA/Wilson 研究集团] 的调查显示,70% 的重新设计是由于规格变更而导致的设计错误。这意味着有人误解了规格并敲响了警钟,因此 50% 的设计会进行第二轮。一些大型芯片制造商实际上计划进行多达四次重新设计。所以归根结底,这只是复杂性的问题。”

这也为 EDA 公司创造了巨大的潜在机会,特别是那些将某种类型的 AI 融入其工具和流程的公司。

“在生成式人工智能中,你有一个co-pilot来协助和创造,”Synopsys 首席执行官 Sassine Ghazi 在 Synopsys 用户组主题演讲中表示。“借助我们与 Microsoft 合作开发的副驾驶技术,你将拥有工作流助手、知识助手和调试助手。你可以以更快的方式培养初级工程师和专家工程师。他们可以以更现代化、更有效、更高效的方式与我们的产品交互。然后你就有了创意元素。我们有早期的客户参与,从 RTL 生成、测试台生成到测试断言,你可以拥有一个副驾驶来帮助你创建 RTL 的一部分、测试台文档和测试断言。”

在某些情况下,生产效率从几天提高到几分钟。但最大的好处尚未随着代理 AI 的推出而实现,agentic AI实质上提高了整个设计和验证流程的抽象级别。

“随着人工智能的不断发展,工作流程也将随之演变,”Ghazi 说道。“我们的利益相关者经常问我这样的问题:我们何时才能看到人工智能在 EDA 市场中发生改变。我认为除非工作流程发生变化,否则这种情况不会发生。在工作流程发生变化时,你可以以非常不同的方式做某些事情,以便以更快、更有效、更高效的方式交付产品。现在,随着agentic AI时代的到来,代理工程师将与人类工程师合作,以应对这种复杂性并改变工作流程。”

图 3:从生成式 AI 到agentic AI 的演变

抽象问题

工程师在高级设计中面临的最大挑战之一是了解设计中数百或数千个不同元素之间的依赖关系。过去,最大的挑战之一是硬件和软件的紧密集成。协同设计现在可能包括数十个甚至数百个需要单独工作、有时需要协同工作的芯片。需要进行多物理场模拟来了解所有可能的相互作用,而不仅仅是硬件-软件协同设计,并且协同设计现在包括各种类型的互连、封装、光子学,在某些情况下还包括更大的系统。

此外,一切都需要可测试 (DFT)、可制造 (DFM) 且具有足够的良率 (DFY),并且需要有足够的内部控制,以免过热。如果运行过热且老化速度比预期的要快,则需要有重新路由信号的机制,这主要是由软件驱动的。

“在验证领域,我们看到软件正越来越多地成为完整解决方案的一部分,”Cadence 的 Graham 说道。“这不仅仅是‘我们要制造一个芯片’。这是特定的芯片。终端市场、芯片的最终用例是可理解的。运行于其上的软件堆栈是已知的,机器人、汽车或其他任何东西都是可理解的。我们需要将所有这些左右移动,我们需要考虑软件验证、硅片前验证,甚至在将其放入模拟器或原型平台之前,我们需要在这些平台上加速软件。”

软件和硬件的功能性在一开始并不总是很清楚。在复杂的设计中,微调这种平衡是一个耗时的过程,很容易导致多次重新设计。

“软件引入了大量的功能和特性,” Axiomise首席执行官 Ashish Darbari 表示。“如果硬件团队(尤其是验证人员)不完全了解这些,那么测试的内容与定义和范围之间存在很大差距。这正是许多错误被遗漏的原因。我们进行了所有这些虚拟原型设计,并尽早启动软件以获得 10,000 或 100,000 个模拟向量。但是谁会问边界条件的问题?一个又一个项目,我们在头两三周就发现所有这些错误案例问题,因为设计师已经没有时间了。”

新市场,不同的关注点

这些问题远远超出了功能验证和调试的范围,这两项工作在制造之前一直占据着芯片开发的大部分时间和资源。在汽车、军事/航空等安全关键型应用中加入更复杂的芯片,对设计提出了全新的要求。过去,这些市场都不允许使用先进节点的芯片,因为它们被认为不可靠。但随着来自中国比亚迪和蔚来等初创公司以及美国 Rivian 和 Lucid 等电动汽车初创公司的竞争日益激烈,老牌汽车制造商正争相将更多功能转移到软件上。这只有使用更先进的芯片和高度定制的封装才能做到这一点,随着汽车制造商朝着越来越高的自动化水平迈进,这将变得越来越必要。

安全是这些系统的要求,但任何系统的故障都会增加安全漏洞。因此,芯片需要设计成能够应对更多极端情况,从炎热气候下的环境热量导致的加速老化到真实道路状况。虽然其中大部分可以模拟,但芯片也需要经过道路测试。如果软件无法充分解决任何问题,则需要重新设计芯片。

“功能验证占用了你大部分的时间,”Axiomise 的 Darbari 说。“但简单的功耗优化,比如将 X 引入设计,很容易使模块容易受到特洛伊木马的攻击,因为这些 X 现在在执行框架中提供了选择。所以硅片上的 X 是 0 或 1。你实际上看不到 X,但从模拟和行为的角度来看,这些 X 现在为最终用户增加了综合选择,使他们能够使用你不应该访问的设计区域。所以一方面,你有功能验证。另一方面,从功耗的角度来看,这些 X 问题被引入,然后你就有了冗余区域。在安全方面,硅片上的区域越多,你暴露的越多。”

把各个部分组合起来

额外的硅片面积需要用于芯片内更多的处理元件和功能,或者用于某种先进封装中的芯片集合。但这也使得首次硅片的实现变得更加困难。

“你处理的加速器具有非常复杂的工作负载,”西门子的福斯特说。“这会在设计中引入许多非确定性,我们甚至不知道如何从语义上描述,因此很难验证。其中一个挑战是,我们构建了许多以工具为中心的流程,而没有考虑到优化所有这些流程所需的反馈回路。我们需要更多连接的流程。然后我们将能够利用人工智能。最明显的一个是当我在做 DFT 时,‘哎呀,我无法实现故障覆盖率。’所以现在我需要手动返回到工具流程的早期阶段。所有这些循环都需要关闭。但是你要去哪里找到做这件事的人呢?”

根据 EDA 公司以及一些领先的代工厂和 OSAT 的说法,答案在于新的工具、方法论,以及可能更严格的设计规则和更有限的封装选择。但现在判断这一切最终会如何还为时过早。变化的速度比几年前任何人预测的都要快得多,证据就在数据中。

https://semiengineering.com/first-time-silicon-success-plummets/

关注全球半导体产业动向与趋势

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4077期内容,欢迎关注。

『半导体第一垂直媒体』

来源:半导体行业观察

相关推荐