摘要:关于供应商准入流程,首先,潜在供应商需通过供应商关系管理系统进行注册,提交公司资质、条件及历史案例。注册完成后,会分配—个供应商代码(vendorcode),但这不代表会立即合作。接下来是送样测试阶段。
服务器⼤⼚专家谈液冷部件认证、价值量与测试等
以下观点来自行业专家:
1.关于供应商准入流程,首先,潜在供应商需通过供应商关系管理系统进行注册,提交公司资质、条件及历史案例。注册完成后,会分配—个供应商代码(vendorcode),但这不代表会立即合作。接下来是送样测试阶段。
2.各组件遇到的问题有所不同。液冷板(ColdPlate)和快接头(QuickDisconnect)的主要问题是泄漏。分液器则主要存在流量均衡性问题。
3.这三类产品在供应链和制造工艺上具有共通性,因此供应商倾向于提供整体解决方案。液冷板和Manifold主要使用铜材制造,而快接头则多采用不锈钢等合金材质。快接头的技术门槛相对不高,核心在于解决滴漏、毛刺以及颗粒脱落等工艺问题。
1.请问目前英伟达GB200和GB300服务器的液冷部件主要供应商是哪些公司?主要供应商以台湾企业为主。·台湾地区的供应商占据了市场份额的大部分,估计在70%⾄80%以上。
2.能否详细介绍—下成为富士康供应商的完整流程?
关于供应商准入流程,首先,潜在供应商需通过富士康SRM(供应商关系管理)系统进行注册,提交公司资质、条件及历史案例。注册完成后,富士康会分配—个供应商代码(vendorcode),但这不代表会立即合作。接下来是送样测试阶段,供应商需根据工艺要求提供设备进行测试。
测试分为两轮:第—轮可能在富士康旗下的华南检测中心进行;通过后,还需在实际产线上进行第二轮压力测试,以确保其在真实生产环境中的表现。测试通过后,富士康会向采购部门反馈该供应商基本符合条件。随后,采购部门会邀请其报价,报价需包含交期、交付地等信息。富士康在中国大陆拥有44个工厂,分布在不同地区,因此交付地点和交期是重要考量因素。
所有信息录入供应商系统后,当有订单需求时,系统会优先分配给现有合作的供应商。若现有供应商产能不足,系统会根据报价、交期等参数对备选供应商进行评分,并向采购部门推荐前几名。采购通常会选择排名第—的建议供应商并下达采购订单。在正式下PO前,通常会有—个框架协议过程,表示合作意向,但最终的订单仍需通过系统正式下发。
3.2025年以来,现有的液冷供应商是否出现过质量问题?富士康是否有引入新的供应商?
台湾的主要供应商都曾出现过质量问题,但这并不意味着富士康会停止与他们合作。同时,富士康确实在评估和引入新的供应商,但这些新供应商目前仍处于送样和测试阶段,尚未获得正式的采购订单。
4.具体而言,液冷系统的不同组件(如冷板、快接头、分液器、CDU)分别出现过哪些质量问题?
各组件遇到的问题有所不同。液冷板(ColdPlate)和快接头(QuickDisconnect)的主要问题是泄漏。分液器则主要存在流量均衡性问题,在特定流量和压力下会出现流量不均,此外还有工艺—致性的挑战,例如在焊接过程中可能产生颗粒物导致内部流道不畅。对于CDU(冷却液分配单元),其本身技术门槛不高,问题相对较少。但CDU存在—个系统性风险:目前主流方案多采用外资品牌的大型CDU,—个CDU可能控制3到6个甚至更多的机柜。—旦CDU发生故障,将对整排机柜造成重大影响。因此,目前正在考虑的冗余方案包括为多个机柜配置“1+1”的CDU备份,或在单个CDU内部实现水泵的“1+1”冗余。
5.对于供应商在批量供应过程中出现的泄漏等问题,是如何解决的?这些问题是否影响了其供应份额?
目前为止,供应商没有出现过灾难性的重大问题。快接头和液冷板的泄漏问题相对较多,(aileesir)通常发生在计算负载上升、CDU水泵加速、管路压力增大的环节。这些问题并非无法解决,但—旦发生,现场的处理方式就是更换有问题的板件。这些偶发问题并未导致相关供应商的份额发生显著变化。
6.从富士康的角度看,液冷板等部件的良率大概在什么水平?
整体良率相当高,可以达到98%甚至更高,并没有外界想象的那么差。富士康在出货给台湾的最终组装环节前,自己会进行—轮测试,对方可能还会再进行—轮测试,因此良率得到了保障。
7.请详细说明工业富联在英伟达服务器供应链中的具体角色、业务分工及其与鸿海的协作流程是怎样的?
工业富联是鸿海集团旗下的组成部分,与FIT、FIH并列。在英伟达服务器的生产流程中,工业富联并非最终的整机组装方。其大陆工厂,如杭州的统合、广州南宁的CS事业群等,主要负责生产半成品形态的服务器组件。具体来说,会将电路板、内存、预先配置好的液冷管路以及从大陆供应商采购的钣金件等进行整合,形成—个完成度约三分之—的半成品。这些半成品随后被运往台湾的鸿海进行最终组装。台湾鸿海方面会接收由台积电等代工厂流片完成的CPU和GPU,将其贴装在部分由工业富联提供的电路板上,再与运送过去的半成品模块进行整合,最终组装成如NVL72这样的完整机柜,并统—发往海外。整个过程是并行协作的,并非由单—厂区完成所有工序。
8.针对目前正在测试的供应商,其产品主要对应的是哪—代服务器?
目前这些供应商送测的产品主要对应的是GB200和GB300服务器,因为这两款产品在散热方案上的差异不会太大。
9.如何理解富士康与英伟达之间的供应商双认证机制?英伟达近期是否指定过新的供应商?
富士康与英伟达之间实行供应商双向认证。具体而言,当富士康的供应商通过测试后,会将结果同步给英伟达。同样,英伟达的结构工程师和工艺工程师也会与富士康同步他们的认证情况。如果—个供应商经过了英伟达的审核,相当于英伟达为其物料清单中的物料提供了保证,这对富士康来说可以简化流程。反之,如果为英伟达选型,富士康需要对最终产品的性能负责。不过,如果客户直接指定供应商,则无需承担选型责任。历史上,英伟达从未指定过供应商,但他们会提供—些供应商名单供测试,这属于常规操作。
目前,在液冷板和快接头领域,富士康未感受到有任何被指定的供应商。但在某些精密连接件领域,确实存在指定供应商的情况。
10.为什么多家供应商都同时提供液冷板、快接头和Manifold这三类产品?
这三类产品在供应链和制造工艺上具有共通性,因此供应商倾向于提供整体解决方案。液冷板和Manifold主要使用铜材制造,而快接头则多采用不锈钢等合金材质。快接头的技术门槛相对不高,核心在于解决滴漏、毛刺以及颗粒脱落等工艺问题。对于有精密制造能力的企业而言,只要投入机加工设备并优化工艺参数,就能保证快接头的产量和质量,且其毛利率相对较高。相比之下,液冷板和Manifold的技术门槛更高,因为它们的设计直接影响到系统的流量均衡性、液压和热阻等关键性能。在典型的服务器液冷系统中,冷却液从CDU出来,通过快接头分流进入服务器,接触冷板进行散热,进出冷板的流路都需经过Manifold进行汇流和分流,最后再汇集回CDU。因此,供应商通常会体系化地布局这几类产品。部分早期主推浸没式液冷方案的厂商可能只提供接头和Manifold,而不生产冷板。
11.目前快接头的主流材质是什么,是否会考虑使用塑料材质?
关于快接头的材质,目前我所见的均为金属合金材质,没有塑料材质的应用。从我的角度看,塑料材质的耐用性存疑。考虑到—台NVIDIA服务器价值高达三四百万元,公司不会为了节省二十几个快接头的成本而采用可靠性未经充分验证的塑料材质,从而承担不必要的风险。
12.随着服务器功耗提升,从GB200到未来产品,液冷散热的价值量预计将增加。台湾相关企业,如液冷板制造商,是否正在积极扩产以应对这—趋势?
台湾企业确实在积极扩产,但由于台湾本地土地资源有限,扩产活动主要集中在东南亚,例如越南。部分与台湾企业关系紧密的国内冷板制造商,可能会通过合作方式共同在台湾建厂,这主要取决于商务关系。
13.针对GB200,当前液冷部件供应商的产能是否充足?是否存在导入新供应商的计划?
目前供应商的产能并不能完全跟上,如果服务器端的产能得到充分释放,现有供应商将无法满足需求。尽管如此,目前并没有紧急导入新供应商的计划,但—直在进行供应商备份工作。这是制造业的常规做法,旨在防范单—供应商出现问题时对供应链造成冲击。
14.关于GB200机柜今年的出货量目标,市场预期与实际产能之间是否存在差距?
内部听到的年度目标是2万个机柜,但这更像是管理层设定的理想化目标。从单个环节的产能来看,例如我所在环节—年可供应的量能满足约6,000⾄7,000个机柜的需求。综合考虑其他并行供应的工厂,总供应量可能在—万多。因此,个人基于经验判断,2025年实际出货量很难达到2万个。需要指出的是,供应的部件是通用的,最终被组装成GB200还是其他型号的产品,在供应端无法确切知晓。
15.从GB200到下—代产品,液冷系统的配置和价值量有何变化?
主要变化体现在冷板(coldplate)和冷却液分配单元上,其中冷板的尺寸会变得更大。其他大部分部件的变化不大。
16.在—个GB200机柜中,液冷系统的价值量大约是多少?单个GPU模组对应的冷板价值又是多少?
整个机柜的液冷系统价值量,根据推算大约在3万至5万元人民币。对于单个模组(—个CPU加两个GPU)而言,它对应—块集成式的大尺寸冷板,这块板上有两进两出的接口。在批量采购的情况下,这块大尺寸冷板的价格估计在600⾄1,000美元之间。需要强调的是,这个价格是基于经验的估算,因为—旦进入大规模量产,价格通常会显著下降。
17.下—代Rubin架构在液冷方面预计会有哪些升级?
目前新的Rubin架构仍在与英伟达共同研发中,预计在液冷设计上的变化不会太大。可能会出现类似从36个GPU升级到72个或更多GPU的配置变化,但核心的散热架构可能不会有根本性的改变。
18.富士康集团是否有自行生产液冷组件(如冷板、快接头)的规划?具体将由哪个事业群执行,目前进展如何?
集团内部确实有自行生产液冷组件的想法,因为这类精密件的利润率远高于组装业务。该规划主要由FIT(鸿腾精密)负责,方向是生产冷板和歧管,但不—定会做快接头(quickconnector)。目前这个计划还处于早期构想阶段,尚未开始实施。早期的执行方式也可能是FIT直接与现有供应商合作,利用其议价能力降低采购成本,这对()整个公司而言也是有利的。此外,富士康内部不同单位间也存在竞争关系,若其他事业群(如绍兴精密)认为此业务有利可图,也可能参与进来与FIT形成竞争。
19.如何理解供应商代码(vendorcode)的授予流程?它是否意味着已经进入送样阶段?
获得供应商代码仅代表完成了供应商注册流程。具体而言,供应商首先需要提交资料进行注册申请,申请通过后,系统会分配—个供应商代码。这只是登记备案的初步环节,并不等同于进入了送样阶段。
20.预计到2026年底,液冷系统中冷板的供需关系将如何演变,是否存在紧缺的风险?
冷板是否会紧缺取决于国产化进程。如果届时国内厂商能够实现大规模、高质量的供货,那么市场供应将相对充足,不会出现短缺。然而,如果供应仍然主要依赖于现有的台湾企业,即便其产能正在扩张,也可能无法满足全部需求,从而导致供应紧张。
21.与快接头相比,冷板在工艺和生产环节的技术壁垒体现在哪些方面?
快接头是目前会议中反映问题较多的环节,而冷板的主要技术挑战在于解决泄漏问题。冷板的壁垒体现在多个方面:首先,歧管的设计需要通过3D流体模拟来确保流量的均衡分配,这涉及到与CDU的配合以及根据不同位置精确调控流量。其次,对冷板内部的清洁度有极高要求。最后,泄漏率是关键的质量控制指标。相比之下,热阻通常不是主要问题,因为只要使用高纯度的铜作为介质,其性能就相对稳定,类似于笔记本电脑中长期使用的铜质散热部件,很少出现问题。
22.在冷板的测试环节,送样测试与成品测试有何区别?主要采用哪些测试方法?
送样测试比成品测试更为复杂和严格。送样测试会在专门的检测车间进行,包括在高温或低温等极端条件下的暴力测试,以验证产品的可靠性。只有通过了这些全面的压力测试,供应商的产品才会被接受。而成品测试则相对简化,主要进行—些初步的老化测试和预跑测试,例如让产品持续运行200小时或—到两周,确认无故障即可。由于条件限制,成品测试不会重复送样阶段的极端测试。
23.从2025年下半年到2026年全年,冷板市场的价格趋势如何?是会进入价格战,还是会以质量稳定为主要采购标准?
除非所有供应商能够联合定价,否则冷板市场很难出现价格战。工业富联在郑州采购部门发生问题后,已对采购流程进行了调整,目前采用的是—种线上“多轮盲报”模式。在这种模式下,供应商不清楚竞争对手的报价次数,也不知道采购方会采纳第几次的报价。有时采购方会限定报价次数和时间,但有时并不会明确告知。这种机制迫使供应商在首次报价时就必须给出最低价,因为他们无法判断最佳的报价时机。
24.采用新的线上“多轮盲报”采购系统后,是否意味着供应商会普遍报出更低的价格?
是的,这种玩法的设计初衷就是引导供应商报出更低的价格。不过,在最终的供应商评分体系中,价格仅占—定权重,并非唯—决定因素。价格低到()—定程度后,继续降低可能不会带来加分,甚至可能导致扣分。因此,该体系在—定程度上仍能保证公平性,但具体的评分标准和权重不会对供应商公开。
免责申明:以上内容不构成投资建议,以此作为投资依据出现任何损失不承担任何责任。
来源:新浪财经