Deepseek引领算力竞赛下半场,封装技术如何改写AI芯片游戏规则

B站影视 内地电影 2025-03-19 12:08 1

摘要:2025年,以 ChatGPT 为起点,生成式 AI 掀起了全球技术革命,将人工智能的发展推向了新的高潮。而今年春节中国科技企业 DeepSeek 推出的千亿参数大模型横空出世,迅速在全球范围内获得了广泛关注和应用,其 APP 上线一个月下载量便破 1 亿,展

2025年,以 ChatGPT 为起点,生成式 AI 掀起了全球技术革命,将人工智能的发展推向了新的高潮。而今年春节中国科技企业 DeepSeek 推出的千亿参数大模型横空出世,迅速在全球范围内获得了广泛关注和应用,其 APP 上线一个月下载量便破 1 亿,展示出了强大的影响力。

在自然语言处理领域,DeepSeek 能够理解和生成自然语言,实现人机对话、文本生成、机器翻译等功能。在与用户的对话中,它能够准确理解用户的意图,并给出富有逻辑和深度的回答,甚至在某些任务上超越了被誉为 “最强推理模型” 的 OpenAI GPT 系列模型,其强大的推理能力和语言生成质量赢得了广泛的认可。在图像生成领域,DeepSeek 可以根据用户的描述生成高质量的图像,为设计、艺术创作等领域提供了新的工具和思路。

DeepSeek 的成功,离不开其背后强大的算力支持。尽管DeepSeek开辟了全新的技术路径,对算力的需求远小于以往的ChatGPT等模型,然而训练和运行这样的大模型,仍然需要消耗天文数字级的算力,单次训练需调用数万张 GPU,每秒处理超万亿次浮点运算。在摩尔定律逐渐逼近极限的当下,面对如此庞大的算力需求,AI芯片在内存带宽、芯片互联效率等方面面临着极致的挑战,先进封装技术作为实现这些高性能AI芯片的关键手段,其重要性愈发凸显。

超算与数据中心:AI 算力的基石

在生成式 AI 的发展进程中,超算和数据中心扮演着举足轻重的角色,是 AI 算力的核心基石。超算和数据中心作为 AI 计算的核心基础设施,承担着巨大的算力任务。超算主要针对大规模、高复杂度的计算任务,如深度学习模型的训练;而数据中心则侧重于大规模数据的处理和存储,支持模型的推理和应用。

为了满足这些需求,超算和数据中心需要配备高性能的芯片和先进的封装技术,以实现高效的数据处理和传输。

在构建支持大规模AI算力的超算和数据中心时,最为核心的高性能计算芯片、互联和存储芯片及其这些芯片的封装技术的选择尤为关键:

-GPU(图形处理器)

GPU 是 AI 计算的核心芯片之一,擅长处理大规模的并行计算任务,如深度学习中的矩阵运算。NVIDIA 的 A100 和 H100 芯片是目前广泛使用的高性能 GPU。

封装类型:通常采用先进的 2.5D 封装技术,如台积电的 CoWoS(Chip on Wafer on Substrate)封装工艺。这种封装通过硅中介层(interposer)将多个芯片整合在一起,提高了芯片之间的数据传输效率。

-CPU(中央处理器)

CPU 是数据中心的基础芯片,负责处理通用计算任务和控制数据流。在 AI 计算中,CPU 通常与 GPU 或 ASIC 等加速芯片协同工作。

封装类型:现代 CPU 芯片通常采用 LGA(Land Grid Array)或 PGA(Pin Grid Array)封装类型。这些封装类型具有高密度的引脚布局,能够提供良好的电气性能和散热性能。

-ASIC(专用集成电路)

ASIC 是为特定应用设计的芯片,如谷歌的 TPU(Tensor Processing Unit)和寒武纪的思元系列芯片等,专门用于加速深度学习中的特定计算任务。

封装类型:常见的有 BGA(Ball Grid Array)和 FC-BGA(Flip Chip Ball Grid Array)等。这些封装类型具有高密度、高性能的特点,能够满足 ASIC 芯片在 AI 计算中的高性能需求。

-FPGA(现场可编程门阵列)

FPGA 是一种可编程的硬件芯片,可以通过编程实现不同的功能,适用于 AI 推理中的灵活配置和优化。

封装类型:通常采用 BGA 封装,这种封装类型具有良好的散热性能和高密度的引脚布局,能够支持 FPGA 在 AI 计算中的高效运行。

-光模块

光模块是数据中心中用于高速数据传输的关键组件,特别是在 AI 计算中,光模块能够提供高带宽、低延迟的数据传输。

封装类型:常见的封装类型包括 SFP(Small Form-factor Pluggable)、QSFP(Quad Small Form-factor Pluggable)等。这些封装类型具有小型化、高密度的特点,能够满足数据中心对空间和性能的双重需求。

-HBM(高带宽内存)

HBM 是一种新型的内存技术,因其高数据传输速率和低功耗特点,广泛应用于图形处理单元(GPU)、深度学习加速器和高性能计算(HPC)等领域。HBM 允许芯片以更高的速度处理数据,这对于当今数据暴增的时代显得尤为重要。

封装技术:HBM 通常采用先进的 3D 堆叠技术,通过硅通孔(TSV)技术将多个 DRAM 芯片垂直堆叠在一起,结合 2.5D 先进封装,实现高带宽、高容量与低功耗特性。

这些芯片在超算和数据中心中协同工作,共同为生成式 AI 提供强大的算力支持。GPU 负责处理大规模的并行计算任务,ASIC 专注于特定算法的高效执行,FPGA 提供了灵活的定制化能力,而 CPU 则负责整体的控制和协调。它们的有机结合,使得超算和数据中心能够满足生成式 AI 对算力的极高要求,推动 AI 技术的不断发展和创新。

除此之外,同时随着算力需求的激增,超算与数据中心的核心硬件架构正在发生根本性变革。

首先是芯片类型,正从单一GPU到异构集成:

Chiplet(芯粒):将大算力芯片拆分为多个功能模块(如计算单元、存储、I/O),通过先进封装重新集成,提升良率与灵活性。例如,AMD MI300X通过13颗Chiplet集成,算力较前代提升3倍。

高带宽内存(HBM):HBM3堆叠内存可提供超过1TB/s的带宽,成为大模型训练标配。但其高达12层的垂直堆叠,对封装精度提出严苛要求。

其次,先进封装扮演越来越重要的角色,2.5D/3D架构成破局关键:

CoWoS(Chip-on-Wafer-on-Substrate):台积电的2.5D封装方案,通过硅中介层连接GPU与HBM,互连密度提升10倍,成为NVIDIA H100等AI芯片的“心脏”。如今业内还在开发更高密度的芯片垂直互连,例如台积电的3D SoIC等。

混合键合(Hybrid Bonding):直接以铜-铜键合替代传统焊料,将互连间距缩至微米级,突破散热与信号延迟瓶颈,被视作3D封装终极方案。

不难看出,在超算和数据中心中,为了充分发挥各类芯片的性能优势,满足 AI 算力对芯片性能、散热和集成度的严格要求, AI算力芯片通常采用先进的封装类型,如BGA、FC-BGA、LGA、PGA、SFP、QSFP、SiP、SoC等。BGA封装通过底部的球形金属焊盘实现芯片与PCB的连接,具有高引脚密度和良好的电气性能。FC-BGA封装则通过倒装芯片技术进一步提高了I/O密度和电性性能,同时降低了电磁干扰。LGA封装适用于高性能处理器,具有高引脚密度和良好的散热性能。PGA封装则以其可靠的连接性能和高频率适应性被广泛应用于微处理器领域。SFP和QSFP封装主要用于光通信模块,支持高速数据传输。SiP将多个具有不同功能的有源电子元件与可选无源器等通过并排或叠加的方式集成在一个封装内,实现一定功能的单个标准封装件,形成一个(子)系统。该方案的集成度相对较低,但可以更加务实地满足包括模拟/RF器件以及电源管理器等方面的市场需求。SoC是一种将系统所需的全部组件(如数据处理单元、嵌入式存储器等)压缩到同一个芯片上的集成电路,需要2.5D、3D集成以及多芯片模块等先进封装技术的支持。作为按照摩尔定律继续往下发展并追求极高集成度的方案,SoC在人工智能和高性能计算等领域不可或缺。

这些封装技术在提升芯片性能和可靠性方面起着至关重要的作用,通过优化封装设计,可以有效提高芯片的散热性能,确保其在高负荷运行下的稳定性和寿命。同时,先进的封装技术能够增加芯片的集成度,减少占用空间,从而在有限的超算和数据中心空间内实现更高的算力密度。这些技术进步直接推动了AI算力的提升,使得更大规模、更复杂的AI模型得以高效训练和部署。

奥芯明:封装技术先锋,算力革命的“中国答案”

算力瓶颈的本质,是芯片性能与封装技术的双重挑战:超算需求方面,生成式AI依赖分布式计算集群,要求芯片间通信延迟低至纳秒级;能效焦虑方面,训练单次模型的碳排放堪比数百辆汽车全年排放,需通过芯片设计优化与封装创新降低功耗;成本压力方面,大模型商业化落地要求单位算力成本下降,而传统芯片架构已逼近物理极限。

因此,这场算力革命,正在倒逼半导体产业从“制程微缩”转向“封装创新”。行业内已有共识,封装技术对芯片性能的影响已超过30%,成为AI算力竞赛的核心战场,这也对封装设备提出了前所未有的挑战和新的需求。在性能、精度、效率等关键方面,封装设备正经历着深刻的变革,以适应生成式 AI 时代的要求。

性能方面,生成式 AI 需要处理海量的数据和复杂的计算任务,这就要求芯片具备更高的性能。为了满足这一需求,封装设备需要能够支持更高密度的芯片集成,实现芯片之间更高速、更稳定的信号传输。例如,在先进的 2.5D 和 3D 封装技术中,封装设备需要具备高精度的对准和键合能力,以确保芯片之间的互连精度和可靠性。

精度方面,随着芯片集成度的不断提高,对封装精度的要求也越来越高。封装设备需要具备亚微米级甚至纳米级的精度,以确保芯片在封装过程中的位置准确性和互连质量。例如,在倒装芯片封装中,封装设备需要将芯片上的微小焊点与基板上的焊盘精确对准,实现可靠的电气连接。如果封装精度不足,可能会导致焊点虚焊、短路等问题,严重影响芯片的性能和可靠性。为了实现高精度的封装,封装设备采用了先进的视觉识别、运动控制和微机电系统(MEMS)等技术,能够对芯片和基板进行精确的定位和操作。

效率方面,面对生成式 AI 市场对芯片的巨大需求,封装设备需要具备更高的生产效率,以满足大规模生产的要求。这就要求封装设备能够实现自动化、智能化的生产流程,减少人工干预,提高生产速度和一致性。一些先进的封装设备采用了机器人自动化技术,能够实现芯片的自动上料、定位、封装和检测等全过程的自动化操作,大大提高了生产效率和产品质量。同时,通过引入人工智能和机器学习算法,封装设备还能够实现生产过程的优化和故障预测,进一步提高生产效率和设备的可靠性。

为了适应这些新需求,封装设备制造商不断进行技术创新和产品升级。在这场全新的技术博弈中,奥芯明作为 ASMPT 在中国市场设立的独立运营品牌,致力于提供先进封装设备与解决方案。奥芯明不仅整合 ASMPT 的全球技术优势,还结合本土研发、供应链优化及行业定制化能力,为中国市场提供更具适配性的封装设备与工艺技术。

目前,奥芯明提供的解决方案覆盖了从薄膜沉积、激光开槽切割,到精密电子和光学元件的成型、组装、封装和检测等一系列环节,产品组合丰富多样,可以满足大规模生产的需求,并被广泛应用于HPC、AI、光通信、IGBT和新能源等领域。

在人工智能领域,奥芯明依托ASMPT的全球技术积累,同时结合本地工程优化与工艺创新,提供热压式固晶(TCB)、混合键合(HB)等先进封装技术,助力AI算力芯片和高性能计算的突破。奥芯明在本土设立研发团队,与行业客户深度合作,优化封装工艺,以适配中国 AI 芯片产业的特定需求。

公司的热压式固晶广泛应用于各种先进逻辑以及存储芯片;混合键合式固晶(HB)从早期的CIS和3D NAND堆叠等应用的晶圆到晶圆混合键合,到现在最新die to wafer的HPC和数据中心的逻辑芯片异质集成以及存储器的3D堆叠;Fan-out固晶适用于2.5D、扇出和嵌入式应用;覆晶(FC)高精度固晶亦在AI算力芯片占据一定的市场。

通过提供卓越的一站式封装解决方案,奥芯明正在助力客户在高性能计算领域取得更大的突破和创新。例如:

-热压键合机(TCB Bonders)

作为AI及其服务器中最高端逻辑芯片组装的关键技术,奥芯明的热压键合(TCB)从芯片到基板(C2S)、芯片到晶圆(C2W)逐步进化,现已成为超精密、高吞吐量的可扩展解决方案。它能够满足未来行业需求,提升集成度和效率,增强芯片整体的性能。

ASMPT是全球首家开创具有惰性气体保护环境的TCB机台的公司,奥芯明的 TCB 设备基于 ASMPT 在惰性气体保护环境技术上的全球领先经验,并针对中国封测市场的实际需求进行了优化。通过在所有 TCB 机台上配置氮气保护,奥芯明进一步提升了键合的稳定性与封装可靠性,为 HPC 和 AI 芯片制造提供高精度、高一致性的封装工艺。

-无助焊剂热压键合(Fluxless TCB)技术:

在先进封装的互连密度不断提升的趋势下, ASMPT 率先推出 fluxless TCB 技术,并在全球范围内广泛应用。奥芯明基于这一技术突破,结合中国封测行业的需求,对其工艺进行了本地优化,提供更高效的封装方案,进一步帮助客户可以通过TCB键合提升产品互联密度并且降低成本,同时该技术支持30微米甚至更薄的芯片封装,适用于 HBM(高带宽存储)堆叠,并能大幅提高封装良率。

Firebird 系列机型主要针对先进TCB技术应用,主要机型包括FB-SW、FB-XD、FB-XHI等,可以处理不同的产品以及要求。

-HBM封装技术

HBM作为一种新型的内存技术,因其高数据传输速率和低功耗特点,广泛应用于图形处理单元(GPU)、深度学习加速器和高性能计算(HPC)等领域。HBM允许芯片以更高的速度处理数据,这在当今数据暴增的时代显得尤为重要。

针对这一市场需求,奥芯明依托ASMPT的技术积累提供的FB-XHI热压键合机,结合flux less TCB技术能够有效提升HBM模块的生产效率和良率,通过精确的温度控制和精细的焊接工艺,确保多层芯片之间的连接质量。通过将多层DRAM芯片封装在一起,HBM显著提升了存储性能和容量,优化能效,为AI和大数据处理提供了强有力的支持。

结语

尽管DeepSeek通过算法层三大突破——低秩键值压缩、动态稀疏MoE架构及GRPO强化学习框架,显著降低千亿参数模型的推理延迟与算力需求,其API成本仅为OpenAI同级别模型的千分之一,但是AI芯片性能的瓶颈仍将催生先进封装技术加速突破,进而带动上游先进封装及封装设备的需求攀升。

从Deepseek大模型的惊艳亮相,到幕后的奥芯明在封装技术的默默深耕,中国科技企业正在两条战线上同步突破:一面以算法创新定义应用场景,一面以硬核技术夯实算力底座。在这场生成式AI驱动的变革中,奥芯明不仅是先进封装设备的供应商,更是中国半导体产业从“跟随”到“引领”的关键支点。

可以预见,新人工智能经济即将到来,而生成式AI的爆发仅是起点,随着量子计算、脑机接口等技术的演进,算力需求将呈指数级增长。这将带动半导体需求的增长,并加速先进封装技术的发展。面对这一趋势,奥芯明的技术布局,正为这场持久战储备关键弹药,公司将继续专注于下一代先进集成封装技术,如HI/SiP、硅光子学(SiPh)和共封装光学(CPO)等,积极探索其在生成式 AI 领域的应用,为AI芯片性能释放构建坚实底座。

来源:集微网

相关推荐