摘要:近期,清华大学集成电路学院任天令(Tian-Ling Ren)教授、林朝阳副教授携手开展了一项研究,旨在解决当前CIM技术中的关键问题。他们设计并制备了一种与互补金属氧化物半导体(CMOS)兼容的二维全铁电门控混合CIM硬件平台。该平台采用新开发的可溶液加工方
近期,清华大学集成电路学院任天令(Tian-Ling Ren)教授、林朝阳副教授携手开展了一项研究,旨在解决当前CIM技术中的关键问题。他们设计并制备了一种与互补金属氧化物半导体(CMOS)兼容的二维全铁电门控混合CIM硬件平台。该平台采用新开发的可溶液加工方法,通过高介电常数的铪氧化物和二维逐层MoS₂原子薄通道之间的范德华界面构建FeFETs。这些FeFETs在超长耐久周期、极低的循环间/设备间变化和最低功耗方面表现出色,并且实现了96.36%的晶圆级产率。相关成果发表于Science Advances上。
研究背景
随着人工智能(AI)技术的飞速发展,处理大规模并行和自适应任务的需求不断增加,传统的冯·诺依曼架构逐渐暴露出其在计算效率和能效方面的瓶颈。传统的计算系统将内存和处理单元物理分开,大量的数据在两者之间来回传输,这不仅导致了严重的能效下降,还带来了不可避免的延迟。这种数据移动问题在处理大规模AI任务时尤为突出,尽管图形处理单元(GPU)等替代技术已被提出,以提高并行计算的速度,但它们通常针对特定应用进行设计,难以彻底解决数据移动的问题。
为了突破冯·诺依曼瓶颈,计算内存(CIM)的概念应运而生。CIM通过在内存单元内直接进行计算,从而抑制数据传输延迟,为今天的AI应用提供了一种高效的解决方案。CIM利用高度密集的内存阵列,通过欧姆定律和基尔霍夫定律实施模拟矩阵-向量乘法,展现了强大的计算并行能力。然而,随着AI大模型的规模和复杂性的不断扩展,神经网络中的参数数量急剧增加,这对硬件资源造成了巨大的压力,并提出了更高的精度要求。
当前,虽然各种非易失性存储器(NVMs)如忆阻器、磁性随机访问存储器、相变存储器、离子浮栅存储器和铁电场效应晶体管(FeFETs)已被广泛应用于CIM硬件,因其具有可重构的存储模式、可调节的导电状态和适宜的电路拓扑,但这些材料在实际应用中也存在问题。特别是传统的硅基或其他多晶氧化物基的FeFETs常常由于不期望的原子扩散和电荷捕获效应,导致电性能漂移或退化,限制了它们的大规模应用。
为了解决这些问题,二维(2D)过渡金属二硫化物(TMDs)作为一种新兴的材料解决方案获得了广泛关注。TMDs具有无悬挂键的钝化表面,最小化了散射效应,并在原子级厚度下保持强大的迁移率,同时提供了范德华层间相互作用,实现了处理兼容性。
研究内容
为了解决这一问题,清华大学集成电路学院任天令(Tian-Ling Ren)教授、林朝阳副教授携手开展了一项研究,旨在解决当前CIM技术中的关键问题。他们设计并制备了一种与互补金属氧化物半导体(CMOS)兼容的二维全铁电门控混合CIM硬件平台。该平台采用新开发的可溶液加工方法,通过高介电常数的铪氧化物和二维逐层MoS₂原子薄通道之间的范德华界面构建FeFETs。这些FeFETs在超长耐久周期、极低的循环间/设备间变化和最低功耗方面表现出色,并且实现了96.36%的晶圆级产率。该研究还基于此平台定制了一种二维全铁电门控混合CIM系统,展示了其在动态目标跟踪(DOT)中的应用,成功实现了高准确率和高功率效率。这项研究有效解决了CIM技术中的性能和集成问题,为各种AI应用提供了新的技术路径和理论依据。
图文解读
1. 实验首次构建了二维全铁电门控混合CIM硬件平台:该平台与互补金属氧化物半导体技术(CMOS)兼容,利用新开发的可溶液加工方法,将高介电常数的铪氧化物与二维逐层MoS₂原子薄通道构建了铁电场效应晶体管(FeFETs)。这些FeFETs在晶圆级产率为96.36%的情况下,展示了超长耐久周期(>1012)、极低的循环间(CtC)和设备间(DtD)变化(~0.3%/~0.5%),以及最低功耗(0.03 fJ/bit)。
2. 实验通过构建混合CIM系统,优化了AI应用的性能:系统集成了布尔逻辑和触发器阵列用于数字处理,以及多级单元阵列用于模拟计算。以动态目标跟踪(DOT)为示例,该系统成功实现了高准确率(99.8%)和显著的功率效率(26.3 TOPS/W)。这种混合CIM系统在准确率、能效、速度和电路紧凑性方面相较于传统的模拟计算芯片和硅基混合计算硬件具有显著优势。
图1 | 二维全铁电门控混合平台。
图2 | 基本铁电单元的电气特性。
图3 | 铁电布尔逻辑门和触发器。
图4 | 用于模拟内存计算的铁电MSC阵列。
图5 | 用于直接光刻(DOT)的二维混合计算内存系统。
结论展望
本文展示了全铁电门控混合计算内存(CIM)硬件平台的显著进展,尤其是在处理人工智能(AI)任务中的应用潜力。传统的冯·诺依曼架构由于内存和处理单元的物理分离,导致数据传输延迟和能效降低,而CIM通过在内存中直接计算有效解决了这一问题。然而,现有CIM技术在精度和能效方面仍面临挑战。本文通过采用二维(2D)过渡金属二硫化物(TMDs)和高介电常数铪氧化物的范德华界面,开发了一种新型全铁电门控FeFETs,这种设计不仅提升了器件的耐久性和稳定性,还显著降低了功耗。研究中展示的二维混合CIM系统成功将数字处理和模拟计算结合,实现了高达99.8%的准确率和26.3 TOPS/W的能效,这为解决AI模型日益增长的精度和计算需求提供了可行的解决方案。该研究为混合CIM硬件的实际应用奠定了基础,展现了其在动态目标跟踪等复杂AI任务中的广泛应用前景,推动了CIM技术向更高效、更精确的方向发展。
文章链接:
来源:Future远见