线性化注意力综述:突破Softmax二次复杂度瓶颈的高效计算方案 大型语言模型在各个领域都展现出了卓越的性能,但其核心组件之一——softmax注意力机制在计算资源消耗方面存在显著局限性。本文将深入探讨如何通过替代方案实现线性时间复杂度,从而突破这一计算瓶颈。 softmax 线性化 线性化注意力 2024-12-31 09:53 3