gspn

纵览网丨英伟达与港大携手推出新型视觉注意力机制,提升高分辨率生成速度超 84 倍!

传统的自注意力机制虽然在自然语言处理和计算机视觉领域取得了不错的效果,但在处理高分辨率图像时却面临计算量巨大和空间结构损失的双重挑战。传统的自注意力机制的计算复杂度为 O (N²),这使得处理长上下文时非常耗时,并且将二维图像转化为一维序列会导致空间关系的丢失

英伟达 香港大学 视觉 自然语言处理 gspn 2025-06-11 11:24  2