高效Attention引擎是怎样炼成的?陈天奇团队FlashInfer打响新年
新年第一天,陈天奇团队的FlashInfer论文出炉!块稀疏、可组合、可定制、负载均衡......更快的LLM推理技术细节全公开。
attention 陈天 flashinfer 2025-01-24 09:59 3
新年第一天,陈天奇团队的FlashInfer论文出炉!块稀疏、可组合、可定制、负载均衡......更快的LLM推理技术细节全公开。
attention 陈天 flashinfer 2025-01-24 09:59 3