90分钟生成10万Token,新框架实现3倍无损加速超长文本生成
而且支持R1-Distill,团队发布经过微调的DeepSeek-R1-Distill-Qwen-32B模型,同样具备3倍加速效果。
论文 token kv kv缓存 tokenswift 2025-03-12 12:32 2
而且支持R1-Distill,团队发布经过微调的DeepSeek-R1-Distill-Qwen-32B模型,同样具备3倍加速效果。
论文 token kv kv缓存 tokenswift 2025-03-12 12:32 2