开源第一弹!DeepSeek重磅发布
据介绍,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。“在H800上能实现3000 GB/s的内存带宽&580 TFLOPS的计算性能。”DeepSeek说。
开源 deepseek deepseek重磅 2025-02-24 20:01 2
据介绍,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。“在H800上能实现3000 GB/s的内存带宽&580 TFLOPS的计算性能。”DeepSeek说。
开源 deepseek deepseek重磅 2025-02-24 20:01 2
DeepSeek 重磅发布 Janus-Pro 7B 开源生图模型。在 R1 发布引发的热潮与震荡尚未完全平息之际,中国 AI 领域的强劲力量 DeepSeek,又一次在 Hugging Face 平台上扔下了一颗 “重磅炸弹”—— 全新开源 AI 模型 Ja
模型 deepseek deepseek重磅 2025-01-29 04:52 2