英伟达力挺DeepSeek-R1:新一代AI推理的革新者

B站影视 2025-01-31 14:11 2

摘要:DeepSeek-R1这一拥有6710亿参数的超大规模AI推理模型,现已正式进入NVIDIA NIM微服务预览版。开发者可在Build.nvidia.com上获取该服务,并在单个NVIDIA HGX H200系统上实现每秒3872个Token的推理速度。更重要

就在最近,英伟达官方发布重磅消息:DeepSeek-R1这一拥有6710亿参数的超大规模AI推理模型,现已正式进入NVIDIA NIM微服务预览版。开发者可在Build.nvidia.com上获取该服务,并在单个NVIDIA HGX H200系统上实现每秒3872个Token的推理速度。更重要的是,该服务将很快通过API接口提供下载,并成为NVIDIA AI Enterprise软件平台的一部分。

这意味着,全球AI开发者将迎来一个更强大、更易部署的推理模型,他们不仅可以安全地试验新功能,还能基于DeepSeek-R1构建专属AI代理。

DeepSeek-R1:AI推理能力的新标杆

DeepSeek-R1被英伟达官方定义为"最先进推理能力的开放模型"。与传统AI推理不同,DeepSeek-R1不会简单给出直接答案,而是采用多层推理的方法,以思路链、共识和搜索的方式优化回答,这一过程被称为“测试时间扩展”(Test-time Augmentation, TTA)。

这一能力的核心在于,DeepSeek-R1能够在逻辑推理、数学计算、编程及语言理解等领域提供更精准的推理结果。相较于常见的AI模型,DeepSeek-R1不仅能“思考”问题,还能反复调整自身推理路径,以更高的准确率生成答案。

这种“反复思考”的特性带来了更长的生成周期和更大的计算需求,而NVIDIA的高性能GPU为此提供了完美的解决方案。通过NVIDIA NIM微服务,企业可利用NVLink和NVLink Switch技术,将DeepSeek-R1模型的运行效率最大化。数据显示,在一台搭载8块H200 GPU的服务器上,该模型的运行速度可达每秒3872个Token。

计算力支撑:NVIDIA的优势

DeepSeek-R1属于大规模混合专家(MoE)模型,其参数规模高达6710亿,是当前许多开源LLM的10倍。该模型不仅支持128000个Token的上下文长度,还采用256位专家机制,每个Token会并行分配至8个不同的专家进行推理。

为了确保这一庞大模型能在高效计算环境下稳定运行,NVIDIA的Hopper架构FP8 Transformer Engine在其中发挥了至关重要的作用。该引擎能以更低的能耗实现更强的计算能力,而NVLink提供的900GB/s带宽则保证了模型内部专家之间的高速通信。

与此同时,NVIDIA还宣布,下一代Blackwell架构将通过第五代Tensor Core提供高达20 petaflops的峰值FP4计算性能,并引入全新的72-GPU NVLink域优化DeepSeek-R1等推理模型的推理效率。这一技术突破不仅将提升模型的计算能力,也将进一步降低AI推理的成本。

从开源到复现:AI民主化进程加速

DeepSeek-R1的开源性质正迅速催生新的创新模式。最近,加州大学伯克利分校的研究团队基于DeepSeek R1开发出了微缩版本——TinyZero。该小型模型的训练成本仅为30美元,由此表明,在公共MIT许可下,即便是小型研究团队也能基于DeepSeek-R1的代码库进行再开发。

TinyZero的研究负责人潘佳怡表示:“小规模复现模型的难度远比想象中低,我们的目标是揭开AI训练的神秘面纱,并更深入地理解这些模型的科学原理。” 这一趋势预示着,AI模型将不再只是科技巨头的专属资产,越来越多的研究人员和企业将能够利用开源技术进行创新。

DeepSeek-R1正式登陆Azure AI Foundry

随着DeepSeek-R1的影响力不断扩大,微软也宣布,该模型现已加入Azure AI Foundry,并在GitHub模型目录中提供下载。DeepSeek-R1的加入,使Azure AI Foundry的模型产品组合增加至1800多个,涵盖前沿、开源、行业特定及任务导向型AI模型。

微软强调,DeepSeek-R1能够在值得信赖、可扩展且企业级就绪的平台上运行,企业可无缝集成该模型,以满足SLA、安全性及负责任AI的要求。结合微软的云计算能力,DeepSeek-R1有望加速AI技术在各行业的应用。

黑石集团:AI基础设施的未来仍值得期待

DeepSeek-R1的成功引发了硅谷、华盛顿及华尔街的广泛关注。部分分析师认为,该模型的快速崛起挑战了美国人工智能行业的核心信念。然而,兰德公司AI研究员伦纳特·海姆表示:“这并非人工智能前沿能力的飞跃,市场的担忧可能被夸大了。”

另一方面,全球顶级私募股权机构黑石集团则对AI基础设施的未来持乐观态度。黑石总裁乔纳森·格雷在第四季度财报电话会议上表示:“实体基础设施、数据中心及电力的需求仍然极其迫切。我们预计,人工智能的计算能力成本将大幅下降,AI应用会变得更加普及。”

近年来,黑石集团积极投资数据中心,并通过100亿美元收购QTS、160亿美元收购AirTrunk等大手笔交易,巩固了其在AI基础设施领域的领导地位。格雷指出,AI推理的未来仍然充满变数,但数据中心的需求将持续增长。

结语:DeepSeek-R1的崛起与AI推理的未来

从英伟达的认可到微软的接纳,再到黑石集团对AI基础设施的持续押注,DeepSeek-R1正在成为AI推理领域的重要里程碑。无论是测试时间扩展、多专家推理,还是NVIDIA NIM微服务的优化部署,该模型都展示了AI推理的未来发展趋势。

随着计算成本的降低和开源生态的繁荣,AI技术正以前所未有的速度迈向普及化。DeepSeek-R1的成功不仅标志着推理技术的突破,也为全球AI开发者提供了前所未有的创新机会。未来,AI推理将如何重塑行业格局,让我们拭目以待!

来源:小胡科技频道

相关推荐