云服务及芯片大厂纷纷力挺,DeepSeek生态迅速崛起!

B站影视 2025-02-06 12:04 3

摘要:近期中国AI技术厂商DeepSeek的AI大模型持续火爆,全球众多的科技大厂也从一开始的不敢相信、质疑,到认可之后,纷纷下场对DeepSeek模型进行支持。

2月6日消息,近期中国AI技术厂商DeepSeek的AI大模型持续火爆,全球众多的科技大厂也从一开始的不敢相信、质疑,到认可之后,纷纷下场对DeepSeek模型进行支持。

DeepSeek推出的 V3 和 R1 两款开源 AI 模型都颠覆了业界对于“AI算力需求”的看法。特别是DeepSeek推出的推理大模型DeepSeek-R1,其不仅性能比肩OpenAI o1 ,并且其所需的训练成本可能只有后者的约1/20(V3仅用了2048 个 H800 GPU,花了两个月的时间训练完成,仅花费了约558万美元),API的定价更是只有后者的约1/28,相当于使用成本降低了约97%。

总结来说,DeepSeek采用了并不先进的AI芯片,以更低的算力要求和更低的成本,达到了OpenAI等美国AI技术厂商的顶级AI大模型的效果。这一成就被认为对美国的人工智能领导地位构成威胁,不仅引发了OpenAI、微软、Meta、谷歌等众多大模型厂商的恐慌,还一度引发了英伟达等AI芯片企业的价值重估和股价大跌。

当时,OpenAI和微软官方就曾对外表示,正在调查 DeepSeek 可能对OpenAI模型进行不当“蒸馏”的迹象。蒸馏是一种将大型模型的知识转移到较小模型的技术。OpenAI发言人称,蒸馏不会暴露模型的内部工作原理,开发人员可以使用它来改进他们的应用程序。然而,OpenAI 的服务条款禁止用户使用通过蒸馏获得的数据来构建竞争性 AI 产品。

不过,很快舆论的风向就发生了变化。不仅OpenAI CEO奥尔特曼公开承认,“DeepSeek确实是一个非常好的模型,OpenAI会开发出更好的模型,但我们不会像往年那样保持那么大的领先优势了。”

奥尔特曼还罕见地承认了自己的错误,表示OpenAI正在讨论一个新的开源策略。“我个人认为,在这个问题上我们站错了队,需要想出一个不同的开源策略;不是OpenAI的每个人都持有这种观点,而且这也不是我们目前的最高优先级。”

与此同时,亚马逊AWS、微软、阿里云等众多的头部的云服务大厂纷纷上线了基于DeepSeek-R1模型的云服务。同时,英伟达、英特尔、AMD等众多的AI芯片厂商也纷纷宣布了对于DeepSeek模型的支持。

云服务大厂纷纷上线基于DeepSeek模型的云服务

1月30日起,亚马逊AWS宣布,其用户可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型,享受AWS提供的优质服务和支持。

随后,微软也宣布DeepSeek-R1已在Azure AI Foundry和GitHub上提供,开发者可以用新模型进行测试和构建基于云的应用程序和服务。

2月1日,华为云在官微宣布,与硅基流动联合首发并上线基于昇腾云服务的DeepSeek R1/V3推理服务,其性能可与全球高端GPU部署模型相媲美。

2月2日,腾讯云称,将DeepSeek-R1大模型一键部署至其“HAI”平台,开发者仅需3分钟即可接入调用。

2月3日,百度智能云也宣布,其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低价格方案及限时免费服务;


同日,阿里云也宣布,其PAI Model Gallery支持云上一键部署DeepSeek-V3和DeepSeek-R1模型,用户可零代码实现从训练到部署再到推理的全过程。

2月4日,字节跳动旗下火山引擎也宣布,全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型,企业用户可在火山引擎机器学习平台veMLP中部署或通过火山方舟平台直接调用;


同日,京东云也宣布,已正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式,供用户按需部署,快速调用。

2月5日,中国联通宣布,联通云已基于星罗平台实现国产及主流算力适配多规格DeepSeek-R1模型,兼顾私有化和公有化场景,提供全方位运行服务保障。联通云基于A800、H800、L40S等多款主流算力卡,预置DeepSeek-R1多尺寸模型,用户可按需灵活选择、快速扩展,快速搭建DeepSeek-R1推理和微调环境。


众多芯片厂商纷纷完成适配

在芯片领域,众多的芯片大厂也在第一时间完成了对于DeepSeek大模型的适配。

北京时间1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM,并在单个英伟达HGX H200系统上实现了惊人的处理速度。

随后,英伟达的竞争对手——AMD也宣布已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,针对AI推理进行了优化。

1月31日,英特尔宣布其最新发布的酷睿Ultra 200H平台的AI PC已经实现了对于DeepSeek-R1-1.5B模型的本地支持。

2月1日,英特尔又宣布其Gaudi 2D AI加速器现已针对DeepSeek JanusPro模型进行了优化,这使得AI开发者能够以更低成本、更高效率实现复杂任务的部署与优化,有效满足行业应用对于推理算力的需求,为AI应用的落地和规模化发展提供强有力的支持。

近日,中科曙光国家先进计算产业创新中心有限公司也发文宣布,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线;

摩尔线程也宣布,已实现对DeepSeek蒸馏模型推理服务的部署,并即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。

天数智芯也称,联合Gitee AI正式上线DeepSeek R1模型服务。

2月5日,华为官方表示,DeepSeek系列新模型正式上线昇腾社区;

Gitee AI同日表示,DeepSeek-V3满血版在国产GPU厂商沐曦集成电路的GPU上首发体验上线。

应用生态快速拓展

应用端方面,近日,盛天网络在互动平台上表示,公司目前正在进行对接使用DeepSeek模型。通过在线API接口以及对开源模型进行私有化部署的方式开展工作,已部署完成进入测试阶段。预计DeepSeek模型后续可应用于公司社交产品带带和给麦,以探索更优质的产品与服务,结合公司弹性算力池有效降低算力成本。

2月5日,万兴科技也表示,公司已完成推理大模型DeepSeek-R1的适配,并落地融合相关能力于万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等产品。

易点天下2月5日宣布,已完成开源推理大模型DeepSeek-R1的私有化部署,易点天下旗下KreadoAI、数眼智能、zMaticoo ADX等多款核心产品将融合DeepSeek-R1大模型相关能力,为用户带来全新智能营销体验。

据当虹科技官微,近日,当虹科技BlackEye多模态视听大模型正式融合DeepSeek-R1和DeepSeek Janus Pro,并完成视听传媒、工业与卫星、车载智能座舱等多行业垂类场景的数据调优训练。

2月5日晚间,三六零公告,在DeepSeek基于MIT开源协议的生态环境下,公司旗下的部分产品进行了DeepSeek的接入与本地化部署;但公司暂未向DeepSeek提供任何服务。

编辑:芯智讯-浪客剑 部分资料来源:中国基金报


来源:芯智讯

相关推荐