DeepSeek火了

B站影视 2025-01-26 23:03 3

摘要:DeepSeek发布的R1模型在性能上与OpenAI的O1相当,在高难度提示词、代码和数学等技术性极强的领域表现出色,位列第一。在风格控制以及高难度提示词与风格控制结合的测试中,也与O1并列第一。采用混合架构,运用大规模强化学习和思维链推理来提高回应的精准度,

DeepSeek火了的原因主要有以下几点:

技术层面

DeepSeek发布的R1模型在性能上与OpenAI的O1相当,在高难度提示词、代码和数学等技术性极强的领域表现出色,位列第一。在风格控制以及高难度提示词与风格控制结合的测试中,也与O1并列第一。采用混合架构,运用大规模强化学习和思维链推理来提高回应的精准度,其R1-zero版本还能进行无监督微调,展现出卓越的推理能力。OpenAI等巨头每年投入数十亿美元开发AI模型,而DeepSeek仅用560万美元就打造出了DeepSeek-V3,以约600万美元开发出了R1。

市场与应用层面

相比OpenAI的O1,DeepSeek-R1每百万输入令牌收费0.55美元,每百万输出令牌收费2.19美元,远低于O1的每百万输入令牌15美元和每百万输出令牌60美元。在APP Store“效率”类应用中跻身前三,在Hugging Face平台上R1版本下载量登顶。可应用于办公效率提升、复杂数据分析等领域,展现出巨大的应用潜力。DeepSeek-R1完全开源,允许所有人遵循MIT许可蒸馏R1来训练其他模型,为开发者和研究人员提供了更多的创新空间。

行业竞争与格局层面

打破了AI领域少数巨头垄断的局面,新兴团队和科研力量借助DeepSeek技术有机会与传统巨头竞争,推动行业走向多元竞争。让人们质疑AI行业巨额资本投入是否是最有效的方法,引发了行业内对于发展模式和竞争策略的深入思考,也使Meta等公司的工程师们试图复制其技术。

传播与舆论层面

X平台(原推特)等社交媒体的算法调整,可能使DeepSeek的相关内容获得了更多曝光机会。或许是华尔街的投资者们看中了DeepSeek的潜力,通过各种渠道进行宣传,引发了市场关注。

来源:公社哥

相关推荐