#马斯克质疑DeepSeek低成本训练#

B站影视 2025-01-29 07:07 2

摘要:近日,马斯克对DeepSeek的低价训练成本提出了质疑,此事在人工智能界引起了波澜。DeepSeek作为迅速崛起的中国AI公司,其宣称的低成本训练成本模式,打破了人们对AI大模型训练需高耗费的固有认知。

近日,马斯克对DeepSeek的低价训练成本提出了质疑,此事在人工智能界引起了波澜。DeepSeek作为迅速崛起的中国AI公司,其宣称的低成本训练成本模式,打破了人们对AI大模型训练需高耗费的固有认知。

DeepSeek的DeepSeek-V3及新推出的DeepSeek-R1模型,在成本上仅为OpenAI同类模型的十分之一左右。其通过Multi-Head latent Attention(MLA)和DeepSeek MOE架构节省显存,以专家加载均衡技术和“对偶流水线”机制,高效利用算力,降低成本。同时在数据传输、计算加速等方面也采取了一系列创新措施,如FP8混合精度训练架构。此外,DeepSeek-R1采用强化学习技术和思维链推理,提升推理能力。

然而,马斯克从硬件规模、训练成本合理性及技术突破独立性等方面表达质疑。比如DeepSeek硬件数量的真实性,其宣称的低成本是否包含前期研发投入,以及技术突破是否自主。

从行业视角看,这一质疑反映出AI训练成本、技术效率及未来发展走向等深层次问题。一方面,若DeepSeek模式属实,将为AI行业开辟新的方向,鼓励更多公司以低成本创新;另一方面,也让人们重新审视传统的高算力堆砌模式。

总之,马斯克的质疑虽未定论,但引发了行业深度思考,DeepSeek的创新也为AI发展带来新的可能,推动AI行业在技术与成本间寻平衡、谋创新。

来源:小周科技讲堂

相关推荐