摘要:近日,马斯克对DeepSeek的低价训练成本提出了质疑,此事在人工智能界引起了波澜。DeepSeek作为迅速崛起的中国AI公司,其宣称的低成本训练成本模式,打破了人们对AI大模型训练需高耗费的固有认知。
近日,马斯克对DeepSeek的低价训练成本提出了质疑,此事在人工智能界引起了波澜。DeepSeek作为迅速崛起的中国AI公司,其宣称的低成本训练成本模式,打破了人们对AI大模型训练需高耗费的固有认知。
DeepSeek的DeepSeek-V3及新推出的DeepSeek-R1模型,在成本上仅为OpenAI同类模型的十分之一左右。其通过Multi-Head latent Attention(MLA)和DeepSeek MOE架构节省显存,以专家加载均衡技术和“对偶流水线”机制,高效利用算力,降低成本。同时在数据传输、计算加速等方面也采取了一系列创新措施,如FP8混合精度训练架构。此外,DeepSeek-R1采用强化学习技术和思维链推理,提升推理能力。
然而,马斯克从硬件规模、训练成本合理性及技术突破独立性等方面表达质疑。比如DeepSeek硬件数量的真实性,其宣称的低成本是否包含前期研发投入,以及技术突破是否自主。
从行业视角看,这一质疑反映出AI训练成本、技术效率及未来发展走向等深层次问题。一方面,若DeepSeek模式属实,将为AI行业开辟新的方向,鼓励更多公司以低成本创新;另一方面,也让人们重新审视传统的高算力堆砌模式。
总之,马斯克的质疑虽未定论,但引发了行业深度思考,DeepSeek的创新也为AI发展带来新的可能,推动AI行业在技术与成本间寻平衡、谋创新。
来源:小周科技讲堂
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!