三大美国公司与DeepSeek合作,防止美国在 AI 技术上被中国 甩在身后

B站影视 2025-02-01 19:08 2

摘要:据美国有线电视新闻网 (CNN)报道显示,DeepSeek 给美国的ai技术领域敲响了警钟,这是一家成立一年的中国初创公司,其免费的开源 AI 模型 R1 或多或少与美国科技巨头的先进模型不相上下。而且这些模型的构建成本很少,使用的是不太先进的芯片。

据美国有线电视新闻网 (CNN)报道显示,DeepSeek 给美国的ai技术领域敲响了警钟,这是一家成立一年的中国初创公司,其免费的开源 AI 模型 R1 或多或少与美国科技巨头的先进模型不相上下。而且这些模型的构建成本很少,使用的是不太先进的芯片。

到目前为止,美国科技界普遍接受的观点是,美国科技巨头可以通过花费数十亿美元、积累先进芯片和建立大型数据中心来保持领先地位。美国的这些科技公司,在研发资金上面有着十足的优势,所以他们相信,他们可以比其他任何企业都投入更多的资源来解决这个问题并保持领先地位。

但是现在,这些都受到了质疑。

并且一些技术领导者表示,他们将 DeepSeek 视为验证,而不是威胁。

美国的连锁反应

自从DeepSeek的两款大模型发布之后,美国的AI科技领域迎来了前所未有的动荡。DeepSeek使用的芯片比较落后,开发成本低,但是在性能上却与美国的主流ai大模型持平。在处理复杂的自然语言任务时,DeepSeek 的模型能够以几乎相同的速度和准确率给出令人满意的答案。这不得不让美国的ai企业提高警惕,开始下一步的技术布局。

OpenAI 首席执行官 Sam Altman 在媒体中公开表示,DeepSeek 的 R1 模型“令人印象深刻”,但是Open AI将会马上发布一些新的模型。OpenAI 首席产品官 Kevin Weil 还表示,该公司即将推出的 o3 模型将在未来几周内推出,这将“是又一个重大进步”。

美国政府在之前就已经对中国的科技企业实施了严格的限制,旨在阻止中国公司购买或构建自己的训练人工智能模型所需的尖端计算机芯片。这些芯片是人工智能军备竞赛的核心,而出口限制的目标则是阻止中国跟上世界ai技术的发展脚步。

DeepSeek 大模型的成功,表明美国政府的第一届出口限制适得其反:这些严格的限制可能将中国企业逼入绝境,迫使中国公司想出绕过出口限制进行创新或构建自己的芯片的方法。

DeepSeek采用华为昇腾910B、寒武纪MLU370等国产AI加速芯片,辅以大部分NVIDIA A100(在限制前采购)芯片作为补充,在此之上进行大模型的训练。

昇腾910B:算力320 TFLOPS(FP16),功耗310WNVIDIA A100:算力312 TFLOPS(FP16),功耗400W

对比英伟达的A100芯片,华为的昇腾910B不管是在算力上面,还是在功耗上面,都要更出色。并且在训练成本上面,DeepSeek也更具有优势。

OpenAI 训练 ChatGPT-4 成本高达 7800 万美元甚至可能达到 1 亿美元,而 DeepSeek 大模型训练成本不到 600 万美元,仅为同性能模型的 5% 到 10%;在模型推理层面,DeepSeek 新推出的 DeepSeek-R1,价格为 2.2 美元 / 百万词元,同性能的 OpenAI-o1 价格为 60 美元 / 百万词元,DeepSeek 价格优势明显,这对美国公司在科研、企业等智力密集型产业中的应用具有重大价值。

DeepSeek 应用了不同的模型训练模式,打破了美国堆砌算力的主流技术方式。其利用算法把数据进行总结和分类,经过选择性处理后再输送给大模型,最大优化算力,实现了成本的降低和模型性能提升,这种创新模式冲击了美国大模型公司的既有模式 。

并且DeepSeek 还开源了部分模型,如 DeepSeek-R1,这种开源模式可以吸引全球顶尖专家共同参与,通过共创共建的方式让 DeepSeek 变得更强大,为美国公司提供了参与和优化的机会。

美国的一些开源人工智能的支持者表示,中国DeepSeek公司的模式,证明了美国公司应该吸取中国ai企业的创新,而不是一味地进行压制。只有这样,整个美国领域可以更快地发展,并保持全球的技术标准。

谷歌的前首席执行官埃里克·施密特在《华盛顿邮报》中写了一篇专栏,“美国已经拥有世界上最好的封闭模型。为了保持竞争力,我们还必须支持一个充满活力的开源生态系统的发展。”

通过其 Llama 模型推动开源 AI 的 Meta公司还表示,此类模型正在推动行业的重大转变,这将更快地将 AI 的好处带给每个人。

AI 顾问、前 OpenAI 上市负责人 Zack Kass 说,即使 DeepSeek 迫使硅谷在短期内重新思考 AI 设想的商业模式,相信这项技术将改变世界的人也应该为这种进步感到高兴。

DeepSeek 的成功,直接就促使了其他 AI 公司重新审视自身的发展战略和市场定位。一些原本依赖高成本、大规模投入的公司需要调整研发策略,以应对 DeepSeek 所带来的竞争压力。同时,也促使更多中小企业和初创公司看到了在 AI 领域发展的机会,加速了全球 AI 市场的洗牌。

DeepSeek 在算法方面进行了大量新技术的开发,如多头潜在注意力机制(MLA)和混合专家模型(DeepSeekMoE)等创新架构,显存占用降至传统架构的 5%-13%,推理成本仅为 GPT-4 Turbo 的 1/70,训练成本更是 OpenAI 同类模型的 1/10 。

这种极致效率打破了 “模型规模扩大 → 算力需求指数增长” 的传统路径,为全球 AI 技术发展提供了新的思路和方向。

DeepSeek坚持完全开源(MIT 协议),公开技术细节并允许商业化使用 。这不仅吸引了全球开发者共建生态,还迫使闭源厂商(如 OpenAI)面临竞争压力,促使更多企业转向开源技术,进一步挤压闭源模型的生存空间。

而且其定价的策略直接改变了全球 AI 市场的商业格局,DeepSeek的 API 定价仅为 OpenAI 的 3.65%,近乎 “免费” 的性价比直接威胁现有商业模型的盈利能力。这促使 AI 企业重新思考商业模式,探索更具成本效益的发展路径,推动 AI 技术的商业化、平民化和普惠化。

来源:大漠过千里

相关推荐