扎克伯格强调 DeepSeek 强大,中美 AI 大模型差距缩小

B站影视 2025-01-22 12:02 2

摘要:2025 年 1 月,AI 领域传来令人瞩目的消息,扎克伯格罕见地强调了一款来自中国的 AI 大模型 ——DeepSeek 的强大之处,并表示中美在 AI 大模型领域的差距极小。这一观点引发了全球科技界的广泛关注。

2025 年 1 月,AI 领域传来令人瞩目的消息,扎克伯格罕见地强调了一款来自中国的 AI 大模型 ——DeepSeek 的强大之处,并表示中美在 AI 大模型领域的差距极小。这一观点引发了全球科技界的广泛关注。

DeepSeek,这个在近期备受瞩目的名字,正逐渐成为 AI 领域的一颗耀眼明星。杭州深度求索人工智能基础技术研究有限公司于 2023 年 7 月成立,其背后的母公司是量化私募巨头幻方。

DeepSeek 的团队构成年轻且富有活力,核心成员大多是刚毕业的学生或处于 AI 职业生涯早期的专业人士。他们在研究方面成果斐然,其中高华佐和曾旺丁在 MLA 架构的研究中实现了关键创新。

近日,其创始人梁文峰获邀参加了国家高层座谈会。这一新闻经新闻联播报道,反映出国家对科技创新的高度重视,以及对像 Deepseek 这样具有潜力的科技公司的支持与鼓励。

DeepSeek-V3 是该公司的一款具有代表性的模型。这款模型在多个方面展现出了卓越的性能。它在知识类任务、算法类代码场景、工程类代码场景、中文能力、数学能力等方面均有出色表现,多项评测成绩超越了其他开源模型,甚至在性能上可与世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 相媲美。

从测评结果来看,DeepSeek-V3 在百科知识、代码生成等场景中取得了第一梯队的成绩。其数学和编程能力尤为突出,对于将其当作搜索引擎的用户来说,是一个相当合格的选择。尽管在一些总结归纳上与 GPT-4o 略有差距,但考虑到其使用限制,DeepSeek-V3 依然受到了众多用户的青睐。

令人惊讶的是,DeepSeek-V3 整个模型的预训练成本仅花费了 557.6 万美元,仅为 GPT-4o 的二十分之一。如此 “低廉” 的成本,使得 DeepSeek 有了打破行业底价的底气,开发者调用 DeepSeek-V3 的支出也只需 GPT-4o 的十分之一,性价比可谓爆棚。

更加难能可贵的是,DeepSeek-V3 在训练时使用的是英伟达的 H800 芯片,这是一款在性能上被阉割的特供 AI 芯片。然而,就是在这样的硬件条件下,DeepSeek-V3 依然取得了令人瞩目的成就,这让一众硅谷大佬们惊呼其为 “来自东方的神秘力量”。

DeepSeek-V3 于 2024 年 12 月 26 日推出网页版后一夜爆火,月度访问量迅速突破千万。与大模型一同发布的,还有一篇 53 页的论文,详细介绍了其技术细节,将如何用有限资源进行模型优化的策略全部公之于众。

DeepSeek 采用的主要技术包括创新的模型架构、高效的训练技术以及优化资源利用。它没有创造出全新的技术,却通过 “工程创新” 改进了业内原有的模型训练方式,为 AI 行业提供了崭新的思路。

扎克伯格在谈到 DeepSeek 时,对其技术给予了高度评价,称 “他们的技术真的很不错,这个模型非常先进”。这一观点反映出中美在 AI 大模型领域的差距正在逐渐缩小。

近年来,中国高校和企业在 AI 领域发展迅速。美国乔治敦大学安全与新兴技术中心(CSET)的研究显示,在当今世界超过一半的 AI 最热门领域,“中国的研究领先美国”。数据表明,无论是 AI 研究论文总数量,还是 AI 研究高引用率论文数量,中国机构都名列前茅。

而 DeepSeek 的成功也并非偶然。其背后的团队以年轻和创新精神著称,在资源有限的情况下,取得了令人瞩目的成绩。他们的研发成果为中国人工智能领域的发展注入了强大动力,也向世界证明了中国在 AI 大模型领域的实力。

尽管美国在 AI 领域一直处于领先地位,但 DeepSeek 的出现让人们看到了中国的追赶速度。在这场全球 AI 竞赛中,中国正凭借着不断的创新和努力,逐渐缩小与美国的差距。

未来,随着技术的不断进步和发展,DeepSeek 有望继续引领行业变革,中美在 AI 大模型领域的竞争也将愈发激烈。我们期待看到两国在 AI 领域共同推动技术的进步,为人类带来更多的福祉和便利。同时,DeepSeek 的成功也为其他企业提供了宝贵的经验和启示,激励着更多的创新者在 AI 领域不断探索和突破。

需要注意的是,虽然 DeepSeek 取得了显著的成就,但 AI 领域的发展仍然充满挑战和不确定性。各国和各企业都需要持续投入研发,不断提升技术水平,以适应快速变化的市场需求和技术发展趋势。在这场科技的赛跑中,只有不断创新和进步,才能在激烈的竞争中立于不败之地。

来源:人工智能学家

相关推荐