从Deepseek到Manus,中国的AGI时刻已然开始?

B站影视 欧美电影 2025-03-14 14:19 1

摘要:在当今科技迅猛发展的浪潮中,AI领域无疑是最受瞩目的焦点。每一次重大突破,都引发全球的关注与热议。2024年12月26日以及2025年1月20日,DeepSeek相继发布大圆模型V3和基于强化学习的推理模型R1。

在当今科技迅猛发展的浪潮中,AI领域无疑是最受瞩目的焦点。每一次重大突破,都引发全球的关注与热议。2024年12月26日以及2025年1月20日,DeepSeek相继发布大圆模型V3和基于强化学习的推理模型R1。

这一重磅举动瞬间将DeepSeek推至行业的风口浪尖。其相关应用在应用商店的下载量一路飙升,迅速占据榜首位置,与此同时,硅谷巨头们的股价也因此集体出现波动。

短短两个月的时间里,围绕DeepSeek的新闻与讨论热度持续高涨,也促使硅谷的科技公司纷纷加快脚步,推出性能强劲的大模型,AI领域的霸权之争愈发激烈,呈现出一片硝烟弥漫的景象。

DeepSeek能在短时间内迅速走红,背后的原因值得深入剖析,主要可以归结为两个关键方面。

首先,从性能维度来看,它表现得极为出色。作为开源模型,DeepSeek成功达到甚至超越了部分前沿闭源模型的水平,这一成果给开源社区注入了一剂强有力的“强心针”。

回顾以往,众多开源模型在与闭源模型的竞争中,往往处于劣势地位,难以与之抗衡。而DeepSeek的横空出世,成功打破了这一长期存在的格局,让开发者们看到了开源模型所蕴含的无限潜力与可能性,为开源模型的发展开辟了新的道路。

另一方面,DeepSeek的出身——来自中国,这一事实大大超出了美国对中国模型的性能预期。在过去相当长的一段时间里,美国的主流观点普遍认为中国的模型技术落后美国两到三年。然而,DeepSeek的出现,大幅缩短了中美模型技术之间的差距。

原本预估的24-36个月的差距,被迅速缩小到6-9个月。这种心理预期上的巨大落差,在行业内引发了强烈的震动,使得DeepSeek成为全球关注的焦点。

在AI大模型的发展历程中,开源模式正逐渐展现出其独特的影响力,而大模型开源与传统软件开源相比,有着诸多不同之处。

传统软件开源,通常主要是指开放源代码。在这个过程中,需要遵循一系列的开源协议,其中以OSI的十大原则最为著名。

根据这些原则,开源协议大致可以分为两类:一类是copy left类型,这类协议对使用者有一定的要求,即使用者在利用开源代码进行开发时,需要将自己修改或衍生的代码也进行开源回馈;另一类则是较为宽松的类型,像常见的MIT、Apache协议等就属于这一类,它们给予使用者更大的自由度。

然而,大模型开源的概念与之有所不同。大模型开源主要是指开放模型权重,这意味着其他人可以依据这些权重进行模型的部署和重构。但需要注意的是,在AI大模型领域,严格来讲,几乎没有真正意义上完全开源的情况。因为即使获取了源代码,如果缺乏算力和数据的支持,模型也无法正常运行。

在这一点上,DeepSeek的开源举措显得尤为突出。它不仅开放了模型权重,还将训练和推理过程中使用的一系列核心库进行了开源。

例如,用于加速推理的Flash MLA,它能够有效减少推理过程中的KV cache,提升推理效率;Moe模型底层的高性能通信库,为模型的高效运行提供了保障;双向流水线技术以及高性能文件系统ThreeFS等。并且,DeepSeek还通过专业的论文,对相关技术进行了详细且深入的介绍,展现出了极大的诚意。

对于AI公司而言,选择开源大模型这一策略有着其独特的动机。以DeepSeek为例,开源能够吸引更多的开发者使用其模型以及API,从而增强自身在海外市场的影响力。毕竟,在全球AI市场竞争日益激烈的当下,扩大自身在开发者群体中的影响力,就意味着能够占据更有利的市场地位。

从长期发展的角度来看,任何一家AI公司都需要考虑盈利问题,开源公司也不例外,它们有着多种商业模式可供选择。

比如,有的公司会将部分性能最优的模型闭源,只开放相对较弱的模型,通过这种方式来平衡开源与盈利的关系;有的则提供SaaS或API服务,让那些不想进行本地部署或者云端部署的用户,可以直接使用其提供的服务;还有的在开源的基础上,向用户售卖高级组件,或者提供诸如安全性能提升、团队协作功能增强等企业级服务。

然而,尽管开源公司有着这些商业模式,但整体而言,在全球市场的大环境下,开源公司的商业模式仍面临着诸多挑战,如何实现可持续的盈利,依然是一个亟待解决的难题。

DeepSeek的出现,对上下游的AI生态产生了极为深远的影响。

在硬件层面,以英伟达为代表的硬件厂商首当其冲,受到了多方面的冲击,但同时也迎来了新的机遇。东海岸的对冲基金从成本和效率的角度出发,认为DeepSeek的训练成本低且效率高,这将会导致市场对英伟达卡的需求降低,基于这种判断,他们纷纷抛售英伟达的股票。

而西海岸的AI从业者则有着不同的看法,他们认为,随着模型成本的降低,会有更多的公司选择自行部署模型,这无疑将带动英伟达相关产品的需求增长。正是由于这两种不同观点的碰撞,英伟达的股价出现了明显的起伏波动。

从更宏观的市场格局来看,随着模型推理成本的下降,在硬件市场中,推理卡的需求比例呈现出上升的趋势,而训练卡的需求比例则相应下降。并且,由于推理卡的技术门槛相对较低,其市场竞争也变得更加激烈。

在模型应用端,DeepSeek的影响力同样不可小觑,它对闭源模型市场造成了强烈的冲击。以OpenAI为代表的闭源公司,目前正面临着严峻的融资困境。

OpenAI计划的下一轮高达3000亿美元的融资进展艰难,Anthropic上一轮估值600亿美元的融资也耗费了大量时间才完成,而这背后都有着DeepSeek的影响因素。因为当开源模型能够达到闭源模型80%-90%的性能时,闭源模型一直以来所依赖的高估值的合理性就会受到严重质疑。

此外,在AI领域,新的热点不断涌现。近期发布的Manus,自称是全球首个通用Agent,一经推出便引发了广泛关注。Manus在国内的传播速度极快,从实际体验来看,它在某些方面确实展现出了一定的效果。

然而,它也面临着一些挑战,其中最突出的就是可能会被大厂迅速复刻。并且,与在国内的高热度相比,Manus在国外的热度明显较低。

当下,AI应用的落地方向正逐渐聚焦于Agent,尤其是Multi-Agent(多智能体)领域。与单个Agent相比,Multi-Agent系统就如同一个分工明确、协作紧密的团队。不同的智能体可以发挥各自的专长,并行处理任务,这不仅能够显著提高效率,还能有效降低出错率。

据行业预测,在今年夏天,OpenAI、Anthropic等行业巨头有望推出与Agent相关的产品,到年底前,普通用户就有机会使用到这些产品。随着技术的不断发展和创新,AI领域必将迎来更多的突破与变革,而我们也将持续关注这一充满活力与挑战的领域的动态。

文本来源 @科技早知道 的视频内容

来源:波波百谈

相关推荐