《超越追赶》视角看DeepSeeK的成就

B站影视 2025-01-29 09:40 1

摘要:DeepSeek作为国内AI领域的一匹黑马,凭借其在AI大模型技术上的创新和成本优势,引发了全球范围内的广泛关注。本文将从浙大吴晓波教授的“超越追赶”理论出发,深入分析DeepSeek在机会窗口和技术二次创新方面的成就,供大家参考。

DeepSeek作为国内AI领域的一匹黑马,凭借其在AI大模型技术上的创新和成本优势,引发了全球范围内的广泛关注。本文将从浙大吴晓波教授的“超越追赶”理论出发,深入分析DeepSeek在机会窗口和技术二次创新方面的成就,供大家参考。

最近令全球哗然的DeepSeek几乎挤占了国内外各大社交媒体平台,引起了AI圈、各行业企业圈、资本圈、政治圈以及社会各阶层的关注和讨论。作为国内AI领域的一匹现象级的黑马,DeepSeeK凭借其在AI大模型技术路线上的创新和成本优势的建立,其立下的“丰功伟绩”显而易见有历史性的积极面,但也充斥着不同视角的消极面。

积极的一面是国内外专家纷纷公开表达,中美AI差距在缩小(从之前的2-3年缩短到了1年之内甚至半年内),优化后的架构和训练方式大大降低了对算力的依赖、中国大概率可以摆脱美国的芯片卡脖子问题,进而促进国内芯片的发展。

消极的一面是有些博主从资本视角看这场举国同庆的盛宴,只不过是资本圈的营销剧本,只不过是与普通老百姓关系甚远甚至危机隐私就业问题的糟心事儿,只不过是依附于顶尖大模型技术的更新迭代、绝非独立创新那般优越…

但无论全球AI竞争与合作会走向怎么样的结局,当下DeepSeek作为一家国内大厂、AI六小龙之外的后起之秀,面对行业领先者、在位者的时候,可以利用好自身禀赋、把握机会窗口,形成后发优势,最终实现持续追赶、甚至有望全面超越的成果,就是一个值得被拆解的典范。我们尝试用浙大吴晓波教授的超越追赶理论,从机会窗口、二次创新2个层面逐一分析,从而看清楚DeepSeek从追赶到超越的外在机会和内在逻辑。

注:关于DeepSeeK最近在技术上的成果、对比及相关的评论,详见文末的参考文献

DeepSeek是一家专注于人工智能开源大模型研发与应用的科技公司,以“技术驱动 + 场景落地”为核心理念,专注于金融、医疗、政务等高价值领域,提供行业专用的大模型解决方案。

DeepSeek是在2023年由母公司幻方量化创立的,在此之前它是幻方量化公司内部专注于AI研究和应用的团队,而其母公司幻方量化是一家成立于2016年的量化投资公司,不仅可以为DeepSeek提供了强大的技术支持和资源,还通过与多家公司的合作,为DeepSeek的模型训练和应用提供了丰富的数据和算力支持。

超越追赶理论是由浙江大学吴晓波教授提出的,宏观上解决国家级的超越追赶问题,微观上解决企业通过技术创新和商业模式创新实现追赶超越问题的方法论。具体通过把握范式转变的机会窗口,借助技术和商业模式上的二次创新、价值网络的作用来实现赶超。

本篇文章重点先从机会窗口和技术创新2个层面拆解DeepSeek这类企业能够“横空出世”的外在机会和内在逻辑,随着AI领域和DeepSeek的持续发展,我们后续补充超越追赶理论的其他模块,从而更系统地进行分析。

为什么这次先从机会窗口和技术创新2个层面展开,原因在于VUCA时代之下顺势而为是每一个在位者企业和后发者企业的必然选择,技术壁垒是每一个在位者企业和后发者企业的立身之本,而机会窗口体现的就是顺势而为,技术创新强调的就是技术壁垒。

机会窗口是市场上绝大多数企业都接受某一产品的概念模式,但具有主导地位的产品架构还没有形成的这一特殊时期(引自《超越追赶》),在机会窗口时期,后发者企业追赶以及超越的阻力相对更小,或者说领先者与后发者之间的优劣势差距相对更小,为后发者追赶及超越创造了机会。

而面对不同有利条件类型的机会窗口时,企业得选择适配的追赶模式,并防范掉入追赶陷阱(即落后-引进-再落后-再引进的恶性循环)。

具体来说,不同的有利条件指的是企业外部的市场环境、技术环境以及企业内部的资源能力情况等三个影响因素的不同组合情况,市场环境的有利性可以体现为市场需求大或者潜在需求增长快,生产经营容易获得规模经济和学习效应(主动获取多样化信息和知识,并通过相互交流提高吸收程度和运用深度);技术条件的有利性可以体现为技术演进具有可预测性且变动慢,或者技术演化处于混沌期;而资源能力的有利性可以体现为内部资源丰富、调度外部资源能力强等。

我们从《超越追赶》理论总结的不同有利性组合情况可以看出,市场、技术、资源能力三个因素中至少有2个处于有利条件时,整体环境有利性才是相对可观的、也是相对靠谱的,在追赶超越模式上,企业可以根据实际情况相应采取或自主研发或合作共赢或引进学习或兼并收购等超越方式。

有了以上关于机会窗口相关知识逻辑的补充,我们把目光转向DeepSeek来看其所处的市场环境、技术环境和自身资源能力方面的处境究竟如何?以及它选择了哪条超越模式的道路?

市场环境方面,随着B端和C端对AI的认知、习惯和需要的进一步加深,同时各行各业急需通过AI技术革命实现新的商业升级来解决增长乏力的问题,低成本、优性能的AI大模型和场景应用的市场需求是日益增长、越发紧迫;而且,美国对中国设置芯片禁令等科技封锁的手段,导致中国面临AI、新能源等多行业卡脖子的问题,这个时候高效率、低成本的大模型技术突破成了中国摆脱卡脖子问题、推动国内AI发展和国产芯片发展的关键需求所在;此外,中国国内信创替代(即国产替代)、数据本地化等政策的推动,更有利于国内AI大模型公司的发展;总体上看,视窗环境是有利的。技术环境方面,目前AI大模型技术的发展路径仍属于百花齐放阶段,在模型架构、训练方式、算法创新上有不同选择来解决不同的需求,模型架构创新方面包括Transformer架构及其变体、多模态融合架构等并行路径,训练方式创新方面有预训练+微调、强化学习等并行路径,算法创新方面有深度学习算法、扩散模型等并行路径,主导范式仍未形成,AI大模型处于技术演进的混沌期(即技术范式转变、技术演进非线性、方向尚不明确的阶段);总体上看,技术环境是相对有利的。资源能力方面,DeepSeek脱胎于母公司幻方量化,作为量化投资的资深玩家,幻方量化在AI领域及金融领域拥有强大的技术积累、硬件资源和数据资产,可以为DeepSeek的大模型研发给到全面的保障和支持;同时,DeepSeek利于技术开源策略,凭借其资深的行业积累和技术创新,吸引了全球开发者和企业的参与到整体的开发中,生态资源可以不断丰富;总体上看,内外部的资源能力是有利的。

当三个环境因素均相对有利的情况下,机会窗口是相对明朗的、相对容易打开的,DeepSeek或者类似DeepSeep处境的后发者可以通过借机会窗口的力、走自主研发的路,进而获得超越领先者的机会。事实上,DeepSeek走的也正是“自主研发”的路线,只不过是建立在引入Google的Transformer大模型的基础上,进行二次创新后的自主研发,严格来说应该属于引进后的二次创新。

《超越追赶》总结了关于后发者技术追赶实现后发优势的两种策略,一种是以较低代价获取领先者所费不菲积累起来的先进设备和技术,并结合自身的条件和环境,对先进技术进行消化吸收,且在此基础上展开技术创新,最终实现赶超;一种是后发者跳过旧范式直接紧随新范式。第一种策略适用于技术生命周期较长、领先者创新迭代速度缓慢的行业场景,后发者具备较长的时间窗口来消化吸收和在创新;而第二种策略适用于技术进步周期短的高新技术领域,如电子通信、人工智能等。

DeepSeek采取的正是第二种策略,在成熟的Transformer大模型基础上,通过自主研发,从模型架构、训练方式两方面进行创新迭代,形成了“架构优化+训练方式优化”的创新策略,减少了对高性能硬件(GPU)的依赖。

架构优化,主要表现为多头潜在注意力机制(MLA)+混合专家机制(MoE)的配合,降低了对内存和计算资源的需求。DeepSeek将传统的多头注意力机制升级为多头潜在注意力机制(MLA),如同将一个厂房浓缩成了一个小车间,从而大幅降低对内存和计算资源的需求。同时,DeepSeek在传统的Transformer架构基础上、通过自主研发引入了混合专家(MoE)机制,将模型中的“计算任务”分配给多个专家模块,每次只激活任务相关性较高的少数专家,进一步减少了计算资源的需求。训练方式优化,主要表现为规则化奖励+GPRO模式配合的强化学习模式。DeepSeek抛弃了传统大模型通过加强预训练来实现性能提升的方式,选用通过提升推理时的思考能力来实现性能提升的方式(如同不让小孩花大量精力去刷题背题,而是让他去做更多的逻辑思考,该比喻引自视频号AI享科技)。具体的实现逻辑是在仅依靠准确性奖励和格式奖励两条奖励规则的引导下,让大模型自己找到最优答案,并通过GRPO(Group Relative Policy Optimization)的优化机制形成“输入问题 → 模型生成多个答案 → 规则系统评分 → GRPO计算相对优势 → 更新模型”的模型迭代流程,提升模型的学习效率、甚至形成顿悟的效果(如同老师出题后,让多个小朋友一起做卷子,大模型选出分数最高的卷子和小朋友,其他小朋友抄就可以了,该比喻引自视频号AI享科技)。

架构优化和训练方式优化结合的技术创新策略,不仅带来了大模型效率效能的提升,还带来了成本优势的大幅领先。从DeepSeek-R1论文的性能数据上可以看出,在数学、代码、自然语言推理等任务类型的性能上已堪比顶级大模型水平,同时其成本却不到顶级大模型的三十分之一,这足以体现DeepSeek大模型在技术创新实现了跨越范式的创新,即在AI大模型领域的市场竞争上,形成了以算法(高效率、低成本)为主线的新的竞争范式,而不是之前算力为主线的竞争范式。

DeepSeek的R1、V3和OPEN AI的O1性能比对

API费用对比

相关的技术对比和成本对比不在本文中赘述,详细内容可见文章开头的内容推荐

DeepSeek的机会把握和技术创新,打破了当前AI大模型的竞争格局,建立了中国AI走向前沿的信心。DeepSeek创始人梁文锋在接受“暗涌”采访时说:“我们看到的是,中国AI不可能永远处在跟随的位置。中国AI和美国有一两年的差距,但真实的GAP是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。”

超越追赶是每一个后发企业可以有也应该有的目标和梦想,不局限于当前备受国家关注的AI、芯片、新能源等行业,也应该是当前备受煎熬的软件行业的重要课题。追赶超越可以是一个企业通过机会窗口的把握、技术创新和商业模式创新双轮驱动之下实现的,但要实现更大范围、更高战略规划时的追赶超越,我们更加需要有更加完整的价值网络和产业联盟,目的只有一个:看清路线图,顺势而为。

文献参考

【2025年1月发布的R1大模型的论文】DeepSeek-R1论文.pdfNature新闻:China’s cheap, open AI model DeepSeek thrills (scientists(https://www.nature.com/articles/d41586-025-00229-6)一文读懂:DeepSeek新模型大揭秘,为何它能震动全球AI圈(https://www.36kr.com/p/3135022841879040为什么老外在deepseek上面慢半拍?(https://finance.sina.com.cn/roll/2025-01-26/doc-inehhqya0549350.shtml)DeepSeek 发展历程(截止到25年1月)(https://zhuanlan.zhihu.com/p/17511493759)

本文由 @运营在洞察 原创发布于人人都是产品经理。未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

来源:人人都是产品经理

相关推荐