专访面壁智能CEO李大海:端侧AI的方向是个性化,开源与商业化不矛盾

B站影视 韩国电影 2025-03-31 21:43 1

摘要:今年DeepSeek崛起后,《麻省理工科技评论》刊发了一篇题为《关注DeepSeek之外的4家中国人工智能初创公司》的报道,指出阶跃星辰、面壁智能、智谱AI、无问芯穹4家企业同样展现出不逊于DeepSeek的技术实力与全球竞争力。

21世纪经济报道记者白杨 北京报道

在由ChatGPT掀起的大模型创业热潮中,面壁智能是相对低调的一家创业公司。虽然没有被列入大模型创业“六小虎”,但它的实力,依然不容忽视。

今年DeepSeek崛起后,《麻省理工科技评论》刊发了一篇题为《关注DeepSeek之外的4家中国人工智能初创公司》的报道,指出阶跃星辰、面壁智能、智谱AI、无问芯穹4家企业同样展现出不逊于DeepSeek的技术实力与全球竞争力。

在近日召开的2025中关村论坛年会期间,21世纪经济报道记者独家专访了面壁智能CEO李大海。

他向记者表示,DeepSeek今年的崛起,再一次证明了面壁智能在2024年6月份提出的知识密度定律(大模型的知识密度每100天会提升一倍)。不管是云侧模型还是端侧模型,提高模型的知识密度都很重要。

2024年初,面壁智能正式发布了被称为“小钢炮”的MiniCPM端侧模型,目前累计下载量接近700万。

李大海表示,端侧AI未来的主要发展趋势仍然是小型化,然后逐步的端侧原生化,以及由端侧原生化带来的逐步个性。在具体落地场景上,他认为汽车和手机是最重要的方向。

在2025中关村论坛年会上,李大海面向汽车场景发布了全新的纯端侧智能助手cpmGO。去年12月,面壁智能还成功部署了首个纯端侧屏幕助手,并已进入量产序列。

另外,面壁也是大模型开源的拥护者。李大海表示,当前的AI开发模式下,开源本身就是一个商业模式。DeepSeek已经非常形象地向大家展示了这一点。

同时,他认为,商业化与开源并不矛盾,商业化反而会由于开源得到最大化。

以下是对李大海的采访(内容略有删减):

21世纪:你如何看待今年DeepSeek的崛起?它对面壁智能以及端侧AI的发展带来哪些影响?

李大海:DeepSeek展示了高效大模型的魅力。高效,意味着更高的知识密度,和更低的成本。我们看到,DeepSeek的模型相比o1,知识密度大概有了10倍的提升,又免费开放给全世界人们使用,确实从智能感观上比较震撼。面壁在2024年6月提出了知识密度定律(大模型的知识密度每100天翻一番),这一规律也再一次得到了印证。

尤其在端侧,知识密度的提升尤为重要。因为云端知识密度的高低可能只影响着成本,尚可通过补贴等方式抹平。但在终端上,知识密度越高,则意味着可用性越强。在终端需要平衡性能与功耗,就像戴着镣铐跳舞—— 更轻量高性能的模型,才能将功耗极致控制在临界值以下,使得其可以在终端运行使用。

21世纪:这个密度定律,你觉得今年是否会依然有效?未来这种以小博大的技术路径,要如何突破云端模型的算力壁垒?

李大海:我相信它在未来很长一段时间都会持续有效,就像摩尔定律已经持续有效了半个世纪一样。

在我看来,端侧模型跟云端模型的分工是不同的。端侧模型信息安全保护和贴近用户的先天优势,所以更适合用来做贴身服务的个性化工作。

而云端模型规模更大,Scaling Law也仍然有效,所以它可以去做更复杂的、需要深度思考的工作。现在我们看到很多类似DeepResearch的功能,他要工作好几个小时,然后输出复杂的报告,这些就是云端该做的事情。

端侧要足够快、足够敏捷、足够符合直觉,快速给出尽可能精准的决策行动。他们俩分工是不一样的,端侧模型也不需要去击败云端模型。

21世纪:面壁一直在走坚持开源的路线,请你谈一下对于开源的思考?

李大海:当前的AI开发模式下,开源本身就是一个商业模式。DeepSeek已经非常形象地向大家展示了,为什么开源是一个好的商业模式。因为一个优秀的模型,通过开源的方式,能够迅速让对它感兴趣的人接触、使用、下载,让市场成本变得足够低。这便是开源的魅力。

面壁一直是开源的拥护者。几乎每一款模型都进行了开源。我们的端侧模型从2024年1月份到现在已经积攒了近700万的下载,是2024年HuggingFace最受欢迎、最多下载量的中国大模型,我们骨子里就是崇尚开源和相信开源的。

另外,我认为开源是一种信仰, 除了非常务实的去讲它是一个商业模式外,开源本身也是AI领域能够快速发展的底层原因。在AI领域,大家都非常开放,有什么样的想法都会第一时间发论文,把代码开源出来,这样才能够让行业里面每个人都能站在别人的肩膀上,能够跑得更快。

举个例子,面壁2024年1月发布MiniCPM-1,使用了WSD学习率调度器,后续被Huggingface Transformer库集成,Llama、Deepseek均也采用了类似技术进行模型训练。

面壁一方面在行业里去做这样的贡献,同时也会非常积极地学习开源领域中最新发布的技术。众人拾柴火焰高,才能让AI发展日新月异。

21世纪:你怎么理解开源和商业化之间的矛盾,如何平衡这二者关系?

李大海:我觉得商业化这件事情不是受开源影响,反过来,商业化会由于开源这个模式得到最大化。

我们看DeepSeek,它其实就从开源这件事里把自己技术优势的商业利益最大化。如果DeepSeek做出R1时选择闭源,那他变现技术优势的速度会非常慢。而现在,他用开源的方式一下子把全球点燃了。所以开源用的好,其实能够让商业利益更大化。

21世纪:你认为今年端测AI的发展会有哪些趋势?还会面临哪些挑战?

李大海:端侧AI的发展趋势一定仍然是小型化,然后逐步的端侧原生化,以及由端侧原生化带来的逐步个性化。

当然我们也相信,云端的高阶推理技术会逐步在端上实现。但是由于端和云各自固有的不同特点,所以端上不需要所有场景都用高阶推理。慢思考对于有些场景来说反而是不适用的,所以在端上我们也会更审慎的去使用高阶推理能力。

21世纪:你曾表示AGI的实现需要7到10年,现在这个预测是否有变化?对面壁智能而言,今年的工作重心是什么?

李大海:我们拿知识密度定律的周期跟摩尔定律的周期去做对比,因为知识密度定律的周期是100天,摩尔定律是18个月,二者大概是六倍的关系。

整个计算的发展经历了半个多世纪,经历了50-100个周期的迭代,我们觉得在AI领域,可能也需要接近50到100次周期迭代,才能够达到非常理想的状态。

从2018年BERT发布,以此为元年算起,其实已经经历了五六年,所以全部算下来,差不多就是7到10年,这是一个底层逻辑。但是我们也相信人类的技术发展是非线性的,当模型越来越好的时候,这个过程会被加速。

面壁智能今年的工作重心仍然是端侧。我们会重点把端侧模型做好,让它更加个性化,能够去更好地服务用户。在具体场景上,现在汽车跟手机一定是最重要的方向,另外我们也在同步探索很多新方向,比如我们的端测模型已经部署在了机器人上。

来源:21Tech

相关推荐