蒸馏技术让AI公司胆寒:DeepSeek以小博大引发行业巨震

B站影视 2025-01-30 23:20 2

摘要:在人工智能领域,一个名为“蒸馏(Distillation)”的技术词汇,如今却让众多AI公司闻之色变。DeepSeek这家中国公司的成功,正是建立在蒸馏技术的基础之上,它的崛起不仅彰显了小型AI模型的潜力,更对科技巨头和初创企业斥巨资研发最先进AI技术的商业模

在人工智能领域,一个名为“蒸馏(Distillation)”的技术词汇,如今却让众多AI公司闻之色变。DeepSeek这家中国公司的成功,正是建立在蒸馏技术的基础之上,它的崛起不仅彰显了小型AI模型的潜力,更对科技巨头和初创企业斥巨资研发最先进AI技术的商业模式提出了新的质疑。

长久以来,科技巨头们一直秉持着“越大越好”的理念,在人工智能领域投入了数以亿计的资金。然而,DeepSeek的突破性成就却颠覆了这一传统观念,证明了小型AI模型同样能够展现出卓越的性能。

DeepSeek通过蒸馏技术实现了对大型AI模型的“偷师学艺”。这一过程中,新系统通过向现有模型提出数十万个问题并分析答案来学习。这有点像你花几个小时采访爱因斯坦,走出房间时几乎与他一样精通物理学。数据管理公司Databricks的首席执行官阿里·戈德西形象地比喻道。

相比之下,OpenAI、Anthropic等公司的顶尖AI系统则是从零开始,通过海量原始数据进行自我学习,这一过程往往需要数月时间,并耗费数千万美元甚至更多。而蒸馏技术则能够借鉴这些成果,在短短几周甚至几天内,以极低的成本创建出几乎同样优秀的模型。

值得一提的是,OpenAI方面周三表示,他们已经注意到DeepSeek利用其驱动ChatGPT的AI模型进行蒸馏来构建自己的系统。然而,根据OpenAI的服务条款,禁止使用其AI开发竞争对手的产品。

对于外界的种种声音,DeepSeek方面并未予以回应。

DeepSeek的成功无疑在硅谷引发了关于蒸馏技术的热烈讨论。这一技术的出现,不仅挑战了传统的大型AI模型研发模式,更可能为AI行业的发展带来新的变革。未来,随着蒸馏技术的不断成熟和完善,我们有理由相信,更多高效、低成本的AI解决方案将会不断涌现,为人类社会带来更多的便利和价值。

ChatGPT vs DeepSeek(图片来源于网络)

蒸馏技术并非新鲜事物,但DeepSeek在此领域的成功却引发了业界对科技巨头和初创企业商业模式的重新审视。这些企业,包括谷歌、OpenAI、Anthropic以及埃隆·马斯克的xAI,都在斥巨资研发最先进的AI技术。就在上周,OpenAI还宣布与软银等合作伙伴共同投资5000亿美元,用于未来五年内的人工智能基础设施建设。

然而,如果这些巨额投资并不能为公司带来无可比拟的优势,反而只是为成本更低的竞争对手提供了成长的土壤,那么这些投资的合理性就可能受到质疑。在DeepSeek的成功案例之后,硅谷的高管和投资者们开始重新审视自己的商业模式,并质疑是否还有必要争做行业领头羊。

汉比资本(Hanabi Capital)的资深科技高管兼风险投资人迈克·沃尔皮(Mike Volpi)表示:“如果成为行业先锋的成本是快速跟随者的八倍,那么从经济角度来看,这是否值得呢?”

OpenAI的首席执行官山姆·奥特曼(Sam Altman)在X平台上称赞DeepSeek的最新发布为“令人印象深刻的模型,特别是在性价比方面”,并补充说:“我们很高兴能够继续执行我们的研究路线图。”而Anthropic的首席执行官达里奥·阿莫代伊(Dario Amodei)则在他的博客中写道,DeepSeek的旗舰模型“并不是一项独特的突破,也没有从根本上改变先进AI系统的经济性”,而只是“持续降低成本曲线上的一个预期点”。

科技高管们预计,很快就会有更多利用蒸馏技术打造的高质量AI应用面世。人工智能公司Hugging Face的研究人员上周就开始尝试构建与DeepSeek类似的模型。该公司的高级研究科学家刘易斯·汤斯塔尔(Lewis Tunstall)表示:“最容易复制的就是蒸馏过程。”

DeepSeek的成功不仅展示了蒸馏技术在降低AI成本方面的巨大潜力,也引发了业界对AI研发商业模式的深刻反思。随着蒸馏技术的不断发展和普及,未来或将有更多高效、低成本的AI解决方案涌现,为人工智能的广泛应用开辟新的道路。

在硅谷最广泛使用的排名中,OpenAI和谷歌的AI模型仍然领先于DeepSeek。科技巨头们在最先进的系统方面保持着优势,这得益于他们进行了大量原创性研究。然而,许多消费者和企业却乐于使用性能稍差但成本更低的技术。

美国总统特朗普的AI顾问大卫·萨克斯(David Sacks)周二在福克斯新闻上表示,他预计美国公司会加大难度,防止他们的模型被用于蒸馏。

尽管如此,DeepSeek表示,他们过去曾对Meta Platforms和阿里巴巴等发布的开源AI进行了蒸馏,甚至利用自己的一个模型来构建另一个模型。开源AI开发者通常会在获得认可的情况下允许进行蒸馏,而DeepSeek的模型也是开源的。

本月,加州大学伯克利分校的研究实验室NovaSky发布了一项技术,声称其性能与OpenAI最近发布的一个模型相当。NovaSky的科学家通过蒸馏阿里巴巴公司的开源模型,仅以450美元的成本就构建了这项技术。

伯克利研究人员将该模型作为开源软件发布,并且它已经被用于帮助构建更多低成本的AI技术。一家名为Bespoke Labs的初创公司利用该技术对DeepSeek的技术进行了蒸馏,构建了一个新的模型,据称该模型在编程和数学问题上的表现良好。

这一系列事件表明,AI蒸馏技术正在逐渐兴起,它使得以更低的成本构建高效能的AI模型成为可能。这对于许多消费者和企业来说无疑是一个好消息,因为他们可以在不牺牲太多性能的情况下,享受到更加经济实惠的AI技术。随着开源文化的普及和蒸馏技术的不断发展,未来或许会有更多低成本、高性能的AI解决方案涌现,为人工智能的广泛应用开辟新的道路。

UC Berkeley的计算机科学教授Ion Stoica表示:“蒸馏技术作为一种手段,对于为现有模型添加新功能非常有效。”

AI行业的竞争已经异常激烈,大多数公司在争夺市场份额的过程中都在亏损。DeepSeek等使用蒸馏技术的公司的加入,可能会进一步拉低价格,形成一个反馈循环,使得为先进研究投入巨额资金变得越来越难以自圆其说。

在过去的一年里,软件开发者访问OpenAI等公司的AI模型的价格已经大幅下降。据技术高管称,像DeepSeek这样的开源AI只会进一步降低成本。

Together AI的CEO Vipul Ved Prakash表示:“对于这一级别的智能来说,很难再为非常大的利润空间辩护。”该公司向AI应用开发者出售计算服务。

从上述信息中,我们可以看出蒸馏技术在AI领域的应用正在逐渐显现出其巨大的潜力。它不仅能够帮助现有模型升级,增加新功能,还有望进一步降低AI模型的使用成本。这对于整个AI行业来说无疑是一个重要的发展趋势。

然而,随着DeepSeek等公司的加入和蒸馏技术的普及,AI行业的竞争也将进一步加剧。价格战的爆发似乎已经在所难免,而这对于那些投入巨额资金进行先进研究的公司来说,无疑是一个巨大的挑战。他们需要在保持竞争力的同时,寻找新的盈利模式,以应对日益激烈的市场竞争。

总的来说,蒸馏技术的兴起不仅为AI模型带来了升级的可能,也为整个AI行业带来了新的变革和挑战。未来,我们将继续关注这一领域的发展,看看蒸馏技术还会带来哪些惊喜和变化。

来源:万物云联网

相关推荐