让英伟达暴跌17%,特朗普“敲响警钟”,DeepSeek趁热打铁又上新模型!

B站影视 2025-01-30 13:52 1

摘要:DeepSeek旗下R1大型语言模型推出之后,凭借开源共享和极具性价比的竞争优势,引发了人们对中国AI力量快速赶超乃至颠覆美国AI引领地位预测,投资者纷纷重新评估AI竞争格局。

大数据文摘受权转载自头部科技

文丨丁灵波

最近几天,AI圈没有一家公司的热度能比得上DeepSeek。

DeepSeek旗下R1大型语言模型推出之后,凭借开源共享和极具性价比的竞争优势,引发了人们对中国AI力量快速赶超乃至颠覆美国AI引领地位预测,投资者纷纷重新评估AI竞争格局。

昨天,受“DeepSeek效应”影响,一些美国科技股纷纷下跌,尤其是和算力相关的公司如MRVL下跌19.1%,ORCL下跌13.8%,AVGO下跌17.4%,TSM下跌13.3%,AMD下跌6.4%,ASML下跌 5.8%,最惨的就是AI算力之王英伟达,下跌约17%市值一夜蒸发了近6000亿美元,创下“美国公司有史以来的最大市值跌幅”。

在算力科技股大跌之际,DeepSeek并没有放慢冲击脚步。今天,他们又推出了一款基于视觉的模型Janus Pro 7B在开源社区上线,将其范围从语言处理扩展到计算机视觉的关键领域。

进军多模态

Janus Pro 7B是个啥?这应该算是DeepSeek进军多模态模型的关键一步。

据介绍,这是一种全新的自回归框架,兼具理解与生成能力的统一多模态大语言模型(MLLM),通过将视觉编码解耦为不同路径,克服了以往方法的局限,同时仍采用单一、统一的Transformer架构进行处理。

这种解耦不仅缓解了视觉编码器在理解与生成两种功能间的冲突,还增强了框架的灵活性,Janus Pro超越了以往的统一模型,其性能与特定任务模型相当甚至更优,此外,它还具备简洁性、高度灵活性和高效性,Janus-Pro基于DeepSeek-LLM-15亿参数基础模型/DeepSeek-LLM-70亿参数基础模型构建,有望成为下一代统一多模态模型的有力候选。

论文介绍,Janus Pro 7B在各种视觉任务中表现出色,包括图像生成、视觉问答和图像字幕等,与一些规模巨大、资源最密集的AI模型不同,Janus Pro 7B无需消耗大量计算资源,用更少的参数实现了较高的平均性能。

这种效率可以大大降低希望将高级视觉AI集成到其运营中的企业的准入门槛,对于很多公司而言,无需承担高昂的基础算力成本即可部署复杂的视觉智能的前景越来越有吸引力。

2024年11月13日,DeepSeek曾上线一款JanusFlow模型,这次推出的Janus Pro是Janus系列中的高级版本,表现优于先前最先进的统一多模态模型以及一些特定任务模型。

Janus Pro能生成更稳定的图像输出,视觉质量有所提升,细节更丰富,不过图像分辨率被限定为384×384,论文也提到输入分辨率被限制在384×384算是一种局限性,会影响它在诸如光学字符识别(OCR)等精细任务中的表现。

不过,Janus Pro 7B生成的图像高度逼真,在文本转图像生成方面尽管分辨率仅为384×384但仍包含大量细节。对于富有想象力和创意的场景,Janus Pro 7B能够准确捕捉提示中的语义信息,生成逻辑合理、连贯一致的图像,此外在图像描述、地标识别、常识知识、文本识别等方便表现出色。

Janus Pro 7B的成效放在当下可能并不算轰动,但选择的发布时机会放大其影响力,紧随R1模型和引发美国AI市场动荡之后,它进一步印证了DeepSeek作为AI秩序颠覆者的下一步雄心。

Janus Pro 7B 的开源性质或许会放大这种颠覆性,与之前的开源运动一样,这降低了开发者对高级AI的访问门槛,而不像封闭的专有模型那样受限。不少国外媒体认为,DeepSeek的R1语言模型和视觉AI连击两拳,会进一步加剧美国人工智能公司的紧迫感和竞争压力。

对于美国AI巨头来说,DeepSeek构成了一些威胁,他们的专有高级模型能否在免费开源、高质量性价比服务替代品面前如何被市场继续接受成为摆在面前的问题。

苹果成“居家AGI”算力新宠

在美国社交媒体上,这两天充斥着一种关于人工智能“天塌下来了”的情绪,引发了大型科技投资者们一定程度的恐慌,成为导致英伟达在内的AI算力科技股遭到抛售的原因之一,尽管DeepSeek的模型创新也需要使用英伟达芯片进行训练。

英伟达的一位发言人表示:“DeepSeek是一项卓越的人工智能进展,是‘测试时缩放’(Test Time Scaling)的完美范例。DeepSeek的成果展示了如何利用这一技术,借助广泛可用且完全符合出口管制规定的模型与计算资源,创建新的模型。”但该发言人称,公司将DeepSeek的突破视为会给GPU带来更多创新路线。

这位发言人补充道:“推理仍需要大量英伟达GPU和高性能网络。我们现在有三条缩放定律:持续适用的预训练和训练后缩放定律,以及新的测试时缩放定律。”英伟达还表示,DeepSeek所使用的GPU完全符合美国出口规定。

Nvidia发言人的相关评论也反映了NVIDIA首席执行官黄仁勋、OpenAI首席执行官Sam Altman近几个月来讨论的一个新主题:人工智能的热潮和对Nvidia GPU的需求很大程度上是由“缩放定律”推动的。

自去年11月以来,黄仁勋和Altman一直专注于研究缩放定律的一个新方向,业内称之为 “测试时缩放”。

这一概念指出,一个训练完备的人工智能模型在进行预测、生成文本或图像时,如果它能利用额外的计算能力,花费更多时间进行 “推理”,相较于运行时间较短的情况,它将给出更优的答案。

“测试时缩放定律” 的多种形式已应用于OpenAI的部分模型如o1,以及DeepSeek取得突破的R1模型,只不过R1基于有限算力的优化做到了更极致的水平。

虽然DeepSeek让英伟达市值暴跌,但却无意间带动了苹果的市值迎来一小波上涨,在AI赛道上掉队的苹果这回躺赢了一次。

因为好多开发者发现了DeepSeek在Apple硬件产品上运行效果很棒。一位开发者做了详细分析,目前市场上能够运行DeepSeek V3和R1的主流芯片:

NVIDIA H100:80GB内存,带宽3TB/s,售价25000美元,每GB成本312.50美元;

AMD MI300X:192GB内存,带宽5.3TB/s,售价20000美元,每GB成本104.17美元;

苹果M2 Ultra:192GB内存,带宽800GB/s,售价5000美元,每GB成本26.04美元!

原因在于,DeepSeek V3/R1是混合专家(MoE)模型,总共有6710亿个参数,但每次生成一个token时,只有370亿个参数处于激活状态。在生成token令牌时,开发者无法确切知道哪370亿个参数会被激活,所以所有参数都需要在高速GPU内存中随时待命。

此外,开发者不能使用普通系统随机存取存储器(RAM),因为加载370亿个激活参数时速度太慢(每秒生成令牌数会小于1)。另一方面,GPU内存速度快,但成本高昂。然而,Apple Silicon使用统一内存(Unified Memory)和UltraFusion技术连接芯片,这种折衷方案以较低成本提供了大量中速内存。

统一内存允许CPU和GPU共享同一内存池,而非各自拥有独立内存,这样就无需单独的内存,也无需在CPU和GPU之间复制数据。

UltraFusion是苹果专有的互连技术,能以超高速度、低延迟(2.5TB/s)连接两个芯片,苹果M2 Ultra实际上就是通过UltraFusion将两个苹果M2 Max芯片连接在一起,这就是苹果能够实现大容量内存(192GB)和高内存带宽(800GB/s)的原因。

有传言称苹果M4 Ultra将使用相同的UltraFusion技术连接两个M4 Max芯片,这将使M4 Ultra拥有256GB的统一内存,带宽1146GB/s,两块这样的芯片可以每秒57个令牌的速度运行DeepSeek V3/R1。

苹果成功地将这些技术整合在一个小巧的设备中,面向消费者提供高能效运营顶尖开源模型的能力。有不少用户将多个苹果计算设备集群在一起运行大型模型,例如在7台M4 Mac Mini上流畅运行DeepSeek R1(6710 亿参数)模型。

总而言之,除了NVIDIA,DeepSeek+Mac Mini让开发者有了性价比更高的选择,实现居家开发AGI。

特朗普敲响“行业警钟”

美国总统特朗普周一表示, 中国AI程序DeepSeek的突然崛起 “应该给美国科技公司敲响警钟”,因为又一款中国应用的火爆给政府和国会带来了新的问题。

截至目前,关于TikTok的协商问题尚未解决,DeepSeek在上周末又冲到了苹果应用商店免费应用第一名的位置,成为在美国大受欢迎的现象级应用之一,真是一波未平一波又起。

特朗普表示,他仍然预计美国科技公司将主导人工智能,但他承认低成本人工智能助手DeepSeek所带来的挑战,低成本模式对人工智能整体而言“是一个非常积极的发展”,“我们需要集中精力进行竞争”。

尽管美国对高性能半导体出口中国实行了严格管制,但仍没阻止V3、R1等模型的诞生,这引发了网上关于这些管制措施有效性以及美国AI未来应如何发展的激烈争论。

民主党参议员马克·沃纳(Mark Warner)力挺现有的先进芯片技术出口管制,并表示可能需要进一步加强监管。 他认为:“声称出口管制无效的说法是错误的:DeepSeek的成绩仍然依赖于先进的芯片,中国超大规模企业为部署这些模型而构建全球云基础设施的努力仍然受到美国管制的严重影响。”

目前尚不清楚特朗普政府或国会是否会出台新的人工智能政策来应对DeepSeek的崛起,但可以肯定的是,国内AI企业在取得成绩的同时不能掉以轻心,面对更加激烈的下一步竞争同样需要做好准备。

来源:大数据文摘

相关推荐