太平洋 AI 周报:开源总按五遍铃

B站影视 2025-02-28 18:27 2

摘要:如果说本周的关键词,那一定是开源,而最耀眼的开源项目就是 DeepSeek 了,五个开源项目涵盖了 AI 训练、推理、通信和存储等全栈基础设施,包括:

在 2012 年,漫威发行了一本名为“Fury's Big Week”的漫画,在那一周里,绿巨人现身、雷神来到地球、钢铁侠找到救命元素。

而本周也绝对称得上 AI 领域的“Big Week”,在这里没有超级英雄,但每一个 AI 工具的推出或更新,都能让我们成为无所不能的“超级英雄”。

本周 AI 大事件

DeepSeek 开源周:五大开源项目公布

Claude 3.7 发布:全球首款混合推理模型

Grok-3 发布:“最强”AI 模型来了

万相 2.1 开源:480P 视频本地部署

GPT-4.5 发布:更人性化的对话模型

当开源成为主旋律

如果说本周的关键词,那一定是开源,而最耀眼的开源项目就是 DeepSeek 了,五个开源项目涵盖了 AI 训练、推理、通信和存储等全栈基础设施,包括:

Flash MLA:针对 Hopper GPU 优化的高效多头潜在注意力(MLA)解码内核

DeepEP:首个面向 MoE(混合专家)模型的专家并行通信库

DeepGEMM:专为 FP8 矩阵计算设计的库

并行策略优化:双向管道并行算法 DualPipe&专家并行负载均衡器 EPLB

3FS 文件系统:高性能并行存储系统

对 DeepSeek 来说,开源在一定程度上回应了国际上的质疑声,同时也展示了自主创新能力,也推动了 AI 基础设施的标准化。

在本周,推出基于 Qwen2.5-Max 的推理模型 QwQ-Max-Preview,并承诺将全面开源 QwQ-Max 和 Qwen2.5-Max 系列。通过“全栈开源+本地化部署”策略,为 AI 技术的普惠化按下加速键。

发布&曝光,大模型还在进化中

本周还有两个国际 AI 巨头的新产品发布。

首个混合推理模型 Claude 3.7 Sonnet 发布,在编码和前端 Web 开发方面的提升显著,全面领先 OpenAI o1、o3-mini、DeepSeek R1 等。而且与前代产品相同,每百万输入 token 3 美元,输出 15 美元。

同时他们还发布了首歌编码工具 Claude Code,可以一次性完成原本需要 45 分钟以上手动操作才能完成的任务,未来几周内官方还会持续优化。

而在另一边,提前 4.5 小时预告直播的 OpenAI 也拿出了全新的 ChatGPT-4.5,虽然 OpenAI 表示 GPT-4.5 是“迄今为止最渊博的模型”,但同时它也告诉大家,GPT 4.5 并不是最前沿的 AI 模型,在性能表现上可能比不上 o1 或 o3-mini。

相比性能,GPT-4.5 最大的特点是“更精致的个性”,它拥有更强的写作能力,在交互沟通时会更加自然,它会更擅长去解决编写、编程或者其他更实际的问题。作为 OpenAI 最大的 LLM,他的计算效率比 GPT-4 提升了 10 倍以上。

AI 硬件也疯狂

虽然上周 AI Pin 被收购基本宣告了纯 AI 硬件的死亡,但“硬件+AI”的步伐从未停止。

比如苹果宣布与 Google Gemini 合作,或许未来苹果智能会变成一个开放接口,随用户喜好接入不同的 AI 模型。

国内各大手机厂商也在疯狂接入 DeepSeek-R1,以 OPPO 为例,张老板刘作虎在微博宣布,有 40+ 款欧加机型接入满血版 DeepSeek-R1,支持语音直接唤醒。支持机型包括 22 年发布的 Reno 9 系列、23 年发布的一加 Ace 2 系列。

AI 有趣:当大模型遇到“树中两条路径之间的距离”

北大团队发现,如果你在与 DeepSeek 沟通时,输入“树中两条路径之间的距离”,R1 就会无法输出种植推理的标记,一直输出下去,这句话会导致 R1 不断重复相同的思考过程。

但我们实测,在满血版的 DeepSeek 中并不会出现不停思考的问题,或许可以当作检验各家接入模型是不是满血版的方法(不是)。

除了这句话,北大团队也发现一些乱码会导致 R1 无限思考,造成算力资源浪费。这或许与 RL 训练的过程有关,为了拿到奖励,模型不断地去进行不会惩罚的思考,并期待给出正确答案。

另外,特斯拉 FSD 也终于来到了中国,然后市值蒸发了 6465 亿。

整体来看特斯拉的 FSD 在华表现并不能让人满意,实线变道、闯红灯、无视闸机、博弈激进……虽然表现好的时候确实可圈可点,但国内智驾内卷严重,比亚迪更是用百万级车辆规模掀起“智驾普及战”,好得见多了,特斯拉这百公里 12 分的智驾,确实不怎么样。

据马斯克所说,国内版的 FSD 训练凭借的是网络视频中的中国路牌标志,一定程度上也可以看到特斯拉在计算机视觉和多模态数据处理、视频模拟与合成训练环境、强化学习和仿真优化等方面的技术力非常强大。

很神奇吧,纯视觉方案。

从 DeepSeek 每天一个开源项目轰炸开源社区,到 GPT-4.5 让 AI 开启“人性化觉醒”,再到全能的 FDS 在国内“水土不服”。AI 正逐渐从冰冷的运算机器变成充满创作欲望的数字诗人,竞争正在从堆砌算力的军备竞赛转向集体智慧的全面涌现。而 FSD 的首战铩羽,也从另一个角度提醒我们,AI 的进化绝非简单的算力堆砌。

在 James M. Cain 的黑色犯罪小说《邮差总按两遍铃》中有这样一段描述:上帝就像邮差,他总是按两次铃,而你通常在后院,总要等到第二次按铃的时候才能听见。

而在这疯狂的一周里,DeepSeek 如同 AI 时代的开源邮差,马不停蹄的按下了 5 次门铃,或许你在第一次铃响时还存有侥幸心理,但当铃声不断响起,我们或许已经站在了奇点门前,享受着 AGI 觉醒前夕最后的寂静。

来源:太平洋科技网

相关推荐