DeepSeek-V3升级,继续追赶Claude 3.7

B站影视 欧美电影 2025-03-25 15:51 2

摘要:2025年3月25日凌晨,深度求索悄然推出DeepSeek V3的重要更新版本:DeepSeek V3-0324。

DeepSeek上新了!OpenAI又成了炮口

(1)DeepSeek-V3-0324 发布

2025年3月25日凌晨,深度求索悄然推出DeepSeek V3的重要更新版本:DeepSeek V3-0324。

官方说是“小版本迭代”,但DeepSeekV3-0324在技术能力、开源策略及用户体验上实现了多项突破,再次引发全球开发者的关注。

X上大量相关帖子,如Cline火速更新代码生成的候选大模型。

(2)核心亮点

V3-0324 强在哪儿?

代码能力直逼行业顶尖(Claude 3.7),推理速度再次刷新纪录。

Aider榜单上,V3-0324 正确率55%,排第7,原版V3 48.4%, 排第10,对手包括闭源模型、推理模型。

非推理模型中,V3-0324排第二,仅次于推理模型Claude Sonnet 3.7(60%) 。

调用成本上,远低于其他模型,是DeepSeek R1的1/5, 当然,V3原版更便宜。


评测榜单地址:https://aider.chat/docs/leaderboards/

1️⃣ 编程能力比肩Claude3.7,实现了开源模型首次实现闭源水平

根据国外评测平台kcores-llm-arena数据:V3-0324在代码能力测试中以328.3分的成绩,超越Claude3.7Sonnet普通版(322.3分),接近其思维链版本(334.8分)。

实测中,用户仅用简单提示词就生成包含HTML/CSS/JS的完整登录页面,代码量超800行且无错误,生成质量与Claude3.7相当。

有开发者反馈,该模型在60秒内解开密码谜题,而Claude3.7耗时5分钟仍未完成。

2️⃣ 推理效率跃升,每秒20个token加速商业化落地

硬件适配方面,V3-0324在512GB M3 Ultra MacStudio上生成速度每秒超过20个token,较前代显著提升。

这将进一步降低企业部署成本,为实时应用场景(如在线客服、代码实时补全)提供了技术保障。

3️⃣ 多维度能力提升:数学推理与前端开发双突破

V3-0324在数学解题和前端开发领域也进步显著。

测试发现,其生成的动画天气卡片(整合CSS与JavaScript)在视觉效果和代码简洁性上优于前代R1模型,且支持动态切换天气条件,工程化能力更强。

(3)如何实现?

技术原理

1️⃣ 专家混合模型(MoE)的负载均衡突破

V3-0324依然基于6710亿参数的MoE架构(激活参数370亿),引入“偏差项动态调整”策略,彻底摆脱传统辅助损失对模型性能的掣肘。

通过实时监测专家负载并动态调节偏差值,训练中实现专家资源的高效分配,避免了路由崩溃问题,性能提升超15%。

2️⃣ 节点受限路由机制降低通信开销

V3-0324采用预设节点数量的路由限制策略,将通信流量压缩至传统模型的1/3,解决了分布式训练中的跨节点通信瓶颈问题。

结合DeepEP通信库的FP8调度与RDMA低延迟内核,训练效率提升40%,为超大规模模型扩展铺平道路。

(4)进一步开源

开源战略升级:MIT协议释放商业潜力

DeepSeek将V3-0324的开源协议调整为MIT许可证,允许开发者自由修改、分发及商业使用,开源战略从技术开放迈向生态共建。

这一步引发连锁反应:

1️⃣开发者社区更加活跃:HuggingFace模型页面上线12小时,下载量突破10万次,GitHub行生项目新增200余个。

2️⃣ 企业门槛降低:MIT协议消除了法律风险,预计将加速金融、教育等领域的私有化部署。

3️⃣ 全球协作生态成型:已有海外团队基于V3-0324开发出低代码医疗诊断工具,验证开源模型的商业适配性。

(5)用户实测

用户实测反馈:效率与质量的双重惊艳

1️⃣ 开发者:从“可用”到“好用”,体验跃迁

一名前端工程师称:V3-0324生成的交互动画代码可直接投入生产环境,节省了80%的开发时间。

2️⃣ 企业用户:成本下降与场景拓展并行

某电商平台技术负责人透露,基于V3-0324的智能客服系统响应速度提升3倍,且无需支付API调用费用,年运维成本预计减少百万元级。

传闻R2基于新V3,这让大家对R2充满期待

huggingface模型评论区画风突变:

笑而不语ing,Sam Altman忙着生小孩。

(6)实测

案例1:一句话让大模型生成页面

指令:Create a Saas landing page效果:新v3趋近于Claude Sonnet指令:根据Figma设计感生成产品代码效果:新v3胜出,遵从设计稿时还自己发挥,增加预览页(看来中文理解更好)

案例3:

代码生成测试:

生成玉虚宫列表页卡片展示代码生成卡片抽签系统

以列表页为例,V3原版效果:

新版效果:

抽签系统:

优点:自我意识、人物信息搜索更加准确,不再显示“我是GPT-4”; 卡片布局更加整洁不足:新版模型生成的卡片都是圆形、缺失个别按钮、UI设计(字体、大小、样式)上下滑了。

详见往期文章:【实践】大模型代码比拼:玉虚宫抽签系统

(7)附录

参考

模型评论区地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/discussions/8DeepSeekV3-0324重磅升级:代码能力比肩Claude3.7,MIT协议推动开源生态:https://www.scensmart.com/news/deepseek-v3-0324-heavy-upgrade-code-capability-on-par-with-claude-3-7-mit-protocol-promotes-open-source-ecology/

原文:https://mp.weixin.qq.com/s/B12YSfPhsB-KpUNwFAzUwQ

来源:鹤啸九天blog

相关推荐