DeepSeek V3.1更新「最终版」!下一次是V4R2了?

B站影视 欧美电影 2025-09-23 19:40 1

摘要:“极”字乱飞把代码整成乱码,昨晚三点还在改Bug的程序员,今天一早发现DeepSeek悄悄打了个补丁。

“极”字乱飞把代码整成乱码,昨晚三点还在改Bug的程序员,今天一早发现DeepSeek悄悄打了个补丁。

补丁叫V3.1 Terminus,听着像告别演出。

官方说修好了“极”字幽灵,也顺手把中英混排的乱码压下去。

听起来小得不能再小,可真正熬夜的人知道,少一个乱码就少一次回滚。

有人测了新版,确实不再冷不丁蹦出“极极极极”。

但Codeforces分数掉了,官方解释是“安全策略收紧”。

翻译成人话:模型更谨慎,脑洞被剪了翅膀。

写竞赛题的人不爽,写生产代码的人却松了口气——谁也不想线上突然来一段“极你太美”。

这次还把代码智能体和搜索智能体各升级了一小格。

体验下来,写脚本时补全更快,搜资料时少翻两页。

像给自行车换了更顺的链条,说不出哪里惊艳,就是踩起来轻了。

真正吊胃口的是“Terminus”这后缀。

社区里有人翻出旧帖,发现DeepSeek历来用希腊字母做代号,这次直接写“终点”,摆明不想按套路出牌。

猜测四起:V3就此收官?

下一跳直接V4?

还是像论文里常见的“Final-v2-ReallyFinal”?

官方一句“年底见”把悬念留足。

更炸裂的料来自路线图:多模态已经在内部跑图跑音频,万亿参数的MoE架构也在烧卡。

听起来像把GPT-4V、Claude 3的卖点打包升级,但落地到中文场景能不能打得过同月发布的Baichuan3,还得看数学和代码实测。

开源党最关心部署。

这次同步放出的权重,在Hugging Face和ModelScope都能直接拉。

实测显存从22G降到18G,一张3090就能跑,速度还快了两成。

树莓派玩家别激动,量化版还没出,但社区已经有人连夜剪枝,估计周末就有尝鲜包。

总结一句话:V3.1像一次深夜便利店购物,没买到满汉全席,但买到了立刻能吃的热饭。

急着修Bug的,现在就能升级;想等大招的,盯紧年底那场发布会。

来源:奋发有为奶酪w7

相关推荐