摘要:“极”字乱飞把代码整成乱码,昨晚三点还在改Bug的程序员,今天一早发现DeepSeek悄悄打了个补丁。
“极”字乱飞把代码整成乱码,昨晚三点还在改Bug的程序员,今天一早发现DeepSeek悄悄打了个补丁。
补丁叫V3.1 Terminus,听着像告别演出。
官方说修好了“极”字幽灵,也顺手把中英混排的乱码压下去。
听起来小得不能再小,可真正熬夜的人知道,少一个乱码就少一次回滚。
有人测了新版,确实不再冷不丁蹦出“极极极极”。
但Codeforces分数掉了,官方解释是“安全策略收紧”。
翻译成人话:模型更谨慎,脑洞被剪了翅膀。
写竞赛题的人不爽,写生产代码的人却松了口气——谁也不想线上突然来一段“极你太美”。
这次还把代码智能体和搜索智能体各升级了一小格。
体验下来,写脚本时补全更快,搜资料时少翻两页。
像给自行车换了更顺的链条,说不出哪里惊艳,就是踩起来轻了。
真正吊胃口的是“Terminus”这后缀。
社区里有人翻出旧帖,发现DeepSeek历来用希腊字母做代号,这次直接写“终点”,摆明不想按套路出牌。
猜测四起:V3就此收官?
下一跳直接V4?
还是像论文里常见的“Final-v2-ReallyFinal”?
官方一句“年底见”把悬念留足。
更炸裂的料来自路线图:多模态已经在内部跑图跑音频,万亿参数的MoE架构也在烧卡。
听起来像把GPT-4V、Claude 3的卖点打包升级,但落地到中文场景能不能打得过同月发布的Baichuan3,还得看数学和代码实测。
开源党最关心部署。
这次同步放出的权重,在Hugging Face和ModelScope都能直接拉。
实测显存从22G降到18G,一张3090就能跑,速度还快了两成。
树莓派玩家别激动,量化版还没出,但社区已经有人连夜剪枝,估计周末就有尝鲜包。
总结一句话:V3.1像一次深夜便利店购物,没买到满汉全席,但买到了立刻能吃的热饭。
急着修Bug的,现在就能升级;想等大招的,盯紧年底那场发布会。
来源:奋发有为奶酪w7