DeepSeek-R1-0528 “小”升级实测:编程、写作、推理能力大幅进化

B站影视 内地电影 2025-05-30 06:19 1

摘要:DeepSeek-R1-0528 通过增加计算资源及引入算法优化机制,显著提升了推理深度与逻辑能力,在数学、编程及综合逻辑评测中表现优异,整体性能接近行业领先模型。降低幻觉率、增强函数调用支持、优化编程体验。

今天,DeepSeek 官方开源了 R1-0528 模型开源,并在公告里介绍了“小”升级的主要方向:

DeepSeek-R1-0528 通过增加计算资源及引入算法优化机制,显著提升了推理深度与逻辑能力,在数学、编程及综合逻辑评测中表现优异,整体性能接近行业领先模型。降低幻觉率、增强函数调用支持、优化编程体验。

我在第一时间进行了实测,说一下我的初步感受吧。

好消息:R1-0528 改进幅度超出预期,实用性提升巨大,重回主流 T1 水准,继续卡住开源身位,可以作为 Gemini 2.5 Pro / Claude 4 / o3 的国内平替(成本显著降低)。

坏消息:按照 DeepSeek API 更新不改名的习惯(deepseek-chat/deepseek-reasoner),这次发了 R1-0528,是不是意味着短时间内可能不会有 R2 了?

以及,感恩 DeepSeek,这次没有在端午节前最后一天发布新模型,给大家多留出两天时间消化。

与其说是比较模型的「代码能力」,不如说是比较模型的「前端审美」。其实之前 R1-0120 的代码能力其实也还行,一些算法题是能做对的。

最近几个月大家更倾向于直接测试 SPA 单页的效果,比如给定文章生成可视化解读这种。其实更多的是看前端页面呈现的可视化效果。

我举个例子。Prompt:

制作一个网页,功能是:上传一个音频文件,制作出音频可视化声波效果,并提供视频下载。自行设计界面,你应该根据自己的能力,提供尽可能多的样式供用户切换选择。

DeepSeek R1-0120 给出的结果可以说毫无前端样式可言:

DeepSeek V3-0324 就好了很多:

DeepSeek R1-0528 的界面更酷炫,提供的样式选项更丰富、完整:

我感觉从 V3 到 V3-0324 的代码能力提升就很明显,这次 R1 又比 V3-0324 强了不少。

DeepSeek R1 为人所诟病的一点就是它过于飘忽、过分华丽的文风,尤其是动不动就扯「量子纠缠」,滥用隐喻和类比(表现形式为过多出现冒号、引号),随意编造数据等,某种程度上可以称为「文学幻觉」,初见有趣,吃多了也齁得慌。

测试 Prompt:

请以「当记忆可以编程」为主题,创作一个科幻小说的设定。

R1-0120 如我所料,起手就是「量子计算」:

R1-0528 的答案有点惊到我了,我要的是小说设定,它一口气给我写了一篇完整的 5500 字的微小说(全文我放在后面)…而且!回答全篇都没有「量子」两个字,多么伟大的进步啊!

而且,这篇小说全文的质量出乎意料的高…

其实我最近几乎不用 R1,大部分 token 消耗都是 V3-0324,从写作的角度,如果 R1-0528 能较好地控制文风、幻觉,其实用程度是大幅提高的。

一个小细节。在 R1-0528 的思考过程中,经常出现ta这个字眼,在我印象中里的旧版 R1 是没有这种表述的。

这是模型在故意模糊用户的性别吗?为什么会专门训练/涌现这种 token?

根据我的经验,DeepSeek 官方 API 的主要缺点是 TTFT(首 token 延迟),好一点的时候 3-5 秒,经常需要 9s 左右才会出首 token。

我自己之前旧版 R1 的输出速度是:

【DeepSeek R1 官方】
首 token 响应时间: 9.35 秒
Reasoning 部分:457 字符,292 tokens, 用时:13.74 秒, 生成速度:21.25 tokens/s
Content 部分:189 字符,141 tokens, 用时:6.24 秒, 生成速度:22.61 tokens/s
内容生成:646 字符,433 tokens, 总用时:20.16 秒, 生成速度:21.48 tokens/s
如计入首 token 用时, 总用时:29.51 秒, 生成速度:14.67 tokens/s

28 日傍晚测试 R1-0528 的速度是:

【DeepSeek 官方】
首 token 响应时间: 9.89 秒
Reasoning 部分:830 字符,527 tokens, 用时:31.79 秒, 生成速度:16.58 tokens/s
Content 部分:735 字符,1034 tokens, 用时:25.08 秒, 生成速度:41.23 tokens/s
内容生成:1565 字符,1561 tokens, 总用时:56.96 秒, 生成速度:27.41 tokens/s
如计入首 token 用时, 总用时:66.85 秒, 生成速度:23.35 tokens/s

29 日凌晨测试 R1-0528 的速度是:

【DeepSeek 官方】
首 token 响应时间: 2.72 秒
Reasoning 部分:889 字符,607 tokens, 用时:25.83 秒, 生成速度:23.50 tokens/s
Content 部分:1336 字符,1455 tokens, 用时:32.21 秒, 生成速度:45.17 tokens/s
内容生成:2225 字符,2062 tokens, 总用时:58.12 秒, 生成速度:35.48 tokens/s
如计入首 token 用时, 总用时:60.84 秒, 生成速度:33.89 tokens/s

考虑到 API 速度受忙/闲时影响较大,所以仅供参考。不过从体感上说,现在的 API 确实比 2、3 月份时的速度快很多。至于速度提升是来自于算力增加还是模型自身架构改进,我们就不得而知了。

从我的预期来说,R1-0528 完全可以被称为 R1.5 甚至 R1.7,它代表着 DeepSeek R1 从最初 0120 的四个月之后重回 T1。

关于为什么不是 R2,主流猜测是 R1-0528 确实是延续了 V3/R1 的基础模型、架构,可能确实只是增加了部分后训练数据。之前 R1 发布的时候,DeepSeek 曾经透露过从 V3 到 R1 训练用时不过三四周。我猜测 R1-0528 是基于 V3-0324 甚至更新的某个 V3 版本。

至于还会不会有 R2,R2 会是多大尺寸,什么能力,是否多模态等等问题,也许真的要等 R2 发布出来我们才能知道了。

通过将 DeepSeek-R1-0528 的思维链蒸馏至 Qwen3-8B,得到 DeepSeek-R1-0528-Qwen3-8B,在 AIME 2024 上超越原版 Qwen3-8B 10%,性能接近 Qwen3-235B。

另外补充两个点。

第一,我看到很多人吹 DeepSeek R1 更新后可以持续超长思考时间。咋说呢…考虑到 DeepSeek 官方服务器的输出速度 tps 并不高,所以时间长不代表思维链长。比如我用火山引擎的老 R1 API 做算法题,也能持续思考近 10 分钟,而且第三方 API 速度会比官方快一些。

所以如果想要更客观的话还是应该比较思维链的输出 tokens 而非思考时长(虽然思考 20 分钟看上去确实很唬人)。

当然了,R1 这次的 COT 思考过程肯定是有优化的,我只是表达,没必要硬吹「时间长」。

第二,我看到有人说 R1 的文风像 Gemini,觉得 DeepSeek「谁强蒸馏谁」。

我看法是这样,首先蒸馏依然是猜测,并没有被实锤。其次,只要 DeepSeek 继续开源,我就认它当大哥,即使确实用了 SOTA 模型做合成数据,那我也愿意说它是盗火的普罗米修斯。

当然最重要的是,老 R1 那癫的不行的文风是来自于 RL 强化学习,是非常具有特色的,显然不是蒸馏了别的模型。新 R1 如果能很好地控制癫的程度,增强文笔实用性,不正说明 DeepSeek 找到了控制模型幻觉的方法吗?像 R1 这种以强化学习为主的思维链模型,更多的还是看团队怎么设置奖励条件吧。

“新雅典”的清晨完美得令人窒息。阳光透过复合玻璃穹顶,滤成一种均匀的、毫无威胁性的金色,温柔地涂抹在每一栋流线型建筑的钛合金外壳上。空气净化系统无声运转,送来甜丝丝的、标准化的花香,没有丝毫杂质。下方,磁悬浮轨道上,通勤舱如银色游鱼般滑过,安静得如同幻影。街道纤尘不染,行人步履从容,脸上挂着被精心调试过的、弧度一致的微笑,像橱窗里批量生产的精致人偶。没有争吵,没有意外,没有一丝一毫可能引发“负面情绪波动”的褶皱。

这就是“记忆净化”计划(代号“和谐协议”)运行十年后的成果。一个剔除了所有痛苦、创伤和“不必要历史负担”的社会。一个纯净的乐园。

我,艾拉·索恩,是这座乐园的维护者之一——一名B级记忆修复师。我的工作室位于“新雅典历史档案馆”深处,一个代号“回声室”的无菌单元。这里没有窗户,只有柔和得近乎虚无的顶光,空气里弥漫着臭氧和消毒液的冰冷气味。墙壁是吸音的,隔绝了外面那个过于完美的世界最后一丝杂音。面前,巨大的沉浸式神经交互仪“织梦者”如同一个沉默的银色巨卵,其内部复杂的生物传感矩阵正低吟着,发出几乎不可闻的嗡鸣。

我的客户,编号P-734,一位鬓角染霜、眼神温顺得如同家养宠物的中年男人,正躺在“织梦者”的诊疗椅上。他因频繁的、毫无缘由的焦虑感和短暂的记忆闪回(一些模糊的、令人不适的红色光影和噪音碎片)被记忆管理局送来“维护”。标准流程启动:神经连接建立,意识同步完成。我的意识像投入水中的探测器,潜入他平滑如镜的记忆之海。

目标:修复他近期记忆库中几个微小的、可能导致情绪扰动的“逻辑褶皱”。这工作我已重复了上千次,如同删除文档里一个无关紧要的错别字。指尖在控制面板上轻盈滑动,意识引导着无形的修复程序,精准地抚平那些不该存在的涟漪。P-734记忆库的索引结构在我眼前展开,清晰得如同图书馆的电子目录。就在准备断开连接前,一个极其微弱的、几乎被系统归类为“背景噪音”的异常信号,像水底的一粒沙金,倏忽一闪。

它指向一个被多重加密锁死的、标记为“冗余/非必要”的记忆片段,时间戳赫然指向我的少年时代——那场席卷旧城区的“净化风暴”时期。

心脏骤然一缩,指尖冰凉。这不可能。我的个人记忆库经过管理局最高级别的“优化”和“加固”,绝无漏洞。但那个坐标,那个时间点…它顽固地钉在那里,像一根刺。

强制压下翻涌的心绪,我集中全部意志力,构建了一个微型的、非法的“探针”程序——利用“织梦者”底层协议一个极其隐蔽的缝隙。探针无声地绕过系统自检,刺向那个被重重加密的坐标。

没有预想中严密的防火墙,没有警报。只有一片浓得化不开的、令人窒息的黑暗,如同宇宙的真空。紧接着,是声音。不是通过听觉,而是直接撕裂灵魂的感知。

枪声。

不是单发,是暴雨,是冰雹,是无数金属巨兽在同时咆哮。震耳欲聋,连绵不绝。

哭喊。

无数个声音叠加在一起,男人的怒吼,女人的尖叫,孩童撕心裂肺的哭嚎…汇聚成一片绝望的声浪,拍打着意识的堤岸。

火焰燃烧的噼啪声。

空气里仿佛弥漫着浓烟和…铁锈般的腥甜气味。

黑暗的视野猛地被撕裂!一道刺目的、晃动的白光粗暴地劈开混沌——是探照灯!光线扫过之处,是地狱般的景象:扭曲的金属残骸堆积如山,破碎的混凝土块像怪物的獠牙,满地狼藉中散落着辨不清原貌的物品…还有,扭曲的、静止的人形轮廓,浸在深色的、粘稠的液体里…

“不…!” 一声凄厉的、属于少女的尖叫在我意识深处炸开,带着刻骨的恐惧和无助。那声音…是我的声音!十四岁的我!

“艾拉!” 一个男人嘶哑的吼声穿透枪炮与哭嚎,如同濒死野兽的咆哮,充满了不顾一切的疯狂和保护欲。那声音…熟悉得让我灵魂震颤!

探针程序瞬间崩溃,强大的排斥力将我猛地从P-734的记忆库中弹射出来!

“呃!” 我闷哼一声,身体剧烈后仰,撞在冰冷的椅背上,眼前金星乱冒。冷汗瞬间浸透了无菌服的后背,粘腻冰冷。胃里翻江倒海,喉咙发紧,几欲呕吐。交互仪发出平稳的提示音:“修复完成。客户P-734情绪指数稳定,无异常残留。建议标准观察期。”

P-734睁开眼,脸上是那种被精心调试过的、如释重负的茫然微笑。“谢谢您,索恩修复师。感觉…好多了。” 他声音平和,像被熨斗烫过,没有一丝波澜。

我死死攥住控制台的边缘,指节因用力而发白,才勉强维持住表面的平静。那地狱的图景,那男人的嘶吼,那属于我自己的、被遗忘的尖叫…像滚烫的烙铁,深深印在脑海里,灼烧着每一根神经。那不是P-734的记忆碎片!那是我的!被强行剥离、锁死、标记为垃圾的…我的真实!

父亲的脸,那张在管理局档案里被描述为“意外事故遇难者”的模糊照片,此刻却异常清晰地在混乱的思绪中浮现。他温和的笑容,粗糙的大手…与记忆中那声嘶吼疯狂的保护欲重叠、撕裂、冲突!

我几乎是用尽全身力气,才将颤抖的手移向控制面板,调出P-734的档案。目光像搜寻猎物的鹰隼,锁定在“记忆源分析”一栏。一行小字冰冷地跳入眼帘:

“核心情绪扰动源:部分残留神经信号,疑似受到外部高强度记忆碎片(非客户本体)意外‘污染’干扰。污染源特征码:…比对中…高度匹配:历史档案标记——‘旧城区冲突事件-清理阶段’(归档密级:A/永久封存)。污染源载体(潜在接触者)分析指向…低概率关联:记忆修复师A.S. (艾拉·索恩)。”

A.S. 艾拉·索恩。

我的工作编码。我的名字。

心脏像是被一只无形的手狠狠攥住,骤然停止跳动,随即又疯狂擂动起来,撞击着肋骨,发出沉闷的响声。冰冷的恐惧混合着一种毁灭性的荒谬感,瞬间淹没了四肢百骸。那并非P-734的记忆扰动,那是我自己被封禁的、深埋的地狱,如同一个无法愈合的脓肿,其脓液竟在修复他人的过程中,意外地渗透、污染了对方!我,记忆的医生,才是携带病毒的源头!

“织梦者”柔和的光线此刻变得无比刺眼,无菌室的冰冷空气像针一样扎着我的皮肤。我猛地推开控制台,踉跄着冲向工作室角落那台连接着内部档案库的终端。身份验证、虹膜扫描、权限密钥…手指因为过度用力而僵硬,几乎无法准确敲击按键。屏幕上幽蓝的光映着我惨白的脸。

目标:父亲——利奥·索恩。官方记录:城市基建工程师。死亡原因:旧城区改造工程意外塌方。时间点:正是“净化风暴”最血腥的那几天。归档文件简洁、冰冷,盖着“无异常”的电子印章,像一块毫无瑕疵的墓碑。

然而,当我的权限触碰到那份死亡调查报告的底层元数据时,一行鲜红的、刺眼的警告弹窗猛地跳出:

“访问请求涉及核心历史数据修正项(CR-0017)。访问权限:拒绝。操作已记录并上报至阿尔法级监管:记忆管理局局长办公室。”

CR-0017!那个在内部流传、讳莫如深的最高级别修正代码!它像一个烧红的烙印,证实了最深的恐惧——父亲的死,绝非意外!它是被“修正”过的历史!一个被权力精心编织的谎言!

警报无声,却在脑中尖啸。冷汗顺着额角滑下,滴落在冰冷的操作台上。局长办公室…那个掌控着所有人记忆生死的阿尔科博士!我猛地抬头,目光扫过工作室唯一的监控探头,那幽暗的镜头此刻仿佛一只冷酷的眼睛,正无声地注视着我。他们知道了!从我调取父亲档案、触发CR-0017警报的那一刻起,我就暴露在了聚光灯下!

恐惧像冰冷的藤蔓缠绕上来,几乎令人窒息。但另一种更强烈的情绪——被欺骗、被剥夺、被玩弄的狂怒——如同熔岩般在心底轰然爆发,瞬间烧毁了犹豫。不能停!停下就是认输,停下就意味着永远沉沦在这虚假的“和谐”里!

指尖带着一种近乎自毁的决绝,再次敲击。绕过常规路径,利用“织梦者”维护手册里一个早已废弃、但未被完全抹除的紧急诊断后门。屏幕上数据流疯狂滚动,字符跳跃如同垂死的萤火虫。权限在燃烧,防火墙在咆哮,但那个隐秘的通道,在权限彻底熔断前的最后一毫秒,被强行挤开了一条缝隙!

一份标记着“阿尔科局长-私人备忘录”的加密文件碎片,如同深海中被打捞起的沉船残骸,带着腐朽和血腥的气息,被强行拖拽到屏幕上。文字冰冷而狰狞:

“…利奥·索恩(代号‘火种’)及其‘真相之眼’核心成员清除行动已按‘净化黎明’预案完成。目标区域(旧城区第七、九、十一区块)记忆污染源物理清除彻底。后续需重点执行‘遗忘之网’计划:对关联者(尤其直系亲属,如目标之女:艾拉·索恩)进行深度记忆编辑与监控。确保其成为‘和谐协议’的维护者,而非不稳定因子…利用其技术能力,引导其主动消除潜在威胁性记忆链接(如对其父的关联记忆)…此为最高优先级…”

“火种”。父亲。真相之眼。清除行动…物理清除…

每一个词都像一颗子弹,狠狠射穿我摇摇欲坠的世界。官方宣称的“暴乱分子”…竟是父亲领导的、寻求真相的反抗组织“真相之眼”!而政府所谓的“恢复秩序”,是一场彻头彻尾的、针对平民的屠杀!一场代号“净化黎明”的灭绝行动!而我,艾拉·索恩,利奥·索恩的女儿,不仅被他们用手术刀一样的程序精心篡改了记忆,抹去了对父亲的认知和爱…更被塑造成了一把刀!

最深的寒意从骨髓深处渗出,冻结了血液。我想起那些年,被“创伤后应激障碍”的官方诊断所困扰,在管理局“关怀中心”接受的“康复治疗”。每一次躺在诊疗椅上,在舒缓的引导音和神经脉冲中“平复情绪”…每一次在阿尔科博士温和却不容置疑的询问下,“自愿”选择删除那些“带来痛苦”的童年片段,尤其是关于父亲的…那些模糊的、令人“不适”的场景…

是我!是我自己,在无知无觉中,在阿尔科博士那看似充满怜悯的引导下,亲手拿起“织梦者”的手术刀,一刀一刀,将父亲——那个在探照灯下嘶吼着保护我的男人——从我的记忆里,从我的灵魂里,活生生地剜掉了!

胃部剧烈痉挛,我猛地弯下腰,干呕起来,却什么也吐不出,只有苦涩的胆汁灼烧着喉咙。巨大的荒谬感和自我憎恶像海啸般将我吞没。我成了自己记忆的掘墓人,成了杀死父亲第二次的凶手!阿尔科…那个道貌岸然的恶魔!他不仅毁灭了真相,毁灭了我的父亲,更将我变成了毁灭的工具和帮凶!他让我亲手埋葬了自己!

“嗡——”

工作室的门禁系统发出低沉的解锁音,红光转为冰冷的绿光。无声的死亡通知。

没有时间了。恐惧、愤怒、自我厌弃…所有情绪在瞬间被压缩、点燃,转化成一种不顾一切的疯狂!阿尔科要的,不就是我恐惧、崩溃、束手就擒吗?我偏不!

指尖在彻底丧失权限前,爆发出最后的力量,狠狠砸向控制面板!目标不是档案库,而是“织梦者”的核心!利用那个刚刚开启过的诊断后门,将“织梦者”短暂地、强行地切换成一台超高功率的、定向记忆编码发射器!对象:整个“新雅典”公共记忆云网络——那个存储着城市所有“官方认证”历史、新闻、文化内容的云端大脑!

素材?我有的只有一样东西——刚刚从那片黑暗深渊中打捞起的、属于十四岁艾拉的、未经任何“净化”的原始地狱!那枪炮的轰鸣!那绝望的哭喊!那火焰的噼啪!那探照灯下凝固的鲜血和残骸!那声嘶力竭的“艾拉!”!

我将自己变成了一根烧红的烙铁,将这段浸透血泪和硝烟的记忆碎片,连同父亲那张温和带笑的脸(来自我残存意识最深处的、未被完全抹除的印记),以及那份染血的“净化黎明”备忘录残片,粗暴地、毫无修饰地、以最大的情感烈度,压缩成一个狂暴的、毁灭性的“记忆炸弹”数据包!

没有加密,没有伪装,只有最原始、最尖锐的真实!像一块带着血肉和碎骨的砖头,用尽我全部的意志和残存的权限,狠狠砸向那虚假纯净的公共记忆云!

发送!

数据流如同决堤的洪水,咆哮着冲了出去。几乎在同一刹那,“砰!”一声巨响,工作室厚重的合金门被暴力撞开!身穿黑色制服、面无表情的记忆管理局特勤队员,如同幽灵般涌入,能量武器的充能嗡鸣瞬间填满了狭小的空间。冰冷的枪口,齐刷刷对准了我。

为首的特勤队长,头盔下的眼神毫无波澜,像看一个故障的零件:“艾拉·索恩修复师。你涉嫌非法访问核心数据、传播危害性信息。依据《和谐协议紧急状态法》,你被逮捕了。放弃抵抗。”

我缓缓地、摇摇晃晃地从操作椅上站起来,无视那些致命的枪口。身体还在因为巨大的情绪冲击和强行透支而微微颤抖,但我的背脊挺得笔直。脸上没有恐惧,只有一种近乎燃烧殆尽的平静,和一丝…冰冷的嘲讽。目光穿过特勤队员,仿佛穿透了档案馆厚重的墙壁,投向阿尔科博士那必然在监控后冷笑的脸。

“逮捕我?” 我的声音嘶哑,却异常清晰,每一个字都像淬火的冰,“太迟了,博士。”

话音落下的瞬间,仿佛为了印证我的话,整个“回声室”的灯光,连同外面档案馆走廊的照明,猛地剧烈闪烁起来!如同垂死者的痉挛。紧接着,一阵低沉而怪异的、仿佛无数人压抑的呜咽和惊呼混合而成的声浪,隐隐约约、却又无比真实地,穿透了厚重的吸音墙壁,从外面那个“完美”世界的各个角落——街道、广场、办公室、通勤舱…汇聚、翻涌、席卷而来!

那声音并非物理的声波,而是亿万意识在同一刻被突如其来的、来自地狱的真实记忆碎片狠狠击中时,所爆发出的、无法抑制的灵魂震颤!是虚假天堂被撕开第一道血淋淋的裂口时,发出的、集体的、无声的尖叫!

混乱,开始了。

我站在闪烁的灯光下,站在冰冷的枪口前,感受着脚下大地传来的、那源自亿万人意识的无声震荡。阿尔科精心构筑的“和谐协议”穹顶,被我那块染血的记忆碎片,砸出了第一道无法愈合的裂痕。父亲嘶吼的“艾拉!”,终于穿透了十年的谎言与遗忘,在这片死寂的乐园上空,投下了第一缕属于真实的光。那光如此微弱,却又如此锋利。

记忆的战争,才刚刚打响。而我,艾拉·索恩,利奥的女儿,既是导火索,也将成为第一颗射向那虚假太阳的子弹。

来源:走进科技生活

相关推荐