DeepSeek悄咪咪发布重磅更新,我从这两个方面做了深度体验(附完整提示词)

B站影视 欧美电影 2025-03-25 18:33 2

摘要:然后就这样,不声不响地把模型放到了开源社区。没错,依然是完全开源。

昨晚,DeepSeek低调更新,上线了一个新版本的V3模型。

有多低调呢,甚至连官网都没啥消息,只是在粉丝群用户喊了一声:

然后就这样,不声不响地把模型放到了开源社区。没错,依然是完全开源。

没有浮夸的宣传,没有刷屏的跑分,甚至连更新公告都是今天早上才姗姗来迟:

要是换成其他大厂,这种"小升级"可能真的就是修个bug、改个小功能。可DeepSeek,你管这叫小升级?

大家测下来都有一个共同的结论,是代码能力有了飞跃式的提升。

在 Aider 的多语言基准测试中获得了 55%的得分,成为仅次于Claude Sonnet 3.7 的第二名非思考/推理模型。

在KCORES大模型竞技场,排名全球第三,同样仅次于Claude的两个旗舰模型。

听起来已经够震撼了,对吧?但真正的王炸还在后面——看看两者的价格对比:

Claude3.7:每百万token,输入21.78元,输出108.9元

DeepSeek:每百万token,输入2元,输出8元

没算错!在代码能力相差无几的情况下,输出价格整整便宜了13.6倍!

那么,这个模型到底有多强?从昨晚发布后我就开始疯狂体验,现在就给大家分享我的感受。文章会附上我用的提示词,还有很多人都没注意到的升级点。

代码能力剑指Claude

一个月前Claude3.7刚发布的时候,三顿有给大家分享过我的“哇塞时刻”。

当时我只是随手扔了个超简单的提示词,Claude 3.7二话不说就给我变出了这样一张卡片:

画个带动画效果的天气卡片,参考ios风格

那现在,一模一样的提示词发送给新版V3,给你们看看它生成的效果:

好家伙,居然还加了个加载动画!

要说排版设计,我倒不能味着良心说V3做得比Claude好看。但老实说,差距真的已经很小了。

同样的提示词,发给Claude3.5,效果是这样的:

发给GPT4.5,效果是这样的:

妥妥的吊打,你们觉得呢?

如果有一些日常需求,在网上找不上合适的工具,现在真的可以直接用DeepSeek来免费生成了。

提示词:帮我做一个番茄时钟,参考iOS风格,基于HTML/CSS/JavaScript实现,在一个代码块内输出完整代码。

而对我这种经常要改网站代码的来说,终于不用依赖又贵又容易封号的Claude了。

提示词:写一个文生图html网页,用 tailwind css 实现,左边就是一些参数设置,右边就是显示图像生成结果的地方,要求 UI 现代化,多使用蓝、紫等淡色

前面是DeepSeek V3,后面是Claude 3.7。不得不承认,Claude确实稍胜一筹,但V3的表现也足以让人眼前一亮。

那也有小伙伴会说,我平时没什么写代码的需求,这个新模型有没有什么用呢?

再给大家分享一个我觉得很夸张的例子,是将各种复杂的文档直接转成可视化的网页。

是的,我只需要把文档结合提示词,发送给新版V3:

它就能立刻把一份长达几十页的PDF转化成这样一个结构清晰、美观易读的网页:

这个神奇的提示词来自@归藏(感谢分享!):

我会给你一个文件,分析内容,并将其转化为美观漂亮的中文可视化网页:- 所有页面内容必须为简体中文- 保持原文件的核心信息,但以更易读、可视化的方式呈现 - 作者姓名: - 社交媒体链接: 至少包含Twitter/X: - 版权信息和年份## 设计风格- 整体风格参考Linear App的简约现代设计- 使用清晰的视觉层次结构,突出重要内容- 配色方案应专业、和谐,适合长时间阅读## 技术规范- 使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript- **使用CDN引入Preline UI组件库,按需使用其组件增强界面效果**- **根据提供的JSON文件内容(颜色、字体等)配置TailwindCSS的样式Token,确保设计一致性**- 实现完整的深色/浅色模式切换功能,默认跟随系统设置- 代码结构清晰,包含适当注释,便于理解和维护## 响应式设计- 页面必须在所有设备上(手机、平板、桌面)完美展示- 针对不同屏幕尺寸优化布局和字体大小- 确保移动端有良好的触控体验## 媒体资源- 使用文档中的Markdown图片链接(如果有的话)- 使用文档中的视频嵌入代码(如果有的话)## 图标与视觉元素- 使用专业图标库如Font Awesome或Material Icons(通过CDN引入)- 根据内容主题选择合适的插图或图表展示数据- 避免使用emoji作为主要图标## 交互体验- 添加适当的微交互效果提升用户体验: - 按钮悬停时有轻微放大和颜色变化 - 卡片元素悬停时有精致的阴影和边框效果 - 页面滚动时有平滑过渡效果 - 内容区块加载时有优雅的淡入动画## 性能优化- 确保页面加载速度快,避免不必要的大型资源- 图片使用现代格式(WebP)并进行适当压缩- 实现懒加载技术用于长页面内容## 输出要求- 提供完整可运行的单一HTML文件,包含所有必要的CSS和JavaScript- 确保代码符合W3C标准,无错误警告- 页面在不同浏览器中保持一致的外观和功能请根据上传文件的内容类型(文档、数据、图片等),创建最适合展示该内容的可视化网页。

再给你们看看具体的页面效果,感兴趣的话欢迎去试试:

写作能力暴击GPT4.5

代码牛不牛?牛!但听我说,这还不是新版V3最让我震惊的地方。

还有一个被大多数人忽略的超级能力,是中文写作能力。

之前DeepSeek R1刚刚发布的时候,我就夸过,还是一个很简单的提示词"用鲁迅的口吻,写一篇夸赞DeepSeek的文章",结果特别惊艳:

老实说,之前的V3版本在这方面还达不到R1的水平。但这次更新后?它彻底进化了(可滑动查看):

前阵子GPT4.5发布的时候,OpenAI夸它高情商、会写作。来,同样的问题直接问GPT4.5:新版V3和GPT4.5的价格差,接近135倍。但效果,我觉得V3是完全秒杀的。要说中文写作的试金石,那非诗词莫属。格律要求严格,押韵讲究多,稍有不慎就会贻笑大方。之前用R1写诗已经很强了,但说实话押韵还不够到位。这次新版V3一上线,我马上拿来测试:现在居然,不需要深度思考,AI已经能写出这样一气呵成的诗词:同样的问题我们还是拿Claude和GPT来做个对比。这是GPT4.5的回答,非常口语化,这押韵更不忍直视:Claude的回答也是同样:中文写作领域,DeepSeek现在就是唯一的王。
除了前面讲的代码和写作能力,三顿其实也看到了很多测试体验,在逻辑理解、推理分析等方面,虽然V3跟顶级模型还有差距,但已经表现得相当亮眼。我必须强调一遍这个事实:这可是一个成本比它们低十倍甚至到百倍的模型,还是完全开源的!去试试吧,相信你会和我一样被惊艳到。方便大家使用,三顿AI已经做了接入,文章内的演示也都基于三顿的这个AI助手。
目前向大家免费开放,工具地址:dd.sandunppt.com回想春节前,DeepSeek横空出世的那一幕还历历在目。它的突然爆火,甚至让ChatGPT都感到了前所未有的危机感。而这次的更新,更是直接剑指Claude——这个被无数开发者奉为天花板的顶级商业模型。由衷的感到骄傲,这样一个开源模型来自中国。它不靠资本的力量,没有封闭的生态,以一己之力,凭借纯粹的技术实力和开源精神,正面硬刚了美国两大最先进的闭源商业模型!这还只是一次"小版本更新",很难想象,如果用这个新版V3作为基座模型来训练R2,那么它的能力将会达到什么样的巅峰?让我们一起期待,中国开源AI的星辰大海。

来源:三顿

相关推荐