中国AI新突破!DeepSeek-R1正式发布:性能对标OpenAI o1大模型

B站影视 2025-01-24 19:35 2

摘要:上期图文内容,我们分享了深度求索公司发布的DeepSeek-V3 大模型,而在过中国新年之前,深度求索正式推出新一代人工智能助手DeepSeek-R1大语言模型。官方宣称其综合性能对标OpenAI的GPT-4o(o1正式版),并在逻辑推理、数学计算、编程辅助等

上期图文内容,我们分享了深度求索公司发布的DeepSeek-V3 大模型,而在过中国新年之前,深度求索正式推出新一代人工智能助手DeepSeek-R1大语言模型。官方宣称其综合性能对标OpenAI的GPT-4o(o1正式版),并在逻辑推理、数学计算、编程辅助等场景中表现尤为亮眼。这一发布标志着国产大模型技术迈入全球第一梯队。且DeepSeek-R1依然是一款开源模型,价格更是打到了平民的价格。

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

一、核心技术亮点

思维链强化

采用分步式思考优化算法,解决复杂问题时推理步骤更清晰,错误率较前代降低40%。例如在解决国际数学奥林匹克(IMO)题目时,DeepSeek-R1能逐步拆解定理应用过程,并标注关键逻辑节点。

多模态能力升级

支持文本、图像、音频混合输入,实现跨模态内容生成与分析。比如上传一张电路板照片,可自动生成维修建议以及根据用户语音指令实时生成数据分析图表等。

实时联网与长文本处理

整合实时搜索引擎,支持单次解析超100万字符的长文档(如合同、学术论文等)。

官方在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

登录DeepSeek官网或官方App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。

二、与OpenAI GPT-4o的差异化优势

作为开源的国产大模型,第一肯定最重要的是不用再想办法使用梯子才能使用大模型能力了,第二个当然是开源了,模型开源 License 统一使用 MIT。此次开源仓库(包括模型权重)统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。

任何人可以直接在 GitHub 或者 hugging face 上面下载预训练权重,使用简单的代码即可实现使用

三、用户场景实际测试

这里使用了一个简单的测试来看看DeepSeek-R1的表现:

输入需求:“用Python写一个自动爬取天气数据的脚本,并生成可视化图表。”

DeepSeek-R1 10秒内生成完整代码,并标注关键API的调用注意事项。

DeepSeek-R1写清楚了每个过程的要点,并指导用户使用此脚本代码,简直是小白的福音。而调用DeepSeek-R1模型也很简单,只需要安装 openai第三方库,直接使用以下代码即可调用DeepSeek-R1,这里注意的是模型是deepseek-reasoner。

pip3 install -U openaifrom openai import OpenAIclient = OpenAI(api_key="", base_url="https://api.deepseek.com")# Round 1messages = [{"role": "user", "content": "9.11 and 9.8, which is greater?"}]response = client.chat.completions.create( model="deepseek-reasoner", messages=messages, stream=True)reasoning_content = ""content = ""for chunk in response: if chunk.choices[0].delta.reasoning_content: reasoning_content += chunk.choices[0].delta.reasoning_content else: content += chunk.choices[0].delta.content# Round 2messages.append({"role": "assistant", "content": content})messages.append({'role': 'user', 'content': "How many Rs are there in the word 'strawberry'?"})response = client.chat.completions.create( model="deepseek-reasoner", messages=messages, stream=True)

当然若你不了解代码,可以直接在 deepseek 官方网站上面直接使用,只需要在对话框左下角点击深度思考 R1,模型就自动使用deepseek R1 模型。

四、价格

最后一点便是优惠的价格,官方也明码标价,百万 tokens 为 16 元,比openai的 O1 模型优惠了很多。而同样作为开源模型的鼻祖 meta 也对 deep seek 的模型进行了密切关注,毕竟是一款中国模型,引起了广大网友的一致好评。660B参数的大模型,也不是一般电脑配置可以用起来的,因此使用 API 调用,或者直接在 deep seek 官方网站上使用 R1 模型定是一个不错的选择。

来源:人工智能研究所

相关推荐