DeepSeek-V3.1模型上线模力方舟,多场景全能选手登场

B站影视 电影资讯 2025-08-27 14:36 2

摘要:DeepSeek-V3.1,继承并进化自 V3 版本,在推理模式、工具调用、代码能力、长上下文支持等多个关键维度全面升级,访问链接即可在线体验:https://ai.gitee.com/serverless-api?model=DeepSeek-V3_1

DeepSeek-V3.1,继承并进化自 V3 版本,在推理模式、工具调用、代码能力、长上下文支持等多个关键维度全面升级,访问链接即可在线体验:https://ai.gitee.com/serverless-api?model=DeepSeek-V3_1支持双模式推理,思考与直觉自由切换DeepSeek-V3.1 引入「Hybrid Thinking Mode」,可在「思考模式(Thinking)」与「非思考模式(Non-Thinking)」之间自由切换,满足快速响应或深度推理的不同需求。

非思考模式适合快速问答、工具调用等响应场景。

思考模式更擅长多轮推理、搜索代理、复杂代码代理等任务。

工具调用更智能,Agent 任务大幅增强

借助后训练优化,V3.1 在工具使用准确性与 Agent 框架适配上均有显著提升:

支持标准格式 ToolCall,工具调用结果可多轮追踪

内建搜索 Agent 框架,结合外部搜索 API,具备复杂问题解答能力

代码 Agent 能力升级,终端操作、SWE-bench、多语言任务表现优秀

推理效率提升,轻量更高效

在保有高水准输出质量的同时,DeepSeek-V3.1-Thinking 推理速度显著快于 DeepSeek-R1:

极限长文本训练,128K 上下文处理更强

该版本以 671B 参数基础大模型为底座,活跃参数为 37B,采用两阶段长上下文扩展训练策略:

32K 阶段训练数据扩展 10 倍,达 630B tokens

128K 阶段训练数据扩展 3.3 倍,达 209B tokens

模型训练采用 UE8M0 FP8 数据格式,确保兼容 microscaling 微缩格式,具备更强的部署适应性。

欢迎你深入探索在 Agent 框架、代码生成、复杂搜索问答中的潜力表现。

来源:游戏小宇宙

相关推荐