DeepSeek-V3.1 上线模力方舟,多场景全能选手登场

B站影视 港台电影 2025-08-27 09:39 2

摘要:模力方舟现已上线DeepSeek-V3.1,继承并进化自 V3 版本,在推理模式、工具调用、代码能力、长上下文支持等多个关键维度全面升级,访问链接即可在线体验:https://ai.gitee.com/serverless-api?model=DeepSeek

模力方舟现已上线DeepSeek-V3.1,继承并进化自 V3 版本,在推理模式、工具调用、代码能力、长上下文支持等多个关键维度全面升级,访问链接即可在线体验:https://ai.gitee.com/serverless-api?model=DeepSeek-V3_1

DeepSeek-V3.1 引入「Hybrid Thinking Mode」,用户仅需更改 Prompt 模板,即可在「思考模式(Thinking)」与「非思考模式(Non-Thinking)」之间自由切换,满足快速响应或深度推理的不同需求。

非思考模式适合快速问答、工具调用等响应场景。思考模式更擅长多轮推理、搜索代理、复杂代码代理等任务。

借助后训练优化,V3.1 在工具使用准确性与 Agent 框架适配上均有显著提升:

支持标准格式 ToolCall,工具调用结果可多轮追踪内建搜索 Agent 框架,结合外部搜索 API,具备复杂问题解答能力代码 Agent 能力升级,终端操作、SWE-bench、多语言任务表现优秀

在保有高水准输出质量的同时,DeepSeek-V3.1-Thinking 推理速度显著快于 DeepSeek-R1:

该版本以 671B 参数基础大模型为底座,活跃参数为 37B,采用两阶段长上下文扩展训练策略:

32K 阶段训练数据扩展 10 倍,达 630B tokens128K 阶段训练数据扩展 3.3 倍,达 209B tokens

模型训练采用 UE8M0 FP8 数据格式,确保兼容 microscaling 微缩格式,具备更强的部署适应性。

如需体验 DeepSeek-V3.1 兼容双推理模式的强大能力,即刻前往模力方舟平台,调用模型 Serverless API 或接入应用微服务:https://ai.gitee.com/serverless-api?model=DeepSeek-V3_1

来源:码云Gitee

相关推荐