摘要:模力方舟现已上线DeepSeek-V3.1,继承并进化自 V3 版本,在推理模式、工具调用、代码能力、长上下文支持等多个关键维度全面升级,访问链接即可在线体验:https://ai.gitee.com/serverless-api?model=DeepSeek
模力方舟现已上线DeepSeek-V3.1,继承并进化自 V3 版本,在推理模式、工具调用、代码能力、长上下文支持等多个关键维度全面升级,访问链接即可在线体验:https://ai.gitee.com/serverless-api?model=DeepSeek-V3_1
DeepSeek-V3.1 引入「Hybrid Thinking Mode」,用户仅需更改 Prompt 模板,即可在「思考模式(Thinking)」与「非思考模式(Non-Thinking)」之间自由切换,满足快速响应或深度推理的不同需求。
非思考模式适合快速问答、工具调用等响应场景。借助后训练优化,V3.1 在工具使用准确性与 Agent 框架适配上均有显著提升:
支持标准格式 ToolCall,工具调用结果可多轮追踪内建搜索 Agent 框架,结合外部搜索 API,具备复杂问题解答能力代码 Agent 能力升级,终端操作、SWE-bench、多语言任务表现优秀在保有高水准输出质量的同时,DeepSeek-V3.1-Thinking 推理速度显著快于 DeepSeek-R1:
该版本以 671B 参数基础大模型为底座,活跃参数为 37B,采用两阶段长上下文扩展训练策略:
32K 阶段训练数据扩展 10 倍,达 630B tokens128K 阶段训练数据扩展 3.3 倍,达 209B tokens模型训练采用 UE8M0 FP8 数据格式,确保兼容 microscaling 微缩格式,具备更强的部署适应性。
如需体验 DeepSeek-V3.1 兼容双推理模式的强大能力,即刻前往模力方舟平台,调用模型 Serverless API 或接入应用微服务:https://ai.gitee.com/serverless-api?model=DeepSeek-V3_1
来源:码云Gitee