DeepSeek-V3.1,继承并进化自 V3 版本,在推理模式、工具调用、代码能力、长上下文支持等多个关键维度全面升级,访问链接即可在线体验:https://ai.gitee.com/serverless-api?model=DeepSeek-V3_1摘要:DeepSeek-V3.1,继承并进化自 V3 版本,在推理模式、工具调用、代码能力、长上下文支持等多个关键维度全面升级,访问链接即可在线体验:https://ai.gitee.com/serverless-api?model=DeepSeek-V3_1
非思考模式适合快速问答、工具调用等响应场景。
思考模式更擅长多轮推理、搜索代理、复杂代码代理等任务。
工具调用更智能,Agent 任务大幅增强借助后训练优化,V3.1 在工具使用准确性与 Agent 框架适配上均有显著提升:
支持标准格式 ToolCall,工具调用结果可多轮追踪
内建搜索 Agent 框架,结合外部搜索 API,具备复杂问题解答能力
代码 Agent 能力升级,终端操作、SWE-bench、多语言任务表现优秀
推理效率提升,轻量更高效在保有高水准输出质量的同时,DeepSeek-V3.1-Thinking 推理速度显著快于 DeepSeek-R1:
该版本以 671B 参数基础大模型为底座,活跃参数为 37B,采用两阶段长上下文扩展训练策略:
32K 阶段训练数据扩展 10 倍,达 630B tokens
128K 阶段训练数据扩展 3.3 倍,达 209B tokens
模型训练采用 UE8M0 FP8 数据格式,确保兼容 microscaling 微缩格式,具备更强的部署适应性。
欢迎你深入探索在 Agent 框架、代码生成、复杂搜索问答中的潜力表现。来源:游戏小宇宙