DeepSeek-V3.1模型上线模力方舟，多场景全能选手登场

摘要：DeepSeek-V3.1，继承并进化自 V3 版本，在推理模式、工具调用、代码能力、长上下文支持等多个关键维度全面升级，访问链接即可在线体验：https://ai.gitee.com/serverless-api?model=DeepSeek-V3_1

DeepSeek-V3.1，继承并进化自 V3 版本，在推理模式、工具调用、代码能力、长上下文支持等多个关键维度全面升级，访问链接即可在线体验：https://ai.gitee.com/serverless-api?model=DeepSeek-V3_1

支持双模式推理，思考与直觉自由切换DeepSeek-V3.1 引入「Hybrid Thinking Mode」，可在「思考模式（Thinking）」与「非思考模式（Non-Thinking）」之间自由切换，满足快速响应或深度推理的不同需求。

非思考模式适合快速问答、工具调用等响应场景。

思考模式更擅长多轮推理、搜索代理、复杂代码代理等任务。

工具调用更智能，Agent 任务大幅增强

借助后训练优化，V3.1 在工具使用准确性与 Agent 框架适配上均有显著提升：

支持标准格式 ToolCall，工具调用结果可多轮追踪

内建搜索 Agent 框架，结合外部搜索 API，具备复杂问题解答能力

代码 Agent 能力升级，终端操作、SWE-bench、多语言任务表现优秀

推理效率提升，轻量更高效

在保有高水准输出质量的同时，DeepSeek-V3.1-Thinking 推理速度显著快于 DeepSeek-R1：

极限长文本训练，128K 上下文处理更强

该版本以 671B 参数基础大模型为底座，活跃参数为 37B，采用两阶段长上下文扩展训练策略：

32K 阶段训练数据扩展 10 倍，达 630B tokens

128K 阶段训练数据扩展 3.3 倍，达 209B tokens

模型训练采用 UE8M0 FP8 数据格式，确保兼容 microscaling 微缩格式，具备更强的部署适应性。

欢迎你深入探索在 Agent 框架、代码生成、复杂搜索问答中的潜力表现。

来源：游戏小宇宙

标签：模型推理 agent thinking agent框架

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!