OpenRouter推出「:exacto精准工具调用端点」+两款GPT‑5图像模型

B站影视 韩国电影 2025-10-28 17:30 3

摘要:当你把同一套模型权重交给不同的推理栈,结果真的“同人不同命”。OpenRouter刚刚发布的「:exacto精准工具调用端点」正是为此而生:它会把请求路由到在真实流量中“工具调用成功率更高”的提供商,让代理式、工具密集型工作流更稳、更准。同时,他们还上线了两款

OpenRouter 推出「:exacto 精准工具调用端点」+ 两款 GPT‑5 图像模型与新隐形模型 Andromeda Alpha 全解

当你把同一套模型权重交给不同的推理栈,结果真的“同人不同命”。OpenRouter刚刚发布的「:exacto精准工具调用端点」正是为此而生:它会把请求路由到在真实流量中“工具调用成功率更高”的提供商,让代理式、工具密集型工作流更稳、更准。同时,他们还上线了两款图像模型GPT‑5 Image / GPT‑5 Image mini,以及一款专注视觉理解的隐形模型Andromeda Alpha(注意:该模型的提示与响应会被提供方记录,用于改进服务)。

“我们每月观测到数十亿次请求,得以识别不同提供商在工具调用上的实际差异,从而为工具密集型场景精选更可靠的路由。”——OpenRouter团队

同一模型在不同提供商处的推理质量会因为解码细节、系统提示注入、拦截/恢复策略、工具调用规范化流程等而出现可感知差异。:exacto通过“精心挑选的提供商白名单”来提升工具调用的整体成功率与稳定性。

设计目标:在保持模型权重不变的前提下,优化“工具调用准确率与可靠性”。工作方式:你只需在支持模型的slug后面添加后缀「:exacto」,OpenRouter会只在“通过真实数据与基准评测验证”的提供商中进行路由,无需额外配置偏好。适用场景:代理式工作流、函数/工具密集型任务、使用[MCP](Model Context Protocol,一种多工具代理连接协议 "MCP") 的应用等。 > 参考资料:

文档:Exacto Variant 公告:Provider Variance: Introducing Exacto 工具调用文档:Tool & Function Calling

模型:exacto路由写法适用方向KimiK2moonshotai/kimi-k2-0905:exacto中文综合、工具代理DeepSeekv3.1Terminusdeepseek/deepseek-v3.1-terminus:exacto推理/工具调用GLM4.6z-ai/glm-4.6:exacto中文/多语混合GPT?OSS120Bopenai/gpt-oss-120b:exacto开源系大模型代理Qwen3Coderqwen/qwen3-coder:exacto代码/工具调用

官方称在内部评测与开源基准(如 LiveMCPBench、tau2‑Bench)以及真实流量上,:exacto能显著减少工具调用失败,更可靠地触发正确工具。

import OpenAI from "openai";const client = new OpenAI({baseURL: "https://openRouter.ai/api/v1",apiKey: process.env.OPENROUTER_API_KEY,});const completion = await client.chat.completions.create({model: "moonshotai/kimi-k2-0905:exacto",messages: [{role: "user",content: "为 :exacto 发布写一个精简的更新日志。",},],});

你也可以在 models 数组里指定回退模型;凡是带:exacto 的模型在被选中时会强制使用精选提供商路由。

实操优化建议:

设计“结构化、带校验规则”的工具参数(如 enum、pattern、minimum/maximum)以减少歧义。在系统提示中明确“何时调用工具/何时自行回答”的决策准则,避免过度或不足调用。对链式工具调用,分步描述需求;使用中间态总结字段帮助模型保持上下文一致性。结合评测:Tool Calling Demo+自建回归集,持续监测工具调用的精确率/召回率。

如果你在用 [MCP](Model Context Protocol,一种多工具代理连接协议"MCP")或其他代理框架,建议直接把核心模型切到对应的 :exacto 变体,以在真实生产流量中获得更稳定的工具决策行为。

示例:在有“日历/检索/数据库”三类工具的多工具代理中,:exacto通常会更少出现“该调用工具却没调/不该调却乱调”的失配现象,减少你为兜底逻辑付出的工程复杂度

GPT‑5 Image 与 GPT‑5 Image Mini 全面解读

GPT-5 Image将OpenAI最先进的语言模型与最先进的图像生成功能相结合。它在推理、代码质量和用户体验方面做出了重大改进,同时结合了GPT Image 1的高级指令遵循、文本渲染和详细的图像编辑。

模型地址:openai/gpt-5-image 上下文与输出:总上下文 400,000 tokens,最大输出 128,000 tokens 定价:文本 $10/百万输入tokens、$10/百万输出tokens;图像$0.01/千输入imgs、$0.04/千输出imgs;Web Search $10/千 能力侧写:在 GPT‑5 语言能力之上,融合先进图像生成;继承 GPT Image 1的“强指令跟随、清晰可控的文字渲染、细粒度编辑”能力,用于复杂视觉创作与精修 性能观测(OpenRouter 页面): 吞吐:约 26 tok/s 延迟:性能页平均 ~9.96 s;提供商面板展示 ~21.51 s(不同统计口径可能存在差异) 支持参数:Tools / Tool Choice、Structured Outputs、Response Format、Seed、Max Tokens、Temperature、Top P、Stop、Frequency/Penalty、Logit Bias、Logprobs等 数据策略(OpenAI 提供商,OpenRouter 代管审核):不用于训练(Prompt Training=false);提示/响应日志会被保留(保留期未知);需要提供用户 ID(用于匿名化合规与计费);内容审核由OpenRouter管理。 支持参数速览:Structured Outputs、Response Format、Seed、Max Tokens、Temperature、Top P、Stop、Frequency/Presence Penalty、Logit Bias、Logprobs/Top Logprobs、Tools、Tool Choice 等。 性能与稳定性(以OpenRouter公共面板为准,统计口径可能不同): 吞吐:Avg ~26 tok/s(Performance 面板)/ ~29.05 tps(Providers 面板) 延迟:Avg ~10.11 s(模型内部延迟);端到端 E2E Avg ~82.69 s(含排队/路由/图像处理) 可用性:Uptime 100%(随时间波动) 计费与缓存:文本 $10/M 输入、$10/M 输出;图像 $0.01/K 输入、$0.04/K输出;Web Search $10/K;Cache Read $1.25/M(Cache Write/音频暂未提供)。 应用场景示例: 高精度文生图与分镜创作(支持更可控的指令跟随与文字渲染) 细粒度图像编辑(Prompt+局部约束,复杂改图任务的稳定性更强) 文档/界面截图理解与标注(与 GPT‑5 语言能力协同,长文脉冲更稳) 工业/医疗/电商等需要“解释+可控生成”的多模态场景 GPT‑5 Image Mini:高效低延迟的规模化之选

模型地址:openai/gpt-5-image-mini(创建于 Oct 16, 2025)上下文:400,000 tokens定价(显著低于旗舰版): 文本:$2.50/M 输入、$2/M 输出 图像:$0.003/K 输入、$0.008/K 输出 Web Search:$10/K能力侧写:由 GPT‑5 Mini 语言能力 + GPT Image 1 Mini 生成能力组成;原生多模态,延迟与成本更低,保留“强指令跟随、文字渲染、精细编辑”的长处,适合大规模、对成本/延迟敏感的生产工作流。 ✨典型用法: 批量海报/社媒素材/电商主图生成(需要一致性和低成本) UI 线框到高保真草图转化(强调“文本元素清晰可控”) 大规模视觉 A/B 测试与素材版本管理(配合结构化输出)何时优先选 Mini? 预算敏感:大规模生成/理解混合任务 延迟敏感:交互式应用、在线广告创意实时生成 文本理解强度“够用”,更多资源留给批量图像生成from openai import OpenAIclient = OpenAI(base_url="https://openrouter.ai/api/v1",api_key="",)completion = client.chat.completions.create(model="openai/gpt-5-image-mini",messages=[{"role": "user","content": [{"type": "text", "text": "请描述这张图片的景别、主要物体和可读文字,并给出10字内标题。"},{"type": "image_url","image_url": {"url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"}}]}],)print(completion.choices[0].message.content)若涉及结构化抽取(如标题/标签/配色/排版建议),用 Structured Outputs/Response Format 确保 JSON 可解析,减少后处理成本。对“文字渲染”敏感的生成需求,显式描述字体风格、字号、布局与安全边距。大规模调用时,结合 OpenRouter 路由与回退策略,配合缓存(Cache Read 计费)降低抖动与成本。

来源:浅聊AI

相关推荐