铁了心为Agent开发铺路!OpenAI“真香”式升级

B站影视 内地电影 2025-06-05 01:55 2

摘要:就在今天凌晨,OpenAI 官方开发者账号 @OpenAIDevs 在 X 平台上,一口气连续发布了 4 项关键更新,直接把 AI 代理(Agent)开发体验提升到新维度,围绕 Agent 开发体验、实时语音应用、人类干预机制和全链路追踪都做了重要升级。

OpenAI 又放大招了!用实力正名:在AI圈,自己的“一哥”地位不可动摇!

就在今天凌晨,OpenAI 官方开发者账号 @OpenAIDevs 在 X 平台上,一口气连续发布了 4 项关键更新,直接把 AI 代理(Agent)开发体验提升到新维度,围绕 Agent 开发体验、实时语音应用、人类干预机制和全链路追踪都做了重要升级。

具体包括:推出了TypeScript 原生支持,语音代理可以实时跑,执行过程还能人工干预,全链路追踪也一站搞定。

别小看这 4 个更新,它们背后透露出的,OpenAI 对于 AI agent 产品线的定位再升级: 从“开发者玩具”,转向升级成为“企业级 AI 工具链”。

所以,今天这 4 个更新,哪怕你不写代码,也值得关注。我们这就来细细拆一下,告诉大家为什么这么说。

过去,OpenAI Agents SDK 只提供 Python 版本,对大多数前端、全栈和 Node.js 开发者不太友好。

这次,官方直接放出了 TypeScript 版本 SDK,功能完全对齐 Python 版,支持:

handoffs(任务移交)guardrails(安全机制)tracing(执行追踪)MCP(多通道代理控制)以及 Agent 所需的各类基础能力。

安装也是非常简单:

复制

npm install @openai/agents1.

官网还给出了使用示例:

复制

import { Agent, run } from'@openai/agents';const agent = new Agent({name: 'Assistant',instructions: 'You are a helpful assistant',});const result = await run(agent,'Write a haiku about recursion in programming.',);console.log(result.finalOutput);// Code within the code,// Functions calling themselves,// Infinite loop's dance.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.

可以说,OpenAI 的 AI Agent 终于从 Python 圈子里跳出来了,前端开发者也能玩转 AI 代理。

对 AI 工具 SaaS、智能客服、网页嵌入式 AI 助手这些场景是重大利好。

官方文档:

AI 黑箱执行、无法插手,一直是企业在部署 Agent 时最大的顾虑,尤其对于

金融风控、内容审核、法务审校这些场景,可控性尤其重要。

这一次,AI 不再是一锤子买卖,OpenAI贴心地将「人类介入权」被纳入了开发体系。

这次 SDK 增强了 Human-in-the-loop 功能,允许开发者:

在 Agent 调用工具或执行任务时,主动暂停保存当前 agent 状态让人工审核、确认或调整调用再决定是否恢复执行

第三个更新,相信适合所有在做各种 AI 助手的朋友,比如 AI 语音助手、客服机器人、播报应用等等,终于有了靠谱的官方方案。

这次新出的 RealtimeAgent 功能,基于 OpenAI 的 Realtime API,可以让语音代理在本地客户端或服务器端实时运行,具体可以支持:

入门地址:https://openai.github.io/openai-agents-js/guides/voice-agents/

从“对话文字机器人”迈向“语音实时助手”,Agent 从文本应用进化到多模态 AI 产品,这是一个业内的共识和趋势,所以小编认为,OpenAI 这一次的功能真的很香!

这里也给大家放一个示例:

复制

import { z } from'zod';import { RealtimeAgent, RealtimeSession, tool } from'@openai/agents/realtime';const createTicket = tool({name: 'createTicket',description: 'Create a support ticket for a faulty laptop.',parameters: z.object({}),needsApproval: true,execute: async => 'Ticket filed!',});const faqAgent = new RealtimeAgent({name: 'FAQ',instructions: 'Answer laptop support questions concisely.',});const customerServiceAgent = new RealtimeAgent({name: 'Customer Service',instructions: 'Handle customer service inquiries, including support tickets.',tools: [createTicket],});const triageAgent = new RealtimeAgent({name: 'Triage',instructions: 'Route laptop support questions to FAQ or customer service.',handoffs: [faqAgent, customerServiceAgent],});const session = new RealtimeSession(triageAgent, {model: 'gpt-4o-realtime-2025-06-03'});await session.connect({ apiKey });1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.32.33.

为了方便开发者监控 Agent 执行过程,OpenAI 的 Traces dashboard 现在也支持实时语音代理。

可实时查看:

语音输入、输出工具调用记录用户打断情况执行链路

这里值得注意的是,无论通过 API 还是 Agents SDK 调用,执行过程都能清晰追踪。

这也就意味着,企业彻查 Agent 的黑箱行为,也算是有了清晰的抓手。

这 4 个更新看似琐碎,但放在一起,就是一个很清晰的信号:

AI Agent 不再是一个单点功能,而是正走向“全栈可控、支持语音、支持人类干预、过程全追溯”的企业级 AI 操作系统。

未来,客服、销售助理、内容审核、IoT 智能设备、企业运营辅助,这些场景里,AI Agent 不仅能实时跑,执行过程还能随时插手、随时追踪。

这意味着什么?

这就意味着,AI 正从“生成答案”,变成“执行任务”的超级数字劳动力。

而今天 OpenAI 的这波更新,正是为这个趋势铺路。

最后给大家看一下,最早一批尝鲜该功能的 Perplexity 开发的新品效果——

参考资料:https://x.com/OpenAIDevs/status/1929950489539686901

来源:51CTO

相关推荐