摘要:今日凌晨,OpenAI 发布了首款智能体产品“Operator”。这一功能是一款能够模拟人类操作网页浏览器的AI助手,支持自动完成旅行住宿预订、餐厅预约和在线购物等复杂任务。
1月24日消息,今日凌晨,OpenAI 发布了首款智能体产品“Operator”。这一功能是一款能够模拟人类操作网页浏览器的AI助手,支持自动完成旅行住宿预订、餐厅预约和在线购物等复杂任务。
Operator 目前以研究预览(Research Preview)版本发布,能够通过互联网自动为用户执行多种任务。
OpenAI 表示,计划很快将其集成到ChatGPT中。目前,该功能仅面向美国的 Pro 用户开放。
Operator 的底层技术采用了一种全新的模型——Computer-Using-Agent(CUA)。
CUA 结合了 GPT-4o 的视觉能力和强化学习的高级推理能力,使其能够与 GUI 界面交互。
Operator 可以识别网页界面内容,并通过鼠标、键盘完成所有允许的操作,从而实现自动化操作,无需定制化的 API 集成。
当遇到问题或出错时,Operator 能利用自身的推理能力进行自我纠错。如果无法解决问题,它会将控制权交回用户。
OpenAI 总裁 Greg Brockman 在 X 平台发文称:“Operator 是一种可以通过内置浏览器为用户执行任务的智能体。2025年将成为智能体之年。”(袁宁)
来源:成都律师蔡俊
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!