OpenAI发布可独立操作电脑的智能体 智谱已“抢跑”

B站影视 2025-01-24 22:38 3

摘要:北京时间1月24日,OpenAI首席执行官山姆·奥特曼现身直播间,演示了OpenAI的新智能体Operator(操作员)。根据演示,该智能体可以在用户向电脑端输入一段需求后,自动开始执行任务。用户即便“放开双手”,智能体也可以自动执行下去,其所有操作可以在桌面

新京报贝壳财经讯(记者罗亦丹)北京时间1月24日,OpenAI首席执行官山姆·奥特曼现身直播间,演示了OpenAI的新智能体Operator(操作员)。根据演示,该智能体可以在用户向电脑端输入一段需求后,自动开始执行任务。用户即便“放开双手”,智能体也可以自动执行下去,其所有操作可以在桌面上显示。

OpenAI首席执行官山姆·奥特曼(左1)在直播中 来源:官方直播视频截图

例如,当直播人员在对话框中输入去某饭店订桌的需求后,Operator自动打开网页进入了预订网站,搜索到餐厅并完成了网上预订。而上传一张写有“鸡蛋、蘑菇”等食物的购物清单后,Operator就自动打开了浏览器去买菜网站上进行搜索并将这些食物放进了购物车。不过值得注意的是,在付款环节其会要求用户手动操作。

山姆·奥特曼表示,Operator的发布是OpenAI进入Level 3(等级三)的开始,在未来几周和几个月内还将推出更多智能体。根据此前OpenAI发布的“从人工智能到通用人工智能的五个等级”,等级三是智能体,等级四是可以进行创新的人工智能,等级五则是能够完成组织工作的人工智能。

不过,值得注意的是,在OpenAI发布Operator前一天,国内AI“六小虎”之一的智谱更新了其电脑智能体大模型GLM-PC(中文昵称为牛牛),该AI代理智能体早在去年11月就已经开放内测,并在今年1月23日进行了深度思考模式的更新。有开发者对贝壳财经记者表示,Operator在视频中所展示的内容,GLM-PC也完全可以做到。

二者的相同之处在于, 输入的模态(图像感知)、输出的操作空间(点击、滚动、输入)一致,并且都做了敏感性检测,让用户在敏感时刻(例如确认提交等)接盘操作,以及都有推理和一定程度的自反馈。不同之处在于,Operator现阶段主要针对网页,而GLM-PC针对电脑的任何操作(也包括浏览器)。

来源:新京报

相关推荐