摘要:我正在观察人工智能Operator为我下杂货订单,它通过超市网站的搜索栏输入商品,完成购物清单。Operator是OpenAI开发的AI代理,具备自主执行任务的能力,与传统聊天机器人不同。尽管它在实验阶段,表现出色,但仍存在一些局限性,例如在处理敏感信息时需要
我正在观察人工智能Operator为我下杂货订单,它通过超市网站的搜索栏输入商品,完成购物清单。Operator是OpenAI开发的AI代理,具备自主执行任务的能力,与传统聊天机器人不同。尽管它在实验阶段,表现出色,但仍存在一些局限性,例如在处理敏感信息时需要用户干预。在与Operator互动的过程中,我发现它能够有效地选择商品,但在结账时让我感到不安。虽然它成功地为我下了外卖订单,但也犯了一些错误。尽管如此,Operator的表现为未来AI代理的潜力提供了启示,随着技术的发展,它们可能会成为日常生活中不可或缺的一部分。专家们预测,AI代理将变得更加自主,能够处理更复杂的任务,但同时也需注意潜在风险。
我目前正在观察人工智能为我下杂货订单。它携带着我的购物清单,在超市网站的搜索栏中输入每一项商品,并点击选择。看着这个看似数字幽灵执行通常乏味的琐事,令人感到奇异的吸引力。“你确定这不是印度的某个人在操作吗?”我丈夫好奇地问道,俯身想要看屏幕。我正在试验的是Operator,一个由OpenAI开发的新型AI“代理”,它是ChatGPT的创作者。上个月在英国向用户发布的Operator,拥有类似于ChatGPT的文本界面和对话风格。然而,与仅仅回答问题的传统聊天机器人不同,它能够主动完成涉及浏览器导航的任务。AI代理的出现伴随着大型语言模型的崛起,其吸引力显而易见:一个能够执行实际任务的数字助手,远比一个仅提供回应的助手更具吸引力。
AI代理的概念仍在不断定义中,但其基本思想是它们必须以一定的自主性执行操作。AI公司Hugging Face的首席伦理科学家Margaret Mitchell解释道:“一旦某个东西开始在聊天窗口之外执行操作,那么它就从聊天机器人转变为代理。”在这方面,GitHub的负责人Thomas Dohmke设想了一个未来,每个人都拥有自己的个人Jarvis,类似于《钢铁侠》中的会说话的AI。
当我与Operator互动时,我发现许多商业可用的代理都带有警示,表明它们仍处于实验阶段——OpenAI将Operator称为“研究预览”。网上有许多例子展示了这些代理所犯的有趣错误,比如花31美元(约200元人民币)买一打鸡蛋,或试图将购买的杂货退回商店。人们对代理是否代表一种被过度炒作的科技趋势,或是AI驱动的未来的开端,存在不同看法,这种未来可能会改变劳动力市场并影响我们的日常生活。
由于我的储藏室几乎空无一物,我决定让杂货购物成为Operator的第一个任务。我输入请求,它询问我偏好的商店或品牌。我指示它选择最便宜的选项。一个浏览器窗口打开,我看着它搜索“英国在线杂货配送”,并选择了Ocado作为第一个结果。Operator高效地按价格过滤结果,将商品添加到我的购物车中,而不时地向我提出问题。当我指定“几种不同的蔬菜”时,它智能地选择了西兰花,然后询问我是否还想添加其他东西。我建议了两个选项,它选择了胡萝卜和韭菜,与我的选择非常接近。
然而,当Operator意识到Ocado有最低消费要求时,我们遇到了一个小障碍,促使我添加更多商品。当我们到达登录阶段时,代理请求我的协助。虽然用户可以随时接管浏览器,但OpenAI设计Operator时考虑到,在输入敏感信息(如登录凭据或支付详情)时,代理会请求用户干预。Operator通常会不断截图以“看到”它正在做什么,但当用户接管时,它会避免这样做。
当我到达结账时,我测试Operator的能力,请求它完成支付。然而,当它要求我提供卡信息时,我重新掌控了局面。尽管我之前已向OpenAI提供了我的支付信息(Operator需要一个ChatGPT Pro账户,每月费用为200美元,约1400元人民币),但我对直接与AI分享这些信息感到不安。在下完订单后,我等待第二天的杂货配送。然而,这并没有解决我当下的晚餐需求,这让我给Operator分配了一个新任务:从一家当地高评分的餐厅订购一个芝士汉堡和薯条。
AI成功地导航到Deliveroo网站并搜索“芝士汉堡”。在我登录的短暂停顿后,它迅速处理支付,因为我的卡信息已经存储。它选择的餐厅就在附近且评价良好,但令我惊讶的是,它竟然是一家炸鱼薯条店。虽然芝士汉堡尚可,但我尴尬地发现Operator没有给送餐员留下小费,这让我在收到食物后不得不纠正这个问题。
观察Operator的运作在一定程度上削弱了使用AI代理进行在线任务的省时效果,但我发现它可以在后台运作,而我则专注于其他活动。在撰写这篇文章时,我提出了另一个请求:能否为我在当地沙龙预约一个美甲?Operator在这个任务上遇到了困难,导航到美容预约平台Fresha,但最初选择了一个不仅晚了一周而且离我在东伦敦的家有一个多小时车程的预约。在我指出这些问题后,它找到了一个合适的时间,但仍然建议在莱icester广场的地点,这并不方便。此时,我意识到它似乎无法在任务之间保留我的位置信息,而我本可以轻松自己完成预约。
显然,这一代AI代理存在局限性。在登录过程中对人类监督的要求可能会影响效率,尽管Operator存储了Cookies以便未来访问时保持用户登录。尽管结果通常准确,但并不总是符合我的预期。当我收到杂货时,我发现Operator错误地订购了熏三文鱼而不是鱼片,并因特价而双倍订购了酸奶。此外,它将“几块鱼饼”误解为三包,而不是一包,不过幸运的是,它避免了订购巧克力牛奶而不是原味牛奶,因为后者缺货。公平地说,我有机会审查我的订单,更清晰的指示会带来更好的结果。
尽管存在缺陷,我与Operator的体验为未来AI系统的潜力提供了一瞥。随着这些技术的发展和变得更加实惠,我可以想象它们将成为我们日常生活中不可或缺的一部分。例如,如果你已经在一个应用中写下购物清单,为什么不让它也下订单呢?AI代理也开始渗透到个人助理之外的工作流程中。OpenAI的首席执行官Sam Altman预测,AI代理可能在今年“加入劳动力”,软件开发人员是最早采用这一技术的群体之一。
GitHub最近在其AI Copilot工具中加入了代理功能,其首席执行官Thomas Dohmke指出,开发人员已经习惯于某种程度的自动化协助。AI代理的区别在于它们的自主性;它们不仅仅是回答问题,而是与手头的代码协作解决问题。GitHub还在开发一个更自主的代理,名为Project Padawan,取自《星球大战》中对绝地学徒的称呼。这将使AI代理能够独立工作,使开发人员能够管理多个代理,生成供他们审查的代码。Dohmke相信,开发人员的技能仍将受到需求,因为AI可能会增加他们的工作量,而不是取代他们的角色。
Dohmke设想了一个未来,每个人都拥有自己的个人AI助手,类似于《钢铁侠》中的Jarvis。这些代理将学习用户的习惯和偏好,从而增强其实用性。他设想使用他的代理来预订家庭度假。然而,随着自主性的增加,风险也随之加大。Hugging Face的Margaret Mitchell共同撰写了一篇论文,警告不要创建完全自主的代理。她解释道:“完全自主意味着人类控制已完全放弃。”完全自主的代理可能会访问敏感信息或表现出不可预测的行为,这在高风险环境中尤其令人担忧。
Mitchell希望技术专家、立法者和政策制定者能够实施保障措施,以防止此类风险。在此期间,她预计代理能力将更加专业化,以适应特定任务。不久,我们可能会看到代理之间的协作;例如,你的代理可以与我的代理合作安排会议。代理的使用增长可能会改变互联网格局,因为更多的信息可能会以适合AI交互而非人类语言的格式提供。Dohmke对此表示赞同,认为传统主页的重要性可能会降低,因为界面将演变为迎合AI代理的需求,使品牌争夺AI的注意力而非人类的参与。
未来,我们甚至可能会看到AI代理扩展到机器人领域,使其能够执行物理任务。Mitchell预测:“我们将看到能够为我们洗衣服、洗碗和做早餐的代理。”然而,她幽默地补充道:“只要别让它们接触武器。”
来源:老孙科技前沿