摘要:这款以ChatGPT为核心的产品,不仅深度整合了生成式AI能力,更通过“智能代理”功能实现自动化任务执行,用户可直接通过浏览器完成航班预订、文档编辑、在线购物等复杂操作。
在今日凌晨举行的全球开发者大会上,OpenAI正式推出首款AI驱动的网页浏览器ChatGPT Atlas,标志着这家人工智能巨头正式进军浏览器市场。
这款以ChatGPT为核心的产品,不仅深度整合了生成式AI能力,更通过“智能代理”功能实现自动化任务执行,用户可直接通过浏览器完成航班预订、文档编辑、在线购物等复杂操作。
ChatGPT Atlas的最大亮点在于其AI代理模式。用户在浏览任意网页时,可通过侧边栏的“Ask ChatGPT”按钮实时调用AI助手。例如:
阅读电影评论时,AI可自动生成内容摘要,并推荐相似影片;
查找菜谱时,AI不仅能解析步骤,还能直接跳转电商平台下单所需食材;
处理文档时,用户可通过“光标聊天”功能选中段落,AI即时完成润色、翻译或格式调整。
更引人注目的是其任务自动化能力。在“代理模式”下,ChatGPT可模拟用户操作完成端到端任务:例如根据用户需求自动搜索航班、比对价格并完成预订,或从多封邮件中提取关键信息生成报告。OpenAI产品负责人Adam Fry在发布会上演示了这一功能:AI仅用3分钟便完成了一家四口从纽约到东京的往返机票预订,包括选择座位、添加行李和支付全流程。
Atlas首次引入了“浏览器记忆”功能。AI会记录用户访问的网页内容、操作习惯等上下文信息,从而提供更精准的建议。例如,用户一周前浏览过的招聘岗位,AI可在后续搜索中主动推送相关公司的最新动态。
为保障隐私,OpenAI设计了严格的控制机制:
记忆管理:用户可在设置中查看、归档或删除所有记忆数据,清除浏览历史将同步删除关联记忆;
匿名模式:启用后,AI不会记录任何操作,且不与ChatGPT账户关联;
权限边界:代理模式明确限制系统级操作,如禁止下载文件、安装扩展或运行代码。
目前,ChatGPT Atlas已上线macOS平台,并计划在未来三个月内扩展至Windows、iOS和Android系统。基础版本免费向所有用户开放,但代理模式等高级功能仅限ChatGPT Plus、Pro和Business订阅用户使用。这一策略与谷歌Chrome形成直接竞争——后者已于9月集成Gemini AI模型,支持网页解释、多标签页整合等功能,并计划在未来推出购物、预约等代理服务。
行业分析师丛杰指出,AI浏览器的核心价值在于将“信息获取”升级为“任务完成”。根据OpenAI内部测试数据,使用Atlas代理模式完成日常上网任务的效率比传统浏览器提升60%以上。例如,用户撰写一份市场分析报告的时间从2小时缩短至25分钟,AI可自动抓取数据、生成图表并调整排版。
随着OpenAI和谷歌的入局,AI浏览器市场迅速成为科技巨头的新战场。除ChatGPT Atlas和Chrome外,Perplexity的Comet浏览器、Arc Search等新兴产品也在探索类似功能。Perplexity CEO Aravind Srinivas曾表示:“未来的浏览器不仅是窗口,而是能理解用户意图的智能助手。”
然而,技术挑战依然存在。早期测试显示,AI代理在处理复杂任务(如同时预订机票和酒店并满足预算限制)时仍需人工干预。OpenAI承认,当前代理模式的准确率约为82%,未来将通过用户反馈持续优化。
首批试用者对Atlas的评价呈现两极分化。支持者认为其“重新定义了上网效率”,尤其是代理模式在处理重复性任务时表现突出;批评者则指出,AI生成的内容偶尔存在事实性错误,且代理操作的速度仍慢于人类。
来源:科技Nice一点号
