摘要:目前,该公司公布了这款浏览器的具体技术细节,官方称这款 Opera Neon 可被视为 2017 年同名浏览器的「重磅回归」,与其他「只是在浏览器中整合 AI 工具」的 AI 浏览器有显著不同,除了内置 AI 助手回应用户提问外,据称还可以理解网页上下文,帮助
Opera在 5 月 28 日宣布推出一款全新 Opera Neon 浏览器,主打 AI 功能,官方称该浏览器可以帮助用户撰写报告、玩在线游戏、完成各种任务。
目前,该公司公布了这款浏览器的具体技术细节,官方称这款 Opera Neon 可被视为 2017 年同名浏览器的「重磅回归」,与其他「只是在浏览器中整合 AI 工具」的 AI 浏览器有显著不同,除了内置 AI 助手回应用户提问外,据称还可以理解网页上下文,帮助用户互动。
当浏览器开始自主理解网页结构,并像人类一样执行操作指令时,人机交互的边界正在被重新定义。2025年5月28日,挪威浏览器厂商Opera推出的Neon AI代理浏览器,凭借内嵌的Operator模型与DOM树解析技术,将这一科幻场景变为现实。这款被业界称为“浏览器进化史上的里程碑”的产品,正通过技术革新悄然改写互联网入口的竞争规则。
从网页结构解析到自动化操作的闭环
Neon的核心突破在于构建了“感知-决策-执行”的完整技术链条。当用户输入“预订今晚7点旧金山到西雅图的航班”时,浏览器会经历以下过程:
Operator模型首先通过浏览器原生API抓取网页的DOM树结构,识别出发地/目的地输入框、日期选择器、航班列表等组件的层级关系与交互属性。在Kayak网站的测试中,模型能以每秒2000个节点的速度解析页面,较传统屏幕截图方案效率提升30倍。这种解析能力不仅局限于元素定位,更能理解组件间的逻辑关联——例如,日期选择器与航班结果的动态绑定关系。
基于GPT-4o的视觉理解能力,模型将自然语言指令拆解为可执行的操作序列。例如,将“今晚7点”映射为日期选择器的具体时间值,并识别出“提交”按钮的CSS选择器。这一过程涉及多模态信息融合:既要理解用户意图,又要解析网页的视觉呈现与交互逻辑。实测显示,从搜索到完成支付的平均耗时仅17秒,准确率高达98.7%。
在用户设备本地,所有操作通过模拟人类交互完成:点击输入框、滚动页面、填写表单、点击提交按钮。与传统的RPA(机器人流程自动化)不同,Neon的操作基于对网页结构的实时理解,而非固定的屏幕坐标。这意味着即使网页布局发生微调,模型仍能准确执行任务。某跨境电商企业使用Neon后,其客服团队处理订单查询的效率提升300%,人力成本降低65%。
本地化执行构建数据安全护城河
在数据安全成为全球焦点的背景下,Neon采用三重防护机制确保用户隐私。
所有DOM解析与操作指令均在用户设备完成,敏感信息不上传云端。模型通过WebAssembly技术构建本地沙箱环境,即使面对钓鱼网站,也能隔离风险操作。例如,当检测到可疑的资金转账请求时,系统会自动触发二次验证流程。
用户可自定义每个网站的操作权限。例如,允许银行网站自动填充用户名但禁止密码输入,或限制电商网站仅能查询订单不能进行支付。这种细粒度控制解决了企业对自动化工具的核心担忧:在提升效率的同时,避免敏感数据泄露风险。
所有自动化操作均生成可追溯的日志,企业可通过管理后台查看操作详情。日志采用零知识证明技术加密存储,确保只有授权人员能解密审计。这种设计使Neon在欧盟市场获得政策倾斜——某德国制造企业将其供应链管理系统接入Neon后,采购合同自动填充的错误率从人工操作的12%降至0.8%,同时避免了跨境数据传输的合规风险。
场景颠覆:从个人效率到企业级工作流的重构
Neon的三大核心模块正在重塑生产力工具链。
在代码生成场景中,开发者可通过自然语言描述需求,Neon将其转化为可运行的代码。例如,输入“创建一个复古贪吃蛇游戏”,模型会在30秒内生成包含HTML5画布、JavaScript逻辑和CSS样式的完整项目。实测显示,在飞机离线模式下,用户仍能使用Neon完成全栈应用开发,代码生成效率较传统方式提升4倍。更关键的是,生成的代码符合最佳实践,可直接投入生产环境。
任务自动化模块支持跨平台工作流编排。用户可同时操作Gmail发送邮件、Slack通知团队、Trello更新任务状态,所有操作通过一个指令触发。某投行将其内部系统接入后,交易查询响应时间从5分钟缩短至8秒:当客户询问某支股票的实时行情时,Neon会自动登录彭博终端提取数据,填充至预设的PPT模板,并通过企业微信发送给客户。这种端到端的自动化,使客户满意度提升25%。
智能助手模块展现了上下文感知能力。在阅读科技论文时,它能自动提取参考文献并生成文献综述;在浏览新闻时,可根据用户兴趣推荐相关内容。与OpenAI Operator相比,Neon Chat的优势在于对网页结构的理解:它能识别出论文中的图表、公式等非文本元素,并提供交互式解析。例如,当用户点击某个数据图表时,助手会调出原始数据集并生成可视化分析报告。
后记:浏览器进化为数字分身
Opera AI产品总监Henrik Lexow透露,Neon的下一代版本将具备“学习用户习惯”的能力,向真正的数字分身演进:
在工作流自动化层面,浏览器将根据用户日历自动准备会议资料,将邮件信息同步至CRM系统。例如,当检测到即将召开的客户会议时,Neon会自动提取历史沟通记录、合同条款、产品更新日志,生成结构化的汇报文档。这种预测性操作将释放大量重复性劳动,使人类专注于创造性工作。
在跨设备协同层面,Neon将打破终端界限。在手机端复制的链接,可在PC端自动打开并定位到相关段落;在平板电脑上浏览的网页,可通过语音指令在智能音箱上继续播放。这种无缝体验背后,是Operator模型对用户行为模式的深度学习——它能理解“我在不同设备上如何处理信息”,并主动优化交互流程。
技术演进已现端倪,测试版Neon已能根据用户写作风格生成定制化邮件,或在检测到航班延误时自动查询备选方案。随着欧盟《数字市场法案》对数据流动的严格管控,以及企业对自动化需求的爆发式增长,Neon代表的“AI代理浏览器”或将成为下一代互联网入口。当浏览器从“信息展示工具”进化为“数字生产力平台”,人机协作的范式革命已悄然来临。
Neon的实践证明,AI不仅能理解语言,更能理解互联网的结构本身——这或许才是通往通用人工智能的关键一步。当浏览器开始自主操作网页,我们或许正在见证“数字分身”时代的黎明。
来源:咫尺观察