大厂密集发布AI Agent,2025年有望迎来Agent元年

B站影视 2025-01-24 18:03 3

摘要:近期大厂集体发布AI Agent智能体,包括智谱和OpenAI等,春节期间预计持续有新的AI Agent和AI应用上线。1月24日凌晨,OpenAI发布传闻已久的AI Agent——Operator,Operator是一个面向浏览器的智能体,能够模拟人类操作计

【摘要】

近期大厂集体发布AI Agent智能体,包括智谱和OpenAI等,春节期间预计持续有新的AI Agent和AI应用上线。1月24日凌晨,OpenAI发布传闻已久的AI Agent——Operator,Operator是一个面向浏览器的智能体,能够模拟人类操作计算机的能力,完成在线订餐、预订酒店、购买机票等日常繁琐、重复任务。2025年有望迎来Agent元年!

Operator是一个面向浏览器的智能体,能够模拟人类操作计算机的能力,完成在线订餐、预订酒店、购买机票等日常繁琐、重复任务。例如,通过Operator在OpenTable上预订一家名为Beretta的餐厅。Operator能够自动识别指令,并在网站上完成预订操作。

与传统Agent和RPA不同的是,Operator的最大技术特点是无需依赖API或特定网站就能完成所有自动化操作,它是通过对屏幕截图的分析,识别页面元素,然后使用鼠标和键盘进行模拟。所以,现阶段可以把Operator看成是大模型增强版的按键精灵。

Operator是基于新模型CUA(在GPT-4o基础上研发的,未来会开放API)开发而成,专门对视觉UI界面的理解和交互进行了额外专项训练,这也是Operator无需依赖API的主要原因之一。Operator还内置了一个浏览器,能查看网页并通过打字、点击和滚动来与网页进行交互。可处理各种重复性的浏览器任务,包括填写表格、订购杂货,甚至制作表情包等。

OpenAl提到Operator是第一批Agents之一,或意味着未来会有更多发布。目前仅向Pro $200/月订阅用户推出,未来会扩展到普通会员用户,并通过API提供。

Operator的原理是基于Computer-Using Agent(CUA)模型,结合了4o的视觉和推理能力,再次使用了RL(RL必将是今年模型的重点),训练模型与GUI交互。看起来还是通过与Anthropic类似的截图、操作键鼠的方式完成任务,而且模型的推理能力能帮助任务纠错。

Agent应用成为全球产业共识,2025年全球AI应用有望迎来Agent元年。Salesforce、ServiceNow、SAP、Workday均已推出企业端Agent助手,并给出25年加快销售落地的积极指引,企业端Agent助手有望迎来放量。

国内Agent可以关注三个细分:科技大厂合作商、Agent应用提供商、数据中台服务商

科技大厂合作商—协助大模型私有化落地与Agent搭建:汉得信息(字节)、泛微网络(腾讯)、能科科技(华为);Agent应用提供商—向企业客户直接提供Agent功能:金山办公、鼎捷数智、泛微网络、用友网络、金蝶国际、新致软件;数据中台服务商—数据中台是Agent的核心数据引擎:星环科技、普元信息、第四范式。

Applovin、Reddit、Innodata为代表的公司在推荐引擎技术、数据等领域的表现逐步获得市场认可背后反映出不同于传统AI应用的AI新要素。

Al Agent是下一代AI应用的重要场景:模型能力提升是Agent底层能力的重要催化;2B端拥有丰富的落地场景:SAP/ServicenoW/CRM/MSFT陆续推出Agent产品,普遍在24年底-25年初落地。跨系统打通处理复杂事项为重要落地点。

Al Agent是数字劳动力,面问的不是软件预算,而是数万亿的真人劳动力市场;对于平台型Saas的价值重估:软件不再是费用,而是投资,其回报在于将历史数据再利用的价值;对于垂举应用的新机遇:借助AI实现从工月到解决方容的转变,TAM迎来数倍放大机遇。

图:AI Agent垂类受益细分数据来源:民生证券、九方金融研究所

研究报告:

20241227-银河证券-AI Agent繁荣时代开启,科技内需迎新篇章

本报告由研究助理协助资料整理,由投资顾问撰写。投资顾问:吴清淳(登记编号:A0740622030004)

来源:九方金融研究所

相关推荐