谷歌开发者大会炸场!Agent重磅升级, A2A、SDK大更新

B站影视 韩国电影 2025-05-22 07:49 1

摘要:昨天凌晨,谷歌举办了“I/O 2025”全球开发者大会,公布了多项新技术和产品。会议重点介绍了包括新一代视频生成模型、代码生成模型以及文本处理模型在内的多款创新成果。特别值得关注的是,谷歌对智能体Agent进行了重大升级。此外,谷歌还发布了影视级别的视频生成模

昨天凌晨,谷歌举办了“I/O 2025”全球开发者大会,公布了多项新技术和产品。会议重点介绍了包括新一代视频生成模型、代码生成模型以及文本处理模型在内的多款创新成果。特别值得关注的是,谷歌对智能体Agent进行了重大升级。此外,谷歌还发布了影视级别的视频生成模型Flow,采用创新架构、参数更小的Gemma3n模型,以及基于人工智能技术的全新搜索体验。

下面为大家介绍谷歌在第一天开发者大会上有关Agent智能体的重要进展。

1)与微软昨天举办的“Build 2025”全球开发者大会类似,Agent智能体是谷歌当前及未来的重点发展方向之一。本月7日,谷歌刚刚开源了专门用于智能体交互的协议——A2A,该协议旨在打破数据孤岛,显著提升智能体的能力、跨平台兼容性和执行效率。

此次大会上,谷歌发布了A2A协议的v0.2版本,新增了多项关键功能。其中一大亮点是对无状态交互的支持。在以往,智能体之间的对话管理较为复杂,限制了高效的信息交换。新版本通过无状态交互机制,简化了那些不需要持续会话管理的场景。

比如在简单信息查询任务中,智能体间的数据获取流程无需再经历复杂的会话建立与维护,通信变得更直接、更高效。这种轻量化的交互方式大大提升了自动化任务的执行速度和效率。

2)引入了“智能体卡”的概念,这是一种由A2A服务器提供的JSON格式元数据文档,用来描述智能体的身份信息、功能、技能、服务接口以及认证要求。协议中还定义了消息传递、任务分配、组成部分、工件管理、流媒体传输、推送通知以及会话管理等相关内容,支持更加复杂多样的交互场景。

举例来说,智能体卡能够明确标示智能体是否具备流式传输和推送通知的能力,这让客户端能够更直观地了解智能体功能,从而实现更高效的沟通与协作。

3)在文件交换方面,A2A协议v0.2.0引入了更为灵活的处理机制。智能体不仅可以直接返回文件的字节流,还能提供一个指向临时存储位置的URI,方便高效地传输大文件,从而减少了数据传输的负担。

4)在身份验证方面,协议采用了类似OpenAPI的标准化认证方案,明确了智能体间身份验证的规范。这提升了跨智能体交互的安全性和可靠性。过去由于不同开发团队和平台采用各异的身份验证方法,智能体之间的通信存在较高的安全风险和较大沟通成本。现在新的身份验证标准让智能体能够清晰了解对方的认证要求,不论是API密钥、OAuth还是OIDC,都有统一的规范支持。

举例来说,在一个企业内部,来自不同部门的智能体协同处理订单和财务任务时,借助这一标准化身份验证机制,财务智能体与销售智能体能快速且安全地完成认证,保障了数据和协作的安全性,显著提升了交互的可信度。

此外,为帮助开发者更便捷地使用A2A协议,谷歌发布了官方的A2A Python SDK,提供了便于集成和构建智能体的工具,简化了基于Python智能体的开发流程。

A2A生态体系也在不断扩大。尽管A2A刚刚开源,已有微软、埃森哲、波士顿咨询集团、凯捷、科睿唯安、Salesforce、德勤、甲骨文、HCL科技、印孚瑟斯、KPMG、SAP、麦肯锡、普华永道等50多家全球知名企业加入。

例如,微软宣布将在AzureAI Foundry平台支持该协议,助力构建A2A智能体,并能够在Microsoft Copilot Studio中调用任意A2A智能体。同时,微软展示了使用Microsoft EntraAgentID和Microsoft Graph联合调用多个A2A智能体的案例,将其应用于提升职场生产力。

SAP则计划在其AI助手Joule中集成A2A协议支持,使Joule能在SAP生态内协调不同智能体,并在用户界面中调用通过谷歌ADK构建的A2A智能体,帮助用户无需切换上下文即可访问多个系统的智能体,完成更多任务。

BoxAI智能体能够从扫描件和图像等非结构化数据中提取关键内容,如日期和合同条款,将其转换为可用的数据形式。借助A2A协议,BoxAI智能体可以与外部智能体实现安全协作,支持在文件原始位置上完成多个系统间的复杂流程处理。

为了方便开发者在实际环境中部署、管理和扩展智能体,谷歌推出了Agent Engine UI。该界面集成在谷歌云控制台中,为用户提供了一个集中管理平台。通过这个仪表板,开发者可以方便地查看和控制已部署的智能体,管理会话记录,进行跟踪调试,并实时监测智能体的运行状态,从而大幅简化智能体的全生命周期管理工作。

这种简化的方式极大地提升了智能体的开发和管理效率,使开发者能够更好地掌控智能体的运行状况,并深入分析其行为和性能。在智能体引擎的用户界面中,开发者可以查看已上线的智能体、监控各项指标(如请求量和CPU使用率)、管理会话记录、审查部署信息,并进行详细的跟踪和诊断。

另外,谷歌对开源的Agent SDK进行了升级,推出了Python ADK 1.0.0版本,为开发者打造了一个稳定且功能强大的开发平台,支持在更复杂的环境下快速构建和部署智能体。

为了扩大开发者的使用范围,谷歌推出了Java ADK的首个版本v0.1.0,将ADK的强大功能和高度灵活性引入Java开发环境,让Java开发者可以更加便捷地应用于智能体的开发中。开发者只需在Maven项目中添加相应的依赖即可快速上手。

此外,谷歌持续推进多任务智能体Project Mariner的研发,自去年发布预览版以来,该智能体不断拓展应用领域,涵盖信息检索、预订服务、购物体验和研究支持等多种场景。在信息搜索方面,能够高效筛选并整合相关内容;在酒店和机票预订时,自动推荐符合用户需求的选项;购物环节则实现精准商品定位;在科研时,能够快速检索并整理资料,显著节约用户的时间和精力。

谷歌对Project Mariner的功能进行了升级,使其不仅可以独立执行任务,还能够实现多智能体之间的协同工作。比如,一个智能体专注于信息检索,另一个负责预订服务,第三个则处理支付流程。通过将复杂任务拆分成多个子任务,由不同智能体同时完成,这种协作方式大幅提升了整体处理效率。

为了方便用户与智能体进行互动,Project Mariner配备了一个简洁易用的界面。用户可以通过语音或文字输入指令,智能体则以自然语言的方式回应并完成相应任务。这样的设计极大提升了使用的便捷性,使得即便是不具备技术背景的人也能轻松操作。

此外,Project Mariner还集成了一些试验性功能,比如屏幕共享和视频理解,帮助用户更有效地处理复杂任务。这些创新功能为未来智能助手的发展开拓了更多可能性。

此外,Project Mariner的应用范围不仅局限于浏览器端,谷歌还计划将其拓展到更多终端设备,如手机和智能眼镜等,旨在让用户能够在各种设备之间自由切换,体验统一且流畅的智能体服务。

·

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。

·

来源:小羊论科技

相关推荐