谷歌搞大事情,新发布Agent2Agent协议,要让AI机器人打破信息孤岛

B站影视 电影资讯 2025-04-10 13:36 1

摘要:过去几个月,至少有两个AI助手互操作标准出现:先是Anthropic推出了“模型上下文协议(MCP)”,然后思科带头搞了个叫做“AGNTCY”的联盟标准。这是因为大家越来越认识到,让不同公司开发的AI助手能够“互相说话”非常重要。想象一下,财务部的AI、人事部

现在AI助手越来越多,但它们之间却像是生活在平行世界,完全不能交流,现在谷歌也坐不住了,要来解决这个痛点。

过去几个月,至少有两个AI助手互操作标准出现:先是Anthropic推出了“模型上下文协议(MCP)”,然后思科带头搞了个叫做“AGNTCY”的联盟标准。这是因为大家越来越认识到,让不同公司开发的AI助手能够“互相说话”非常重要。想象一下,财务部的AI、人事部的AI和销售部的AI如果能无缝合作,效率会提高多少!

正是看到这个趋势,现在谷歌也来凑热闹了,最新推出“Agent2Agent”(简称A2A)协议。

这次谷歌可没单打独斗,而是联合了50多家大厂一起上,包括Atlassian、Box、Cohere、Intuit、LangChain、MongoDB、Salesforce、SAP、ServiceNow、UKG和Workday等公司。看这阵仗,A2A协议旨在成为AI助手和AI应用之间的互操作语言。

谷歌云业务应用平台副总裁兼总经理Rao Surapaneni在独家采访中表示,A2A让具有不同专长和数据节点的助手更容易获取所需上下文。

“每个AI系统都有特定专长,因为它们拥有数据节点或逻辑节点,或者当前用户群专注于特定任务,这些框架预计会围绕非常专业的焦点发展。作为客户,如果我部署了这些多平台和多框架,我不希望在它们之间来回切换。”他后面还补了一句:“谷歌与50多个合作伙伴和客户合作的部分原因是为了构建A2A,使其具有「以企业级、安全和可信方式进行互操作的能力」。”

什么是A2A协议?

这个A2A协议到底是什么?

简单来说,A2A协议主要是让两种AI助手互相交流:一种叫「客户端助手」,另一种叫「远程助手」。

这就像餐厅里的服务员和厨师的关系:服务员(客户端助手)接收你的点餐并传达给厨师,而厨师(远程助手)则负责根据这些要求烹饪美食。比如你问自家AI一个财务问题,它如果不懂,就可以去请教专门的财务AI,然后把答案告诉你,全程你不用操心。

谷歌在最新一篇博文中写道,A2A协议主要包括四项功能:

功能一,能力发现:助手可以通过JSON格式的“助手卡片”(技术上叫Agent Card)来展示它有什么能力,就像我们人类有个人简历一样,这样客户端助手就能确定最适合完成任务的远程助手。比如你问:“我想了解今年的税收政策变化”,你的个人助手可能对税务不精通,但它知道谁是税务专家,于是就会找到税务助手来合作。

功能二,任务管理:确保助手间的对话都是围绕完成任务展开的,并定义任务的生命周期。对于耗时较长的任务,两个助手会保持联系,互相更新最新进度。任务的最终结果被称为“工件(artifact)”。这就像你点了一道复杂的菜,厨师会不时告诉服务员:“已经开始准备食材了”、“马上就好了”,最后才端出成品。

功能三,协作功能:助手们可以互相发送消息,传递上下文、回复、工件或用户指令。就像服务员可能会告诉厨师:“客人对海鲜过敏”或“客人喜欢微辣口味”,AI助手之间也会分享这类重要信息,确保最终结果符合你的需求。

功能四,用户体验协商:每条消息都包含“一部分”内容,比如生成的图像。每个部分都有特定的内容类型,这样客户端和远程助手就能协商出正确的格式,并明确包括用户界面能力的协商:比如是否支持嵌入框架、视频、网页表单等等。这就像服务员知道,你是坐在高脚凳上还是在包厢里,从而决定如何最好地为你上菜。

总结而言,A2A就像是给AI助手们创造了一种“通用语言”,让它们能够无障碍交流,共同为用户提供更全面、更智能的服务。

最重要的是,谷歌把A2A设计成了开源协议,整个AI社区都可以来贡献代码和更新。Surapaneni强调:“我们希望这真正成为一个社区驱动的开源项目,有一个专门的治理委员会,但核心是要保持开放且由社区驱动。”

在开发A2A过程中,谷歌团队特别注重让AI助手们能用“自然、非结构化”的方式交流,即使它们没有共享的记忆、工具和上下文也没问题。而且A2A基于HTTP和JSON这些现成标准构建,所以更容易与现有技术栈集成,安全性也有保障。

真实案例:A2A如何革新招聘流程?

为了让大家更直观看到A2A协议的能力,谷歌还特别用了一个真实案例,主打一个全面。

谷歌在最新博文中写道:有了A2A,招聘一名软件工程师的过程可以变得很轻松:在Agentspace这样的统一界面中,招聘经理只需告诉自己的AI助手:“帮我找符合这个职位描述、在这个地区、具备这些技能的候选人。”

接下来,神奇的事情发生了:

· 你的AI助手会自动联系其他专门的招聘AI助手;

· 这些专业助手会帮你筛选潜在候选人;

· 你收到建议名单后,只需动动手指,就能指示助手安排面试;

· 面试结束后,另一个专门的AI助手还能帮你完成背景调查。

整个候选人寻找过程变得流畅无比。

AI圈的“通用语言”之争:互操作协议的崛起

当然,A2A只是AI助手“通用语言”大战的最新一幕,让AI助手互相听懂对方说话这件事,现在可热闹了,各大科技巨头都在抢滩布局。

除了谷歌的A2A,市场上还有思科联合LangChain、Galileo、LlamaIndex和Glean组成的AGNTCY联盟,目标是为AI助手间创建标准通信方式;同时参与A2A的LangChain还单独开发了Agent Protocol;微软也升级了AutoGen框架,都是为了让AI助手们能顺畅交流。

有意思的是,微软等很多公司已经拥抱了Anthropic的MCP协议,就连谷歌自己也通过新的Agent Development Kit支持MCP。面对这种情况,谷歌云Surapaneni赶紧澄清:A2A和MCP不是竞争关系,而是互补的。

“我们把MCP和A2A看作互补能力,”他解释道,“A2A处于更高层次的抽象,让应用和助手互相交流。你可以把它想象成分层架构,MCP负责在底层与LLM、工具和数据交互。”

谷歌明显不想把自己孤立起来,Surapaneni没有排除与其他互操作协议联盟合作的可能。他表示A2A随时欢迎新成员加入,协议会根据社区建议和需求不断更新,是一个“活着的代码”——“我们会考虑如何与所有协议保持一致,总会有一些协议带来好点子,我们希望把所有好想法都吸收进来。”

为什么互操作性需求突然爆发?

各大组织和AI公司都认同一个观点:未来的世界不会只有一个AI模型称霸,而是多模型并存。这意味着AI助手也会基于不同的语言和框架构建,这很合理。

但要实现一个完整的助手生态系统,就必须让各家公司的助手能够互相交流。这说起来容易做起来难!行业标准通常需要时间才能确立,还需要大部分公司的认可和支持。

无论是A2A、MCP还是AGNTCY,如果希望成功创建一种标准方式让所有AI助手都能使用,不管它们是谁构建的或基于哪种框架,都必须实现大规模采用和部署。

Surapaneni也坦率承认,即使有50多个合作伙伴在研发A2A,目前的采用率仍未达到临界点。“所有这些协议都会不断发展,特别是在AI快速变化的环境下,我们会发现新的用例和场景需要解决,所以它会继续成长,”他说道。

来源:科技行者一点号1

相关推荐