1. 首页>>分享

谷歌联合50多家大厂推出A2A协议,解决AI助手互操作痛点

图片

作者 | 周雅

来源 | 科技行者

现在有越来越多的 AI 助手,然而这些 AI 助手之间仿佛处于平行世界之中,完全无法进行交流。如今,谷歌也按捺不住了,准备要来解决这个令人困扰的问题。

过去几个月,出现了至少两个 AI 助手互操作标准。首先是 Anthropic 推出了“模型上下文协议(MCP)”,接着思科带头创建了一个叫做“AGNTCY”的联盟标准。这是因为大家逐渐认识到,让不同公司开发的 AI 助手能够“相互交流”是非常重要的。想象一下,财务部的 AI 能够进行合作,人事部的 AI 也能够进行合作,销售部的 AI 同样能够进行合作,并且这种合作是无缝的,那么效率会提高多少呢!

现在谷歌看到了这个趋势,于是也来参与其中了,并且最新推出了“Agent2Agent”(简称 A2A)协议。

这次谷歌并非独自行动,而是与 50 多家大厂携手共进。这些大厂包括 Atlassian、Box、Cohere、Intuit、LangChain、MongoDB、Salesforce、SAP、ServiceNow、UKG 和 Workday 等。从这一局面来看,A2A 协议的目的是成为 AI 助手与 AI 应用之间的互操作语言。

图片

谷歌云业务应用平台的副总裁兼总经理 Rao Surapaneni 在独家采访里说,A2A 能让那些有着不同专长以及处于不同数据节点的助手,更加容易地获取到所需要的上下文。

每个 AI 系统都具备特定的专长。这是因为它们拥有数据节点或者逻辑节点,也可能是当前的用户群专注于特定的任务。这些框架预计会围绕着非常专业的焦点来发展。如果我作为客户部署了这些多平台和多框架,我不希望在它们之间进行来回的切换。他补了一句,谷歌与 50 多个合作伙伴和客户合作,部分原因是要构建 A2A,让其具备“以企业级、安全且可信的方式进行互操作的能力”。

图片

什么是A2A协议?

这个A2A协议到底是什么?

简单来说,A2A 协议主要是用于两种 AI 助手的互相交流。其中一种助手被称为“客户端助手”,另一种助手被称为“远程助手”。

餐厅里服务员与厨师存在这样的关系:服务员(客户端助手)会接收你的点餐并将其传达给厨师,厨师(远程助手)则负责依据这些要求来烹饪美食。例如,当你向自家 AI 询问一个财务问题时,如果它不了解,就能够去请教专门的财务 AI,之后把答案告知你,在整个过程中你无需操心。

谷歌在最新一篇博文中写道,A2A协议主要包括四项功能:

功能一是能力发现。助手能够通过 JSON 格式的“助手卡片”(在技术上被称作 Agent Card)来展示自身具备哪些能力,就如同我们人类拥有个人简历那样。通过这种方式,客户端助手能够确定最适合完成任务的远程助手。比如你提出“我希望知晓今年的税收政策有哪些变化”,你的个人助手或许对税务方面并不擅长,但它清楚谁是税务领域的专家,所以就会去找到税务助手进行合作。

功能二是任务管理。它能确保助手间的对话围绕完成任务展开,还能定义任务的生命周期。对于耗时较长的任务,两个助手会保持联系,互相更新最新进度。任务的最终结果被称作“工件(artifact)”。就如同你点了一道复杂的菜,厨师会不时告知服务员:“已经开始准备食材了”“马上就好了”,最后才端出成品。

功能三为协作功能。助手们能够互相发送消息,将上下文、回复、工件或用户指令进行传递。例如,服务员可能会告知厨师“客人对海鲜过敏”,又或者“客人喜欢微辣口味”,AI 助手之间也会分享此类重要信息,以此来确保最终结果能满足你的需求。

功能四为用户体验协商。每条消息包含“一部分”内容,例如生成的图像。每个部分都有特定的内容类型。这样,客户端和远程助手就能协商出正确的格式,并且明确包括用户界面能力的协商,比如是否支持嵌入框架、视频、网页表单等。这就如同服务员知晓你是坐在高脚凳上还是在包厢里,进而决定如何最好地为你上菜。

总结来说,A2A 为 AI 助手们营造了一种“通用语言”,这种语言使得它们可以毫无障碍地进行交流,并且一同为用户提供更为全面、更为智能的服务。

最重要的是,谷歌将 A2A 设计为开源协议,整个 AI 社区都能够来贡献代码以及进行更新。Surapaneni 着重指出:“我们期望这切实成为一个由社区驱动的开源项目,存在一个专门的治理委员会,然而其核心在于要保持开放并且由社区来驱动。”

谷歌团队在开发 A2A 时,特别注重使 AI 助手能够以“自然、非结构化”的方式进行交流,即便它们没有共享的记忆、工具和上下文也无妨。A2A 是基于 HTTP 和 JSON 这些现成标准来构建的,正因如此,它更容易与现有的技术栈进行集成,并且其安全性也能够得到保障。

图片

真实案例:A2A如何革新招聘流程

谷歌为了让大家能更直观地看到 A2A 协议的能力,特地使用了一个真实案例,并且强调要全面展示。

谷歌在最新博文中称:有了 A2A 后,招聘一名软件工程师的过程能变得轻松。在 Agentspace 这样的统一界面里,招聘经理只需向自己的 AI 助手传达:“帮我找出符合该职位描述、在这个地区且具备这些技能的候选人。”

接下来,神奇的事情发生了:

· 你的AI助手会自动联系其他专门的招聘AI助手;

· 这些专业助手会帮你筛选潜在候选人;

· 你收到建议名单后,只需动动手指,就能指示助手安排面试;

· 面试结束后,另一个专门的AI助手还能帮你完成背景调查。

整个候选人寻找过程变得流畅无比。

图片

AI圈的“通用语言”之争:互操作协议的崛起

当然,A2A 仅仅是 AI 助手“通用语言”大战当中的最新一个场景。让 AI 助手能够互相听懂对方说话这件事情,现在是非常热闹的。各大科技巨头都在积极地抢滩布局。

市场上除了谷歌的 A2A 外,还有思科联合 LangChain、Galileo、LlamaIndex 和 Glean 组成的 AGNTCY 联盟,其目标是为 AI 助手间创建标准通信方式。LangChain 参与了 A2A 并且还单独开发了 Agent Protocol。微软也对 AutoGen 框架进行了升级。这些都是为了让 AI 助手们能够顺畅交流。

有意思的是,很多公司如微软已经接纳了Anthropic 的 MCP 协议,并且谷歌自身也借助新的 Agent Development Kit 对 MCP 提供了支持。在这种情形之下,谷歌云的 Surapaneni 赶忙进行澄清,称 A2A 与 MCP 并非竞争关系,而是相互补充的。

他解释说:“我们将 MCP 和 A2A 视为互补的能力。A2A 处于更高层次的抽象状态,能够使应用和助手进行相互交流。可以把它想象成一种分层架构,其中 MCP 负责在底层与 LLM、工具以及数据进行交互。”

谷歌明显不存在将自身孤立起来的意愿,Surapaneni 并未排除与其他互操作协议联盟展开合作的可能性。他宣称 A2A 随时乐意接纳新成员加入,该协议会依据社区的建议和需求持续进行更新,属于一个“具有生命力的代码”。也就是说,他们会思考如何与所有协议保持协调一致,因为总会有一些协议能带来优秀的点子,他们期望能够将所有的好想法都吸纳进来。

图片

为什么互操作性需求突然爆发?

各大组织和 AI 公司都认同:未来的世界不会仅由一个 AI 模型来称霸,而是会有多个模型同时存在。这表明 AI 助手会依据不同的语言以及框架进行构建,这种情况是很合理的。

要实现一个完整的助手生态系统,就需要各家公司的助手能够相互交流。说起来简单,做起来却很难!因为行业标准通常需要时间来确立,并且需要得到大部分公司的认可和支持。

A2A 希望成功创建一种标准方式让所有 AI 助手都能使用,不管它是谁构建的或基于哪种框架,都必须实现大规模采用和部署;MCP 希望成功创建一种标准方式让所有 AI 助手都能使用,不管它是谁构建的或基于哪种框架,都必须实现大规模采用和部署;AGNTCY 希望成功创建一种标准方式让所有 AI 助手都能使用,不管它是谁构建的或基于哪种框架,都必须实现大规模采用和部署。

Surapaneni 坦率地承认,即便有 50 多个合作伙伴在进行 A2A 的研发。目前的采用率尚未达到临界点。他说道:“所有这些协议都会持续发展,尤其是在 AI 快速变化的环境当中,我们会找到需要解决的新用例和新场景,所以它会持续成长。”

· FIN ·

科技行者团队出品

图片

图片

OpenAI 出走后,Anthropic 诞生了,它成为了 AI 独角兽。这其中包含了完整的故事,还有 5 条“经验之谈”。

专访 DoorDash 的掌门人:它是如何从濒临倒闭的状态转变为主宰美国外卖市场的,又是怎样缔造出一个全新的商业帝国的。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://www.mjgaz.cn/fenxiang/275373.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息