谷歌联合50多家大厂推出A2A协议，解决AI助手互操作痛点-模具钢网

作者 | 周雅

来源 | 科技行者

现在有越来越多的 AI 助手，然而这些 AI 助手之间仿佛处于平行世界之中，完全无法进行交流。如今，谷歌也按捺不住了，准备要来解决这个令人困扰的问题。

过去几个月，出现了至少两个 AI 助手互操作标准。首先是 Anthropic 推出了“模型上下文协议（MCP）”，接着思科带头创建了一个叫做“AGNTCY”的联盟标准。这是因为大家逐渐认识到，让不同公司开发的 AI 助手能够“相互交流”是非常重要的。想象一下，财务部的 AI 能够进行合作，人事部的 AI 也能够进行合作，销售部的 AI 同样能够进行合作，并且这种合作是无缝的，那么效率会提高多少呢！

现在谷歌看到了这个趋势，于是也来参与其中了，并且最新推出了“Agent2Agent”（简称 A2A）协议。

这次谷歌并非独自行动，而是与 50 多家大厂携手共进。这些大厂包括 Atlassian、Box、Cohere、Intuit、LangChain、MongoDB、Salesforce、SAP、ServiceNow、UKG 和 Workday 等。从这一局面来看，A2A 协议的目的是成为 AI 助手与 AI 应用之间的互操作语言。

谷歌云业务应用平台的副总裁兼总经理 Rao Surapaneni 在独家采访里说，A2A 能让那些有着不同专长以及处于不同数据节点的助手，更加容易地获取到所需要的上下文。

每个 AI 系统都具备特定的专长。这是因为它们拥有数据节点或者逻辑节点，也可能是当前的用户群专注于特定的任务。这些框架预计会围绕着非常专业的焦点来发展。如果我作为客户部署了这些多平台和多框架，我不希望在它们之间进行来回的切换。他补了一句，谷歌与 50 多个合作伙伴和客户合作，部分原因是要构建 A2A，让其具备“以企业级、安全且可信的方式进行互操作的能力”。

什么是A2A协议？

这个A2A协议到底是什么？

简单来说，A2A 协议主要是用于两种 AI 助手的互相交流。其中一种助手被称为“客户端助手”，另一种助手被称为“远程助手”。

餐厅里服务员与厨师存在这样的关系：服务员（客户端助手）会接收你的点餐并将其传达给厨师，厨师（远程助手）则负责依据这些要求来烹饪美食。例如，当你向自家 AI 询问一个财务问题时，如果它不了解，就能够去请教专门的财务 AI，之后把答案告知你，在整个过程中你无需操心。

谷歌在最新一篇博文中写道，A2A协议主要包括四项功能：

功能一是能力发现。助手能够通过 JSON 格式的“助手卡片”（在技术上被称作 Agent Card）来展示自身具备哪些能力，就如同我们人类拥有个人简历那样。通过这种方式，客户端助手能够确定最适合完成任务的远程助手。比如你提出“我希望知晓今年的税收政策有哪些变化”，你的个人助手或许对税务方面并不擅长，但它清楚谁是税务领域的专家，所以就会去找到税务助手进行合作。

功能二是任务管理。它能确保助手间的对话围绕完成任务展开，还能定义任务的生命周期。对于耗时较长的任务，两个助手会保持联系，互相更新最新进度。任务的最终结果被称作“工件（artifact）”。就如同你点了一道复杂的菜，厨师会不时告知服务员：“已经开始准备食材了”“马上就好了”，最后才端出成品。

功能三为协作功能。助手们能够互相发送消息，将上下文、回复、工件或用户指令进行传递。例如，服务员可能会告知厨师“客人对海鲜过敏”，又或者“客人喜欢微辣口味”，AI 助手之间也会分享此类重要信息，以此来确保最终结果能满足你的需求。

功能四为用户体验协商。每条消息包含“一部分”内容，例如生成的图像。每个部分都有特定的内容类型。这样，客户端和远程助手就能协商出正确的格式，并且明确包括用户界面能力的协商，比如是否支持嵌入框架、视频、网页表单等。这就如同服务员知晓你是坐在高脚凳上还是在包厢里，进而决定如何最好地为你上菜。

总结来说，A2A 为 AI 助手们营造了一种“通用语言”，这种语言使得它们可以毫无障碍地进行交流，并且一同为用户提供更为全面、更为智能的服务。

最重要的是，谷歌将 A2A 设计为开源协议，整个 AI 社区都能够来贡献代码以及进行更新。Surapaneni 着重指出：“我们期望这切实成为一个由社区驱动的开源项目，存在一个专门的治理委员会，然而其核心在于要保持开放并且由社区来驱动。”

谷歌团队在开发 A2A 时，特别注重使 AI 助手能够以“自然、非结构化”的方式进行交流，即便它们没有共享的记忆、工具和上下文也无妨。A2A 是基于 HTTP 和 JSON 这些现成标准来构建的，正因如此，它更容易与现有的技术栈进行集成，并且其安全性也能够得到保障。

真实案例：A2A如何革新招聘流程？

谷歌为了让大家能更直观地看到 A2A 协议的能力，特地使用了一个真实案例，并且强调要全面展示。

谷歌在最新博文中称：有了 A2A 后，招聘一名软件工程师的过程能变得轻松。在 Agentspace 这样的统一界面里，招聘经理只需向自己的 AI 助手传达：“帮我找出符合该职位描述、在这个地区且具备这些技能的候选人。”

接下来，神奇的事情发生了：

· 你的AI助手会自动联系其他专门的招聘AI助手；

· 这些专业助手会帮你筛选潜在候选人；

· 你收到建议名单后，只需动动手指，就能指示助手安排面试；

· 面试结束后，另一个专门的AI助手还能帮你完成背景调查。

整个候选人寻找过程变得流畅无比。

AI圈的“通用语言”之争：互操作协议的崛起

当然，A2A 仅仅是 AI 助手“通用语言”大战当中的最新一个场景。让 AI 助手能够互相听懂对方说话这件事情，现在是非常热闹的。各大科技巨头都在积极地抢滩布局。

市场上除了谷歌的 A2A 外，还有思科联合 LangChain、Galileo、LlamaIndex 和 Glean 组成的 AGNTCY 联盟，其目标是为 AI 助手间创建标准通信方式。LangChain 参与了 A2A 并且还单独开发了 Agent Protocol。微软也对 AutoGen 框架进行了升级。这些都是为了让 AI 助手们能够顺畅交流。

有意思的是，很多公司如微软已经接纳了Anthropic 的 MCP 协议，并且谷歌自身也借助新的 Agent Development Kit 对 MCP 提供了支持。在这种情形之下，谷歌云的 Surapaneni 赶忙进行澄清，称 A2A 与 MCP 并非竞争关系，而是相互补充的。

他解释说：“我们将 MCP 和 A2A 视为互补的能力。A2A 处于更高层次的抽象状态，能够使应用和助手进行相互交流。可以把它想象成一种分层架构，其中 MCP 负责在底层与 LLM、工具以及数据进行交互。”

谷歌明显不存在将自身孤立起来的意愿，Surapaneni 并未排除与其他互操作协议联盟展开合作的可能性。他宣称 A2A 随时乐意接纳新成员加入，该协议会依据社区的建议和需求持续进行更新，属于一个“具有生命力的代码”。也就是说，他们会思考如何与所有协议保持协调一致，因为总会有一些协议能带来优秀的点子，他们期望能够将所有的好想法都吸纳进来。

为什么互操作性需求突然爆发？

各大组织和 AI 公司都认同：未来的世界不会仅由一个 AI 模型来称霸，而是会有多个模型同时存在。这表明 AI 助手会依据不同的语言以及框架进行构建，这种情况是很合理的。

要实现一个完整的助手生态系统，就需要各家公司的助手能够相互交流。说起来简单，做起来却很难！因为行业标准通常需要时间来确立，并且需要得到大部分公司的认可和支持。

A2A 希望成功创建一种标准方式让所有 AI 助手都能使用，不管它是谁构建的或基于哪种框架，都必须实现大规模采用和部署；MCP 希望成功创建一种标准方式让所有 AI 助手都能使用，不管它是谁构建的或基于哪种框架，都必须实现大规模采用和部署；AGNTCY 希望成功创建一种标准方式让所有 AI 助手都能使用，不管它是谁构建的或基于哪种框架，都必须实现大规模采用和部署。

Surapaneni 坦率地承认，即便有 50 多个合作伙伴在进行 A2A 的研发。目前的采用率尚未达到临界点。他说道：“所有这些协议都会持续发展，尤其是在 AI 快速变化的环境当中，我们会找到需要解决的新用例和新场景，所以它会持续成长。”

· FIN ·

科技行者团队出品

OpenAI 出走后，Anthropic 诞生了，它成为了 AI 独角兽。这其中包含了完整的故事，还有 5 条“经验之谈”。

专访 DoorDash 的掌门人：它是如何从濒临倒闭的状态转变为主宰美国外卖市场的，又是怎样缔造出一个全新的商业帝国的。

本文采摘于网络，不代表本站立场，转载联系作者并注明出处：http://www.mjgaz.cn/fenxiang/275373.html

谷歌联合50多家大厂推出A2A协议，解决AI助手互操作痛点

相关推荐

联系我们