AI 代理提供了一个独特的机会,通过自主处理许多日常重复或复杂任务,帮助人们提高生产力。如今,企业越来越多地构建和部署自主代理,以帮助扩展、自动化和增强整个工作场所的流程——从订购新笔记本电脑,到帮助客户服务代表,再到协助供应链规划。
为了最大限度地从代理式 AI 中获益,这些代理能够在跨越孤立数据系统和应用程序的动态多代理生态系统中协作至关重要。使代理能够彼此互操作,即使它们是由不同供应商或在不同框架中构建的,将增加自主性并倍增生产力提升,同时降低长期成本。
今天,我们推出了一个新的开放协议,名为 Agent2Agent (A2A),得到超过 50 个技术合作伙伴的支持和贡献。
A2A 协议将允许 AI 代理彼此通信、安全交换信息,并在各种企业平台或应用程序上协调行动。我们相信,A2A 框架将为客户增加重要价值,他们的 AI 代理现在将能够在整个企业应用程序领域中工作。
A2A 专注于使代理能够在其自然的、非结构化的交互模式中协作,即使它们不共享记忆、工具和上下文。我们正在启用真正的多代理场景,而不是将代理限制为"工具"。
该协议建立在现有的流行标准之上,包括 HTTP、SSE、JSON-RPC,这意味着更容易与企业日常使用的现有 IT 堆栈集成。
A2A 被设计为支持企业级身份验证和授权,在发布时与 OpenAPI 的身份验证方案具有相同的功能。
我们设计 A2A 具有灵活性,支持从快速任务到可能需要数小时甚至数天的深入研究的各种场景,当人类参与其中时。在整个过程中,A2A 可以向用户提供实时反馈、通知和状态更新。
代理世界不仅限于文本,这就是为什么我们设计 A2A 以支持各种模态,包括音频和视频流。
A2A 促进"客户端"代理与"远程"代理之间的通信。客户端代理负责制定和传达任务,而远程代理负责对这些任务采取行动,以尝试提供正确的信息或采取正确的行动。这种互动涉及几个关键功能:
代理可以使用 JSON 格式的"代理卡"来公布其能力,使客户端代理能够识别能够执行任务的最佳代理,并利用 A2A 与远程代理通信。
客户端和远程代理之间的通信面向任务完成,代理致力于满足最终用户请求。这个"任务"对象由协议定义,并有其生命周期。它可以立即完成,或者对于长时间运行的任务,每个代理可以通信以相互保持同步,了解完成任务的最新状态。任务的输出称为"工件"。
代理可以相互发送消息,以传达上下文、回复、工件或用户指令。
每个消息包括"部分",这是一个完全形成的内容片段,如生成的图像。每个部分都有指定的内容类型,允许客户端和远程代理协商所需的正确格式,并明确包括用户 UI 能力的协商,例如 iframe、视频、网络表单等。
视频演示
通过 A2A 协作,招聘软件工程师的过程可以显著简化。在像 Agentspace 这样的统一界面中,用户(例如招聘经理)可以要求他们的代理找到与工作列表、位置和技能集匹配的候选人。然后,代理与其他专业代理互动,寻找潜在候选人。用户收到这些建议后,可以指导他们的代理安排进一步的面试,简化候选人招聘流程。在面试过程完成后,可以聘请另一个代理进行背景调查。这只是 AI 代理如何需要跨系统协作以寻找合格的求职者的一个例子。
我们很高兴有一个不断增长和多样化的合作伙伴生态系统,积极为 A2A 协议的定义及其技术规范做出贡献。他们的洞察和专业知识在塑造 AI 互操作性的未来方面是无价的。