Definition Was ist Agent2Agent?

Von Dipl.-Ing. (FH) Stefan Luber 5 min Lesedauer

Anbieter zum Thema

Agent2Agent (A2A) ist ein für die Interaktion von KI-Agenten von Google entwickeltes Open-Source-Protokoll. Es ermöglicht die Zusammenarbeit mehrerer KI-Agenten über standardisierte Schnittstellen und Sprachen. Über A2A lassen sich KI-Systeme erkennen, Daten sicher austauschen, Aufgaben gemeinsam bearbeiten und Ergebnisse teilen.

Agent2Agent (A2A) ist ein Open-Source-Protokoll von Google zur standardisierten Interaktion und Aufgabenverteilung zwischen KI-Agenten über Anbietergrenzen hinweg.(Bild:  KI-generiert)
Agent2Agent (A2A) ist ein Open-Source-Protokoll von Google zur standardisierten Interaktion und Aufgabenverteilung zwischen KI-Agenten über Anbietergrenzen hinweg.
(Bild: KI-generiert)

Agent2Agent (A2A) ist ein von Google in Zusammenarbeit mit über 50 Technologieunternehmen entwickeltes Open-Source-Protokoll. Ziel ist es, die Interaktion zwischen KI-Agenten über standardisierte Schnittstellen und Protokolle zu ermöglichen – herstellerunabhängig und skalierbar. Die Vorstellung erfolgte im April 2025. Zu den beteiligten Partnern zählen unter anderem Atlassian, PayPal, Salesforce, SAP und Neo4j.

Allerdings darf an dieser Stelle auch nicht verschwiegen werden, dass zahlreiche KI-Big-Player wie OpenAI, Meta, DeepSeek, Alibaba und andere bei der Vorstellung nicht genannt wurden.

Technische Grundlagen und Architektur

A2A wurde entwickelt, um die Kommunikation und den Datenaustausch zwischen unterschiedlichen KI-Agenten über verschiedene Systeme und Anbieter hinweg zu standardisieren und herstellerneutral zu gestalten.

Die technische Basis für die Interoperabilität bilden etablierte Web-Standards wie HTTP, JSON-RPC und Server-Sent Events (SSE).

Durch eine gemeinsame Sprache und Struktur und standardisierte Schnittstellen und Protokolle können KI-Agenten einander erkennen, Daten sicher austauschen, Fähigkeiten und Dienste teilen, gemeinsame Aufgaben vereinbaren und Ergebnisse oder Statusmeldungen zur Verfügung stellen. Auch die multimodale Kommunikation für Audio, Video und Foto sowie interaktive Benutzeroberflächen werden unterstützt.

Die Aufgabenbearbeitung kann sowohl synchron als auch asynchron erfolgen. Mithilfe von A2A lassen sich große, leistungsfähige Multiagentensysteme realisieren. Die Notwendigkeit für benutzerdefinierten Integrationscode entfällt dank A2A. Gehostet und zur Verfügung gestellt wird das Open-Source-Protokoll über GitHub. Es steht unter Apache-2.0-Lizenz.

Von A2A bereitgestellter Funktionsumfang

Das A2A-Protokoll stellt zentrale Funktionen zur Verfügung, die eine strukturierte Zusammenarbeit von KI-Agenten ermöglichen:

  • Automatische Erkennung von Agenten und deren Fähigkeiten
  • Standardisierter und sicherer Datenaustausch zwischen Agenten
  • Teilen von Diensten und Funktionen unter Agenten
  • Koordination gemeinsamer Aufgaben
  • Statusmeldungen und Ergebnisübermittlung
  • Unterstützung multimodaler Kommunikation (Text, Audio, Video, Bilder)
  • Synchrone und asynchrone Aufgabenbearbeitung

Designprinzipien und Funktionsweise von Agent2Agent

Der Entwicklung von Agent2Agent liegen diese fünf Designprinzipien zugrunde:

  • A2A soll die Zusammenarbeit der Agenten und die Nutzung ihrer Fähigkeiten ermöglichen, auch wenn sie keinen Speicher, Kontext oder Tools teilen
  • A2A soll mit bestehenden Technologie-Stacks kompatibel sein und auf offenen, etablierten Standards und Protokollen wie HTTP, JSON-RPC und SSE basieren
  • A2A soll standardmäßig in Enterprise-Grade-Qualität sicher sein und auf OpenAPI-Authentifizierungsverfahren basieren
  • A2A soll auch lang andauernde, bis zu mehreren Tagen laufende Aufgaben mit Hintergrundtasks, menschlicher Beteiligung und Echtzeit-Status-Updates unterstützen
  • A2A soll modal unabhängig sein und Bilder, Audio, Video und Text und andere strukturierte oder unstrukturierte Formate unterstützen und verarbeiten

Die Architektur von A2A ist modular aufgebaut und folgt dem Client-Server-Modell. Sie lässt sich für zukünftige Entwicklungen oder Technologien flexibel erweitern und anpassen. Das Protokoll kennt drei grundlegende Akteure:

  • Benutzer, die Aufgaben initiieren
  • Client-Agenten, die Aufgaben im Auftrag der Nutzer formulieren und vergeben
  • Remote-Agenten, die die Aufgaben empfangen, sie bearbeiten und Status oder Ergebnisse zurücksenden

Über sogenannte Agentenkarten veröffentlichen die KI-Agenten ihre Fähigkeiten. Bei den Agentenkarten handelt es sich um standardisierte JSON-Metadatendokumente mit Metadaten wie Name und Version, Hosting-URL, unterstützte Input- und Output-Modalitäten, unterstützte Inhaltstypen, Authentifizierungsmethoden und Listen der Fähigkeiten der KI-Agenten. Agentenkarten werden auf einem bekannten Endpunkt bereitgestellt und sind über private oder öffentliche Register oder Marktplätze auffindbar.

Zur Erledigung von Aufgaben kommunizieren Client-Agenten und Remote-Agenten in einem strukturierten Format. Nachrichten können Freitext und strukturierte Daten enthalten. Zur Aufgabenverwaltung und Statusverfolgung kommen sogenannte Tasks zum Einsatz. Jeder Task hat einen Lebenszyklus. Tasks können sofort erledigt werden oder langandauernde Prozesse sein. Ihr Status kann beispielsweise „eingereicht“, „in Bearbeitung“, „Eingabe benötigt“, „erledigt“ oder „fehlgeschlagen“ sein.

Das Ergebnis eines Tasks wird als Artefakt bezeichnet. Für langlaufende Prozesse ist eine Push-Kommunikation vorgesehen. Mithilfe von Server-Sent Events oder Webhooks können Echtzeitmeldungen über Statusveränderungen oder Fortschritte an die Agenten mitgeteilt werden. Um für sichere und vertrauenswürdige Interaktionen zwischen den KI-Agenten zu sorgen, kommen auf OpenAPI-basierende Authentifizierungs-, Autorisierungs- und Verschlüsselungsmechanismen zum Einsatz.

Für ein besseres Verständnis des Funktionsprinzips des Agent2Agent-Protokolls wird im Folgenden ein typischer Ablauf einer Aufgabenbearbeitung vereinfacht dargestellt:

Ein Benutzer initiiert eine Aufgabe, indem er beispielsweise eine Frage formuliert und sie an einen Client-Agenten übermittelt.

Der Client-Agent sucht anschließend nach einem oder mehreren Remote-Agenten, die die entsprechenden Fähigkeiten besitzen, die Fragestellung zu lösen. Die Suche findet über die auf privaten oder öffentlichen URLs gehosteten Agentenkarten statt.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Ist ein geeigneter Remote-Agent gefunden, sendet der Client-Agent den Task an den Remote-Agenten. Er verwendet hierfür JSON-RPC mit definiertem Payload. Über Nachrichten werden Informationen wie Texte oder Dateien übermittelt.

Der Remote-Agent nimmt den Task und die übermittelten Informationen entgegen, startet die Bearbeitung und antwortet bei einer unmittelbar lösbaren Aufgabe mit dem Ergebnis (Artefakt). Er kann aber auch weitere Informationen anfordern oder bei länger andauernden Tasks Statusmeldungen und Zwischenergebnisse mitteilen.

Der Client-Agent nimmt alle Rückmeldungen entgegen. Sind zusätzliche Informationen erforderlich, kann er diese beim Nutzer anfordern. Sobald eine Aufgabe erledigt ist, stellt er die Antwort dem Nutzer zur Verfügung.

Abgrenzung zum Model Context Protocol und Kombinationsmöglichkeiten beider Protokolle

Mit dem vom US-amerikanischen KI-Unternehmen Anthropic entwickelten und als Open-Source-Lösung veröffentlichten Model Context Protocol (MCP) gibt es neben A2A einen weiteren offenen Standard aus dem Bereich der Kommunikation von KI-Modellen und KI-Agenten. Die beiden Protokolle sind aber nicht als Konkurrenten zu sehen, sondern haben unterschiedliche Aufgaben. Es handelt sich um komplementäre Protokolle, die sich einander ergänzen.

Während A2A für die Kommunikation von KI-Agenten untereinander konzipiert ist, wurde MCP entwickelt, um die Integration von externem Kontext und die Interaktion mit Werkzeugen zu vereinfachen und zu standardisieren. Es handelt sich bei MCP um eine Art universeller Konnektor für die bidirektionale Kommunikation zwischen KI-Modellen und Kontextsystemen oder externen Tools. Dadurch wird die dynamische Integration solcher Ressourcen deutlich vereinfacht.

A2A und MCP sind komplementäre Standards. Sie lassen sich kombinieren und gemeinsam für ein umfassendes Framework für KI-Agentensysteme verwenden. Während A2A die Verteilung und Bearbeitung der Aufgaben zwischen verschiedenen KI-Agenten regelt, ermöglicht MCP den KI-Agenten, zur Aufgabenbearbeitung nahtlos auf externe Datenquellen oder Tools zuzugreifen. Durch diese Kombination lassen sich ganzheitliche KI-Systeme schaffen, die durch die Kooperation von KI-Agenten eigenständig und automatisiert Aufgaben bearbeiten, dabei auf externe Datenquellen zugreifen, sich flexibel verschiedenen Anforderungen anpassen und über eine erweiterte Funktionalität verfügen.

Vorteile von Agent2Agent

Agent2Agent bietet unter anderem diese Vorteile:

  • offenes Protokoll für eine hersteller- und plattformübergreifende Kommunikation
  • ermöglicht die Interaktion von KI-Agenten über standardisierte Protokolle und Schnittstellen
  • basiert auf etablierten Standards
  • unterstützt verschiedene Modalitäten und Datenformate
  • in großem Umfang skalierbar
  • ermöglicht komplexe, leistungsfähige Multi-Agenten-Systeme
  • fördert ein offenes und kollaboratives Ökosystem von KI-Agenten
  • unterstützt moderne, offene Authentifizierungs- und Autorisierungsverfahren auf Enterprise-Niveau
  • auch für Langzeitaufgaben geeignet
  • für die Einbindung von externen Datenquellen und Tools mit MCP kombinierbar

(ID:50419418)